Text
                    h^
i№
'ШЩ£ЖШ^


Ю.И.Дегтярев ИССШВДОВАНИЕ ОПЕРАЦИЙ Допущено Министерством высшего и среднего специального образования СССР в качестве учебника для студентов вузов, обучающихся по специальности «Автоматизированные системы управления» •ф* ^ *ф* МОСКВА «ВЫСШАЯ ШКОЛА» 1986
ББК 32.965 Д26 УДК 007-62-52 Рецензенты: кафедра «Автоматизированные системы управления» Московского высшего технического училища им. Н. Э. Баумана (зав. кафедрой проф. В. Н. Четвериков); проф. В. В. Федоров (Московский государственный университет им. М. В. Ломоносова) Дегтярев Ю. И. Д26 Исследование операций: Учеб. для вузов по спец. АСУ.—Л\.: Высш. шк., 1986.-320 с: ил. Б книге рассмотрены методологические и прикладные аспекты совер-" шенствоваиия целенаправленной деятельности; изложены теория и методь! исследования операций*, дан анализ детерминированных, вероятностных, игровых подходов к проблеме принятия решений в условиях, характеризуемых различным уровнем неопределенности. !502000000~-502 ББК 32.965 ^ 00!{0!)-86 ^^""^^ 6Ф6.5 © Издательство «Высшая школа», 1986
ПРЕДИСЛОВИЕ Экономическая политика КПСС, нацеленная на всемерное ускорение развития страны на основе углубления научно-технического прогресса, выдвигает новые сложные задачи в области подготовки высококвалифицированных кадров. Решение этих задач во многом определяется уровнем преподавания таких дисциплин как прикладная математика, системотехника, исследование операций. Современный инженер должен не только обладать техническими знаниями, но и уметь разрабатывать формальные модели реальных систем и процессов. В книге рассмотрены принципы построения и анализа детерминированных, вероятностных, игровых моделей операций, а также приемы исследований в условиях той или иной неопределенности. Каждая глава претендует на самостоятельность и вместе с тем служит для подготовки читателя к восприятию нового, возможно более сложного материала. Стремление изложить теорию достаточно строго и в доступной форме выразилось в раскрытии идей, лежащих в основе тех или иных методов, в развернутых формах записи соотношений, подборе необходимого количества примеров. Содержание предлагаемого учебника соответствует программе курса «Исследование операций» для студентов, обучающихся по специальности «Автоматизированные системы управления». Книга может быть полезна аспирантам и инженерам, использующим рассматриваемые методы в своей работе. Приведенная библиография дает возможность перейти к изучению специализированной литературы. Автор выражает глубокую признательность рецензентам — коллективу кафедры АСУ Московского высшего технического училища им. Н. Э. Баумана (зав. кафедрой проф. В. Н. Четвериков) и проф. В. В. Федорову (Московский государственный университет им. М. В. Ломоносова) за обстоятельную критику рукописи, а также проф. А. М. Олев- скому за ценные замечания к материалам § 1.4, 3.2 и доц. В. Г. Тимковскому за помощь в подготовке материала §4.7. Все замечания по книге просьба направлять по адресу: 101430, Москва, ГСП-4, Неглинная ул., д. 29/14, издательство «Высшая школа». Автор
ВВЕДЕНИЕ Современная научно-техническая революция, связанная с появлением электронных вычислительных машин (ЭВМ), создала предпосылки для развития новых направлений науки. Одним из таких направлений по праву считается исследование операций как средство совершенствования целенаправленной деятельности. Методология исследования операций формировалась на протяжении четырех последних десятилетий под влиянием интенсивных разработок экономико-организационных, космических, энергетических, оборонных систем и способов их практического использования. Важным этапом этого процесса явилось изучение информационных аспектов деятельности человека, что способствовало развитию идей автоматизированного управления. Стремление совершенствовать все формы сознательной деятельности характерно для современного общества и обусловлено рядом объективных причин — ростом масштабов производства, усложнением и удорожанием техники, ограниченностью ресурсов. Особую актуальность приобретает улучшение работы координируюш,их и управляющих центров, которым предоставлено право принимать ответственные решения, связанные так или иначе с защитой общественных интересов. Чтобы достичь желаемых результатов, необходимо значительно повысить качество информации о состоянии управляемых объектов, используемой в ходе подготовки указанных решений. Это требование в равной степени относится и к самим объектам — источникам исходной информации, и к системам ее обработки, входящим в состав соответствующих автоматизированных систем управления (АСУ). В общих чертах АСУ можно определить как систему организационно-технического управления, основанного на использовании достоверной и полной информации, современной вычислительной техники, научных методов анализа возможных решений. Очевидно, системы такого типа нацелены на принципиально новые подходы к проблеме организации информационных процессов, разделяемых условно иа два класса — процессы появления новой информации (принятие решений) и процессы преобразования имеющейся информации по известным правилам (формальная обработка данных).
Появление современных ЭВМ привело к централизации формальной обработки с целью более полного и оперативного информационного обеспечения принимаемых управленческих решений. Это, в свою очередь, позволило построить принципиальную схему АСУ (рис. В.1). В соответствии с приведенной схемой функционируют реальные автоматизированные системы управления отдельными технологическими процессами (АСУ ТП), предприятиями (АСУ П), отраслями народного хозяйства (О АСУ). Конкретные особенности таких систем проявляются в соответствую- •j,jbie_^^ ^6oJi!liSL^2^^ Рис. в.1 щих интерпретациях понятий «управляемый объект» (поточная линия, цех, завод) и «управляющий центр» (вышестоящий руководитель, дирекция, аппарат министерства). Самостоятельную роль в организации и регулировании информационных процессов играют системы обработки данных (СОД). Их проектирование представляет собой сложную научно-техническую проблему. Именно здесь возникают многие задачи исследования операций, связанные с основами автоматизации управления, и используются результаты их анализа. Следует подчеркнуть, что требование построить систему, способную анализировать и обрабатывать любые данные, представляется сегодня технически невыполнимым. Существует множество неформализуемых процедур обработки, реализовать которые может лишь человек с его опытом,
знаниями, интуицией (развитие идей, заключение соглашений, выполнение нетиповых заданий). Кроме того, возможны ситуации, когда нет смысла использовать сложную технику. В дальнейшем, при изучении методологии и конкретных задач исследования операций, станет возможным расширить и уточнить развитые здесь общие представления об автоматизированных управляющих системах и происходящих в них процессах, однако подобная детализация не изменит главного принципа деятельности АСУ, основанного на разделении функций принятия руководителем ответственных решений и их специального информационного обеспечения. Большой вклад в развитие изучаемой теории внесли известные ученые — А. Н. Колмогоров, Дж. Нейман, Л. В. Канторович, Дж. Данциг, Р. Акоф, Н. Н.Воробьев, Н. Н. Моисеев, Р. Беллман, Ю. Б. Гермейер, Е. С. Вент- цель, Г. Кун, А. Таккер, С. Кук и многие другие. Их труды не только расширили границы применимости количественных методов подготовки решений, но и способствовали созданию новых направлений в науке. Исследование операций как область знания продолжает расширяться, обогащаясь результатами, получаемыми и теоретическим, и экспериментальным путем. В этих условиях большое значение приобретают единые методологические принципы анализа, обобщения и практического использования достижений исследователей.
Раздел первый ОБЩАЯ МЕТОДОЛОГИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ. СОВЕРШЕНСТВОВАНИЕ ОРГАНИЗАЦИОННО- ТЕХНИЧЕСКИХ СИСТЕМ Глава 1. ПОНЯТИЯ, ПРИНЦИПЫ И СРЕДСТВА ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Первоначально исследование операций было определено как научный метод, дающий в распоряжение руководителя количественные основания для принятия решений, связанных с деятельностью подчиненных организаций. Подчеркивалось, что речь идет о прикладной науке, применяющей достижения других (фундаментальных) наук для анализа специфических проблем совершенствования руководства [20]. С течением времени круг интересов исследователей операций значительно расширился и охватывает сегодня области экономики, военного дела, энергетики, освоения природных ресурсов. Важное место отводится изучению проблем автоматизации производства и управления различными видами деятельности, поскольку сам процесс автоматизации отражает единство вещественного, энергетического и информационного аспектов развития общества. Конкретным выражением этого стало создание разнообразных автоматизированных систем на базе современной вычислительной техники. Все они по существу являются организационно-техническими системами, соединяющими в себе достижения современной науки об управлении с разработкой новых машин, процессов, форм организации. § 1.1. Основные определения. Иллюстративные примеры Понятия, приводимые ниже, могут использоваться в самых разнообразных исследованиях, но в каждом конкретном случае они требуют соответствующей интерпретации, отражающей сущность изучаемых явлений. Операцией называется совокупность взаимосогласованных действий, направленных на достижение вполне определенной цели. До тех пор, пока цель не определена, нет смысла говорить об операции. Если же цель определена и существуют разные пути ее достижения, то желательно найти лучший из них, добиваясь надлежащей согласованности
предпринимаемых действий. Понятие «лучший» относительно и требует уточнения во всех случаях. Оно начинает что- либо означать тогда, когда назван показатель (критерий) качества выбираемых решений (например, «план А лучше плана В с точки зрения более полной загрузки оборудования» или «вычислительная машина одного типа лучше вычислительной машины другого типа в смысле быстродействия»). Из этих замечаний следует утверждение о единственности цели в каждой конкретной операции. Примеры операций: аппаратный контроль перфолент с целью выявления ошибок, выполнение расчетов на ЭВМ с целью получения каких-то данных, монтаж оборудования в цехе с целью обеспечения выпуска новой продукции в заданные сроки. Оперирующей стороной называются отдельные лица и коллективы, объединенные организационным руководством и активно стремящиеся (в рамках данной операции) к достижению поставленной цели. В зависимости от масштабов операции и характера своего участия в ней представители оперирующей стороны могут либо сами формулировать себе цель, либо получать директивы извне. Следовательно, вопрос о составе оперирующей стороны должен обсуждаться каждый раз специально, и это обстоятельство дает возможность рассматривать ход той или иной операции с разных точек зрения, что всегда полезно. Примером оперирующей стороны является персонал отраслевого вычислительного центра (ВЦ), обеспечивающий своевременную и качественную обработку данных о деятельности предприятий отрасли за отчетный период. Активными средствами проведения операции называется совокупность материальных, энергетических, денежных, трудовых и других ресурсов, а также организационных возможностей, используемых оперирующей стороной для обеспечения успешного хода операции и достижения ее цели. Очевидно, оперирующая сторона должна обладать определенной свободой выбора активных средств и способностью как-то влиять на развитие событий (в противном случае операция перестает быть управляемой, а оперирующая сторона становится пассивным наблюдателем). Не случайно в сферу исследования операций попадают разнообразные проблемы распределения ресурсов. Примерами активных средств являются вычислительные машины, электроэнергия, время, находящиеся в распоряжении коллектива ВЦ, или п'роизводственные мощности, запасы сырья, трудовые ресурсы завода, или фонд заработ-
ной платы производственной бригады, расходуемый по ее усмотрению и определяющий численный состав и квалификацию работников. Стратегиями оперирующей стороны в данной операции называются допустимые способы расходования ею имеющихся активных средств. Здесь слово «допустимые» следует понимать как «не выходящие за пределы технических, организационных, физических возможностей (ограничений)». Среди допустимых обычно находятся и оптимальные (предпочтительные) стратегии, превосходящие остальные по каким-либо признакам. Оптимальные (от латинского opti- jfius — наилучший) стратегии должны представлять первоочередной интерес для оперирующей стороны. Примеры стратегий: принятая последовательность обработки массивов данных на ЭВМ , установленный распорядок дня руководителя учреждения, рекомендуемый принцип поиска неисправностей в сложном изделии, выбранный режим обслуживания заявок на ремонт какого-либо оборудования. Действующими факторами операции называются объективные условия и обстоятельства, определяющие ее особенности и непосредственно влияющие на ее исход. Различают факторы определенные (точно известные) и неопределенные (имеющие вероятностную природу или проявляющиеся беспорядочно). Все они разделяются на контролируемые и неконтролируемые оперирующей стороной, причем неконтролируемыми обычно бывают неопределенные факторы. Наличие контролируемых факторов указывает на возможность управления ходом операции. Совокупность действующих факторов всегда характеризует обстановку, в которой проводится та же или иная операция. Примеры действующих факторов: фиксированная продолжительность рабочей смены, наличие резервов внешней памяти ЭВМ, обязательность контроля информации в процессе обработки (определенные факторы), погодные условия на воздушных трассах, надежность арендуемых каналов передачи данных, характер действий разумного противника в том или ином конфликте (неопределенные факторы). Критерием эффективности операции (или выбранной стратегии) называется показатель требуемого, ожидаемого, достигнутого соответствия между результатом предпринимаемых действий и целью операции. Важнейшей функцией критерия является сравнительная оценка различных стратегий до начала их реализации. Его используют также на
завершающем этапе операции для характеристики полученных результатов. Как правило, интерес представляют стратегии, позволяющие достичь максимальных (минимальных) значений критерия (если, конечно, он имеет численное выражение). Следовательно, необходимо тщательно отбирать критерии во избежание ошибочных интерпретаций цели операции и неоправданного расхолчования активных средств. Примеры критериев: полная стоимость перевозки грузов со складов к местам назначения (в транспортной задаче), полное время занятости поточной линии назначенными работами (в задаче составления календарных планов), вероятность своевременного обслуживания заявки на ремонтном участке (в задаче массового обслуживания), вероятность обнаружения неисправности электронной схемы (в задаче диагностики). Состоянием операции в некоторый момент времени / называется совокупность ее характеристик (особенностей), проявляющихся в этот момент и отражающих объективно сложившееся положение дел. Всякая операция представляет собой процесс, существующий во времени, проходящий различные этапы (фазы) развития и завершающийся получением конечного результата, сопоставимого с исходной целью. Обычно этот процесс как-то проявляет себя, обнаруживает некоторые свойства и поэтому может подвергаться воздействиям оперирующей стороны. Если подобные проявления измеримы и допускают количественную оценку, то можно говорить о них как о варьируемых параметрах, формально отражающих ход операции и называемых обычно фазовыми переменными. Пояснить введенное определение удобно на примере производственного процесса, состоящего в выполнении ряда работ на каком-либо оборудовании с целью получения конечного продукта (возможно изделия, массива данных н т. п.). Оценка состояний процесса в разные моменты следует здесь из ответов на вопросы: какая работа (по порядку) выполняется? сколько времени осталось до ее окончания? сколько работ завершено? какие материалы используют в ходе каждой работы? и т. д. Очевидно, искомые ответы можно представить в виде набора чисел |i (номер очередной работы), ^2 (оставшееся до ее завершения время), |з (количество законченных работ), . . ., меняющихся во времени (фазовые переменные). С их помощью нетрудно описать динамику процесса применительно к конкретной обстановке. 10
Математической моделью операции называются формальные соотношения, устанавливающие связь принятого критерия эффективности с действующими факторами операции. Чтобы построить математическую модель, необходимо оценить количественно проявления рассматриваемых факторов и указать группы изменяемых параметров, формально представляющих эти факторы. Однако следует иметь в виду, что никаких правил построення математических моделей не существует. Каждая модель есть проявление знаний, опыта, искусства оперирующей стороны. Процесс создания модели требует четкого осознания цели операции, проникновения в существо моделируемых явлений, умения отделить главное от второстепенного. Математические модели могут иметь вид формул, систем уравнений или неравенств, а также таблиц, числовых последовательностей, геометрических образов, отражающих зависимости между критерием эффективности операции и теми параметрами, которые представляют учтенные действующие факторы. Примеры математических моделей приведены во всех последующих главах книги. Решением, связанным с выбранной математической моделью, называется конкретный набор значений управляемых (контролируемых) параметров (фазовых переменных). Решение можно получить различным путем, с различной степенью точности, в различных предположениях свойств неуправляемых (неконтролируемых) параметров, но независимо от этого оно должно рассматриваться лишь как вспомогательный материал, нуждающийся в осмыслении и сопоставлениях. Ни одна формальная модель не может дать исчерпывающих сведений о развитии реальных событий (практически всегда присутствуют неконтролируемые факторы), но получаемые с ее помощью решения позволяют оперирующей стороне ориентироваться в окружающей обстановке, вносить полезные уточнения в модель, анализировать различные стратегии, выявлять второстепенные факторы планируемой операции. Примеры решений можно найти в любой области целенаправленной деятельности — в технике, экономике, военном деле (установленные допуски на характеристики приборов, планируемые объемы выпуска продукции, цены на сырье, маршруты патрулирования). Исследователями операций могут быть названы отдельные специалисты или научные коллективы, осуществляющие разработку стратегий, допустимых в тех или иных опе- 11
рациях, математических моделей, использующих различные критерии и понятия оптимального выбора, методов исследования моделей в интересах сравнения конкурирующих стратегий и отыскания среди них хотя бы приближенно оптимальных. Исследователь входит в состав оперирующей стороны, но его роль ограничивается подготовкой рекомендаций, вытекающих из изучаемой модели (или группы моделей). Право окончательного выбора ему не принадлежит, оно предоставляется административному (руководящему) органу, ответственному за проведение операции и имеющему обычно дополнительные соображения относительно допустимых (предпочтительных) стратегий. Таким образом, необходимо различать формальные решения, получаемые исследователем операций, и принципиальные (ответственные) решения, принимаемые руководящими органами. Желательно, чтобы формальные решения были как можно полнее отражены в принципиальных решениях, поэтому важнейшим условием успеха является достаточно хорошая информированность исследователя о предстоящей операции. Приведенные определения позволяют сформулировать основную задачу исследования операций — найти в рамках принятой модели такие решения, которым отвечают экстремальные значения критерия К. Часто сложность модели, несовершенство методов исследования, дефицит средств и другие обстоятельства приводят к отказу от сформулированного требования и замене его требованием найти близкие к экстремальным значения К (с соответствующей оценкой точности приближения) или получить заданные значения К- Таким образом, внимание исследователя операций концентрируется на критерии К и проблеме его увеличения или уменьшения (по смыслу задачи). Критерий становится эквивалентом цели операции в данной модели, а совокупность условий, обеспечивающих достижение экстремальных (или почти экстремальных) значений К, определяет оптимальные (или рациональные) стратегии оперирующей Стороны. Создавая математическую модель, исследователь стремится достичь относительной простоты результата и возможности его всестороннего анализа, но вместе с тем учесть все существенные факторы и детали планируемой операции. В этих условиях большую пользу приносит сотрудничество различных специалистов, коллективные усилия которых приводят к получению приемлемой модели или ряда взаи- 12
мосвязанных моделей, удачно сочетающих противоречивые свойства полноты и компактности. В заключение отметим, что модель и критерий должны выбираться в строгом соответствии с содержанием и целью конкретной операции, должны быть чувствительны к изменениям исследуемых параметров и достаточно просты в практическом использовании. § 1.2. Машинное моделирование операций. Возможности вычислительной техники Развитие исследования операций как науки, обусловленное усложнением существующих и возникновением новых научно-технических проблем (в частности, проблем совершенствования организационного управления, автоматизированного проектирования, применения роботов в народном хозяйстве), сопровождается ростом требований к средствам моделирования изучаемых процессов. Все более часты случаи, когда не удается построить математическую модель, отражающую реальные события во всей их сложности, или когда построенная модель приводит к таким задачам, которые находятся на грани неразрешимости. Здесь на помощь исследователю приходит электронно- вычислительная техника с ее возможностями провести численный эксперимент, накопить статистические данные, оперативно дать разные варианты решений. Математические модели и методы приобретают новое важное качество — становятся основой математического обеспечения моделирующих комплексов. Среди новых подходов к проблеме моделирования операций следует в первую очередь назвать имитационное моделирование с активным использованием диалога между человеком (представителем оперирующей стороны) и ЭВМ. Термин «имитационное» происходит от латинского imitatio (копирование, подражание) и выражает стремление оценить расчетным путем и своевременно учесть последствия возможных изменений обстановки, в которой проводится (или будет проводиться) данная операция. Это расширяет возможности выработки гипотез относительно развития событий, предсказания поведения участников операции, накопления опыта принятия неформальных решений. Кроме того, имитационные модели позволяют детально (на «элементарном» уровне) отразить тот или иной процесс и выявить его скрытые особенности. 13
Несмотря на высокую эффективность, имитационным моделям присущи недостатки: ограниченная точность моделирования и трудности ее априорной оценки (косвенную характеристику точности может дать анализ чувствительности модели к изменениям отдельных параметров исследуемой операции); отсутствие общности результатов, предоставляемых в распоряжение исследователя (каждый цикл расчетов позволяет определить реакцию изучаемого процесса на конкретное «возмущение», и для полноты картины необходимы многократные обращения к модели с соответствующими затратами средств и времени); высокая стоимость и продолжительность (иногда в несколько лет) разработок модели (ее создание требует привлечения высококвалифицированных специалистов, объединенных, как правило, в небольшие коллективы, перед которыми ставятся уникальные задачи). Таким образом, имитационное моделирование, являясь важным и эффективным средством исследования операций, не может заменить собой теоретические изыскания. Совершенствование методологии исследований требует совместного использования тех преимуществ, которыми обладают модели различных классов (тем более, что все они основаны на применении математического аппарата). Сам процесс имитации объединяет три основных этапа ■— подготовительный, рабочий, заключительный. Подготовительный этап включает постановку проблемы, выбор критерия /С, анализ ограничений, подготовку данных для расчетов, разработку соответствующих пpo^paмм для ЭВМ; рабочий этап ■— собственно моделирование, накопление нужных сведений, оценку характеристик модели (например, ее чувствительности к вариациям параметров моделируемого процесса); заключительный этап ■— анализ и интерпретацию полученных результатов, подготовку рекомендаций для руководства, реализацию предложений по улучшению модели и расширению ее возможностей. Очевидно, многое из названного составляет основу создания любой модели, поэтому предварительные теоретические проработки изучаемых вопросов сохраняют свою актуальность. Оснащение исследовательских учреждений современной вычислительной техникой не заменяет собой знаний, опыта, искусства человека. Важной составляющей имитационного моделирования можно считать диалоговые режимы общения представителей оперирующей стороны с вычислительным комплексом. 14
Периодический обмен'информацией между участниками диалога в форме вопросов, ответов, указаний позволяет в наибольшей степени использовать опыт и интуицию специалистов. Условиями успеха являются возможность контроля текущих результатов моделирования оперирующей стороной и способность квалифицированно направлять ход вычислений для получения новых данных о характере изучаемых процессов. Чтобы осуществить диалог, необходимо выполнить следующие требования: разработать сценарий, отражающий специфику исследуемой операции и устанавливающий стандартные приемы обращения к ЭВМ, восприятия получаемых от нее результатов, оформления предлагаемых ей заданий; предоставить в распоряжение оперирующей стороны программные и технические средства, обеспечивающие реализацию диалога в соответствии с имеющимся сценарием; создать условия для модификации сценариев и средств обеспечения диалога при изменениях состава оперирующей стороны, возникновении новых задач, пересмотре принятых принципов моделирования. Организация работы моделирующего комплекса в режиме диалога сталкивается с рядом трудностей. Во-первых, всегда желательно расширить круг исследуемых проблем, сделать более детальной их проработку, но для этого нужна развитая система математического (программного) обеспечения ЭВМ и хорошая подготовка оперирующей стороны (например, создание коллектива опытных специалистов, знающих все тонкости и особенности модели). Во-вторых, чрезвычайно важным может оказаться фактор времени, ограничивающий стремление получить от модели представительные статистики или точные числовые результаты, что может вызвать недоверие к ней в условиях, когда других средств подготовки ответственных решений нет. В-третьих, совершенствуя способы взаимодействия человека и ЭВМ (т. е. повышая информационную эффективность модели), необходимо учитывать и опасность частичной потери полученной информации при попытках представить ее руководящему звену в сжатом виде. Таким образом, оперирующая сторона неизбежно сталкивается с необходимостью подготавливать и принимать решения в условиях неопределенности, устранение которой ставит самостоятельные задачи перед исследователем операций. 15
§ 1.3. проблема информированности исследователя. Выбор решений по многим критериям Обращая внимание на объективную необходимость анализа неопределенных факторов, а также способов их представления в модели, следует иметь в виду, что само понятие неопределенности нуждается в уточнении. Неопределенность может быть связана либо со случайностью тех или иных событий, характеризующих обстановку операции, либо с сознательным противодействием оперирующей стороне в достижении ее целей, либо с коллективными (часто неосознанными) стремлениями, основанными на подражании, модных настроениях, бытовой психологии. Случайные события обладают свойством повторяемости и статистической устойчивости, поэтому удается дать их описание в терминах теории вероятностей. Скрытыми источниками случайностей обычно считаются причинно обусловленные, но малоизученные природные процессы и непреднамеренные стечения обстоятельств. Сознательное противодействие или коллективные устремления непредсказуемы в деталях и могут оцениваться лишь в целом, на уровне допустимых (разумных, физически осуществимых) пределов своих проявлений. Все, что находится за этими пределами, должно быть отброшено; все, что заключено в них, рассматривается в плане гипотез, обосновать которые, как правило, трудно. На практике это приводит к рекомендациям «ориентироваться на худший случай», «обеспечить гарантию от неожиданностей», положенным в основу известного принципа гарантированного результата. Указанные различия в понимании неопределенности переносятся, конечно, и на сами неопределенные факторы, причем для исследователя (и всей оперирующей стороны) Ьопросы их классификации важны с точки зрения выбора подходящей модели, поиска методов исследования, объяснения результатов. Большое значение в этих условиях приобретает информированность исследователя о цели предстоящей операции, ее особенностях, реальных условиях проведения. Полезно заметить, что во многих случаях уровень информированности руководящих представителей оперирующей стороны заметно превышает уровень информированности исследователей (для этого существуют объективные причины). В подобных ситуациях перед исследователями ставится задача рассмотреть различные варианты моделей, 16
группы действующих факторов, ограничивающие условия. Окончательный выбор проводится только в момент принятия принципиальных решений (с привлечением той информации, которой не было у исследователя). Дополнительную (и весьма специфическую) неопределенность вносит отказ от единственного критерия эффективности К в проводимом исследовании. Выше было замечено, что выбор К часто представляет серьезные трудности, возрастающие по мере усложнения и укрупнения изучаемых проблем. Появляется необходимость всесторонне проанализировать каждую такую проблему, отразить ее масштабность и сложность, учесть разнообразные интересы участников планируемых операций. Все это порождает идею многокритериальности, которая приходит на смену идее одного критерия, формально представляющего единственную (и единую) цель оперирующей стороны. Казалось бы, возникает противоречие между привычными подходами к исследованию операций, проверенными временем, и новыми запросами практики, однако это не так. На каком- то этапе подготовки решений, оцениваемых по нескольким критериям, неизбежно приходится либо ранжировать их, либо отдавать предпочтение одному из этих критериев, добиваясь приемлемого компромисса. Вопрос состоит в том, каким способом и в какой форме осуществляется подходящий выбор. Пусть в некоторой операции решено оценивать возможные стратегии по ряду показателей /Ci, . . ., /Сд,. Существуют разные способы оценок, но первостепенное значение имеют два из них — формирование множеств доминирующих решений {множества Парето) и последовательный выбор уступок. Кроме того, допустим переход к всевозможным «обобщенным критериям», представляющим собой скалярную функцию принятых Ki /Сл'. однако этот путь при внешней привлекательности обычно оказывается обманчивым. Неясно, как определить вид такой функции, трудно (или просто невозможно) обосновать принципы оценки ее параметров (весовых коэффициентов, показателей степеней и т. п.), проблематична интерпретация получаемых результатов. Следовательно, использовать рассматриваемый при- ем имеет смысл только в крайних случаях (например, тогда, когда интерес представляет сумма Ki+Ki-]-. . .+Км). В общем же случае происходит просто замена одних неопределенностей другими, замаскированная формальными выкладками. Обращаясь к указанным выше двум способам учета мно- !7
гокритериальности, заметим, что первый из них связан с непосредственными вычислениями значений Ки ■ ■ -, К n Для каждой допустимой стратегии и отбрасыванием бесперспективных вариантов, а второй — с исследованием ряда задач оптимизации по каждому из Kt (i = l, Л/) с одновременным изменением ограничений на величины остальных критериев. Чтобы выяснить, как и в какой момент происходит выбор «главного» критерия, предположим, что известны допустимые стратегии Si, . . ., s^ оперирующей Стороны и есть возможность вычислить Ki, . . ., Д'л'ДЛЯ каждой из них с умеренными затратами средств и времени (табл. 1.1).Сравнение Таблица 1.1 Ki «2 •■• Kn ^м Ki (s,) Ki (Sa) Ki (s«) «!(V) Ki (sm) /<2 (Si) «2 {Ч) K, (.s«) «2 (Sfi ) К 2 (S^l) Kn(si) Kn (ss) Kn {Sm) KNiSf,} Kn (sju) между собой любых двух строк таблицы (т. е. двух стратегий) позволит определить, превосходят ли показатели Ki, . . ., Kn одной строки соответствующие показатели другой строки (например, для строк с номерами т и [i пришлось !8
бы сопоставить /Ci(Sm) и /Ci(Sn), K^isJ и /СгСЗц), . . ., /с (s ) и /СдгСзд)). Если ответ будет утвердительным, то ст'ратегия с лучшими показателями может рассматриваться как доминирующая; если же подобной определенности нет (одна стратегия предпочтительна по одним критериям, другая — по другим или обе они равноценны с точки зрения вычисленных Кд, то необходимо продолжить сравнения применительно к новым сочетаниям строк. Таким образом, появляется возможность установить, существует ли для данной стратегии Sp(l^p^AI) хотя бы одна доминирующая стратегия (достаточно исследовать все сочетания из М строк по 2; их число есть М{М—1)/2). Те 5р,для которых нет доминирующих стратегий, должны быть признаны эффективными, подлежащими дальнейшему изучению. Очевидно, нельзя предсказать заранее, какие из имеющихся Si, , . ., s.u окажутся эффективными. Остается лишь надеяться, что количество таких стратегий в тех или иных случаях будет заметно меньше Л1, и за счет этого удастся сократить объемы и время исследовательской работы. После проведения указанных оценок наступает ответственный момент окончательного выбора единственной стратегии (среди эффективных), и этот выбор осуществляется административными органами по своему усмотрению. В принципе происходит то же самое, что могло бы произойти с самого начала — произвольно, в соответствии с общими представленими и взглядами формулируется цель операции и назначается критерий К. Отличительная особенность рассмотренного способа подготовки решений — это хорошая предварительная проработка вариантов, связанных с разными Ki (t=l, N), исследование сразу нескольких моделей и ориентация на непосредственные вычисления Kt- Большую помощь в этом могут оказать вычислительные машины как средство усиления способности человека проводить всесторонний анализ существующих проблем. Несколько иной подход к проблеме многокритериаль- ности вытекает из идеи последовательных уступок. Пусть Ki, . . ., /Civ расположены в порядке убывающей важности, и поставлена задача найти решение, доставляющее экстремум Ki при произвольных значениях других критериев (предполагается, что есть необходимые предпосылки для этого — математическая модель, методы оптимизации, вычислительная техника). Если искомое решение найдено и Ki=Ki*, то оперирующая сторона ставится перед выбором— либо сохранить достигнутое, либо попытаться улучшить другие критерии (в первую очередь Ki) за счет уступок в 19
величине Ki- В последнем случае возникает новая задачаг найти решение, доставляющее экстремум К2 при Ki=K*i— —-A/Ci и произвольных Ks, ■ ■ -, Kn (здесь A/Ci— конкретное количественное выражение уступки). Далее ситуация повторяется в усложненном виде (назначая А/Сг, нужно помнить об ограничении на Ki), однако появляется некоторая ясность в вопросах взаимосвязи критериев, соотношения уступок и выигрышей, влияния учтенных факторов на результат. Дальнейшие подобные шаги приведут к лучшей информированности оперируюш,ей стороны об ожидаемых исходах планируемой операции и обеспечат более качественную подготовку окончательных решений ценой многократного анализа указанных выше задач. Последнее слово, как обычно, остается за руководящими органами, которые будут основывать свой выбор и на проведенных расчетах, и на собственных неформальных оценках. Рассмотренный способ поиска компромиссных решений обобщает известную рекомендацию, согласно которой многокритериальная задача сводится к однокритериальной путем наложения ограничений сразу на все Ki, кроме одного (главного), принимающего экстремальное значение. Такой путь вполне допустим, но может оказаться довольно трудным из-за усложнения ограничивающих условий и необходимости анализа различных вариантов задачи. Таким образом, развитие методологии проводимых исследований характеризуется совершенствованием математических моделей операций, технических средств передачи и обработки данных, систем математического обеспечения моделирующих комплексов, форм взаимодействия человека и вычислительной машины. Важная роль здесь принадлежит умению использовать абстрактные понятия для описания сущности изучаемых проблем. § 1.4. Математический аппарат исследований. Общие сведения Основополагающими математическими понятиями являются понятия, сформировавшиеся в теории множеств, логике, функциональном анализе. С ними связаны многочисленные обобщения и результаты, способствовавшие развитию новых направлений прикладной науки. Это в полной мере относится и к исследованию операций, базирующемуся на активном использовании математических моделей. 1. Совокупность различимых между собой объектов одинаковой природы принято называть множеством. Каждый из таких объектов 20
в отдельности есть элемент множества (принадлежность некоторого элемента емножеству Е обозначается е^Е). В дальнейшем речь будет идти о множествах, элементами которых являются математические объекты Гчисла, точки), технические объекты (устройства, вычислительлые машины и т. п.). Множества Е-^ и Е^ равны (Ei=^E^, если они содержат одни и те же элементы. 2. Множество Е представляет собой некоторое подмножество множества Е (обозначается Е^Е), если каждый элемент ел^ринадлежа- щнйЖ одновременно принадлежит и Я. В случае, когда £ не содержит ни одного элемента (т. е. является пустым множеством, Е=0)^ оно может рассматриваться как подмножество любого множества. Е является собственным подмножеством Е при условиях Е^0, ЕфЕ (обозначается "ЁсЯ). Знаки «С», «<=» называют знаками включения (соот- е^пЕг-Ф £,С\£2'*Ф Рис. 1.1 ветственно строгого и нестрогого) одного множества в другое. Например, множество сотрудников отраслевого института строго включено в множество всех работников отрасли. 3. Пересечение множеств Е^ и Е^ (обозначается £] П f г) e'-'''ь множество всех элементов е, содержащихся ив Ej, и в £3 (рис. 1.1 а). Объединение множеств Е^ и Е^ (обозначается £] (J ^2) есть множество всех элементов е, содержащихся либо в £], либо в.Е^, либо и в £i, и в Яг (рис. 1.1,6). Множества £i и Е^ являются непересекающимися, если Eif\E2=0 (например, множества малых и больших ЭВМ вычислительного центра). 4, Отношением, существующим на множестве Е, называется форма связи между элементами или подмножествами этого множества. Отношения определяются словами («быть меньше, чем...», «обладать свойством делимости на...», «быть одинаковым с ...») или символами, если они общеприняты («=», «<», «П*)- Те или иные отношения могут существовать и между элементами различных множеств. Например, кодирование информации позволяет сопоставить буквы алфавита и сочетания электрических сигналов. 5. Важнейшую роль играет отношение «быть функцией...». Говорят, что на множестве Е задана функция f со значениями в множестве Э, если каждому элементу е^Е сопоставлен элемент э^Э (обозначается 9=f(e)). Если при этом из eiT^ea следуетf (ei)у= f (gj) и каждый э^Э является образом некоторого е^Е, то между Е и Э существует взаимно однозначное соответствие. В случае, когда Э есть множество действитель- 21
ных чисел-, т. е. чисел, используемых в практических расчетах и измерениях, то функция 9=f(e) называется скалярной, Часто Е является множеством каких-либо функций, тогда 9 называют функционалом. Например, расход машинного времени при разных стратегиях обработки одних и тех же данных есть функционал, значение которого определяется выбранной стратегией. 6. Два множества имеют одинаковую мощность тогда, когда можно установить взаимно однозначное соответствие между их элементами. Множество Е является бесконечным, если оно имеет ту же мощность, что и хотя бы одно из его собственных подмножеств (в противном случае Е конечно). Мощность конечного множества определяется числом его элементов. Бесконечное множество Е называется счетным, т. е. допускающим принципиальную возможность пересчитать его элементы, если устанавливается взаимно однозначное соответствие между элементаг.ш Е и элементами множества натуральных чисел. 7. Числовое множество Е называется упорядоченным, если любые два его элемента е^, е^ связаны либо отношением е-^Ке^, либо отношением е{>е^ (например, множество всех действительных чисел). В этих условиях элемент е называется верхней границей множества Е, если е'^е для всех е^Е. Наименьший из имеющихся е называется точной верхней границей (аналогично определяют нижнюю и точную нижнюю границу множеств). В качестве примера здесь можно назвать принципиально достижимое и реально достигнутое быстродействие ЭВМ при существующем уровне развития техники (второе оказывается точной границей). 8. Множество Е называется метрическим пространством, если каждой паре его элементов е-^, е^ поставлено в соответствие неотрицательное число (метрика) p(ei, ^2), удовлетворяющее условиям: p(ei, e,^=Q только при «1=62 (аксиома тождества), p(ei, 62)=?(^2. ^i) (аксиома симметрии), P(ei> в2)+Р(в2, гз)5*Р(е1. из) (аксиома треугольника). Метрическое пространство, элементами которого являются упорядоченные наборы Х= — {Xi Хп), У={Уъ •••, Уп)< ■■■ из «действительных чисел, а метрикой — ' 1 = 1 расстояние р{Х, ^^)=|/ ^ {xj — !/j)^> называется п — мерным ' 1 = 1 арифметическим эвклидовым пространством (обозначается R„). Элементы X, Y, ... могут рассматриваться как точки пространства Rn (или векторы в пространстве R„), задаваемые координатами xj, yj, ... ... (/=1, п). Формула {X, Y)= 2j xjyj / = i определяет скалярное произведение {X, Y) векторов X и F в R„. Величина /"^ ||Х||= ]/'(Х,Х) = I / 2 *? называется нормой или модулем векто- V / = 1 ра X. Отношения между векторами можно выразить через соответствующие отношения между их координатами. аца12. •. ain 9. Таблица вида ^21^22* '^tnl^mit • -^тп содержащая некоторые (действительные) числа а,-у(г=1, т; j=l, п), называется прямоугольной числовой матрицей А размера тХ п. Указанные а;у являются ее элементами. Элемент а/у находится в г-й строке и /-м столбце матрицы А. Значения тип оговариваются в каждом конкретном случае. Матрица 22
, .a„i ■■ami получаемая из матрицы А заменой строк столб- axnO-lti' ■ •^тп цами, называется транспонированной по отношению к А. Размер А^ есть пХт. 10. Множество точек X^R„, для которых р(Х, Х„)<г, называется открытым шаром радиуса г с центром в Х,, (обозначается Н{г, Хо)). Аналогично определяется замкнутый шар Н (г, Х,,) как множество точек Xgi?„, для которыхр(Х, Хо)</' (рис. 1.2, а, б). 11. Окрестностью произвольной точки XoG^n называется любое множество OcR„, содержащее открытый шар Н (г, Хо),'■>0. В частности, О может быть задано неравенствами [xj— —л'о/Кб, где X/— координаты XgO; Хо/— координаты Хо(/=1, п); S—-некоторые положительное число (рис. 1.2, в). 12. Любое подмножество U множества R„ является ограниченным, если оно содержится в каком-либо замкнутом шаре Н{г, Хо). В этом случае диаметром мноокества U называется точная верхняя граница расстояний между принадлежащими ему точками. SI f(x) т - Л, aX,*(1-a}Xi Рис. 1.3 13. Отрезком, соединяющим две данные точки Xj, Х^в R„, называется множество таких точек X, координаты Xj которых связаны с координатами Xj и Xj соотношениями Xy=axyi+(1—a)xy2 (0<«<:1; /=1, п). Конкретный выбор а определяет положение X на отрезке (при а=\ точка X совпадает с Х^, при а=0 — с Xg, при 0<а<1 располагается между ними). Отношение, в котором находятся рассматриваемые Xj, Ха, X, можно определить равенством X=aXi-i-(l—а)Х2 (0<:а<:1). Понятие «отрезок» тождественно понятию «замкнутый интервал» (рис. 1.3, а). 14. Множество EczRn называется выпуклым, если вместе с двумя любыми точками Х^, Х^ оно содержит и весь отрезок, соединяющий эти точки (рис. 1.3,6). Функция /(X) называется выпуклой на интервале (отрезке) [Xj, Х^], если /[aXi+(l—a)X2]<a/(Xi)+(l—я)/(Х2) при 23
0<а<1 (рис. 1.3, в). Неравенство противоположного смысла определяет вогнутую функцию, причем часто используются термины «выпуклая вниз» (кривая 2), «выпуклая вверх» (кривая /). 15. Точка X есть внутренняя точка множества ЕаКп> если она имеет окрестность, целиком содержащуюся в Е (рис. 1.4, а). В отличие от этого окрестность граничной точки всегда включает и точки, принадлежащие Е, и точки, не принадлежащие Е (рис. 1.4, б). Изолированная точка Х^Е имеет окрестность, в которую не входят никакие другие точки множества Е (рис. 1.4, в). Крайняя точка не может находиться на Рис. 1.4 отрезке, соединяющем какие-либо две точки Х-^, Х^ из Е (рис. 1.4, г). Крайняя точка является одновременно и граничной, но обратное утверждение неверно. 16. Открытым является множество, состоящее только из внутренних точек. Замкнутым оказывается множество, включающее свою границу. Дискретное множество содержит только изолированные точки и обязательно бывает либо конечным, либо счетным. Рис. 1.5 17. Множество точек (векторов) X^R„, координаты которых удовлетворяют неравенству aiXi+...+a„x„<b при заданных Ь, aj {j~\,n), называется замкнутым (т. е. содержащим собственную границу) полупространством (рис. 1.5, а). Его граница, определяемая уравнением %Х] + ...+а„х„=Ь, называется гиперплоскостью в Rn (или плоскостью размерности п—1). Пересечение конечного числа замкнутых полупространств (если оно непусто) называется многогранником (рис. 1.5,6). 18. Точка X„^R„ называется пределом последовательности точек Xft, принадлежащих Rn (k=\, 2, ...), если p(Xft, Xn)->-0 при fe->-oo. Рассматриваемая последовательность, обозначаемая обычно {-Х^}, сходится, если Хп существует. Некоторое множество называется компактным, если любая последовательность его точек содержит сходящуюся подпоследовательность. 19. Скалярная функция z=/(X), заданная на некотором множестве Q^R„ roc^'^vsl^i абсолютного (глобального) максимума (г*) в точке X*, если условие f(X*)'^f(X) выполняется для всех Х£(3. Если же это условие выполняется только для X, принадлежащих достаточно малой 24
окрестности точки X*, то в X* имеет место относительный (локальный) максимум 2 (в этом случае X* удобно обозначать как X", чтобы подчерк- путь указанные различия). Определения абсолютного и относительного минимума получаются заменой знака неравенства на обратный, поэтому можно просто говорить об экстремуме z, уточняя его вид лишь по мере необходимости. Каждый абсолютный экстремум является относительным,- но не наоборот. Количество экстремальных точек может быть любым (рис. 1.6). 20. В задачах на отыскание экстремума выбор точек X, среди которых должны находиться X" и X*, ограничивается либо требованием XfG, либо некоторыми дополнительными условиями, определяющими множество (область) U допустимых точек X, строго включенное в G, Рис. 1.6 В первом случае речь идет о безусловном, во втором — об условном экстремуме Z (абсолютном или относительном). В практических исследованиях наиболее часто встречаются ситуации, характеризуемые тем, что G=R„. Используя введенные понятия, можно дать формальные интерпретации некоторых определений § 1.1. Параметры, отражающие ход той или иной операции, являются функциями времени 1й(/) {k=l, 2, . . .). В каждый фиксированный момент t они принимают какие-то (действительные) значения и тем самым определяют точку в R„ (рис. 1.7). Совокупность таких точек образует фазовую траекторию перехода операции из одних состояний в другие (в рамках исследуемой модели). Различным стратегиям проведения данной операции отвечают разные траектории, поэтому принятый критерий К представляет собой функционал. Развитие исследования операций тесно связано с теорией систем, под влиянием которой сформировались важные научные направления. 25
§ 1.5. Анализ поведения систем. Формализованный подход Понятие «система» вошло в обиход в начале XX в., но долгое время использовалось лишь в самом общем смысле, без претензий на формальную строгость и возможность практических приложений. Развитие представлений о взаимосвязи различных отраслей науки, формирование идей кибернетики, открытие новых явлений сделали необходимым строгое определение системы. Системой называется упорядоченная совокупность материальных объектов (элементов), объединенных какими- либо связями (механическими, информационными), предназначенных для достижения определенной цели и достигающих ее наилучшим (по возможности) образом. Тем самым подчеркивается единство трех основных составляющих понятия системы — элементов, связен, операций. Примеры систем: механический редуктор, интегральная схема, вычислительная машина, летательный аппарат, производственное предприятие. Достоинство данного определения — в простоте и раскрытии сущности систем, недостаток — в отсутствии однозначности (произвольно взятый элемент системы сам является системой, а произвольно взятая система может рассматриваться как элемент более крупной системы). Например, ЭВМ есть элемент вычислительного центра, который, в свою очередь, является элементом сети вычислительных центров, входящих в государственную систему сбора и обработки информации и т. д. Это обстоятельство нисколько не препятствует созданию совершенных технических систем (в частности, АСУ) и даже стало своеобразной аксиомой, лежащей в основе разработки иерархических структур (схем подчинения) как неотъемлемого признака любой сложной системы. Введенные понятия широко используются в кибернетике (от греческого kybernetike — искусство управления), разрабатывающей исключительно важные методы абстрагирования и обобщения поведенческих аспектов деятельности систем, В своих началах кибернетика была определена как <1Наука об управлении и связи в животном и машине», и эта основа сохраняется неизменной, хотя сегодня говорят об «управлении и связи в естественных и искусственных системах». Таким образом, системам присуще свойство разностороннего обмена информацией между собой и между составляющими их элементами. 26
Отмеченные выше особенности систем должны классифицироваться и уточняться в конкретных исследованиях. Подходы к классификации могут быть самыми разными, учитывающими, например, физическую природу той илн иной системы, ее целевое назначение, принципы работы и т. п. В частности, можно исходить из известного тезиса о том, что любое поведение есть последовательный ряд операций, и рассматривать особенности поведения систем как их главный классификационный признак. С этой точки зрения различают детерминированные, вероятностные, игровые системы. Детерминированной можно считать такую систему, в которой составные части взаимодействуют друг с другом точно предвидимым образом. Ее поведение предсказуемо, если известны текущие состояния элементов и законы преобразования информации, циркулирующей между ними. Например, в исправном механическом вычислителе (арифмометре) установка задающего вала и порядка вычислений однозначно определяет результат еще до его непосредственного появления. То же самое можно сказать об абсолютно надежной ЭВМ, обрабатывающей массивы данных по известной программе, или о производственном участке, изготавливающем стандартные изделия. Вероятностной называют систему, возможное поведение которой и его последствия описываются на языке теории вероятностей. Здесь знание текущего (осуществленного) состояния и особенностей взаимной связи элементов недостаточно для предсказания будущего со всей определенностью, поэтому приходится оценивать вероятности ожидаемых событий. Например, перфорационное устройство, имеющее ограниченную надежность, не может гарантировать получение заданного количества безошибЬчных перфокарт (оно становится случайным), станок-автомат выдерживает требуемые размеры деталей лишь приближенно, обычно в пределах допуска (но есть опасность отбраковки каких-то из этих деталей) и т. д. Игровой является система, осуществляющая разумный выбор своего поведения в будущем. В основе выбора лежат оценки ситуаций и предполагаемых способов действий по принятым критериям, а также неформальные соображения, руководствоваться которыми может лишь человек. Например, администрация предприятия, заключающая договоры о сбыте продукции, вступает в своеобразную игру с потребителями, стремясь достичь определенного результата при различных колебаниях спроса. Управляющий центр АСУ 27
часто принимает решения о расходовании имеющихся ресурсов, не зная точно, будут ли корректироваться плановые задания вышестоящими организациями (игровая ситуация). Приведенная классификация условна (как и многие другие), поскольку допускает разные толкования принадлежности системы тому или иному классу. Так, поточную линию производства измерительных приборов, полностью обеспеченную комплектующими изделиями и работающую по графику, можно отнести к категории детерминированных систем, если представляет интерес сам факт выпуска продукции. Эта же линия должна рассматриваться как вероятностная система, если проводится анализ отклонений ее производительности от заданного уровня или подсчиты- вается количество некондиционных приборов. Аналогичная картина наблюдается в различных сферах деятельности и свидетельствует о существовании разносторонних отношений между системами, их управляющими и управляемыми звеньями, между исследователями и объектами исследований. Рассматриваемая классификация полезна еще и тем, что группирует системы в соответствии со свойственной им природой управления. Она разрушает деление систем на живые и неживые, механические и немеханические, формальные и воплощенные в металле. Другой классификационный признак, часто используемый на практике,— степень сложности (масштабности) систем. По этому признаку их подразделяют на простые, состояния которых немногочисленны и легко поддаются описанию; сложные, отличающиеся разнообразием внутренних связей, но допускающие их описание; большие (крупномасштабные), характеризуемые такой разветвленностью связей и своеобразием отношений между элементами, что нет возможности все их выявить и проанализировать. Простыми системами являются, например, элементарные двухпозиционные схемы, датчики, механические передачи. Сложными системами можно считать вычислительные машины, устройства распознавания образов, нервные клетки; крупномасштабными системами — сети вычислительных центров, отраслевые АСУ, объединения служб космической связи. Полезно заметить, что пространственные масштабы играют здесь второстепенную роль, главное заключается в сложности (уровне) организации (наглядным примером служит нервная система высших животных). 28
Важное место в исследованиях различного характера занимает понятие структуры систем. Оно связывается с возможностью расчленения (декомпозиции) данной системы на составные части (вплоть до отдельных элементов), причем во многих случаях существуют разные способы отделения таких частей. Следовательно, одну и ту же систему можно представить различными структурами, и необходимый их выбор согласуется, как правило, с задачами конкретных исследований. Другими словами, цель декомпозиции — выявить отношения, в которых находятся взаимодействующие подсистемы и элементы, поэтому формирование структур происходит обычно логическим путем. Условное изображение выделенных частей системы и связей между ними можно назвать структурной схемой или структурной моделью. Переходя от простых систем к сложным и очень сложным, исследователь сталкивается не только с проблемой всестороннего анализа связей, отношений, операций, но и с качественно новыми их проявлениями. В состав систем начинают входить элементы и подсистемы, которым присущи такие функции высокоразвитых организмов, как приспособляемость и самонастройка, способность к обучению, распознавание образов и ситуаций, выбор линии поведения. Этими особенностями обладают кибернетические системы, имеющие наиболее высокий уровень организации и привлекающие всеобщее внимание благодаря своим возможностям и новизне научно-технических задач, стоящих перед их создателями. К классу кибернетических систем относятся и АСУ. Рассмотренные выше понятия способствуют выработке общих взглядов на природу систем, однако они редко используются в конкретных исследованиях, требующих, как правило, более строгого формального аппарата. В связи с этим полезно обратиться еще к одному определению: системой С называется любой объект, существующий во времени, подвергающийся внутренним и внешним воздействиям или возмущениям, реагирующий на них изменениями своих состояний и обладающий способностью проявить в том или ином виде эти реакции. Таким образом, система С определена, если заданы: а) множество {Т} моментов времени t, множество {^) допустимых воздействий v, множество {Q} возможных состояний q, множество {Я) ожидаемых реакций г; б) переходная функция, представленная теми состояниями q^{Q), в которых оказывается С в момент tQ{T), 29
если в начальный момент to^{T} она была в состоянии ^o€{Q} и на нее действовало возмущение v„^{'f^}; в) отношение, связывающее в каждый момент t ^ {Т} реакции rg{5i} с состояниями q^{Q}. Понятие состояния, вводимое на интуитивном уровне, отождествляется с такой внутренней характеристикой системы, которая необходима для оценки ее текущих и будущих реакций на предполагаемые воздействия. Словам «внутренняя характеристика» можно придать смысл «совокупность объективных показателей, отражающих сложившееся положение вещей», и провести параллель между данным определением состояния и тем, которое приведено в §1.1. Воздействия v^{<f^) можно назвать управлениями, если они приложены с целью вызвать желаемые изменения (преобразования) состояний q. Реакция стационарной системы на некоторое воздействие не зависит от момента его начала (в противном случае имеет место нестационарность). Если {Т} есть множество всех действительных чисел, то определяется система с непрерывным временем (или просто непрерывная С). Если же {Т} есть множество целых чисел, то определяется система с дискретным временем (или дискретная С). Дополнительные пояснения удобно дать на примере функционирования системы обработки данных. Множество {9^} образуют массивы первичной (исходной) информации, которые своим появлением «воздействуют» на систему обработки, причем допустимость (или недопустимость) таких воздействий зависит от того, в каком виде представлены данные, каковы их объемы и содержание, в какое время они поступили. Для каждой конкретной АСУ можно составить хотя бы ориентировочный перечень элементов V g {9^}, удовлетворяющих установленным требованиям СОД. Множество {Т} отождествляется обычно с ограниченным отрезком времени, поскольку любая техническая система рано или поздно заменяется новой (более совершенной). В этих условиях целесообразно рассматривать момент 4 как начало очередного планового периода (месяца, полугодия) или периода выполнения срочных заданий. Замечания относительно {Q} следуют из того факта, что информация не существует вне носителей (перфокарт, ыагнитных дисков, микрофильмов). Прошлое и настоящее системы, а также все ожидаемые ее эволюции в будущем связаны так или иначе с распределением и перераспределе- 30
Нием ресурсов ЭВМ, выбором типа носителей для долговременного хранения данных, стремлением найти эффективные способы организации вычислений применительно к конкретным ситуациям и другими аналогичными действиями. Получаемые при этом результаты характеризуют изменения состояний СОД и могут быть представлены в различных формах (таблицей с колонками цифр, текстом с описаниями достигнутых показателей, списком недоработок). Каждая такая форма содержит необходимые сведения о текущем состоянии как элементе множества {Q}. Итогом деятельности СОД на определенном интервале йремени является информация, предназначаемая для руководящих органов АСУ и отвечающая принятым стандартам точности, оперативности, качества оформления. Информационные «единицы» (сводки, справки, варианты решений) представляют собой реакции г системы на упоминавшиеся выше воздействия, образующие множество {f^}. Очевидно, характер реакций обусловлен природой СОД, поэтому множество {91} можно задать априори и корректировать его по мере совершенствования технической базы СОД, отношений между системой и пользователями, методов руководства. Рассмотренное определение системы в терминах «вход — выход — состояние» широко применяется на практике и позволяет обнаружить в отдельных фактах общие закономерности поведения систем, образования их структуры, управления ими. Оно оказывается полезным и в исследовании операций, тесно связанном с проблемами разработки и моделирования систем. § 1.6. Прикладные аспекты исследования операций Проектирование и эксплуатация систем представляют собой последовательную цепь операций, и именно здесь приходится решать многие из тех задач, о которых говорилось в §1.1 —1.3. Цель любого проектирования — создание системы, отвечающей замыслу и требованиям технического задания, имеющей хорошие производственно-экономические показатели, удобной в эксплуатации и обслуживании. Следовательно, необходимо выделить главные стороны будущей деятельности системы, вводя соответствующие критерии эффективности. По ним оцениваются решения, предложенные в процессе проектирования, принимаемые в процессе испытаний, осуществляемые в ходе эксплуатации системы. Выбор критерия эквивалентен фор- 31
мулировке цели (основной задачи) системы или, как минимум, связан с ней. Желаемые свойства критерия эффективности определяются стремлением обеспечить достаточно полное его соответствие назначению системы, возможность количественной оценки тех ее свойств, которые представляют первоочередной интерес, относительную простоту анализа результата проведенных расчетов. Один из важных принципов разработки систем заключается в требовании найти решения, относящиеся к системе в целом и отвечающие общему замыслу проектирования. Этот принцип предполагает привлечение к работе специалистов-системотехников, осуществляющих координационные функции на «системном» уровне, где происходит сопоставление и объединение отдельных «локальных» результатов, получаемых специалистами более узкого профиля. Отсутствие такой координации опасно с точки зрения возможной рассогласованности локальных решений, имеющих свою специфику (хотя каждое из них должно учитывать высшие интересы создаваемой системы). В этом проявляется так называемый «системный подход» к проектированию, основанный на единстве частных и общих целей. Значительную роль играет внешнее проектирование, связанное с исследованием свойств окружающей среды, в которой придется работать системе в будущем, характера отношений между системой и средой, поведения системы в различных ситуациях. Такие исследования способствуют лучшему пониманию возможностей системы, указывают пути ее совершенствования и, главное, позволяют обоснованно направлять внутреннее проектирование как средство решения проблем, относящихся к устройству отдельных элементов, их теоретическому анализу, поиску вариантов конструкций и т. п. Например, в задачу внешнего проектирования АСУ завода может входить определение числа каналов связи между управляемыми объектами (цехами) и заводским ВЦ, выполняющим функции СОД, выбор типа ЭВМ, которыми будет укомплектован ВЦ, разработка форм документов, содержащих информацию для руководства, распределение ресурсов времени ВЦ по видам работ; в задачу внутреннего проектирования — создание различных датчиков, написание и отладка вспомогательных программ, оборудование рабочих мест операторов, организация контроля исполнения команд. Методология исследования кибернетических систем на всех этапах их создания базируется на моделировании. По- 32
нятие модели связано с наличием какого-либо сходства между объектами, действиями, условиями. Если установлено сходство двух объектов в том или ином смысле, то между ними существуют отношения оригинала и модели. Например, корабль и его деревянная модель обладают внешним сходством (подобием формы), что может быть использовано для анализа проблем остойчивости, сопротивления среды и т. п. Подобием структуры обладают распечатки документов разного содержания, получаемые в результате обработки на ЭВМ входной информации, или сети передачи данных, создаваемые в разных географических районах на базе имеюш,егося оборудования. Для кибернетики и ее важнейших разделов — теории систем и исследования операций — первоочередной интерес представляет сходство поведения модели и объекта, выраженное на каком-либо формальном языке и изучаемое путем преобразований соответствуюш,их формул или высказываний. Главная роль в этом принадлежит математическим моделям, которые служат основой и аналитических исследований, и машинного эксперимента. Их можно классифицировать по тем же признакам, что были использованы для классификации систем, т. е. рассматривать детерминированные, вероятностные и игровые модели. Детерминированная модель отражает поведение системы с позиций полной определенности в настоящем и будущем. Примеры таких моделей: формулы физических законов, программы обработки деталей, движения тел и т. п. Детерминированный подход часто используют в планировании перевозок, распределении специалистов, материально-техническом снабжении. Вероятностная модель учитывает влияние случайных факторов на поведение системы и, следовательно, оценивает будущее с позиций вероятности тех или иных событий. Примерами здесь могут служить описания ожидаемых длин очередей в системах массового обслуживания, продолжи- тельностей решения задач мультипрограммной 3BiM, объемов выпуска сверхплановой продукции нроизводственным участком за день. Игровая модель дает возможность изучать конфликтные ситуации, в которых каждая из конфликтующих сторон придерживается своих взглядов, старается получить информацию о намерениях «противника» и, возможно, извлечь выгоду из его ошибок, действует сообразно складывающейся обстановке. Простейший пример игровой модели: таблица (матрица), строкам которой поставлены в соответ- 2 Дегтярев Ю И. 33
ствие допустимые стратегии одной стороны, столбцам.ф- стратегии другой стороны, а их пересечению — оценки .исхода игры при выбранных стратегиях. Как уже отмечалось, математические модели служат целям и внешнего, и внутреннего проектирования систем (в том числе АСУ). Чем полнее информация о требуемых свойствах системы или характере ее будущей деятельности, тем более обоснован выбор типа модели и выше точность результатов, получаемых коллективом проектировщиков. С этой точки зрения интересны случаи, когда указанная информация практически отсутствует и нет возможности построить какую бы то ни было модель. Подобные ситуации встречаются при создании принципиально новых систем^ условия работы которых можно представить лишь предположительно, на уровне прогноза будущего развития науки, техники, состояния окружающей среды, общества в целом. Содержание и достоверность информации, связанной с прогнозами, определяется накопленным опытом исследований, полнотой современных научных знаний и представлений, реальными возможностями осуществить желаемое в близком или отдаленном будущем. Разработка проблем прогнозирования должна отражать закономерности научно- технического и общественного развития, без учета которых немыслимы конкретные достижения теории киберенетичес- ских систем и исследования операций. Важную роль в исследовании систем и операций играют эвристические приемы решения задач (от греческого heurisko — отыскиваю, открываю). Эвристика — это совокупность знаний, опыта, интуиции, интеллекта, используемых для получения решений с помощью неформальных правил. Обычно эти правила обосновываются с позиций «здравого смысла» и отражают внутренние (часто подсознательные) мотивы предпринимаемых действий, не поддающиеся подробному описанию. Эвристики оказываются полезными и даже незаменимыми при решении задач, имеющих нечисловую природу или отличающихся сложностью и неопределенностью каких-то параметров. Типичным в этом отношении является структурный синтез новой системы, разрабатываемой в соответствии с некоторым замыслом, на эвристиках основана деятельность управляющих звеньев АСУ и т. п.[Таким образом, рассматриваемые подходы к вопросам поиска решений могут удачно дополнять (или предварять) анализ детерминированных, вероятностных, игровых моделей систем и операций, а также повышать эф- 34
фективность использования вычислительной техники в исследованиях современных научно-технических проблем. Таким образом, системы создаются для проведения тех или иных операций, операции исследуются для совершенствования систем. Коллектив разработчиков конкретной системы (особенно кибернетической) сталкивается в своей деятельности с проблематикой исследования операций, коллектив исследователей операций учитывает все особенности проектируемой системы и ее будущей «жизни». Неразрывность этой связи обусловлена единством технических возможностей систем и способов их поведения, направленных к достижению заданных целей.
Раздел второй ДЕТЕРМИНИРОВАННЫЕ МОДЕЛИ ОПЕРАЦИЙ. ОПТИМАЛЬНОЕ ПЛАНИРОВАНИЕ ПРИ ОГРАНИЧЕННЫХ РЕСУРСАХ Глава 2. ЛИНЕЙНОЕ И ЦЕЛОЧИСЛЕННОЕ ПРОГРАММИРОВАНИЕ Детерминированные модели занимают в исследовании операций одно из главных мест. Это обусловлено тем, что в них отражены разнообразные проблемы распределения ограниченных ресурсов в экономике, военном деле, создании новой техники. Пути решения подобных проблем так или иначе связаны с планированием целенаправленной деятельности, т. е. с разработкой определенных установок на будущее, без которых невозможны согласованные действия производственных коллективов, подразделений армии, исследовательских учреждений. Таким образом, планирование должно рассматриваться как основа управления сложными системами, и это наимо практическое выражение в идее создания АСУ. С формальной точки зрения многие задачи составления планов, предусматривающих рациональное расходование тех или иных ресурсов, относятся к классу задач математического программирования. Термин «программирование» (от английского programming — составление плана или программы действий) следует понимать здесь именно в смысле «поиск наилучших планов» (в отличие от того толкования, которое принято специалистами по программному обеспечению ЭВМ). §2.1. Постановка и классификация задач математического программирования. Модель перевозок Когда говорят о задачах математического программирования (планирования), то имеют в виду задачи оптимизации, возникшие в последние четыре десятилетия в связи с попытками повысить эффективность промышленных, транспортных, военных систем за счет улучшений в работе координирующих и управляющих органов. Несмотря на смы-, еловое разнообразие таких задач, все они формально сводятся к одной общей постановке: найти значения переменных Xi, . . ., Хп, доставляющие максимум (минимум) заданной скалярной функции z= 36
=/(jCi, . . ., Xn) При условиях gi{Xi, . . . Xn)~bi (г = 1, m). Условия, о которых идет речь, ограничивают выбор значений Xi, . . ., х„ и могут обладать самыми разнообразными свойствами, определяемыми видом функций gi{xi, ., Хп)- В каждой из т строк здесь сохраняется какой- либо один знак (равенство, неравенство). Множество точек X={xi, . . ., Хп), удовлетворяющих системе ограничений gi{X)=bi (/=1, m), есть область определения и поставленной выше задачи. Функция z называется целевой функцией (в конкретных исследованиях это — критерий эффективности технической системы, показатель качества производственного плана и т. п.). Целевая функция достигает экстремального значения в одной или нескольких точках области U, которые предстоит найти. Обычно вид функций ги gt (f=l, tn) известен, константы bi заданы, величины тип являются произвольными целыми числами (в отдельных случаях между ними устанавливается отношение т<п). Специально оговариваются ограничения, выраженные в требованиях неотрицательности и це- лочисленности Xj (i=l, п). Учитывая сказанное, можно дать краткую запись условий задачи математического программирования: В основу классификации таких задач положены особенности функций Z или gi, встречающихся в конкретных исследованиях. Различают два основных класса задач — задачи линейного и нелинейного программирования. К первым относятся те, в которых и целевая функция z, и все функции gi (/ = 1, т) линейны относительно переменных Xj{j=l, п), ко вторым — те, в которых присутствуют различного рода нелинейности. В качестве примеров назовем лишь хорошо изученные и широко распространенные задачи; решаемые средствами классической математики при условии, что среди ограничений нет неравенств и т<.п, нет требований неотрицательности или целочисленности переменных, функции ZH gi непрерывны и по крайней мере дважды дифференцируемы; имеющие линейные ограничения и целевую функцию, представляющую собой полином второй степени относительно ^;(/'=Т7^; 87
имек|Ш,ие целевую функцию, представленную в виде суммы произвольных функций отдельных переменных д;/, обладающие такими универсальными свойствами, как выпуклость Z и и, что позволяет формировать и использовать условия существования решений независимо от конкретных форм задания z и gi{i=l, т). Приведенная классификация условна, поскольку она охватывает лишь задачи с полной информацией, т. е. такие, в которых все исходные параметры определены. Кроме них можно указать группы задач, содержащих различные неопределенности (случайность отдельных параметров, отсутствие сведений о виде целевой функции и т. п.), следствием чего является практически неограниченное разнообразие приемов решения, позволяющих собрать и эффективно использовать недостающую информацию. Чтобы лучше представить себе конкретные особенности задач математического программирования и условия их возникновения, рассмотрим модель перевозок, дающую классический пример экономии ресурсов. Имеются пункты (склады) Пи . . ., П^ хранения некоторого продукта, в каждом из которых содержится соответственно aj, . . ., а^ единиц этого продукта, и пункты потребления Ях, . . ., Я„ получающие продукт в количествах Pi, . . ., Рг- Запасы и потребности сбалансированы, т. е. k г 2^^= 2 Ря' '^ каждый Пр может взаимодействовать с каж- 1=1 р=1 дым П[. Стоимость перевозки единицы имеющегося продукта со склада Я, в пункт Пр составляет Cjp. Если при этом количество перевозимого продукта есть Xip, то стоимость рассматриваемой «элементарной» операции оценивается величиной CipXip, а общая стоимость всех перевозок — вели- чиной22^г«'^гр- Требуется выбрать такие значения Xip, т. е. составить план перевозок, при которых суммарные затраты на транспортировку окажутся минимальными. Очевидно, математическая задача формулируется так: найти jcii, JCi2, . . ., Xjff, доставляющие минимум функции k г к г= 2 2 ^гр^^р при ограничениях: 2-'^'гр = Рр (каждый i=ip=i 1=1 пункт потребления получает нужное количество продукта); г 2 ^гр = а, (каждый склад полностью освобождается); j;,„^0 р=1 (объемы перевозок не могут быть отрицательными).
Рассмотренная задача называется транспортной задачей, что вполне соответствует ее содержанию. Распределяемым ресурсом здесь являются денежные средства, расходование Которых регламентируется выбором значений Xip^ Линейность функции Z и всех ограничивающих условий указывает на то, что транспортная задача относится к классу задач линейного программирования, часто встречающихся в практике исследований прикладных проблем. Разнообразие математических моделей планирования настолько велико, что обычно приходится анализировать многие способы достижения оптимума и разрабатывать самостоятельные группы методов оптимизации. Ни один из этих методов не является универсальным, с точки зрения применимости к произвольно взятой задаче, но и не существует изолированно от остальных. В доказательствах допустимости сведения одних задач к другим, в попытках построить сходные вычислительные процедуры для различных методов проявляются тенденции сближения и универсализации подходов к проблеме поиска оптимальных решений. § 2.2. Линейное программирование. Общие свойства задачи Задача линейного программирования в общей постановке состоит в отыскании значений п переменных х^, . . ., Хп, п доставляющих экстремум функции г = 2 ^•^/ при условиях «11^1+«12^2 + • • • + Oin^n < ^; (2.1) «тЛ+«т2^2+ • • • +атпХп<Ь^- Условия (2.1) представляют собой систему линейных нестрогих неравенств, от которых можно перейти к равенствам путем присоединения искусственных переменных Xn+i, так что каждая строка aiiXi+. . .+ainXn-^bi превращается в aaXi+.. . +ainXn+x„+{=bi; х„+г>0. Это приводит к увеличению размерности задачи и появлению дополнительного требования неотрицательности Xn+i, однако от такого перехода часто зависит успех решения. Условия (2.1) являются достаточно общими, хотя к ним обычно добавляются требования >fxj^0{j=\, п). Следует заметить, что включение в (2.1) строгих неравенств осложняет поиск решений. Например, если z=Xi и Xi<il, то
нельзя указать значение xt, которое доставило бы максимум Z. Свойства задач линейного программирования во многом зависят от особенностей области определения, заданной неравенствами (2.1). Она представляет собой выпуклый многогранник, содержащийся в Rn (см. § 1.4). Примером может служить область U, определяемая условиями— ^^1+^2^1, ~Xi—^2^0, Xi^Z (рис. 2.1). С увеличением числа переменных наг- ■лядность геометрических представлений теряется, однако аналогии с рассматриваемым примером сохраняются полностью, и в дальнейшем область определения линейной задачи будет условно изображаться гак, как показано на рис. 2.2. Вершины выпуклого многогранника U являются крайними точками, причем их число конечно. Обратимся теперь к следующей теореме. Теорема 2.1. Экстремум целевой функции в задаче линейного программирования {если он существует) всегда яв- Рис. 2.1 Рис. 2.2 Рис. 2.3 ляется абсолютным и достигается хотя бы в одной крайней точке многогранника U. Доказательство. Пусть среди коэффициентов Cj выражения п / = i есть отличные от нуля (в противном случае задача теряет смысл). Следовательно, вектор градиента y^={dzldxi, . . ., dzldxj), определяемый здесь как Vz=(Ci, . ■ ., с^), остается неизменным и отличным от нуля во всех точках X ^U (рис. 2.3). Это, в свою очередь, означает, что экстремум z отсутствует внутри области U и может появиться только на ее границах (иначе было бы выполнено необходимое условие Vz=0)- Пусть теперь X*—экстремальная граничная (но не крайняя) точка U, лежащая на отрезке, соединяющем 40
.две другие точки Xi, Х^. Очевидно, координаты х], xju д..^(у=1, п) этих точек должны быть связаны равенством x*=axji+{\-—d}Xj2, 0<а<1 (см. § 1.4), которое после умножения обеих частей на Cj и суммирования по номерам / пе- п п п реходит в 2 CjX*i = а 2 CjXj-^-\-(\ — a) 2 CjXji wmf{x*) = =a/(Xi)+ (1—a)f{X^, 0<a<l. Последнее соотношение должно существовать совместно с требованиями f (X*)^/(Xi), ДХ*)^/(Х2) (если X*—точка максимума г) или /(Х*)^ </(^i). /(^*)^/(^2) (если X*— точка минимума г), однако все это выполнимо лишь при /(Xi)=/(X2)=f (X*) (проверку легко провести непосредственной подстановкой выражения /(X*) в указанные неравенства). Таким образом, Xi и Хг тоже обладают экстремальными свойствами и поэтому должны принадлежать границе U. Применительно к Xi, Xj можно повторить предыдуш,ие рассуждения и обнаружить тем самым новые точки экстремума Z. Все они окажутся равноценными [целевая функция принимает в них одно и то же значение г*=/(Х*)] и лучших решений для исходной задачи линейного программирования найти нельзя. Это доказывает абсолютную оптимальность X*. Остается заметить, что любая граница выпуклого многогранника обязательно включает в себя хотя бы одну крайнюю точку (вершину), которая может рассматриваться в качестве X* подобно Xi, Х^. Следовательно, среди экстремальных граничных точек X* б f/ всегда находится какая-либо крайняя точка. В предельном случае она оказывается единственной точкой экстремума целевой функции г. П Чтобы использовать полученные геометрические представления, нужно дать их формальную интерпретацию и построить на этой основе метод решения рассматриваемых задач. По-видимому, вычислительная процедура, преду- сматриваюш,ая направленный перебор крайних точек области определения задачи линейного программирования, должна привести к отысканию среди них Х*.Эта идея отражена в так называемом симплекс-методе, являющемся классическим методом в линейном программировании. Он позволяет найти крайнюю точку области U и определить, является ли она точкой экстремума целевой функции п 2=2 CjXj. Если нет, то обеспечивается переход в соседнюю I = 1 крайнюю точку, где значение функции z больше (меньше) 41
предыдущего. Тем самым делается шаг, приближаклций получение решения. Через конечное число подобных шагов, точка экстремума z либо оказывается найденной, либо признается несуществующей (например, в случае, когда ограничения задачи несовместны). § 2.3. Симплекс-метод. Этапы поиска решений Рассматриваемый метод является универсальным в том смысле, что позволяет решать задачи линейного программирования в общей постановке, хотя требует их приведения к так называемому стандартному виду: найти п Xi, . . ., Хп, доставляющие минимум функции г= 2 9-^у "ри /=1 условиях ( aiiXi+---+ai„x„ = bi; \ a^iX,+ ...+a^„=b„; (2-2) [Wxj^O a=l,n). Часто используется матричная форма представления условий (2.2), например z=CX-vmin; АХ~В; Х^О, где А — матрица коэффициентов а^; X я В столбцы {xt, . . ., Хп) и (^1, . . ., Ьт) соответственно; С — строка {с^, . . ., с„). Полезно заметить, что с формальной точки зрения нет необходимости строго различать задачи поиска максимума и минимума, так как одна задача сводится к другой изменением знака Z на.противоположный. Условия (2.2) представляют собой систему линейных неоднородных уравнений, особенности которой определяют характер решения задачи в целом. Если система (2.2) неразрешима (множество и пусто), то задача теряет смысл. Если существует единственное решение (2.2), то оно является одновременно и решением исходной задачи, поскольку нет другого выбора. Наконец, если система (2.2) имеет более одного решения, задача становится объектом исследования. Известно, что в последнем случае искомое множество решений системы (2.2) может быть представлено как •'''1 ='Фх (■''•»>+1' •••' ^п)' Jf2 = i|'2(Jf»+i. •••- х„); (2.3) где ■^и . . ., ■^гп— линейные комбинации переменных Xm+i, 42
.'.':, Xn называемых свободными. Вследствие линейности ibi{i=U т) равенства (2.3) приводятся к виду (2.4) причем коэффициенты Лх, m+i. • • •. ^mn и правые части Bi, . . ., fim однозначно определяются теми Oij, bt, которые присутствуют в (2.2). Система (2.4) имеет следующую особенность: если номер / переменной Xj находится в пределах l^y'^/n, то эта переменная входит только в строку с номером t=/, имея коэффициент, равный единице, и не входит в остальные строки, для которых 1Ф]. Так8я система называется канонической. Она позволяет легко указать множество всех возможных решений для (2.2), среди которых находятся так называемые базисные решения, представляющие особый интерес. Частное решение системы (2.4), получаемое приравниванием свободных переменных Xm+i. • • •> л'^ нулю, называется базисным. Оно имеет вид Ari = fii, ..., дг„ = В„, x„^y = ...=x„ = Q (2.5) и является допустимым (в смысле требований jcj^O) при 'iBi'^Q ('=1. гп). Появление хотя бы одного fij=0 делает решение (2.5) вырожденным. Понятия, относящиеся к стандартной постановке задачи линейного программирования, связаны с геометрическими представлениями, обсуждавшимися в § 2.2. Так, существует соответствие между крайними точками многогранника и и решениями вида (2.5). Пусть U определяется условиями [wxj^O (/ = 1,п) или, что то же, a,„iX^+...+i ^п + т = b; (2-7) [ Wxj^O- Уд:„+г>0 (t = l,/n). Предполагая все bi строго положительными, рассмотрим 43
возможные решения системы (2.7), в которой свободным!^ удобно считать переменные Xi х„. Каждый набор их, значений соответствует некоторой точке в f/ и, кроме того, входит составной частью в решение Xi х„, x^+i, . . ., Хп+т< получаемое подстановкой принятых Xi х„ в (2.7). Тем самым устанавливается общее соответствие между конкретными числами х^ х„, x„+i ^п+т ^ '^^'^' ками X ^и. Пусть теперь Xn+i=bi{i=l, т), x^=0(/=l, га) — допустимое базисное решение системы (2.7). Представим его компоненты х^+ь x^ в виде Xn+i=aXn+i,x-\- (1—a)Xn+i,2\ Xj=axji+ {l—a)Xj2 (0<а<1; i=l, m; /=1, n), где Xji, Xn+t, i и Xj2, Xn+i, 2— два другие произвольно взятые решения (2.7). Очевидно, для номеров /=1, га рассматриваемые формулы примут вид 0=ал:д+(1—a)Xj2, но это означает kji=0 и Х)2=0 (иначе при 0<;а<;1 будет нарушено требование неотрицательности переменных). Таким образом, исследуемые решения (базисное и два других) совпадают друг с. другом, и точка X^U, отвечаюш,ая заданным Xj, x-n+i, не может находиться на отрезке, соединяюш,ем две другие точки многогранника U, т. е. она оказывается крайней. Из сказанного следует важный вывод: если исходная стандартная задача линейного программирования имеет решение, то оно обязательно совпадет с каким-либо допустимым базисным решением системы (2.2). Идея перебора крайних точек многогранника U, лежаш,ая в основе симплекс-метода, переходит в требование последовательного анализа базисных решений названной системы. Для этого необходимо: а) найти некоторое допустимое базисное решение (2.2), если оно суш,ествует; б) проверить найденное решение на оптимальность; в) осуш,ествить переход к новому допустимому базисному решению, если предыдуш,ее оказалось неоптимальным; г) повторять операции б), в) до тех пор, пока не будет получено оптимальное базисное решение системы (2.2) или подтверждена возможность неограниченного увеличения |г|. Для многих практических задач удается сравнительно легко отыскать каноническую форму (2.4) условий (2.2), но часто это вызывает трудности. Можно, конечно, предварительно исследовать вопрос суш,ествования решений, однако желательно, чтобы сам метод исключал необходимость подобных исследований и не был бы связан с априорными предположениями свойств системы (2.2). Симплекс-метод 44
удовлетворяет поставленному требованию. Он реализуется в два этапа: на первом решается вспомогательная задача, а на втором — основная. Предположим, что исходные условия (2.2) рассматриваются в случае, когда все bt (i=l, т) неотрицательны (иначе нужно было бы умножить на —1 строки, содержащие Ь-<.0). Первый этап исследований начинают с формального введения в каждую строку (2.2) искусственной неотрицательной переменной, что позволяет построить систему: j a,niXi+ ■ ■ ■ +a,nnXn + Xn+„ = b„; (2-^) ( Wxj > 0 (/ = 1, n)- Wx^,.,. > 0 (1 = 1, m). Если существует решение для (2.2), то оно допустимо и для (2.8) при Хп+1=. . .=Xn+m=0. Наоборот, если получено решение системы (2.8), содержащее нулевые Xn+t (i==l, m), то оно допустимо для (2.2). т Далее рассматривается сумма ау = 2 ^п+1» наименьшее 1=1 возможное значение которой есть О вследствие неотрицательности всех Xn+i- Именно оно будет получено, если (2.2) имеет решение, причем проверка условия min w=0 проводится путем анализа вспомогательной задачи линейного программирования: найти Xj^O, Хп+г^О (/=1, п, i = l, m), доставляющие min \w= 2j ^n+i^ при условиях (2.8). Осо- бенностью этой задачи является то, что для нее легко наз- вать начальное базисное решение Xj—0 (/= 1, п), Xn+i=bt (i= = 1, m), как это следует из (2.8). Если окажется min ау>0, то процесс вычислений можно прекратить и считать исходную задачу с условиями (2.2) неразрешимой. Если же min w=0, то оптимальное решение вспомогательной задачи фиксируется и используется на втором этапе исследований. Второй этап начинается с оценки и решения вспомогательной задачи, полученного в конце этапа 1. В лучшем случае это решение является невырожденным и содержит все Xn+t В числе свободных переменных. В худшем случае некоторые Xn+t войдут в базис и тогда необходимо сохранять их нулевые значения неизменными на каждом шаге этапа 2. Это достигается отбрасыванием тех Xj, Xn+i, кото- 45
рые имеют отличные от нуля коэффициенты в рассматривав* мом решении. После того как указанная оценка проведена, становится возможным возвратиться к исходной задаче линейного программирования, имея в своем распоряжении некоторое допустимое базисное решение системы (2.2), найденное в ходе исследования задачи на минимум w. Основу рассмотренных этапов симплекс-метода составляет так называемый симплекс-алгоритм, предусматривающий проведение ряда операций с базисными решениями систем (2.8) (на первом этапе) и (2.2) (на втором этапе). § 2.4. Симплекс-алгоритм. Процесс приближения к оптимуму Отыскание допустимого базисного решения лишь создает предпосылки для организации последовательных переходов к новым решениям, если неоптимальность предыдущих подтверждена. Именно с этими моментами связано содержание симплекс-алгоритма. Он используется тогда, когда уже получено некоторое допустимое решение для (2.2) или (2.8), что равносильно приведению этих систем к соответствующей канонической форме. Пусть задача линейного программирования дана в следующей постановке: найти Xi^O, . . ., х„^0, доставляющие п минимум функции г= 2 ^/^/ при (2.9) Считая каноническую форму (2.9) допустимой (VS;^0), рассмотрим очевидное базисное решение Xi=Si, . . ., Хт~ = Sni, л-„+1 = . . .=х„=0. Ответ на вопрос, является ли оно оптимальным, можно получить, проведя несложные преобразования выражения г. Умножим каждую строку системы (2.9) на коэффициент Cj, номер которого совпадает с номером этой строки, и просуммируем полученные равенства, ^о приводит к формуле п z = Zo+ 2 ^у^/' где Zo— некоторая константа, определя- емая имеющимися А ij и Bf, cj— коэффициенты при свободных переменных рассматриваемого базисного решения, во- 46
шедшие в полученное выражение г (cj зависят от значений ^.. и Sj). По своему смыслу г» есть значение г, достигаемо^ в точке с координатами Xi = Bi, . . ., Хт'^Вт, Xm+1=- ■ ■ = __д;^=0. Обратимся к следующей теореме. Теорема 2.2. Допустимое базисное решение Xi'=Bi(l^ = 1^ /п), Xj=0 (/=m+l, п) является оптимальным, если ковффициенты cj при свободных переменных Xj в выражении п 2 = г„+ 2 ^j^j неотрицательны. Доказательство. Обратим внимание на то, что в предлагаемой задаче нужно минимизировать z и что п 2-_г„= 2 О'-'^/- Если Cm+i^O, . . ., с„^0, то при любых Xj'^0 (/=/п+1, п) разность z—г„ неотрицательна, и ее минимум есть ноль. Следовательно, минимум z не будет меньше Zo (иначе найдется отрицательное значение разности Z—Zo, равное min г—г», а этого не должно быть). Для рассматриваемого базисного решения z=Zo, поэтому предыдущее утверждение можно сохранить, лишь положив min г== =Zo, что и доказывает теорему. D Из приведенного доказательства следует: любое решение системы (2.9), которому соответствует нулевая сумма Cm+iX^+i+. . .+с„х„ при Vcj^O; xj^O (/=/n+l, п), также будет оптимальным; допустимое оптимальное базисное решение окажется единственным, если Vcj->>0 (в этом случае свести к нулю разность Z—г, можно только при Xm+i=- . •=Хп=0)- Таким образом, получен признак оптимальности решения исходной задачи, однако сразу найти такое решение удается не всегда. Даже в тех случаях, когда задача представлена в допустимой канонической форме, очевидное базисное решение чаще всего оказывается промежуточным и должно быть заменено новым, позволяющим получить лучшее, т. е. более близкое к оптимальному значение г. Пусть базисьюе решение Xi=Si, ..., Хт=Вщ, Xm+i — - • . ~Хп=0 оказалось неоптимальным (среди коэффициентов Cj, j~m+l, п есть отрицательные). Чтобы перейти к другому допустимому решению, нужно сделать строго положительной (ввести в базис) какую-то из переменных х^+ь • • ., х„, обратив в нуль одну из Xi, . . ., х^- Имея в виду ограничение Wxj^O, можно сказать, что при таком переходе значение Z уменьшится только тогда, когда вводимая в базис 47
переменная будет иметь в выражении z отрицательный коэффициент. Обозначим через s тот номер / из {/п+1 п), для которого величина Cj отрицательна и максимальна по модулю, т. е. Cs=min {Cj-<;0}. Решив дать положительное приращение переменной л:з=0, представим базисные х^, . . ., х^ иге помощью (2.9) в виде Xi = Di ^i^X^ ^т^^'^т ^ms^s< г = г„ + сл (с.<0). (2.10) Поскольку Cs<;0, нужно как можно больше увеличивать Xs В стремлении минимизировать г, однако возрастание Xs будет продолжаться до тех пор, пока какая-то из переменных Xi, . . ., л'и не обратится в нуль, т. е. достигнет граничного значения. Это произойдет, если хотя бы один коэффициент Ais (i = l, т) в (2.10) положителен (по исходному условию среди Б,- нет отрицательных). Если же Л is >0 для нескольких номеров/из {1 т), то первой в нуль обратится та базисная переменная из (2.10), которой отвечает наименьшая величина отношения B^IAis (i=l, т). Таким образом, предельное значение, до которого можно увеличивать Xs, будет равно min {BilAis}. Необходимо подчеркнуть, что равенство нулю хотя бы одного Bi при соответствующем y4;s>0 (сЛучай вырожденного базисного решения) означает невозможность ввода Xs в базис с соблюдением требований Vxy^O. Указанный процесс перехода необходимо повторить, если новое базисное решение тоже окажется неоптимальным. Симплекс-алгоритм состоит в последовательных повторениях подобных операций до тех пор, пока не будет найдено либо оптимальное решение исходной задачи линейного программирования, либо множество допустимых ее решений, для которых |г|^-оо. Следует отметить, что рассмотренный процесс поиска оптимума закончится за конечное число шагов, если ни на одном из них не появляются вырожденные базисные решения. Методологию линейного программирования с успехом применяют в исследовании операций. Многие практические проблемы находят отражение в моделях исследуемого класса, позволяющих получать ценные рекомендации по экономному расходованию разнообразных ресурсов. Ниже дан пример, иллюстрирующий возможности изучаемой Теории. 48
§2.5. Модель раскроя материалов. Выбор наилучшего варианта Имеется некоторый материал в виде стандартных листов, которые нужно раскроить для получения не менее 80 шт. деталей типа 1 и не менее 40 шт. деталей типа 2. Известны четыре способа раскроя листа и каждый из них дает результат, указанный в табл. 2.1. Требуется так провести операцию изготовления деталей, чтобы обш,ий расход листов оказался минимальным. Таблица 2.1 Способы раскроя Результат 3 детали типа 1 и 1 деталь типа 2 1(1) и 6(2) 1(1) и 9(2) О (1) и 13 (2) Пусть Xj— количество листов, раскраиваемых /-м способом (/=1,4). Тогда целевую функцию (показатель эффективности исследуемой операции) можно представить как г=л:1+л:24-л:з-Ьл:4 (суммарный расход материала). Выбор значений Xj ограничен условиями Sxi-hUXi+x^^SO; Xi + -f 6x2+9x3-}-13^4^40 (обеспечивается зада'нное число деталей) и Xi, Хг, Хз, Xi^O (количество листов не бывает отрицательным). Таким образом формулируется задача линейного программирования: найти х^ при min 2 Xj I /=i ; Зх1 + ?Х2 + л:з>80; Xi + 6x2 +9^3+13^4 > 40; Wxj^O (/=174). (2.11) ЧИ Чтобы использовать симплекс-метод для решения поставленной зада- необходимо привести систему (2.11) к стандартному виду С Зх1-{-2х2+Хз—Хъ = 80; \ л:1 + 6д:2 + 9д:з4-13д:4 —л:в = 40; (2.12) Очевидное базисное решение Xi=...=x^—0, х^~—80, х^=—40 уравнений (2.12) оказывается недопустимым, так как содержит отрицательные компоненты х^, х^. Следовательно, систему (2.12) нужно рас- «^матривать как стандартную, не отличающуюся в принципе от (2.2)j и решать задачу в два этапа, 49
Этап 1. Переходя формально от условий (2.12) к условиям Xi + 6xi + 9xa-\-l3xi--Xi+xs==-40; (2.13); ул:у>0 (/=rj), ставим вспомогательную задачу: найти Xi, ..., x's-'-min {<i)=X';-\-Xg} при ограничениях (2.13). Здесь легко отыскивается исходное допустимое базисное решение л'7=80, л'8=40, Xi=.-.=Xi=0, после чего начинается реализация симплекс-алгоритма. С помощью (2.13) получаем выражения базисных л-7, Xg через свободные Xi, ..., Хе, и тогда (л^Х'!-\-Хй=\20—4л'1—8x2—Ю^з—^Зх^-{-Хъ-\^х^. Присутствие отрицательных коэффициентов указывает на неоптимальность рассматриваемого исходного решения. Переменную Xi, имеющую в выражении со наибольший по модулю отрицательный коэффициент «—13», целесообразно ввести в бавис с тем, чтобы перейти к новому решению. Для этого анализируются равенства Х7= 80, л'8=40—13x4, получаемые из (2.13) при отброшенных xi, х^,, Хз, ^5> Ч- Очевидно, х^ можно 5(величнвать до значения 40/13, после чего появится новое базисное решение л-7=80, л-4=40/13, Xi=X2=X3=x,,=Xi=Xs=Q. Для него w=x-,-\- 4^X8=80 (на предыдущем шаге w было равно 120). Выражение ш через свободные переменные нового решения имеет вид w=xi-\-Xi=9G—Ъхх—2л'2—Л'з+^а+^в и говорит о том, что, во-первых, минимум W опять не достигнут (есть отрицательные коэффициенты) и, во-вторых, в базис нужно ввести х^. Обращаясь к (2.13), находим х,=80—Ъхх, л'4=(40—х-^)1\Ъ (остальные свободные переменные отброшены, так как они сохраняют нулевые значения). Очевидно, Хх может расти до 80/3, и тогда х^ обращается в О, а очевидное базисное решение есть л-1=80/3, л-4=40/39, л-2=л-з=^5=^б=*7=-^8=0. Оно оказывается оптимальным (для вспомогательной задачи), поскольку выражение о) через свободные переменные 'w=x-!-tx^ не содержит отрицательных коэффициентов. Таким образом, достигнут минимум w, равный О, переменные Хл *8 перешли в разряд свободных и могут быть отброшены, а решение д^1 = 80/3; л:4 = 40/39; Х2=^хз = Хь = х^ = 0 (2.14) допустимо и для системы (2.12). Этап 2. Имея допустимое базисное решение системы (2.12), найденное в результате минимизации w на этапе 1, прежде всего, оценим его оптимальность для исходной задачи с целевой функцией z. Тем самым начинается повторное использование симплекс-алгоритма, по уже в новых условиях. С помощью (2.12) нетрудно найти Xi= (9G—2х^—Хз-\-х^)!?> и Xi= = {¥)—х1--&Х2—9хз+х^\1\Ъ, а затем z=x-i-fл-2+Жз+*4=(40-27—3*2+ -)-12л-5+Зл-б)/39. Здесь переменная х^, имеет отрицательный коэффициент^ следовательно, решение (2.14) неоптимально, и его нужно заменить. В базис может быть введена только переменная х^, причем уравнениями, связывающими х^, с х^, Xi, являются л'1=(80—2л-2)/3, л'4=(40— — 16л'2)/39[л'з, ^5! ^6 отброшены, так как они сохраняют свои нулевые эначения, см. (2.12)]. Ясно, что л-2 может увеличиваться здесь до 5/2 и новым базисным решением для (2.12) оказывается xi = 25; л:2 = 5/2; хв = Xi = Хъ = х^ = 0. (2.15) Выражение г через свободные переменные есть 2=(440+2хз+Зл-4+5л-в-|- -t-Jfe)/l6, что говорит об оптимальности решения (2.15), 50
Таким образом, наилучший вариант действий состоит в применении только первого и второго способов раскроя, причем первым способом нужно кроить 25 листов, а вторым— 2 5 листа, и тогда наименьший расход материала составит 27,5 листов. Количество получаемых при этом деталей будет равно 80 (типа 1) и 40 (типа 2). Рассмотренная модель является достаточно простой, хорошо показывает возможности математики и вместе с тем представляет практический интерес. Многие задачи линейного программирования с гораздо большим числом переменных и ограничений решаются сегодня вычислительными машинами, программное обеспечение которых позволяет автоматизировать громоздкие расчеты оптимальных планов. § 2.6. Двойственность в линейном программировании. Проблема зацикливания Рассмотрим следующие две задачи с ограничениями-неравенствами: £=CX-^min при АХ<В, Х>0; (2.16) г = ВГ->тах при А-^Г>С, Г>0. (2.17) Они имеют ряд особенностей: матрица коэффициентов в (2.17) получена транспонированием матрицы А условий '(2.16); неравенства АХ^В и A'^Y'^C имеют противоположные знаки; при переходе от (2.16) к (2.17) В и С меняются ролями; - смысл экстремума г противоположен смыслу экстремума г. Задачи, обладающие перечисленными особенностями; называют взаимно двойственными. Их изучение оправдано тем, что в практике различных исследований иногда легче решать двойственную задачу, чем прямую. Допустимость перехода от прямой задачи к двойственной (и наоборот) утверждается теоремой двойственности, приводимой здесь без доказательства: если существуют решения систем (2.16) и {2.17), то среди них есть оптимальные, причем такие, что minz=fflaxz. Удобство формального перехода от (2.16) к (2.17) сохраняется лишь тогда, когда задачи даны в нестандартной форме, поэтому важно рассмотреть случай стандартных условий АХ=В, Х^О. Здесь каждая строка—ограничение прямой задачи может быть задана как совокупность двух 61
строк ' , ^. или 1 ^ , V a,-iXi + ... + а,-л < bi; { —a^x^ — ... — а,-,л;„ > —6;, после чего двойственные условия принимают вид ''апУх — йпУз+ «21^3—«21^4+ •• • +«т1У2я-1—««iy-2,«<Ci; £^1иУ1—СЦпУ^-Г^тУи — ^2нУ4 + • • • +«тпУ2т-1—<^тпУ2т^^п' Ju • • •- У2т>0- ^2.18) Число переменных у в (2.18) возросло до 2т, что устраняется несложными преобразованиями системы (2.18), где каждая разность (г/i—у г).- • •. {Угт-i—У 2т) рассматривается в качестве новой переменной у с соответствующим индексом, не имеющей ограничения на знак. Таким образом, для исследуемого случая двойственные задачи формулируются как 2 = CA:-^min при АА: = В; Х^О; 7=6/-^ max при A''F<C. Поиск оптимальных решений в линейном программировании иногда осложняется конкретными особенностями той или иной задачи. Одним из основных осложнений является так называемое зацикливание. Оно возникает в тех случаях, когда на очередном шаге приближения к оптимуму встречается вырожденное базисное решение, что затрудняет переход к новому допустимому базисному решению. Подобные ситуации могут повторяться с определенной частотой, зависящей от числа нулевых переменных, попавших в базис. Зацикливание встречается довольно редко и в принципе преодолимо. В качестве практических рекомендаций здесь называют обычно отказ от ввода в базис той д;,, для которой Cs=m\n{Cj<S>} (см. §2.4), случайный выбор новой крайней точки множества U с целью продолжения процесса поиска экстремума в облегченных условиях, использование особенностей исследуемой задачи для предсказания структуры оптимальных решений. Линейное программирование — один из наиболее изученных разделов математического программирования. Принципиальных трудностей решения линейных задач нет. Часто возникают технические трудности, связанные с тем, что многие практические задачи содержат большое количе, ство переменных и ограничений, доходящее до нескольких 52
тысяч й любые их преобразования становятся громоздкими сложными. В ряде случаев с ними не справляются современные ЭВМ. Другой важный момент, характеризующий состояние теории и практики линейного программирования, связан с необходимостью вносить в общую задачу такие дополнительные ограничения, которые переводят ее в совершенно новое качество. Речь идет прежде всего о требованиях це- лочисленности переменных Xj{j=l, п). Подобные требования появляются тогда, когда оперирующая сторона и входящие в ее состав исследователи сталкиваются с проблемами распределения «штучного» ресурса, не допускающего деления на произвольные части. Примером может служить план централизованного распределения уникальных дорогостоящих установок между потребителями, составляемый с учетом их запросов. Все это требует разработки специальных методов поиска оптимальных целочисленных решений, причем желательно, чтобы эти методы были хорошо обоснованы и в полной мере использовали достижения существующей теории. § 2.7. Целочисленные решения. Метод Гомори Задачи, сформулированные в терминах линейного программирования и содержащие требование «все или некоторые Xj— целые числа», играют важную роль в исследованиях различных прикладных проблем. В формальном плане это приводит к пересмотру некоторых геометрических представлений, развитых в § 2.2. Так, область определения целочисленной задачи отождествляется с множеством дискретных точек — узлов целочисленной решетки (если все X линий, плоскостей, гиперплоскостей (если целочисленны лишь отдельные Xj) (рис. 2.4, а, б). Соответствующие коррективы вносятся и в методологию поиска оптимальных решений, причем серьезные трудности вызывает разработка теоретически обоснованных методов получения экстремальных X*, г*. С этой точки зрения представляет интерес метод Гомори, который позволяет решать как частично, Так и полностью целочисленные задачи линейного програм- °^L< 1^4 *'' ^-f- 1) Рис. 2.4 ] целочисленны) или с множеством непересекающихся 53
мирования; применяется и в тех случаях, когда требование; целочисленности распространено и на величину г; дает ре4 шение, вообще говоря, за конечное число шагов, т. еу< предлагает определенную вычислительную схему (поэтомут часто используется термин «алгоритм Гомори»). ( Обратимся к задаче: найти х^, ..., л;„-^т1п{г = п \ п = 2 ^Л-' при 2 aijXj = bi (i = I, m); Vxj > 0 (/ = 1, n), /=i J /=i 2 и некоторые Xj— целые числа. Множество номеров указанных Xj далее обозначается «/», так что принадлежность отдельно взятого / множеству / означает требование целочисленности соответствующей переменной Xj. Первый шаг алгоритма Гомори предусматривает отбрасывание условия «г, X} О € /) — целые числа» и решение получаемой «обычной» задачи линейного программирования. В результате отыскивается каноническая система, например, z — z„-]-CiXi -f-... +с„_„л;„_^, указывающая оптимальное базисное решение (2.19) hi— "it •••! ^п — "т> ^1 О, (2.20> причем V5j^0, VCj-^0 (/=1, m; /=1, п—т). Для удобства дальнейших исследований вводится параметрическая форма представления компонент (2.20), получаемая из (2.19) при Xj^aHj (/=1, П—т), Xn_m+i = Bi— II-т п-т = 2 ^ij^j (i = l,m), г = г„4 2 ^уМ/- ;= 1 /=1 Упорядочение записи выражений всех переменных достигается здесь за счет единых обозначений коэффициентов при Mj и величин 5,-, так что (2.19) переходит в -^1 = «01 + «iiMi + • • • + «Ml «м; Я, = «0,, -bai„Mi +-•••+ ссмп^м; z = Zo + aioCOi+ . .. -f-aMu«M; М = п—т. (2.21) 54
• Г ^^ У\ / V Если при Va)y=0 система (2.21) дает целые значения Tjj х- (/ € /)> то исходные условия рассматриваемой целочис-, ленной задачи удовлетворяются. Если же этого нет (какие- то из «оу. / € I и, возможно, Zo оказались дробными в (2.21)); то необходимо продолжить поиск X*, z*, сделав второй шаг решения. Пусть либо Zo, либо «oj (/ € /) есть дробные числа, т. е. равенства (2.21) определяют в области U стандартной задачи крайнюю точку X, которая не может быть принята в качестве X*. Возникает вопрос: нельзя ли так видоизменить область и, чтобы отбросить оказавшуюся ненужной точку X, но сохранить все точки ХфХ, претендующие на роль X*? Ясно, что отсечь X можно было бы с помощью дополнительного линейного ограничения, которому не удовлетворяют координаты X. На рис. 2.5 показана область U и некоторая гиперплоскость /—/, определяемая дополнительным ограничением. Заштрихованная часть U отбрасывается, появляются новые крайние точки 1 и 2. Отсечением точки X завершается второй шаг алгоритма Гомори. Третий шаг предусматривает возвращение к задаче с отброшенными условиями целочисленности z, Xj(j^I), но с расширенной системой ограничений, в которую включено теперь то, что получено на втором шаге. Снова решают задачу линейного программирования в стандартной постановке и определяют новую точку X (такой точкой может стать, например, точка 1, рис. 2.5). Если найденная таким образом X снова окажется ненужной, то формируется новое (второе по счету) отсекающее ограничение, т. е. проводится четвертый шаг решения, повторяющий полностью второй шаг. Подобные операции продолжают до тех пор, пока очередная точка X не удовлетворит всем условиям исходной целочисленной задачи. Из приведенного общего описания метода Гомори следует, что его отличительной особенностью являются периодические изменения конфигурации первоначальной области и с целью ее сужения. Именно в этом заключены основные трудности, и здесь оказывается удобным представление решений (2.20) в виде (2.21). Чтобы перейти к соответствующим формальным выклаД' кам, введем следующие понятия и обозначения: ip] — наи- Рис. 2.5
большее целое число, не превосходящее р; |р = р—[р] ^- положительная собственная дробная часть числа р; _ I О при |р = 0; ^Р^| 1-|р при |р>0 — дополнение |р (или положительная дробная часть числа —р). Принципы формирования дополнительных ограничений в методе Гомори основываются на результатах трех теорем (теоремы Гомори). Теорема 2.3. Если Xj— переменная, на которую распространяется требование целочисленности, м^ (s=l, М)— параметры, связанные с Xj соотношением Xy=aoj+«ijWi+ + . . .+ajvijWA/. и ^<^sj^^ (s=l. Щ, то линейное неравенство 1 < 1а +ai/ui + Ьам/а>м (2.22) выполняется для всех м^. дающих целочисленное Xj, и не выполняется для базисного решения (2.20), получаемого из {2.21) при всех со, равных 0. Доказательство. Вследствие неотрицательности (по предположению) величин «sj и ^s (5=1, М) минимальное значение Xj не будет меньше а^/. т. е. min xj^ ^a„j. Отсюда следует Xj^[a„j] + 1, поскольку х;—целое число. Вычитая это неравенство из выражения Xj, приведенного в условии теоремы, приходим к соотношению (2.22), что и доказывает первую часть ее утверждения. Доказательство второй части очевидно (!« .^1 по определению), П Полученный результат легко преобразуется в дополнительное ограничение, используемое в методе Гомори. Если от условия Xj^[ao;] + l перейти к х,—Xj=laoj] + l (для этого переменная Xj должна быть неотрицательной и целочисленной) и вычесть последнее равенство из выражений Xj, то Xj = —I«j^. + «lyCui -f h «муМм. (2.23) Выбрав x-j в качестве новой переменной и дополнив систему (2.21) уравнением (2.23), приходим к следующему: при обращении в нуль всех со (этим определяется точка X) появится базисное решениеXi=aoi. . • ■, x„=aoni^j=—la ■, 56
в котором компонента Xj отрицательна, так как всегда ^«^ .> ;>0. Такое решение недопустимо, следовательно, усло.ие (2.23) не удовлетворяется в точке X, хотя в других точках, для которых рассматриваемая координата Xj принимает целочисленные значения, оно выполнено. Это следует из равенства Xj=Xj—[«оу]—1, дающего целые неотрицательные значения Xj при любом Xy^[aoy] + l. Таким образом, уравнение (2.23) можно использовать в системе (2.21) с целью отсечения X. Известным недостатком, ограничивающим область применения теоремы 2.3, является введенное выше требование a^j^Q (s= 1, М; j £ I). Чтобы избежать связанных с этим неудобств, обратимся к следующей теореме. Теорема 2.4. Если х,— переменная, на которую распространяется требование целочисленности и Ms (s=/, М) — целочисленные неотрицательные параметры, такие , что м Xj = ai^j-\-^a^jbi^, то линейное неравенство 1^1»^ .+ + |а .<й1+. . .+|а„.<»м выполняется для всех cOs. даюш,их целое значение Xj, и не выполняется для базисного решения (2.20), получаемого из [2.21) при нулевых м. Доказательство теоремы (2.4) достаточно простое (см., например, [11]). Дополнительная переменная Xj определяется здесь формулой „ м ^У=-!«„,+21а,Л- (2.24) 5=1 ^ Включение равенства (2.24) в систему (2.21) позволяет отбросить X, но не затрагивает точек, для которых координата Xj остается целочисленной. Теорема 2.4 тоже имеет ограниченную область применения из-за условия «все cOg— целые числа», но вместе с теоремой 2.3 помогает решать многие задачи. Рассмотрим общий случай, когда переменные cOs могут быть дробными и целочисленными, а коэффициенты a^j при дробных Ms не имеют ограничений на знак. Для упрощения формулировок введем обозначения: Si— множество номеров s, для которых м^— целые и Sa— множество номеров s, для которых м^^ дробные и as;>0; 67
5з— множество номеров s, для которых ы^— целые и Si— множество номеров s, для которых со^— дробньй и asj<0. Теорема 2.5. Если Xj— переменная, на которую распространяется требование целочисленности, и ы^— пара- м метры, связанные с Xj соотношением Xj = «оу + 2 o's/'^i» s = l то линейное неравенство 1 < (1- 1а,,-ю^ + X а.ую^) ■ 1оГ ^ + ( X la „.CO, —S a„.0), УТГ, выполняется для всех со^, даюищх целочисленное Xj, и не выполняется для базисного решения (2.20), получаемого из {2.21) при (us=0. Доказательство теоремы есть, например, в [29]. Необходимо подчеркнуть, что переменная Xj, определяемая здесь как 4-=-1+(£+£)-тг+(2-Е)-г- <"=' не обладает свойством целочисленности в отличие от (2.23) и (2.24). Следовательно, равенство (2.25), введенное в систему (2.21), не может использоваться для формирования новых отсекающих ограничений. Условия теорем требуют, чтобы каждое такое ограничение получилось из какой-либо одной строки (2.21), содержащей в левой части целочислен- ,ную Xj или Xj. Таким образом, всегда имеет смысл обращаться к теоремам 2.3 и 2.4, если это допустимо по ходу решения конкретной задачи. Дополнительные пояснения, относящиеся к технике использования алгоритма Гомори, дает приводимая ниже модель распределения неделимого ресурса. § 2.8. Модель планирования с учетом транспортных ограничений Транспортные факторы могут существенно влиять на йринимаемые плановые решения. Одна из таких ситуаций (в форме упрощенной модели) заключается в следующем. 58
Решено создать станцию наблюдения и связи в труднодоступном районе, оборудованную установками двух ти- jjoB — 1 и 2. С этой целью необходимо провести сложную операцию, состоящую в производстве установок, их транспортировке и монтаже. Производство и монтаж осуществляются некоторым промышленным объединением (оперирующая сторона), причем на это отпущены определенные денежные средства (фонды), указанные в табл. 2.2 в условных Таблица 2.2 Тип установки 1 2 Стоимость работ (в расчете на одну установку) производство 6 4 монтаж 2 3 перевозка 3 16 Отпущенные средства (фонды) 13 I 9 I ? единицах (там же даны стоимости проводимых работ). Транспорт приходится арендовать, и известны лишь цены перевозок, а общие затраты предстоит определить. Из экономических соображений принимается, что все производимые установки должны быть доставлены к месту их использования и приведены в рабочее состояние. Если Xi— количество установок типа 1, а Хг— количество установок типа 2, то полная стоимость их транспортировки составит 3x1+16x2- Она должна включать в себя, во-первых, плату за аренду некоторого количества z транспортных средств (платформ, большегрузных автомобилей, самолетов и т. п.) и, во-вторых, накладные расходы, не зависящие от объема перевозок. Удельная арендная плата установлена в размере 12 единиц, а накладные расходы — 7 единиц. Следовательно, уравнение баланса есть 12z+7= = 3xi+16x2 (предполагается использовать транспорт одного вида). Учитывая трудности доставки грузов, оперирующая сторона стремится так планировать производство установок, чтобы создание станции не повлекло за собой слишком больших требований к транспортным организациям, возможности которых так или иначе ограничены. Возникает задача: найти Xi, Хг, доставляющие минимум функции 2 = —-7/12+Х1/4 + 4Х2/З при условиях 6Xi + 4X2<13l 2x1+8x2^9 (перерасход фондов запрещен); Xi, Хг, z — це-
лые неотрицательные числа. Сюда можно было бы добавит"! условие Xi+Xa^l, исключающее случай Xi=X2=0 (опе-- рирующая сторона бездействует), однако в этом нет необходимости, так как при Xi=X2=0 функция г принимает значение — 7/12, противоречащее требованию «г — целое число». Таким образом, окончательная формулировка задачи: найти Xi, . . ., X4-^min {г=—7/12+Xi/4+4x2/3} при 2xi+ +4x2/3+X3=13/3; A:i/2+3x2/4-bx4=9/4; Xj, X2, Хз, X4, z — целые неотрицательные числа. Вспомогательные переменные Хз. Х4 позволяют перейти к ограничениям-равенствам, и по своему смыслу должны быть целочисленными. На первом шаге решения поставленной задачи отбрасываются требования целочисленности л:у(/= 1,4) и г. Очевидно, оптимальное решение стандартной задачи линейного программирования можно получить сразу — л:1=0, л:2=0, л:з=13/3, ^4=9/4, г=—7/12, но его нельзя использовать, поскольку оказались нарушенными первоначальные условия целочисленности г, д-з, х^^. Следовательно, положив a:i=u)i, ^2=0)2, нужно анализировать систему [хх = (И\\ л:2 = й)2; л:з=:13/3 — 2u)i—4й)2/3; I ^4 = 9/4 —o)i/2 —Зй)2/4; (2.26) iz = -7/i2 +0)1/4 + 4(02/3, представляющую собой интерпретацию исходных равенств и дающую числовые значения компонент Xj при 0)1=0)2=0. Дополнительное ограничение для исследуемой целочисленной задачи удобно формировать, выбирая последнюю строку (2.26) и применяя теорему 2.3. Здесь «0^= =Zo=—7/12 и \^ =7/12, поэтому новая переменная есть 'х^=—7/124- -1-0)1/4+40)2/3, и расширенная система ограничений принимает вид I 2аг1 + 4л-2/3 + агз= 13/3; Ari/2 +3^2/4+_Л4_= 9/4; \аг1/4 + 4аг2/3-аг5 = 7/12; VA^ySsO (/=1,5) ^' ' Ясно, что ^1, Хг не могут оставаться свободными (при Хх^=х^=^ величина Xj отрицательна), и их нужно заменить. Для этого обратимся к задаче: найти Xj, ...,л:5-^гп1п{г=—7/12+a:i/4+4a:2/3} при ограничениях (2.27). Ее решением (получаемым, например, с помощью симплекс-метода) является ^1=45/21, л:2=1/28, x^=Q, ^4= 129/112, х^,=й или (в параметрическом представлении) |Г1 = 45/21-4о)з/7 —4о)5/7; ^2= 1/28+Зо)з/28 +60)5/7; ,2.28) 1.?з = о)з; А-4= 129/112 + 23о)з/112 —5о)5/15; ^5 = 2 = 0)5. Полезно заметить, что здесь z=0. Отбрасывание очередной X может сопровождаться увеличением z, и совсем не исключено, что оптимальное ^)ешение исходной целочисленной задачи окажется хуже (в смысле достижимой величины г), чем решения промежуточных задач. В строках системы (2.28) опять присутствуют дробные свободные слагаемые, и нужно вводить новое дополнительное ограничение, Выбрав 60
вторую строку с «02=1/28 и |„ =27/28, получаем Хв=—27/28+Зй)з/ 28+6(05/7. Отсюда следует формулировка третьей по счету линейной задачи: найти Xi Xe-^min{z=X!,} при I 2а-1 + 4а-2/3 + а-з=13/3; Xi/2 + 3a-2/4 + a-4 = 9/4; "\ a-i/4 + 4a-2/3-a-5 = 7/12; Зл-з/28 + бА-в/7-д-в = 27/28; VA-ySsO (П?). Решив ее, получаем, х^—О, Х2=\, Xa=i, х^=^12, л:5=3/4, Хв=0 или ^1=«1, х"2=1+й)в, х^=3—2u)i—4й)в/3, Х4=3/2—u)i/2—Зй)в/4, ;5=:3/4+u)i/4+4u)e/3,'*-e=u)e,'z=3/4+u)i/4+4u)(i/3. Этот результат не удовлетворяет требованиям целочисленности всех Xj (/=1, 6), и в качестве еще одного ограничения, порождаемого строкой х-а, принимается х-,= — l/4+u)i/4+4u)e/3. Очередная линейная задача принимает вид: найти x-i x-,^>-mm{z= х^} при ( 2xi + 4л:2/3 + лгз = 13/3; Xi/2 + Зл-2/4 + х^ = 9/4; ] А-1/4 + 4А-2/3—л:5 = 7/12; Зл-з/28 + 6^5/7— х^ = 27/28; Ui/4 + 4A-e/3-A-,= l/4; VA-ySsO (/=1,7). Она имеет решение Xi=l, ^2=1, Xs~U ^•4=1, x^=l, х^=0, x-;=Q, г=1, которое полностью целочисленно и должно быть признано оптимальным с точки зрения требований исходной задачи. Таким образом, х\=\, х1=\, т. е. оперирующая сторона должна производить по одной установке каждого типа, и тогда ей достаточно арендовать одну транспортную еди"^ ницу, затрачивая на это сумму, равную 19. Задачи целочисленного линейного программирования относятся, строго говоря, к классу нелинейных (и трудноре- шаемых), хотя внешне они схожи с линейными задачами. Наряду с рассмотренными постановками оптимизационных проблем существуют и другие, причем их разнообразие достаточно велико. Глава 3. МЕТОДЫ НЕЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Продолжая изучение методов математического программирования, обратим внимание на ряд обстоятельств, способствующих разрешимости оптимизационных задач: наличие только глобального экстремума целевой функции; выпуклость области определения задачи; гладкость (диф- ференцируемость) функций f{X), gi{X). Перечисленными свойствами обладают линейные задачи (см. гл. 2), но большинству нелинейных задач присущи такие особенности, которые затрудняют (а иногда делают невозможными) исследования общего характера. В этих условиях большое значение приобретают результаты, содержащие обоснованные и пригодные для практики рекомендации. 61
§3.1. классические условия экстремума. Метод множителей Лагранжа Проблема отыскания условного экстремума скалярной функции многих переменных была изучена еще Лагран- жем, предложившим так называемый метод множителей для задач с ограничениями^—равенствами giiX)'=bi, i= >=1, m. Интересный сам по себе, этот метод позволил получить в более позднее время ряд обобщений, которые привели к разработке алгоритмов решения задач с неклассическими условиями. Идею метода множителей Лагранжа удобно пояснить на следующем примере. Дана задача с целевой функцией z=f{xi, Ха) и единственным ограничением giXi, X2)=b (требования неотрицательности и целочислен- ности Xi, Ха отсутствуют). Рассматриваемые f{xi, Х2) и gixi, Х2) непрерывно дифференцируемы, свойства g(xi, Xj) таковы, что из равенства g(Xi, Xi)=b следует X2=((i{Xi) (т.е. Хг выражается в явном виде через Xi). Требуется получить необходимые условия, которым должна удовлетворять точка локального экстремума г. Представляя Ха как X2=9(xi), приходим к равенству 2=f[xi, 9(Xi)]=/t(xi). Ограничение gr(xi, Х2)=Ь говорит о том, что из всех точек плоскости Xi, Ха интерес представляют лишь те, которые лежат на линии, определяемой уравнением X2=9(xi) (рис. 3.1). Если в какой-либо из этих точек 2 достигает локального экстремума, то и h{xi) достигает экстремума h", причем он не является условным, так как сам способ построения функции h{xi) предусматривает |Учет исходного ограничения и никаких дополнительных требований к Xi предъявлять не нужно. Следовательно, экстремальная точка х? (первая координата точки Х") находится из уравнения —^^^Lo = 0. Учитывая, что йц) _ dg/dxi dxi ' Зф dxx " dxx dgldx^ ' М..) = П..ф1;^=^+^-^и получаем df dg/dxi "1 ^Q &2' dgldxi J x' 62
df/dx2 л Обозначив отношение ^ ^^ через л и предположив dgldXrj^O, приводим предыдущее равенство к виду dfldxi-^ . }Sgldxi=0. Поскольку из определения Я следует и dfldx^— —X3g/5x2=0, искомые необходимые условия существования экстремума могут быть представлены как df/dxi--Mg/dx, = 0; df/dx^—Kdg/dx^ = 0; gix^, х,) —Ь = 0. (3.1) Совместное решение уравнений (3.1) относительно xt, л'а, Я позволяет найти все точки, в которых ожидается локальный экстремум функции г. Главное состоит здесь в том, что систему (3.1) можно получить более коротким и чисто формальным путем. Для этого достаточно составить (по данным исходной задачи) сумму/(xi, Ха)+Я[Ь—g{Xi,X2)]=' =Ф(л:1, Хг, к), а затем приравнять нулю частные производные M)/dxi, дФ/дх^, дФ/дК, считая Xj, Ха, к независимыми переменными. Функция Ф(х1, Хг, Ц называется функцией Лагранжа, множитель X — множителем Лагранжа. Суть метода множителей заключается именно в отыскании решений системы (3.1) с последующей проверкой достаточных условий экстремума во всех найденных точках Х", сравнении получаемых результатов и выборе наилучшего из них, чем и определяются глобально оптимальные X*, z*. Существует обобщение рассмотренных условий (3.1) на случай произвольного числа переменных п и ограничений-равенств т{т<.п). Здесь функция Лагранжа есть т Ф(Х, Л) = /(Х)+ 2 Ы^—ёькЩ- Символами X и Л обо- (=1 значены векторы (xj х„) и {К Х^). Необходимые условия локального экстремума имеют вид т дф (X, Л) _ df (X) у ^ dgi (X) _ Q. dXj dxj ^ ' dxj ' ^^^ = Ь,-к-(Х)=0. (3.2) Таким образом, для отыскания точек Х" приходится решать систему т+п уравнений (3.2), причем необязательно требовать, чтобы каждое ее решение доставляло условный экстремум Z. Но каждая точка, в которой такой экстремум достигается, должна отвечать условиям (3.2). Преимущество рассматриваемого метода в том, что можно не учитывать взаимную зависимость переменных (он сводит задачу условной оптимизации к задаче безусловной 63
оптимизации). Недостатком же является необходимость решения громоздких уравнений (3.2), что далеко не всегда ^удается. К тому же, встречаются случаи, когда экстремальные точки X заведомо существуют, но система (3.1) или (3.2) неразрешим_а. Например, в задаче об отыскании Xi, х^, доставляющих минимум 2==Xi при Xi-{-xl=0, область определения содержит единственную точку ^=(0,0), которая и является экстремальной. Если попытаться найти ее из уравнений ЭФ/дл:1=1—2^X1=0; ЭФ/дл;2=—2Ь;2=0; ЭФ/дХ= = ^—Xi—Х2 =0, то сделать это не удастся. Следовательно, нужны какие-то дополнительные средства, устраняющие возникшее осложнение и позволяющие применять метод более широко. Оказывается достаточным задавать функцию т Лагранжа в тле Ф{Х, A) = IJ (Х)+^ li[b!—gi(X)], 1= 1 и тогда формальные трудности анализа равенств (3.1), (3.2) уменьшаются, причем обращение Хо в О свидетельствует о вырожденности ограничений задачи. Ниже приведена модель выбора конструктивных параметров, иллюстрирующая возможности метода. Разрабатывается конструкция вагонетки, предназначенной для перевозки сыпучих грузов по тоннелям с круглым сечением. Ее конструктивными параметрами являются длина, ширина и высота, а основной характеристикой — рабочий объем У. Ставится задача выбора таких значений параметров, которые обеспечат максимум V при условии, что зазоры между стенками тоннеля и вагонеткой нигде не будут меньше за- ^"'^- '^-^ данного S (это условие выполняется, если контуры вагонетки вписываются в круг радиуса г=р—S, где р — радиус тоннеля, рис. 3.2). Ясно, что при постоянной площади z поперечного сечения вагонетки ее объем пропорционален длине, поэтому длину можно выбирать из любых соображений, даже не связанных с рассматриваемой задачей. Следовательно, целевой функцией нужно считать г. С формальной точки зрения все указанные требования сводятся к следующему: найти длину сторон прямоугольника максимальной площади, вписанного в круг радиуса г. Если А'ь Х2— координаты вершины / (рис. 3.2), то г=АхуХ^ и Xi-fx|=r^ Производная dgldx2=2x2 отлична от нуля, и можно применять метод множителей Лагранжа. 64
функция Лагранжа в данном случае имеет вид Ф (xi, х^, Х^, Х}= '=4XoXiX2-{-X(r^—xi—xl). Приравнивая нулю ее производные, получим 4X(iX_2—2Ял:1=0; ^iX^Xi—2Ял:2=0; г^—xl—х1=0, откуда следует xi—r/Y^ 2; X2 = riy 2; XS==1; Я'' = 2. Таким образом, поперечное сечение вагонетки должно представлять собой квадрат со стороной Рассмотренная модель может учитывать и такие особенности проектируемой конструкции, как размеры ходовой части, что достигается, например, увеличением б или дополнительным ограничением величины Хг и т. д. Полезно заметить, что решение задачи представлено в виде набора значений х\, xl, 1,1, IP (проверка достаточных условий экстремума подтверждает их оптимальность и в абсолютном смысле). Здесь 'kl^Q, и функцию Лагранжа можно было бы с самого начала задать как AxiXi-\-'k (г^—xl— —xl). Далее, г°=2г^ и К''=дг''/дг^, в связи с чем возникает вопрос; является ли указанное соотношение между г" и Х" случайным или в нем отражена некая закономерность? Оказывается, множители Х?, вошедшие в оптимальные решения тех или иных задач, связаны с соответствуюш,ими г° общим соотношением Х°=дг7д&г. Оно выполняется всегда и характеризует реакцию найденного z на возможные изменения того bt, которое входит в правую часть ограничения gi{X)=bi, совпадающего по номеру с рассматриваемым Х°. Следовательно, зная конкретные значения Х", . . ., Vln, можно определить степень влияния имеющихся ограничений на получаемое г". В частности, равенство нулю какого-либо X? указывает на несущественность соответствующего ограничения gi(X)=bi, которое без ущерба для задачи изымается из рассмотрения. В приведенной выше модели было получено Х°=2, поэтому можно утверждать, что изменение г^ в некоторое число раз вызовет изменение г" в удвоенное число раз. В дальнейшем ссылки на (3.2) будут даваться в предположении, что множитель К введен в Ф {X, Л). Разработанный применительно к классическим постановкам задач метод множителей Лагранжа, как выяснилось позже, допускает обобщения и на случай ограничений-неравенств. Это позволяет использовать его модификации в исследованиях неклассических задач. 3 Дегтярев Ю. И.
13.2. Проблема обобщения метода множителей. Теорема Куна — Танкера Рассмотрим вопросы, относящиеся к использованию понятий, введенных в § 3.1, для анализа более широкого круга оптимизационных задач, содержащих требования Vxy^O, Пусть в дополнение к основным условиям gi (X)=bi (г = 1, m) в задачу введены, например, требования неотрицательности xj, а сама она формулируется так: найти х„ ...,x„-^max{z=f(Xi, ■ ■ ■, x„)}j^iix„ ...,xj = = foi(i=l,m); VX/.>0 (/=l,n). (3.3) Очевидно, экстремум целевой функции в этом случае может быть достигнут либо во внутренних точках области, заданной неравенствами Xj^O (/=1, п), либо на ее границах. Для внутренних точек Х" (их координаты xj строго положительны) выполняются равенства (3.2). Следовательно, первым шагом должно быть получение Х" на основе (3.2). Далее необходимо обследовать границы с целью отыскания Х" на них, для чего в исходную задачу вводятся различные комбинации нулевых Xj. Сначала решаются (методом множителей) п задач с п—1 переменной (их получают поочередными подстановками х^—О, ^2=0, . . ., х„=0 в выражения f и gi, i=l, т), затем С1 задач с п—2 переменными (в них присутствуют подстановки Xy=0, Xs=0, /=1. п; 5=1, п, }Ф8) и т. д. Продолжать этот процесс можно до тех пор, пока число ограничений исходной задачи (3.3) остается меньше числа переменных, которым разрешается принимать положительные значения. Таким образом, общее количество решаемых задач, вытекающих из (3.3), составит П+С1+С1+. . .Ч-СГ"*. Если требование неотрицательности распространяется на какую-то часть переменных Xj (j=\, п), то «нулевые» подстановки формируются только из этих Xj. После того, как указанные действия будут проведены, т. е. будет закончен поиск граничных Х", нужно вычислить значения г во всех найденных точках Х", сравнить эти значения между собой и выбрать среди них наибольшее. Из сказанного следует, что метод множителей Лагранжа применим в рассматриваемых ситуациях, однако заметно возрастают трудности вычислений. Обратимся теперь к другому случаю — требование Vjf^^O (/=1, п) снято, но первые v условий (3.3) принимают 66
вид неравенств, т. е. ( gi(Xi, ..., х„Х bi {i = T7m); ■ \ giixi, ■■■, x„)^bt {i = u+l, v); (3.4) [ giiX^, .... A-J = /7; {i = v+l, m). Вводя вспомогательные переменные, можно перейти к эквивалентной форме записи условий (3.4): { gi{Xi, ..., A-J + х„,- = bi {i = ТТйу, giixi, ■■■, x„)—x^i = bi (t = M+l, v)\ (3.5) \gi{xi, ..., xj = fo, (£ = 0+1, m), T. e. возвратиться к задаче с ограничениями — равенствами, дополненными требованиями неотрицательности некоторых переменных (именно x„(, %„;). Для нее функция Ла- гранжа есть Ф(Х, Х„, Х„ Л) = Я„/(Х)+ 2 h[bi-Xui-gi{X)] + i =1 + 2 h[bi+x,.t-gi{X)]+ S ^-Л^—ё'/]. Находя производные этой функции и приравнивая их нулю, нетрудно убедиться ВТОМ, что справедливы соотношения дФ1дХи1=—>ii=0 (f = l, ы) и (ЭФ/(ЭхJ,(•=?-;=0 {i=u-\-\,v). Следовательно, если экстремум z достигается при x„,. x^i>Q), то строки с номерами от 1 до о в (3.5) можно отбросить, так как связанные с ним "к^ все равно обращаются в нуль. Если же допустить, что какие-то из переменных xlii, xli равны нулю (граница области Хиь х^{^Ь), то это равносильно превращению соответствующих строк (3.5) в равенства, поэтому всегда >i"x°j=0 (г = 1, и), 'k\x%[=Q {i=u+\, v). Таким образом, возможна следующая схема поиска глобального экстремума (максимума) z в рассматриваемом случае: отбрасываются строки с номерами от 1 до о в (3.5) и решается (методом множителей) задача: найти Ху, . . ., х„-^ -^тах {z=f[Xu . . ., Хп)) при gi{Xu . . ., л-„)=^; (j=i;+l,m); к системе gi(X)=^bi {i=v+\, т) добавляется одна строка нз отброшенных (например, первая) в виде g'](X)=6i (т. е. x„i=0) и снова решается задача на отыскание max г; строка gi{X)=bi, введенная на предыдущем шаге в систему gi(X)=bi {i=v+l, т) заменяется новой (например, 3* 6f
второй), после чего опять исследуется оптимизационная задача; действия, связанные с введением в задачу одного из отброшенных ранее ограничений, повторяются в общей сложности о раз, что эквивалентно поочередным подстановкам Xui~0 и Xvi=0 в (3.5); рассматриваемые включения производятся далее для комбинаций из двух, трех и более строк до тех пор, пока система (3.5) не будет восстановлена в виде gi{X)=bi (г=1, т); все решения Х", г", найденные в результате указанных выше действий, проверяются на достаточность, сравниваются между собой и среди них выбирается то, которому отвечает наибольшее значение z (абсолютный максимум). Предложенный путь обобщения метода множителей Лагранжа на случаи, когда есть требования Ху^О или gi{X)^b;, вряд ли можно назвать удобным и коротким. Более того, анализ ситуаций, возникающих при совместном появлении указанных требований, сопровождается еще большими трудностями, связанными, в частности, с растущим числом промежуточных задач. Естественно поставить вопрос: нельзя ли найти более приемлемую форму обобщения изучаемого метода? Оказывается, такая форма существует. Пусть дана задача; найти Xi, . . ., лг^-^тах {z=f{xi, . . ., Хп)} При условиях { gi(Xi, ..., x„)^bi (1=ТГйу, gi{x„ ..., x„)^bj_(i = u + l,my, (3.6) Vx^>0 (/=l,n). Все предположения относительно z и gi (г=1, m), сделанные в §3.1, сохраняются здесь полностью. Попытаемся проследить, каким образом формируются необходимые и достаточные условия существования экстремума. Чтобы избежать неудобств, связанных с ограничениями-неравенствами, представим (3.6) в эквивалентном виде ( gi(X) + x^i = bi {i^TT^y, I gi{X)—x,„; = bi {i = u + \,my j Xj — X^j=Q (/ = l,n); "^ • > Теперь функция Лагранжа есть Ф = Х„/(Х)-4' 68
+ 2 li[bi -x,,-gi (X)] + 2 J^/ (bi + x^i - gi (X)] + 1=1 t=«+l n + 2 ^/{^wj—^/)> a необходимые условия, которым должны y=i удовлетворять оптимальные х°, Х^, представляются как ((5Ф/аху)^о.=0; ((5ФЩг);,о=0 (/=1, п; г=1, т). Рассмотрим более подробно равенства (ЭФ/(Эху=0 (/= ==1, п). Их можно привести к виду т • W {dfldxj),- 2 К (dgildxj) „-Ц= О, (3.8) собрав под знаком 2 производные по xj первых двух сумм выражения Ф. Ясно, что слагаемое — X'} появилось здесь вследствие перехода от (3.6) к (3.7). Обратим внимание на следующее обстоятельство: в левую часть (3.8) входит производная по xj функция Ф {X, Л)= т =X„f (Х)+2^Д^г—gi (Х)], т. е. функции Лагранжа в том ви- 1=1 де, как она встречалась в решениях классических задач (см. §3.1). Для составления ©(Х, Л) достаточно данных (3.6), поэтому желательно сформулировать такие условия экстремума f{X), которые включали бы только Ф(Х, Л), а не Ф. Заметим, что множитель К°, связанный с /-й искусственной строкой (3.7), должен обладать свойством Х°х^у—О [см. замечания, относящиеся к (3.5)]. При х^,->0 (или, что то же, х/>0) он обращается в нуль и необходимые условия существования Х" (из рассматриваемых в данный момент) т Принимают вид Xg (df/dxy) „ — 2 '^lidgi/dxj) „ = 0. -*■/ i = i "j Далее, при x%j=0 (это равносильно_х°=0, так как х",—х^1=0) соответствующий множитель к"; отличен, вообще говоря, от 0. Его знак в этом случае определяется из следующих соображений: если правой части любой строки Xj—x^j=0 дать отрицательное приращение, то область определения исследуемой задачи (3.6) расширится (произвольное значение xj'^0 удовлетворяет и неравенству Xj'^bj, bj<CO), а величина г" не уменьшится (всякое расширение области и создает предпосылки для улучшения ожидаемых z"), т. е. dz^/dbj^O или Ц-^0. Таким образом, при
x)=0 необходимые условия есть т K{dfldxj) 0-2 KidgildXj) ,: :о. Обращаясь теперь к соотношениям {дФ1д'к1)Ц=^ (г = = 1, т) и применяя те же способы оценки знаков Х°, можно получить еще одну группу необходимых условий экстремума в рассматриваемой задаче (3.6), и тогда полный их перечень принимает вид ^ \дФ{Х, Л) -1 о<0 при х^>0; dxj дФ(Х, Л)- Xj о[ дФ(Х, Л)1 г, ,. -. , аФ (X, Л) ая; аФ(х, Л) dXi Lo<0, Х?<0 (i = «+l,m), (3.9) l4^^i^]яr«(^=^)• Вопрос о достаточных условиях экстремума f(X) в задаче (3.6) ставят в следующих предположениях; выполнены требования (3.9) и, кроме того, существует такая точка X", Л" с координатами х? Хп,, К, ■ ■ ■> ^т, что неравенства Ф {X, Л^ХФ (X», Л°)<Ф (X», Л) справедливы для всех X, Л из некоторой окрестности Х°, Л° (речь идет о так называемой седловой точке, доставляющей максимум Ф по X и минимум по Л). Тогда неравенство Ф (X, Л°)^Ф (Х°, Л") можно представить как т т я°/(Х)+ 2 K[bi-gi{X)]^Kf{X'')-{- 2 K[bi-gi{X'')]. (= 1 1=1 т На основании (3.9) сумма ^Ц[Ь—§•,-(Х°)] равна нулю, 1=1 т а каждое слагаемое суммы 2^?f^—gi{X)\ неотрицательно, 1=1 т. е. можно утверждать «/(х) плюс неотрицательная величина ^f (Х°)», и тем более «f (X)^f (Х°)». Тем самым подтверждается наличие экстремальных свойств Х° и достаточность для этого рассмотренных предположений. Вывод формальных соотношений — условий экстремума еще не означает, что они всегда будут выполнены, поэтому имеет смысл уточнить наиболее важные аспекты практического использования изложенной теории. 70
Во-первых, необходимо существование таких X ^ U, для которых дФ/дК1фО, т. е. gi{X)<:bi (г = 1, и), gi{X)>bi {i=u-\-\,m) {условие Слейтера). Если этого нет, то уравнения Ц {с1Ф/(1X1)^0 = О теряют смысл, возникает неопределенность выбора Xi (множество компонент Л становится неограниченным). Другими словами, область определения задачи (3.6) должна содержать хотя бы одну внутреннюю точку. Во-вторых, исключается (в общем случае) возможность одновременного обращения в нуль множителей К1, Xj {i=l, т), хотя любые другие комбинации равных нулю Х? допустимы (см. §3.1). Выполнение условия Слейтера гарантирует отличие К от нуля и в этой ситуации можно полагать Хо=1 [2]. В-третьих, существование седловой точки связано не только с уже встречавшимися неравенствами (3.9) но и с требованиями выпуклости функций f(X), gi{X) [9], [14]. Следовательно, говоря о задаче (3.6), нужно иметь в виду задачу выпуклого программирования. Проведенный анализ позволяет пояснить в общих чертах идеи, выраженные теоремой Куна — Таккера: точка X' является решением задачи выпуклого программирования (3.6), удовлетворяющей условию Слейтера, тогда и только тогда, когда среди Kt^O (г = 1, и), >-г^0 (г=ы-Ы, т) находятся X", обеспечивающие выполнение неравенств Ф (X, Л°ХФ (Х», Л»ХФ (Х», Л) для всех X^U. Таким образом, исследовалась проблема обобщения классического метода множителей Лагранжа на случаи ограничений gi {X)^bi, x^•^0 в задачах нелинейного программирования. Показана возможность обобщений, выраженная теоремой Куна — Таккера, которая является одной из центральных в теории конечномерной оптимизации. § 3.3. Квадратичное программирование. Метод Вольфа Структура задач квадратичного программирования позволяет широко применять теорему Куна — Таккера для поиска оптимальных решений. Различные интерпретации условий (3.9) привели к разработке ряда алгоритмов, многие из которых преследуют цель свести исходную квадратичную задачу к вариантам линейного программирования. Учитывая сказанное, обратимся к задаче: найти xi л;„, 71
f n n n \ доставляющие max-(2;= 2 ^Л+2 ^ dif^XjxA при n 1=1 2 aijX/ '^bi (i = Ы + 1 > tn)\ 1= 1 Va;^^0 (/=l,n). Достаточные условия экстремума (максимума) выражены здесь в требовании 2 2 ^/k^/^k < 0> ^ € ^ и это требова- ние будем считать выполненным. Полагая для простоты K=h рассмотрим функцию Ла- гранжа п п п т г п ф (X, Л) = 2 cjXj +22 Фл-^А+.2 к ь,— 2 atjxj 1=1 i = 1k=i 1=1 и ее производные 5Ф/5л;/ = <7 + 2 2 с!/Л—2 ^[«г/; дФ/д'к1 = Ь1—2 ^о-'^/) которые удобно обозначить через 1=1 —Pj и qi соответственно. Это позволит интерпретировать (3.9) следующим образом: значения х'} (/=1, п) определяются теми решениями системы f " 2 aijXj + qi = b[ {i = \,m)\ i = i n m 2 2 dj^Xk— 2 ^,7+;?/ = —cy (/=T7«), \ k=i t=i (3.10) которые удовлетворяют требованиям xj^Q Pj^O, Xj-pj=0 (/=l,n), ^;>0, qt^O (i = l, u), ^j<0, ^i<0 (i'=M+l,m), Переход к системе (3.10) дает возможность упростить в большинстве случаев процедуру отыскания л;° (/=1, п) за счет использования, как будет показано ниже, симплекс- алгоритма. Данная система содержит т+п линейных уравнений с 2 (m+n) неизвестными xj, pj, Xi, qi. Предполагая уравнения (3.10) независимыми (поскольку независимы условия, из которых они получены), можно рассматривать т-\-п переменных в качестве свободных. 72
Если некоторое решение (3.10) обладает свойством Xj-pj=0, (/=1, п), Xiqi=0 (i=l, /n),T0 среди его компонент должно быть, как минимум, пг+п равных нулю, т. е. оно должно иметь вид либо: «ровно т+п компонент отличны от нуля, ровно т+п компонент равны нулю», либо «более т+п компонент равны нулю, менее т+п компонент отличны от нуля». Очевидно, подобные решения являются базисными, и для отыскания Х" нужно использовать метод сходный с симплекс-методом (см гл. 2). Возникает вопрос: нельзя ли сразу выбрать произвольно т-\-п свободных переменных среди xj, pj, Xi, gi, положить их равными нулю, а затем определить через них остальные переменные в соответствии с (3.10)? Ответ может быть только отрицательным, потому что произвольный выбор решения опасен возможными нарушениями условий xj'^0, Pj'^O, 'ki^O, qi^O. Приходится обращаться к специальным приемам определения х), и один из них используется в так называемом методе Вольфа, предусматривающем исследование задач линейного программирования для поиска решений задачи квадратичного программирования. Идея метода Вольфа в общих чертах такова: вводятся дополнительные переменные, позволяющие перейти от (3.10) к новой системе уравнений, для которой легко указать базисное решение, допустимое с точки зрения требований xjp}=0 (/=1, п) и A,,-^;=0 (i=l, /n); решается задача линейного программирования с целью обратить эти дополнительные переменные в нуль, т. е. возвратиться к исходной системе (3.10), но так, чтобы получить при этом X". Здесь приходится все время следить за соблюдением условий Х}р}=0, Xiq—O, что и определяет единственное отличие применяемого варианта симплекс-алгоритма от того, который рассмотрен в гл. 2. Успешно завершить вычисления можно тогда, когда либо все Cj в выражении z равны нуга п лю, либо 2 2 dfi^XjXi^ < 0. Последнее неравенство пред- полагается выполненным. Введем в (3.10) искусственные неотрицательные переменные у{ (/=1, /п), w'j (/=1, п), w"j (/=1, п) так, что ^' = ' (3.11) 1 2 2 ^-Л— 2 V.7 + P/ + tt>,'—«/ = —С/ (/= 1, «)• k-l 1=1 73
Допустимое базисное решение системы (3.11) есть либо xj=^0, Pj=0, Я,=0, ^г=0^ w"j=0, yi=bi, хю]~^—с, (при '^Cj<.0), либо xj=0, Р/=0, li==0, _g£=0, w'j=0, iii—bi, w"i=cj (при Vcj>0). Если Vcj=0 (/=1, n), то безразлично, какое из названных решений использовать. Важно подчеркнуть, что такие решения не являются допустимыми для (3.10) и могут рассматриваться лишь как исходные для задач линейного программирования, обсуждаемых ниже. Первый шаг поиска X" связан с решением следующей вспомогательной задачи: найти Xj, pj, А;, q;, У{,п)\, w']-^ —>min\ г= 2 i/г ( при ограничениях (3.11). Ясно, что минимизация суммы неотрицательных г/г (г = 1, т) должна привести к отысканию базисного решения, содержащего нулевые yi{i=l,ni) и удовлетворяющего поэтому «промежуточной» системе уравнений / п I 2 ai,x,+ qi = bi (/=1, т); У'\ . (3-12) ; 2 2 фл-^л — 2 >' i^ij + Р/ + «/ — «у = —С/ (/ = 1, п). Теперь можно отбросить все г/г (они обращены в 0), а также w], входящие в строки с с^>0, и w], входящие в строки с Cj<S) (нужно оставить в каждой строке или w], или Wj в зависимости от знака соответствующего с/). Тем самым число переменных W] уменьшается до и и появляется возможность сделать второй шаг, направленный на окон-- чательное их исключение. На этом шаге рассматривается задача: найти л;^^0,р^^О, , f= " ^ ^i^O. ^г^О, й)| ^ 0->-min ч г = ^ ю^ } при ограничениях \ / = I } (3.12). Она решается с соблюдением правила: при переходе к очередному базисному решению переменная pj{Xj) не должна попадать в базис, если там уже находится xj (pj). Другими словами, запрещается одновременное пребывание Xj и Pj с одинаковым номером / в группе переменных, отличных от 0. Если min г=0, то соответствующее оптимальное базисное решение является решением системы (3.10), т. е. всей задачи квадратичного программирования. Рассмотренный метод Вольфа является простым, но довольно громоздким. Его преимущество заключается в 74
возможности применить симплекс-алгоритм в квадратичном программировании, привлекая для этих целей существующее программное обеспечение ЭВМ. Более подробно вопросы реализации метода обсуждаются ниже. § 3.4. Модель производства новой продукции. Фактор дефицита сырья Планируется выпуск некоторой продукции (например, новых лекарственных препаратов), и это связано с необходимостью импорта дорогостоящего и дефицитного сырья, стоимость которого колеблется в зависимости от спроса. В то же время цены внутреннего рынка, где эта продукция может быть продана, стабильны. Исследуется вопрос о производстве двух видов новых лекарств, изготовляемых из импортируемого сырья. Цены на них утверждены с учетом реальной обстановки и должны сохраняться неизменными. Объемы производства предстоит определить, исходя из анализа сырьевой проблемы и ограниченности производственных ресурсов. Пусть Хх, Xi— количества производимых лекарств 1-го и 2-го вида в миллионах весовых порций, продаваемых по цене 1 и 2 руб. соответственно. Получаемые от их реализации средства в размере (л;1+2л;2) млн. руб. должны компенсировать (хотя бы частично) импортные расходы. В переговорах с поставщиками сырья выясняется, что затраты на его приобретение и доставку растут пропорционально квадрату предполагаемого объема производства, и в денежном выражении это составляет (a;J+a;2)/2 млн. руб. Таким образом, экономическая рентабельность рассматриваемой операции оценивается (в миллионах рублей) как Xi-\-2x.i—(xl-\-xl)/2, и главным является стремление преодолеть дефицит на разумной основе. Комбинат-изготовитель лекарств может выделить для нового производства лишь часть своих мощностей, что накладывает дополнительные ограничения на выбор Xi, x-i. Так, устанавливаются лимиты на стоимость основных фондов (эксплуатация зданий, снабжение энергией, амортизация машин — 6 млн. руб.) и стоимость производственных процессов (зарплата, накладные расходы, вспомогательные материалы — 5 млн. руб.). Известно, что изготовление 1 млн. весовых порций лекарства первого вида требует 2 млн. руб. из основных фондов и 1 млн. руб. от трудовых затрат, а лекарства второго вида — 3 и 4 млн. руб. 75
тех же расходов. Это приводит к условиям 2 лгх+Злгг^б; Xi+Ax2^5. Теперь задача формулируется так: найти Хй лгг, доставляющие max {z=Xi+2x2—0,5 xl—0,5 xl} при ограничениях 2 л:1+Зл:2<6; a:i+4a:2<5; Xi, х^^О. Нетрудно видеть, что роль слагаемого 22Фа^У^а здесь выполняет сумма — 0,5 (xl+xl) (Фа=0, /=й=^). и для допустимых Xl, Хг она отрицательна (случай л:1=л:2=0 исключается, так как означает отказ от выпуска продукции вообще). Следовательно, можно применять метод Вольфа так, как он был представлен в § 3.3. Составляем функцию Лагранжа Ф (X, Л) = a:i Ч- 2а;2 — (х\ + x\^j1 + Х^ (6 — 2xi — Ъх^ + Хг (б — х^ — Ах^), не обращая внимания на знаки неравенств в условиях задачи, и находим Pi=— дФ/dxi = — 1 + >;i + 2>Ч + >^2; '71 = дФ/dXi = 6 — 2а;1 — Зх^; Р2 = — дФ/дх2 = —2 + АГг + 3^1 + 4^2; (/г = дФ/дХ^ = 5 — Xi — ix2. Поскольку здесь Су-> О (/'=1, 2), можно ограничиться введением всего m+n искусственных переменных ш'/=шу и у (/=1, 2, i=l, 2). Тогда первая задача линейного программирования принимает вид; найти Xi, х^, Pi. Pi, ^1. ^2. Qu '72. i/i, Уг, Wi. W2 минимизирующие сумму г=г/х+г/2 при '2a;i + 3a;2 + (7i + ?/i = 6; >;1 + 4а:2+'72+?/2 = 5; — Хх — 2%1 — %2r\-Pi—Wi = — 1; — а;2 —3Xi —4Х2+Р2 —ffi'2'=—2; (3.13) Ui. >;2>0; Pi, Р2Э=0; XjPj=^0 (/=1,2); IXi, Х25гО; qi, (72SsO; X;(7/ = 0 (('=1,2); yi, y^^O; Wi,W2^0. Базисное решение системы (3.13), удовлетворяющее требованиям Xj-pj=0; Х/9/=0, можно назвать сразу: а;х=л;2=0; Pi=p2=0; Xi=X2=0; qi^q2=0; У1=6; У2=5; (Вх=1; Ш2=2. Используя его в качестве исходного в решении сформулированной линейной задачи, выразим yi, ш,- (i=l, 2, /=?1, 2) и г через свободные переменные в соответствии с уравнениями (ЗЛЗ), т. е. yi = 6 — 2xi —3x2 —qi; Щ= 1 —Xi — 2Xi — X2 + Pi', г/2 = 5 — л^х — 4а;2—172; W2 = 2—X2 — ЗХ1 — 4^2 + Р2; г= 11 —За;! — 7а;2 — <7i — q^- Если теперь увеличить, например, qi до 6 (при этом у^ обращается в 0), то можно получить новое допустимое базисное решение Xi=X2='0, Pi=^p^^O, Xi=X2=0, г/1=(72=0, (7i=6, г/2=5, (Вх=1, (В2=2. Выражения новых базисных переменных и г через свободные приобретают вид (7i = 6 —2а;]; —За;2—f/i", ffi)i= 1 —a;i —2?.i —Х2 + Р1; i/2 = 5—a;i —4a;2—(72". ffi)2 = 2—A;2—3Ai —4X2 + ^2". r= 5 — a;i — 4л;2 — (72 + г/1. Увеличивая теперь 172 по 5 (т. е. обращая г/2 в 0), имеем Xi-<=X2=0, Pi=»p2=0, Xi=X2=0, г/1=г/2=0, (7i=6, (72=5, Wi=l, 0)2=2, г=г/1+г/2. 76
Таким образом, достигнут минимум г (свободные г/х, г/г входят в выражение г с положительными коэффициентами), и этот минимум оказался равным нулю, причем требования xjpj=0, Х;(7/= О удовлетворены. Именно возможность сохранять Х/=0 (i= 1, 2) в процессе решения рассмотренной линейной задачи (это обеспечивается структурой уравнений (3.13)) позволила избежать трудностей, связанных с необходимостью следить за соблюдением равенств Л/9,-=0. Последнее из полученных выше базисных решений, минимизирую" щее функцию г, построено так, что одновременно удовлетворяет и уравнениям (3.14), входящим во вторую задачу линейного программирования: найти х-^, х^, Pi, Р2, ^1, ^2> 9i. 92> Wi, coj, доставляющие min {z=Mi+(B2} при (2xi-\-3x2-Jrqi = 6; .vi + 4a;2 + '72 = 5; — >;,; —2X1 —Xa + pi —ffi)i = —1; —aTj—3^1—4^2 + ^2 —«2 =—2; (3.14) Ui, X2, Pi, РгЗгО; xjpj = 0 (/=1,2); Ui, ^2, (7i, (/23=0; X,'(7/ = 0 (i=l,2). Отсюда следует (7i = 6 — 2л:х — Злгг; Wi= 1 —ati—2Xi —Яг + Рь (/2 = 5 — ATj — 4a;2 ; ffi'2 = 2 — a;2 "-^ 3^1 — 4^2 + P2; г = 3 — ATi — a;2 -^ 5Xx — 6X2 + Pi + Рг- Уменьшить z можно за счет увеличения либо xj, либо Я/ (/=1,2^ г=1,2). Выбирая для этого переменную Xi и увеличивая ее до единицы (Wi обращается в нуль), получаем базисное решение Ш1=л;2= О, pi=p2=О, Ai=X2=0, (7i=4, 92=4, Ху=\, Ш2=2 и новые равенства (7i = 4—3a;2 + 4Xi + 2X2 —2pi + 2ffi'i; .Vi= 1 — 2Xi —X2 + pi —ffiii; (/2 = 4 — 4a;2 + 2^1 + ^2 — Pi + ffiii; ti'2 = 2—x^ — ЗЯх — 4^2 + P2; z = 2—ДГ2 — 3^1—4Л2 + P2 + ffiii. Ясно, что дальнейшее уменьшение z должно сопровождаться возрастанием только Х2, так как при попытке увеличить Xj, или Xj нарушаются условия Xiqi=0. Величина Х2 может расти до единицы ((/2 обращается в нуль), что приводит к решению (i)i=q2-=0; p^=p2=0;kj^= =^2=0; (7i=l; Xi=l; X2=l, ffi'2=l и равенствам a;i = 1—2Xi—Л2 + Р2 —ffi-i; 491 = 4+10X1 + 5X2—5pi +3(72 +5mi; 4a:2=4 + 2Xi + X2—(7i—(72+ffi'i; 4ffi)2 = 4— 14Xi— 17X2+pi+4p2+92—^'il r= 1 - (14Xi + 17X2 - pi - 4p2 - (72*—3ffi>i)/4. Теперь увеличивать можно лишь Х2 (поскольку ^г'^О)! причем до значения 4/17 (ш2 обращается в 0). Получаемое базисное решение u)j=g2=0; pi = pa=0; Xi=W2=0; (7i=22/17|_a;i= 13/17; л;2= 18/17; X2= =4/17 оказывается искомым, так как здесь z=0 и удовлетворены все условия (3.14). Итак, решение исходной задачи квадратичного программирования с целевой функцией г есть л:?=13/17?»0,765; л:2=18/17л;1,05; z"=2,03. Оно является глобально оптимальным, поскольку квадратичная форма — {х1+х1)/2 от- 77
рицательно определена в области U. Найденные х1, х1, г" можно было бы обозначить х1, х1, z*. Полученный результат говорит о том, что целесообразно произвести 765 тысяч порций лекарства первого вида и чуть больше 1 млн. порций лекарства второго вида. Доход от продажи лекарств превысит расходы на импорт еырья более чем на 2 млн. руб. (z*=2,03), но производственные затраты составят в общей сложности 9,7 млн. руб. (при отпущенных 11 млн. руб.). Оставшиеся 1,3 млн. руб. относятся к статье основных фондов, ограничение которых оказывается несущественным (это следует не только из проверки условий — неравенств исходной задачи, но и из равенства нулю 1J.) Методы математического программирования, рассмотренные выше, были тесно связаны с особенностями исследуемых задач (характером целевой функции и функций ограничений). Это придавало определенную специфику процессам вычислений. Вместе с тем существуют такие подходы к проблеме конечномерной оптимизации, которые не предъявляют жестких требований к структуре изучаемых задач. С этих позиций следует рассматривать метод динамического программирования, получивший широкое распространение в прикладных исследованиях. § 3.5. Динамическое программирование как метод оптимизации. Общая характеристика Динамическое программирование представляет собой метод оптимизации многошаговых процессов принятия решений, позволяющий указать пути исследования целого класса экстремальных задач. В частности, метод оказывается весьма эффективным при анализе задач с сепарабель- п ной целевой функцией f{X)= 2 fjiXj), к которым относят- /= I ся не только задачи линейного и квадратичного программирования, но и многие другие, встречающиеся в практике разработок систем, организации управления, планирования операций. Необходимость принять решение возникает тогда, когда производятся те или иные целенаправленные действия (например, некоторая физическая система переводится из одного состояния в другое посредством приложения управляющих воздействий или разрабатывается последовательность формальных преобразований при поиске экстремума 78
функции). Если в какой-либо реальной задаче подобные ситуации возникают периодически, то образуется процесс принятия решений. Вообще говоря, ход процессов такого рода заранее не определен. Его нужно организовать, причем так, чтобы получить наибольший эффект с точки зрения принятого критерия Z эффективности действий. Формально это должно означать стремление минимизировать (максимизировать) величину указанного критерия (если, конечно, он имеет числовое выражение). Предположим, что интересующий нас процесс можно разбить на Л^ шагов, а действия, совершаемые на г-м шаге, характеризуются совокупностью показателей (m^i, . . ., «гм)=^г. Состояние процесса к началу этого шага тоже имеет характеристику в виде совокупности параметров (jiri, . . ., JXr;j)=Qr. Обычно предпринимаемые действия не являются полностью произвольными, а зависят от состояния Qr, которое возникло перед г-м шагом, т. е. ^^= 4lr(Qr). Очевидно, результирующее значение критерия г, получаемое по окончании процесса, будет определяться теми 41^ (г=1, Л^), которые были приняты ранее, т. е. z= =z (%, . . ., 41^). Возникает вопрос: как выбрать ^i, . . ., ^дг, чтобы величина Z приняла экстремальное значение? Ответ можно было бы получить, рассматривая z как функцию переменных и^^ (г=1, Л^, s = l, М) и находя экстремум z одним из известных способов, однако этот путь далеко не всегда прост (особенно, если велико число переменных). Появляется идея провести оптимизацию поэтапно, анализируя последовательно каждый шаг процесса в поисках наилучших вариантов его продолжения. Эта идея лежит в основе метода динамического программирования, реализующего принцип последовательной оптимизации. Следовательно, важным условием применимости рассматриваемого метода является возможность разбиения процесса принятия решений на ряд однотипных шагов или этапов, каждый из которых планируется отдельно, но с учетом результатов, полученных на других шагах. Динамическое программирование основывается на важных принципах оптимальности и вложения. Принцип оптимальности, формируется следующим образом: необходимо всегда обеспечивать оптимальное (в смысле принятого критерия) продолжение процесса относительно уже достигнутого его состояния. Другими словами, решение на каж- 79
дом последующем шаге должно приниматься с учетом результата, полученного на всех предыдущих шагах. В § 3.6 будет показано, что этот принцип имеет простую математическую интерпретацию, выраженную в составлении определенных рекуррентных соотношений. Принцип вложения утверждает, что природа задачи, допускающей использование метода динамического программирования, не меняется при изменении количества шагов, т.е. форма такой задачи инвариантна относительно Л^. В этом смысле всякий конкретный процесс с заданным Л^ оказывается как бы вложенным в семейство подобных ему процессов и может рассматриваться с более широких позиций. Реализация названных принципов дает гарантию того, что, во-первых, решение, принимаемое на очередном шаге, окажется наилучшим с точки зрения всего процесса (а не «узких интересов» отдельного этапа) и, во-вторых, последовательность решений одношаговой, двухшаговой и т. п. задач приведет к решению исходной Л/-шаговой задачи. Обратим внимание на специфические особенности схем динамического программирования. Обычно они строятся так, что первым исследуется конечный этап изучаемого явления, отраженного в задаче оптимизации. Действительно, этот этап может быть изучен и спланирован сам по себе наилучшим (в смысле критерия г) образом, поскольку он завершает процесс. Но сделать это можно лишь на основе предположений об ожидаемых неходах предшествующего (но еще не исследованного) этапа, т. е. о значениях Qдг, что даст набор условно оптимальных решений IIn /Qa^. Завершив указанное исследование, нужно повторить его применительно к предпоследнему этапу процесса, но при условии, чтобы желаемый эффект, выраженный в экстремальных значениях г, был достигнут не на этом этапе отдельно, а на двух последних этапах вместе. Тем самым будет найден второй набор условно оптимальных решений (4/д,_1, 'Un)ov\IQn-i< учитывающих результаты '^A^opt- Повторив подобные операции для третьего, четвертого и последующих этапов изучаемого процесса, можно в конце концов найти решение задачи в целом {%.^, %^, . . ., 'Wjv)opt/Qi. Продолжая общую характеристику метода динамического программирования, обратимся к краткому анализу его преимуществ и недостатков. В первую очередь отметим следующие положительные качества: изучаемый метод дает возможность решать задачи, которые раньше не исследовались из-за отсутствия соответст- 80
Рис. 3.3 вующего математического аппарата (например, вариационные задачи с ограничениями-неравенствами или конечномерные экстремальные задачи с дискретной структурой); метод позволяет упростить поиск оптимальных решений в ряде случаев за счет резкого сокращения объемов вычислений (в первую очередь это относится к комбинаторным задачам); являясь в своей основе вычислительным, метод динамического программирования допускает широкое применение средств механизации счета (в первую очередь ЭВМ), что облегчает сложные исследования. К недостаткам можно отнести отсутствие универсального алгоритма, который был бы пригоден для решения всех задач (алгоритмы, используемые в рамках динамического программирования, объединены лишь общей идеей и в каждом конкретном случае должны формироваться применительно к условиям задачи). Кроме того, возникают значительные трудности при анализе задач большой размерности (несмотря на высокую вычислительную эффективность метода, в ряде случаев оказываются недостаточными мощности современных ЭВМ). Дополнительные пояснения дает приводимый ниже пример расчета кратчайшего пути. Некоторый материальный объект должен перейти из пункта А в пункт В. Возможные маршруты перехода и расстояния указаны на рис. 3.3. Требуется найти наикратчайший путь (подобным образом могут быть интерпретированы задачи о выборе кратчайшего транспортного маршрута при известной сети дорог, об отыскании критического пути на сетевом графике и т. п.). Принятие очередного решения равносильно в данном случае выбору направления выхода из того узлового пункта, куда попал объект. Шагом (этапом) процесса является перемещение объекта из одного пункта в другой по допустимому маршруту. Состояние процесса непосредственно перед началом очередного этапа характеризуется местоположением я объекта. Критерием эффективности действий является пройденное расстояние, которое подлежит минимизации. 81
Решение начнем с анализ а последнего (четвертого) этапа рассматриваемого процесса. Здесь, по существу, нет никакого выбора и приходится констатировать следующее: если результатом действий объекта на третьем этапе явился его выход в топку,"я41,то кратчайший (и единственный) путь в пункт В есть ^a^ay^'^Uinfi', аналогично Я42Я51^ =!'2^42opt; Л4зл:а1=%зорЬ Я44Я51='г/44ор1 — первый набор условно оптимальных решений. Возможные положения объекта к началу предпоследнего (третьего) этапа есть Яз^, (у=1, 5). Для состояния Я31 существует единственное решение Яз^Я41Я51='г/з1ор1. ДЛЯ Яз2 лучшим является продолжение !'1з.ЛЛ1='Из2ор1 и далее 'Иззор1=ЛззЛ42-Ч1. ''^34ор1=Лз4"42Лбг'?^35opt= «=ЯзаЯ4зЯ51 (замстим, ЧТО дсйствия планируются здесь с учетом требования достичь наибольшего эффекта на двух последних шагах вместе). Повторяя предыдущие рассуждения применительно к Яа^ (у=1,4),- получим: кратчайший путь из я^! в В есть Я21Яз1Я41Я51, из ЭТ22—Л22Я33Я42Я51, из Яаз—^•ii^M'^ii^bi и, наконец, из Я24—Я24Л35Я43Я51. Теперь рассмотрим точку А. Поскольку оптимальные решения для точек Язд (у=1,4) уже найдены, достаточно сравнить между собой расстояния (Я11Я21+'г/210р1). (Л11Л22+^2201)1)- (niin23+'?^230pt) и (Л]1Я.^4+ + '?/24opt)- Наименьшим среди них оказывается (Я11Я22+Я22ЯззЯ42%1)- Итак, методом динамического программирования найден оптимальный вариант перехода из А в В. Полученное решение оптимально только в смысле минимума длины пути, проходимого объектом. Отказ от принятого критерия повлек бы за собой изменение результата. Например, считая маршруты опасными, можно требовать максимальной вероятности успешного их преодоления, и тогда результат исследования будет иным (в частности, наилучшим может оказаться какой-то периферийный маршрут). Обратимся к анализу формальных соотношений, характеризующих метод динамического программирования и называемых функциональными уравнениями {или уравнениями Беллмана). § 3.6. Задачи с сепарабельной целевой функцией. Формальный анализ Приводимый анализ преследует цель изучить особенности динамического программирования как средства поиска экстремальных X*, Z*. Этим объясняются упрощения, вводимые по мере необходимости в общую задачу: найти X = (Xi, ..., х„)~> max j г = 2 // (•^/) [ при gi{x)^bi (г== V. / = 1 / «=1, т), ^Xj^O (у=1, п). Предположим сначала, что в рассматриваемой задаче присутствует только одно линейное ограничение, и она 62
( '^ \ формулируется так: найти X —ьтах fz = 2//(-*y) [ при п 2 a/XjS^b„, VaTj^O — целые числа и Vay>0 (/=1, «). /■ = 1 ' ^_ Пусть из совокупности АГу (/=1, п) выбрана и зафиксирована величина х„. Если в этой ситуации найти максимум Z по остальным переменнымXi, . . ., x„_i, то он будет зависеть от а:„, так как вследствие сепарабельности г справедливо равенство тахг = /„ (а:„)+ max ^ Zi f/i^M (^ла- гаемое /„ можно вынести за знак max, поскольку оно связано с х„, а не с х^, . . ., a:„_i, которые рассматриваются в данный момент). При любом постоянном целом значении лг^^О названные Xi, . . ., а:„_1 должны удовлетворять условию 2ау-^/^&„ — йп-^п' вытекающему из исходного ограниче- / = 1 ния, а также требованиям неотрицательности и целочислен- ности. Это влечет за собой зависимость от л:,, величины max iZif/iX/)}, которую можно обозначить как Xi Xn-i V/= 1 J W„_i(b„_,), где b„_,=b„—a„x„. Если функция W„-i найдена каким-либо способом, то величина г*= max z определяется выражением Xi Хп г* = тах{/„(^«) + Ч'„_, (&„-!)}• (3-15) Хп Здесь х„ принимает значения О, 1, ..., [bjaj. Равенство x„ = l + [bja„] недопустимо, так как приводит к нарушению п условия 2 ^/Х/^Ь„ при VaTj^O, Va;>0. Важно заметить, что знание ^„^i сводит задачу поиска 2* к простому случаю оптимизации суммы fni^J+^n-i по единственному параметру л:,,. Чтобы определить ¥„_!(&„_i), необходимо найти Xi, . . ., п- I д:„_1, доставляюш,ие максимум г= 2 f/ix/) при ограни- / = 1 п-1 чениях 2 ^у-^/^^л-!' Va: >0 — целые числа, Уа;>0 (/= = 1, п). Очевидно, это требование совпадает с исходной постановкой задачи (различие лишь в числе переменных Xj). 83
Следовательно, отделив а:„_1 и повторив предыдущие рассуждения, получим ( Ч'„-1 {Ь„-г) = max {/„_i (x„_i) + Ч'„_, (&„_,)}; ^n -2 -^ 'Уп-2Фп~2)= max ]2//(A:y)|; (3.16) Л-1 Xn-2 \ 1 ) bn-2 = b^-i—an~iXn-i< a:„_iG|o, 1 ^—^ |. Рассматриваемый процесс можно продолжить с целью определения W^^^ через ^п-з> ^п-з — через W„^i и далее до тех пор, пока не будет найдена функция 4''i(&i)=raax/i(A:i) при Xi£ {О, 1, . . ., [bi/ai]}, &1=&2—йа Х2- Таким образом, исходная задача с п переменными распадается на ряд однотипных задач с одной переменной, и процесс решения становится пошаговым. Теперь можно утверждать следующее: чтобы получить г*, достаточно составить последовательность функций f 1 \ « 'УдФд)^ max ]2//(^/)[ .^g = ^«— 2 ajXj {q=l, п—\), Хи ■.■,Xq \ 1 ) /=9+1 в которой ^i определяется непосредственно как max /i (Xi), Xi a остальные Ч'^ — с помощью рекуррентного соотношения ¥^(&,)=max{/,(x,) + 4',_i(Vi)}' (3-17) и затем найти г* в виде Ч,^{р,^. Соотношение (3.17) представляет собой основное функциональное уравнение метода динамического программирования в рассматриваемой задаче с сепарабельной целевой функцией. Знание г* не исчерпывает вопроса об оптимальных решениях, так как остается неизвестной точка Х* = {х1, . . ., Хп), где Z достигает значения г*. Переходя к поискуХ*, заметим, что любая из величин Ь^ (<7=1. п—1) заключена в пределах O^bg^b,,, поскольку b^=^b„—2 ^Л- и 0^ 9+1 п ^ 2 ^jXj ^ ^я (из-за неотрицательности произведений ajXj). Для простоты предположим, что &„ и а^ (/ = 1, п) — целые числа. Вместе с условием « Xj — целые» это определит целочисленность всех Ь^. Порядок действий становится таким. 84
Выбирается переменная Xi, принимающая целочисленные значения от О до [^i/aj при 0^bi^b„ и решается задача отыскания max /i (xi); результаты сводятся в табл. 3.1. Таблица 3.1 Значения hi Оптимальные Xi _ Значения max /i (xi) 0 xi{0) W,iO) 1 хг(1) 'Pi(l) ..i ... bn Xi (b„) 'Pi (M Выбирается переменная лга, принимающая целочисленные значения от О до [бг/яа] при 0^b2<ib„ и решается задача отыскания max {f2{x2)+^i{bi)} при &i=&2—«2 АГа; результаты сводятся в табл. 3.2, при составлении которой удобно пользоваться табл. 3.1, находя Wi для разных &2—«а -^а. Таблица 3.2 Значения fej Оптимальные «2 Значения max {/2-f'Pi} 0 ^2(0) Ч'гСО) 1 ^2(1) '^2(1) ... ... b„ Х2 (6„) "Р, Фп) Операции повторяются для всех оставшихся Xj (/=3, п—1); появляются новые результаты Хд{Ьд), ^д{Ь^) (на каждом шаге используется предыдущая таблица), и в итоге накапливается информация в виде стандартных таблиц, содержащих все л:^, Wg{g=l, п — 1). Анализируется последняя задача, связанная с отысканием г* = тах {/„(a:„)+4''„_i}; так как &„ задано однозначно, таблица с х„ состоит всего из одного столбца, дополняющего предшествующие результаты; теперь остается выбрать из множества найденных л: g ((7=1. п) одну или несколько совокупностей х1 х1, определяющих X*, и это делается с помощью полученных ранее таблиц. 86
■~ в качестве л:^ принимается л:„, так как z* можно достичь лишь прил:„—л:„ независимо от того, каковы л:„_1 ATi; если появилось несколько значений х,^, то последующий анализ проводится применительно к каждому из них, начиная с произвольно взятого. При известном xl вычисляется bn-i=b„—а„Хп и в таблице, содержащей л:„_1, отыскивается столбец Ь^-й значение л:„_1 (&*„_i) отождествляется с х'^^^. При известных л:',, л:*_1 вычисляется b*n^2 — b„—а„л:^—• —а„-1, л:*„-1, и в таблице, содержащей л:„_2, отыскивается столбец &;;_2, что дает Хп^^ =х„_^{Ы^ з)- Тем же способом определяются остальные x*j ij=n—3, 1), и этим завершается процесс поиска X*. Можно сказать; что каждый шаг (этап) состоял здесь в определении соответствующего Хд {q=n, 1), состояние процесса характеризовалось величиной bq {параметр состояния), а получаемые результаты —■ величиной W^ {функция состояния). Рассмотренные операции реализуют метод динамического программирования применительно к задаче с сепара^ бельной целевой функцией (точнее, к ее упрощенному варианту). Теперь важно оценить, возможен ли отказ отряда искусственно введенных условий (в частности, условия «Xj, aj, b„ — целые числа») и к чему он приведет. § 3.7. Способы представления данных. Модель капиталовложений Условия общей задачи (см. § 3.6) могут варьироваться в известных пределах, и это не нарушит тех рекомендаций, которые были даны выше и относились к проблеме поиска X*, 2*. Исключив требование целочисленности Xj, aj, b„, можно решать задачу с сепарабельной целевой функцией п п г= 2 fji^j) и ограничениями 2 ^^/Х/^Ь„, Va-^-^O так же, / = 1 / = 1 как это делалось в§ 3.6, т. е. найти 4''i(&i)=max/i(.ri) при 0^bi^b„ и далее все функции состояний Ч'^ = тах{/^ {Хд) + ^9 +^q-i{bq-i)};Os^bgi^b„;x^'^0; д=2, п, последняя из которых определит г*. За этой стадии решения различия сведутся к тому, что переменные Хд {q=l, п—1) будут ме- 86
нятся в пределах от нуля до b^luq (а не [bqla^]), и поиск максимумов по л:убудет вестись, вообще говоря, иными методами. Например, в предыдущей задаче любую функцию ^q можно было найти перебором значений суммы f q{xq)-\~^ q-i, 3 теперь более перспективным может оказаться анализ уравнений При дальнейшем изучении различий возникает вопрос о способах представления промежуточных данных и определения оптимальных л:^_1, л:«-2, • • . при известных Хд{Ь^) {q=\, п). Он не является принципиальным, хотя и важен сам по себе. В зависимости от конкретной ситуации х^ и Чд могут быть представлены в виде формул или графиков (если их исследованием занимается человек), в виде систем уравнений или сеток значений (если все передано вычислительной машине) и т. д. Различны и способы получения х*1 (/ = 1, п—1), среди которых наиболее предпочтительны непосредственные вычисления значений &^_i, . . ., b{ и •««-1 = -*^„-1 (&«-i), л:^-2=л:„_2 (&«-2), •■• с использованием всех доступных средств. Таким образом, отбрасывание требований целочислен- ности Xj, Qj, b„ не меняет сути метода решения задачи, меняются лишь приемы промежуточных вычислений и характер отображаемой информации. Этот вывод сохраняет силу во всех случаях применения метода динамического программирования. Многие модели операций, связанных с расходованием ограниченных ресурсов, предполагают исследование задач с сепарабельной целевой функцией. В частности, представляет интерес упрощенная модель, отражающая проблему капиталовложений в производство. Исследуется вопрос о распределении бюджетных средств между тремя предприятиями производственного объединения с целью ускорения выпуска определенной продукция. Характер реакции каждого предприятия на одни и те же капиталовложения различен. Так, первое предприятие, оснащенное устаревающим оборудованием и имеющее ограниченную территорию, может интенсифицировать производство ценой больших издержек (сверхурочными работами, повышенным расходом материалов, увеличенными штатами ремонтных служб и т. п.). Второе предприятие располагает сравнительно новым оборудованием и способно 87
более эффективно использовать капиталовложения, обеспечивая пропорциональный рост объемов производства. Наконец, третье предприятие, завершающее реконструкцию и освоение новейшей технологии, может выпускать продукцию при условии, что ему будут переданы все распределяемые средства (в противном случае ввод мощностей переносится на более поздний срок). Требуется так распределить капиталовложения, чтобы суммарный объем получаемой продукции оказался максимальным. Пусть ATi, АГа, АГз— размеры капиталовложений для рассматриваемых предприятий, ограниченные общим бюджетом (условной единицей). Выход продукции первого предприятия определяется как In (1 +Xi), второго предприятия — как Х2 и третьего — как а:|. Требуется найти Xi, х^, Хз-^ ,,,,„, -> max {г=1п (1+a:i)+a:2-|-a:|} при ограничениях х^+х^+х^^Х; х{^0; Xi'^O; а:з=0 или 1. Здесь ai= 02= (ц= I; &«= &з— ^ • Сначала решается задача отыскания 4'i=max{/n(I+A;i)}, 0<A;i<6i, (X6i<I, где by= I—Xi—X3. Для этого достаточно построить график, (рис. 3.4), дающий 4=bi,'¥i=ir\(i+\)=\r\(l+bi). Необхо- Oibi<J димо подчеркнуть, что речь идет о ка- чественном исследовании, основанном на Рис. 3.4 знании свойств логарифмической функции, а не каких-то расчетах. На рис. 3.4 представляет интерес лишь точка с координатами 6i, ifi. Функция ¥2 определяется какЧ''2=тах{д;:2+Ч''1};0<Х2<б2; 0<Ь2<Ь где &2= I—лгз. Используя соотношение &i=62—х^, получаем Vj= = 1п(1+б2—лгг), следовательно, ¥2= max{^2+In(1+62—-"^г)}- Производ- ^4^{.2 + 1п(1+6.-..)} = 4^2 поэтому (после проверки достаточных условий экстремума) Xi^b^ и ФункцияЧ''з есть тах{жз+Ч''2}. Переменная хз в условиях рассматриваемой задачи может принимать лишь значения О и !. Независимо от этого Хз-\-^2~хз-\-1—-«3=1. следовательно, д:з(П=^ " д:з(/л=0. Теперь из имеющихся xj (/'=1, 3) нужно выбрать те значения, которые будут приняты в качестве xj. Положив жз(11)=0 и жз(1)=1, получим &2(11)=1—-»;з(11)=1; &2(1)=0, что дает хцп)=1; X2(i)=0. Далее b^u)=l—X3{ii)—X2(U)=0, 6i(i)=0, т, е. хцП)=хиь=0. Таким образом, найдены оптимальные решения xl—O; л-2* = 1; х1=0; г* = 1 и х1=0; а:|=0; Хз=1; г=1. Они говорят о том, что можно применять две стратегии капитало- ная — {х2+1п(1 +&2—■»^2)}=7-т4;—— обращается в нуль при -t2=&2i
вложений, ориентируясь либо на второе, либо на третье предприятие. Окончательный выбор делается неформально, с учетом обстоятельств, не отраженных в модели. В§ 3.6, 3.7 речь шла о скалярных параметрах Ьд и требовалось на каждом шаге найти лишь одну переменную Xq^ хотя на практике чаш,е оперируют векторами Вд, Хд. Это осложняет решение задач, а иногда делает его невозможным. § 3.8. Проблема многомерности в динамическом программировании Условия, в которых появляется векторный параметр состояния, иллюстрирует следующая задача: найти 2П' ^ п \ п п X —>- max -12=2 f/i^j-)} при 2 «ly-^/^^in' 2 (^^Л ^^' Vat^^O — целые числа (случай т=2). Полагая, как и ранее, все а^, а^, bi„, b^n положительными и целыми, заметим, что любая функция из последовательности Ч'^ (<?=!. ") является теперь функцией двух аргу- п ментов big, big, где big = bi„— 2 ^уХ/, b^g=^b^„ — п — 2 «гЛ' поскольку все Хд, по которым отыскиваются максимумы сумм fq{Xq)+^q-i, ДОЛЖНЫ удовлетворять требованиям O^X^ibiqlaiq], O^JCg^lbiqlttiq]- ЭтО ВОЗМОЖНО тогда, когда неотрицательная величина Xq не превышает меньшего из [biqluiq] (г = 1, 2), т. е. O^A:^<rain {[&i^/ai^]; [b^gla^]}. Следовательно, приступая к определению Ч'х^» =гаах/i(a:i), необходимо предварительно найти 6i = rain [biglttig]. Затем, повторяя на каждом шаге аналогичные i операции, нужно составить последовательность функций %(Ч. Кд)= max {fg{Xg) + '¥g-i}; 6^ = rain {&,.^/а,^, 0^big^bi„, 0^&29^^2n- Вместе с Wg определяются и Хд {big, biq). Причем для (7==« выполнено Ч'Л^!». &2«)=г* и х„{Ьи, &2„) = 4- Если свести всю информацию о Ч'д и лг^ в таблицы, то для каждого номера q туда придется включить &i„&2„ значений bq и такое же количество значений Xq, Ч'д, полученных в 89
Таблица 3.3 0 1 ^2? Й2„ 0 1 Ьч ^• 1,, "Vq hn результате решения соответствующей промежуточной задачи. После этого q-я таблица принимает вид (табл. 3.3.). Ясно, что не только заполнить, но и использовать такие таблицы для получения оптимальных х'п-к—х^п-кФип-кг t>l,n-k) чрезвычайно сложно (особенно тогда, когда величины &1„, &2„ достигают десятков и сотен единиц). В этом — главное препятствие на пути применения метода динамического программирования в задачах с векторным параметром Bq. Даже небольшое число составляюш,их Bq (порядка 3—4) может привести к неразрешимости задачи из-за чрезмерных требований к объемам памяти и быстродействию вычислительных машин, В основе этого утверждения лежит очевидная оценка о^ = 3 Д &,•„, М запоминаемых чисел б,, Ч^^, ш,ими в ограничения 2 ctijXj^b;„ ~М связываюш,ая количество Хд с величинами &,■„, входя- (i- i, m). Если m = =2, &i„, &2„ = 10, TO M =300 (объем данных табл. 3.3), но при m=4 и &,.„ = 100 (j = 1,4) величинам становится равной З'Ю'. К тому же с ростом числа составляюш,их В ус- 90
ложняются процедуры поиска б^ и особенно Хд, что вызывает дополнительные затраты средств н времени на реализацию метода. Рассмотрим теперь случай, когда на каждом шаге решения появляется вектор Хд. Соответствующая постановка задачи может быть такой: найти хи . . ., л:„, у^, . . ., г/„, доставляющие max {г = 2 // i^/' У/) ^ при 2 о^х^- ^ &i„; I /=1 J 1=1 п ^ a^j-yj^b.^^; >fxj'^Q; Vj/j>0 — целые числа (/=l,n). Сохраняя предыдущие рассуждения, нетрудно прийти к основному функциональному уравнению Ч'^^гаах {fq{Xg, j/^) + ¥^_i}. Для этого достаточно зафиксировать величины х„, у„, представить z* в виде г*=гаах {/„ (л:„, yn)+^n-i]^ хп, Уп где Ч'„_1= max | Zi f/iX/, У/)\ , и т. д. Иссле- Xt, Ui. Дования, проводимые на очередном этапе с целью отыскания Хд = {Хд, Уд), усложняются, так как приходится решать оптимизационную задачу с несколькими переменными. Дальнейшие изменения условий задачи и приближение их к общим условиям, сформулированным в начале § 3.6, должны привести к новым вариантам промежуточных вычислений, дающих Хд, ^д, а также X*, z*. Проанализировать все эти варианты практически невозможно, однако главные выводы, касающиеся применения метода динамического программирования, сводятся к следующему. Остается неизменной структура основного функционального уравнения, вид которого определяется видом функции z. Различные вариации ограничивающих условий приводят лишь к изменению деталей этого уравнения (анализ функциональных уравнений другого типа станет необходимым при переходе к какому-либо новому классу задач). Линейные ограничения-неравенства, рассмотренные выше, были выбраны из соображений простоты и наглядности оценок, характеризующих основные этапы решения (в частности, упростилось определение пределов, в которых изменяются значения Xq, bq, q=\, п—1). В более сложных случаях возникают трудности поиска и описания параметров Вд, функций Чд, решений Хд. 91
Важным фактором, влияющим на разрешимость оптимизационных задач методом динамического программирования, становится увеличение их размерности. Это характерно для всех методов, но в данном случае определяющая роль принадлежит проблеме накопления, хранения и обработки промежуточной информации, объемы которой резко возрастают с ростом тип. Исследование задач с сепарабельной целевой функцией позволило более наглядно представить вычислительные аспекты динамического программирования, которые приобрели большое значение в связи с распространением быстродействующих ЭВМ. Рассмотренные в гл. 2, 3 методы математического программирования основывались на анализе свойств задач определенных классов. На практике выявить эти свойства удается далеко не всегда, поэтому возрастает роль так называемых прямых вычислений X*, z*. В них используется то или иное «ведущее правило» вне зависимости от конкретной формы задачи. В дальнейшем будут изложены наиболее распространенные подходы к проблеме формирования алгоритмов поиска оптимума в задачах математического программирования, представленных в общей постановке. Глава 4. ПРЯМЫЕ ВЫЧИСЛЕНИЯ В ЗАДАЧАХ ОПТИМИЗАЦИИ Разнообразие нелинейных задач математического программирования (с полной или неполной информацией) вызывает необходимость разработки методов оптимизации, не связанных непосредственно с анализом условий существования X* и базирующихся на вычислительных и логических операциях. Идеи этих методов обычно просты. Как правило, они следуют из соображений «здравого смысла» и сводят проблему решения той или иной задачи к выбору надлежащего алгоритма поиска X*, г*, причем желаемые свойства таких алгоритмов оговариваются заранее. Общим здесь является утверждение целесообразности (достаточности) предлагаемых подходов к решению экстремальных задач. Необходимость того или иного подхода чаще всего недоказуема. Численные методы играют значительную роль в прикладных исследованиях. Это обусловлено рядом причин, среди которых главное место занимает разнообразие функций f{X) и gi{X), а также форм их задания. В отдельных 92
слузаях бывает трудно определить, к какому классу относится та или иная задача и существует ли для нее обоснованный метод решения. На выбор метода может влиять и требование максимально использовать мощности ЭВМ с целью снижения затрат на исследования (если подобная перспектива реальна). Большое значение приобретает вычислительный эксперимент как источник информации о свойствах изучаемой задачи в условиях, когда ее сложность или неопределенность каких-то параметров затрудняют разработку удобной математической модели. Таким образом, численные методы оптимизации следует рассматривать как необходимое средство исследования операций различных по содержанию и сложности. §4.1. Алгоритмические отображения. Сходимость вычислительных процессов Центральными вопросами, интересующими исследователей проблем численной оптимизации, являются вопросы выбора подходящих алгоритмов поиска X*, 2* и анализа их сходимости. Каждый алгоритм предлагает правило, в соответствии с которым определяется очередная точка Х^ и подготавливается переход в точку X^j+i. Процесс поиска X*, г* характеризуется последовательностью указанных переходов (шагов), причем каждый из них дает некоторую информацию о направлении «движения», величине шага и т. п. Отношение, связывающее Х^^^ с Xk и составляющее основу применяемой вычислительной схемы, называется алгоритмическим отображением. Оно может принимать различные формы. Простейший его вид — функциональная зависимость Xu+i = W {Хи)- Здесь каждая точка X имеет (порождает) единственный образ W {X) (случай точечно-точечного отображения). Более общим является точечно-множественное отображение, где образ W {X) произвольной точки Х£ и представляет собой некоторое множество, включенное в и (область определения задачи). Следует иметь в виду, что характер отображения W может меняться с изменениями k. Алгоритм, построенный на основе того или иного отображения, сходится, если он либо непосредственно вычисляет экстремальную точку X* (и соответствующее г*), либо представляет ее в виде предельной точки Х^ последовательности {Xh}, k=l, 2, . . . . Необходимо подчеркнуть, что достичь точки X* за конечное число шагов удается не 93
всегда. В общем случае говорить о сходимости можно только в смысле существования Х„. Примерами, иллюстрирующими сказанное, являются: а) отображение вида Xh+i=Xk!r, г>\ (случай скалярного аргумента Х=х), дающее последовательность значений х, которая сходится (при й->оо) к а:„=0; б) отображение вида Xu+i^lXj^lp; xjr], p>r>\; здесь нельзя указать заранее, какая конкретно последовательность точек X возникнет, так как известно лишь, что Xhfp^Xk+i^Xi^/r, однако ее сходимость будет столь же быстрой, как и сходимость последовательности х^+^—х^/г. Анализ условий сходимости алгоритмов (и связанных с ними вычислительных процессов) основывается на следующих понятиях и определениях: функция W{Xu) называется непрерывной в точке Х^, если из равенства lim Х^^ = Х^ следует lim W{Xi^) = W{XJ\ /г->- со /г->- со точечно-множественное отображение W (Х^) называется замкнутым в точке Х„, если предельная точка последовательности {Xft+i}, выбираемой в соответствии с требованием Xi,+,eW{Xi,) {k = \, 2, . . .), принадлежит W {XJ (понятие замкнутости является обобщением понятия непрерывности); отображение W (Х/^) называется замкнутым на множестве и, если оно замкнуто во всех точках X £U. Пусть л:* =0 — решение некоторой экстремальной задачи, например задачи об отыскании A:^0->min {z=\+x} или A:^0->max {z=—2x^+3} и т. д. Если дано исходное значение a:=a:i=7^0, то допустимым оказывается алгоритм, использующий отношения X/^+j^^xJr при /•>! или а:^+, £ G [Xh/p, Xhfr] при р>/->1. Как уже отмечалось, последовательности {xk} в этих случаях обладают свойством \imXj;= О, Т. е. сходятся к рассматриваемой точке х*~0. Очевидно, не всякий алгоритм является приемлемым в указанном смысле. Так, если то при начальном значении Xi>\ возникает последовательность {Xfe}, сходящаяся к х^ = \. Тот факт, что алгоритм приводит к точке, не удовлетворяющей условию х^=х*=^0, равносилен нарушению требования сходимости. Чтобы найти причину неудовлетворительного поведения последовательности {х,^}, построенной в соответствии, с 94
формулой (4.1), заметим следующее: функция W {Xk) = л:ft//" является непрерывной в U, функция W (Xk) в виде (4.1) имеет разрыв в точке х~1. Именно это оказывается решающим для оценок того или иного алгоритма. Пусть поиск точки максимума функции z=f{X) на множестве и осуществляется с использованием точечно-множественного отображения W(Xft) и искомые X* существуют. Если при этом выполнены условия: 1) все Xft+i, порождаемые принятым W(Xft), образуют компактное множество (см. § 1.4), включенное в U; 2) для любой точки Xh+i^ е W{Xu), ХифХ* выполнено/(Xfe+i)>/(Xft); 3) при Хи=Х* алгоритм либо завершает поиск, либо вычисляет такие Xft+i, что /(Xft+i)=/(Xft)=/(X*); 4) отображение r(Xft) замкнуто во всех Х^фХ.*, то рассматриваемое отображение IF(Xft) приемлемо, поскольку соответствующий алгоритм либо останавливает процесс вычислений в X*, либо определяет X* в виде предельной точки последовательности {Xft+i}. Действительно, если нарушено первое условие, то последовательность {Xft} может иметь предельную точку вне и или вообще расходиться. Второе условие требует улучшения значений z на каждом шаге, т. е. обеспечивает желаемое развитие процесса. Третье условие исключает непроизводительные действия в заключительной стадии поиска X*. Наконец, четвертое условие необходимо для устранения тех опасностей, о которых говорилось выше применительно к (4.1). Таким образом, выбираемое отображение должно обладать рядом свойств, вследствие чего оно часто имеет весьма сложную структуру. На практике непосредственная проверка условий 1—4 бывает затруднена неудачным выбором W [Х^), который обычно связан с неформальными соображениями, поэтому проблема сходимости исследуется в каждом случае отдельно с использованием математического аппарата, вычислительной техники и других средств, которыми располагает исследователь. §4.2. Методы возможных направлений. Правила переходов Идея методов возможных направлений проста: из начальной допустимой (по условиям задачи) точки Xi осуществляется переход к новой допустимой точке, в которой значение целевой функции z лучше, чем в Х^. Процесс продолжается до тех пор, пока есть возможность улучшать г, 95
причем каждый шаг основан здесь на выборе подходящего направления выхода из очередной точки Х^ и оценке требуемой «длины шага», что позволяет в итоге найти X*. Формула, в соответствии с которой производится выбор Xf^ + i, имеет вид ^к+1 = ^к + акГк> (4.2) где Oft — величина й-го шага; г^ — единичный вектор, определяюш,ий направление перемеш,ений. Равенство (4.2) является обш,им и используется всегда, хотя в каждом конкретном случае нужно уточнять правила определения г^ и а^. В этом заключаются различия между отдельными методами, рассматриваемыми в данном параграфе. - Метод наискорейшего спуска. В основе метода наискорейшего спуска лежат следуюш,ие правила: в качестве г^ выбирается вектор градиента целевой функции f{X), т. е. yf{Xh)=(df/dxi df/dx„); величина а^ определяется либо условием /(Xft+i) = = max {/(Х^-f-Q^ftfft)} (в задаче на максимум г), либо f i^k+i) — ^^^ {/ i^k — '^к^к)} (в задаче на минимум г). °к>° Преимуш,еством метода является возможность получать наибольшие прираш,ения |г| при переходах от Xk к Xu+i (см. гл. 10). Изучаемый метод является одним из наиболее распространенных численных методов решения экстремальных задач. В его названии отражена идея скорейшего достижения точки минимума z. В предлагаемом виде метод используется тогда, когда отсутствуют ограничения на выбор X, т. е. /7=/?„. Для доказательства сходимости введем следуюш,ие предположения: 1) рассматривается задача на отыскание безусловного минимума f{X), причем множество ее решений непусто; 2) функция f{X) является выпуклой вниз и дифференцируемой, т. е. (V/(Xi), X,—X,)^f{X,)-nX,) при Х,ФХ„ Xi, Xi^Rn', в частности (V/(X,), X,-X*)^nX,)-f{X*)>0- 3) множество {X} точек X, обладаюш,их свойством / (Х)^ f(Xi), ограничено, т. е. diam {X}~D<.oo {Xi — начальная точка поиска); 96
4) для любых Х^, Xi, отличных от X*, выполнено неравенство fiX,)-f{X,)^{Vf{X,y, X,-X,)—l.\\X,-X,f, р>0. Использование этих предположений позволяет оценить поведение разностей f{Xu)~fiX*) (k = l, 2, . . .) и темса- мым ответить на традиционный вопрос о скорости сходимости процесса поиска X*, что косвенно подтверждает замкнутость W(Xu)- Из очевидного соотношения и предположения 2 следует [fiX,)-f(X*)]-[f(X,,,)-fiX*)]^ >wmr^^ifi''^)-nxiv- - Если f{X^)—/(Xft+i)>0 (это требование должно всегда выполняться, см. § 4.1), то последнее неравенство можно представить в виде 4—tk+i^b^tl, Ь^^-О, 4>4+i- Его реше- Г Л; П -1 ние есть /^+i ^t^ 1 + ^i 2 ^z L < = 1 . в этом, достаточно переписать рассматриваемое неравенство в виде tJtk+x—\>bkWtk+i или| \ltu+i—\ltu>butkltk+i и просуммировать по номерам k). Таким образом, / (Х^) —f {X*) С — ^ ^^^^"'^ ^^*^ k^l (чтобы убедиться 1- /(Хо-М^*) 1 = 1 f{Xi)-f (Xui) (V/(X/), Х,-Х*)2 (4.3) Теперь проблема оценки разностей f{Xj^)—f{X*) сводится к анализу свойств слагаемых, собранных под знаком суммы в знаменателе формулы (4.3). Для исследуемого случая f{X,)~fiX,^,)^f{X,)-f{X,-a,'^f{X,))^f{X,)- -f(X,-aVf{X,)), где а — произвольное неотрицательное значение параметра йи, йи — его же значение, найденное в результате минимизации f{Xk—CL^rji). Согласно предположению 4 f{X,)-f{X,-a^f{X,))> XV/(Xj; aV/(X,))-|||aV/(^,)p. Р > 0. 4 Де1тярев }0. И. 97
Положив здесь а=1/р, получим Далее, согласно неравенству Коши — Буняковского, (v/(Xft), Х^-Х*У^ОЦ'^[(ХЖ, поэтому (vnXi), X,—А'*)2 =^ 2PD2 • Замена каждого слагаемого суммы в знаменателе (4.3) величиной 1/(2Р D^) только усилит неравенство (4.3), следовательно, f/Y \ f (Х*\ <" f №)—7 (X*) 2pD^[/№)-f(X*)] ^ 2pD^ ■"2pD?-L-(ft-I)[/(Xi)-f(X*)] ^ Й-I • ^^-^^ Нетрудно видеть, что f {X,^)-^f (Х*) при й-^оо, т. е. имеет место слабая сходимость метода наискорейшего спуска. Решающую роль в получении оценок (4.4) играли предположения 1—4. Исследователь не всегда имеет в своем распоряжении столь обширные сведения об особенностях функции f{X), и проблема обеспечения сходимости остается одной из центральных в теории оптимизации. Метод циклического покоординатного спуска. Пусть заданы п единичных векторов d, . . ., е„, направления которых совпадают с положительными направлениями соответствующих координатных осей. Предлагается оптимизировать f{X) поочередно по каждому из указанных направлений, начиная, например, с первого Ci. После того как завершится исследование е„, происходит возврат к Ci и процесс (цикл) повторяется. Если Х^ — очередная точка, куда совершен переход, а ej — вектор, определяющий направление дальнейшего «движения» (1^/^п), то Xk+i находится из условия /(X+i) = rain{/(X^-{-fl^ey)}, Х^+2 — из условия f(X^^^) = "к = min {/(^A+i + flA+ie/+i)} и т. д. (в задаче на минимум г). Сходимость метода обеспечивается в предположениях о существовании непрерывных производных df/dxj (j=l, п), о единственности значения а^=аи, доставляющего минимум fiXk+Oh^j) на любом направлении е;(/=1, п) и т. п. Очевидно, можно разрабатывать и другие алгоритмы поиска X*, г*, объединяемые идеей выбора допустимых 98
направлений r^. В частности, учет не только необходимых, но и достаточных условий экстремума приводит к так называемым методам второго порядка, объединение полезных свойств разных методов — к методам сопряженнык градиентов и т. д. Важно заметить, что разнообразие подходов к проблеме выбора возможного направления перемещений от Xfe к Xh+i не затрагивает принципа вычисления Xk+i при известном г^ (оптимизация по параметру а,^). Сравнительная простота условий сходимости алгоритмов, основанных на использовании формулы (4.2), объясняется двумя причинами: 1) удобными свойствами функции /(X) (гладкость, единственность а^ и т. п.); 2) отсутствием ограничений на выбор Xh- Это затрудняет практическое применение методов возможных направлений в том виде, как они были даны выше. Возникает необходимость разработки других методов численной оптимизации, развивающих какие-то иные подходы к проблеме поиска X*, г*. § 4.3. Методы штрафных функций. Особенности учета ограничений Рассматриваемые методы основаны на идее преобразования имеющейся оптимизационной задачи с ограничениями в последовательность задач без ограничений. В этом смысле можно говорить об аналогии с методом множителей Лагранжа, позволяющим формально перейти от задачи на условный экстремум f{X) к задаче на безусловный экстремум Ф(Х, Л). Пусть требуется найти X-^min {z=[{X)} при ф,-(Х)^0 (г = 1, т). Введем функцию (О, X£U; ^(^^=\оо, Х^и и обратимся к задаче об отыскании точки X £ /?„, доставляющей минимум суммы f {Х)-\-¥' (Х)=^ (X). Если минимум S (X) будет найден в точке X, то она попадет в область и, определяемую исходными неравенствами Фг (Х)^0 (за пределами U значения =2^ бесконечно велики). Но в точках Х£ и функция =2'(Х) совпадает с f(X) (здесь <F (Х)=0), поэтому X оказывается точкой экстремума (минимума) f(X). Таким образом, формальный переход от f{X) к S{X) решает проблему учета ограничений ц>;{Х)^0. Функция S'iX), налагающая бесконечно большой «штраф» за выход точек X из U, называется штрафной 4* 99
функцией. Непосредственное ее использование в расчетах затруднено тем, что понятие бесконечности не имеет конкретного числового выражения. В практических исследованиях (F(X) аппроксимируется последовательностями функций ff'k(^), приближающимися в пределе (при й->оо) к ff'(X). Это позволяет унифицировать вычисления, применяя один и тот же алгоритм в решении разных задач. Существуют две разновидности методов штрафных функций — методы внутренней и внешней точки. В первом из них функция (F(X) препятствует выходу точек последовательности {Xfi} из и, во втором присутствие(F(X) должно предотвратить блуждание указанных Х^, «далеко за пределами» и при сохранении требований ИтХ^, = Х*, X*£U. Метод внутренней точки. Имея в виду сформулированную выше задачу поиска минимума f(X), зададим функцию (F (X) в следующем виде:1"(Х) непрерывна и принимает положительные значения во всех внутренних точках области и, lim (F(Xj^) = oo »(с приближением Х^ к любой граничной точке Х^ величина еГ возрастает). Пусть S{r) — некоторая монотонно убывающая скалярная функция аргумента г, стремящаяся к нулю при г-^оо. В этих условиях алгоритм поиска X*, г* предусматривает: а) выбор начальных Xi G U, ri>Q и составление суммы ^(Х,/•i)=/(X)+S(/-i)<F(X); б) решение задачи об отыскании точки безусловного минимума ^{Х, Гг) (она принимается за Ха и обязательно принадлежит области U); в) выбор нового положительного r=/"2<Ai и составление новой суммы ^(Х, /•2)=/(X)+S(r2)(F(X); г) повторное решение задачи на безусловный минимум S и определение на этой основе точки Хз=Х; д) повторение операций в), г) при уменьшающихся г, т. е. формирование последовательности {Xft} до тех пор, пока равенство f{X^+i)=f{X^) не будет выполнено с заданной точностью, что явится признаком окончания процесса поиска X*, г*. Возможности метода внутренней точки иллюстрирует приводимый ниже пример. Пример 4.1. Найти Xi, Х2-^тт{г^Xi-\-х^ при х^—xX^s^Q, х{^0. Решение начинается с выбора функций ^ (X) и S(r). Удобно в качестве т oF (X) рассматривать— 2 1пф,-(^), в качестве S (/■) просто/-. Тогда на 1 = 1 каждом шаге будет исследоваться функция J^{X, r)=Xi-\-X2—r[ln{X2— -tf)+lnxi]. СуществоЬание точек безусловного минимума X связано 100
5Jf с равенствами ^—^^—'' Х2 — Зх^ lxi[x2 — xiy (достаточные условия min Jf здесь выполняются). Следовательно, искомые экстремальные точки всегда будут находиться на линии X2=-'^i+3a'i> которая лежит внутри области х{^0, Х2—xl^O (за исключением точки 0,0), и каждую из них можно принять за Xi. Далее следуют обычные операции: выбирается Xi=(l,4) и г^=1, т.е. if(X, ri) = x^-\-X2—lnxi(x2— —xi); решается система 5Jf(Xi, r{)!dxi=0, d^(Xi, r^j/dx^—O, что дает X2=(l/2, 5/4); принимается /'2=0,5 и исследуется if(X, /■2) = -ti+-t2—lnxi(x2— —x{)/2, достигающая минимума в Хз=(0,31; 0,59); операции повторяются для /-3=0,25, г^=0,1, ... и это позволяет получить Х^, Х^ и т. д. последовательность которых стремится к Х^= = (0, 0): точка (О, 0) становится подозрительной на экстремум функции f(X); в той окрестности точки Х„, которая принадлежит области U, функция f(X)=Xi-i-X2 положительно определена (достаточные условия минимума), поэтому Х*=(0, 0) и г*=0. Если бы в проведенном решении была принята другая последовательность {Xj;}, ТО ЭТО привело бы к другим Х^, Х2, ..., но конечный результат остался бы тем же. Метод внешней точки. Предположим, что функция <F (X) обладает следующими особенностями: она непрерывна и строго положительна в /?„, кроме точек X^U (в них она равна нулю). Функция S{r) монотонно возрастает с увеличением г и имеет пределом оо (при г-^оо). Существует некоторое компактное множество G, содержащееся в /?„ и включающее в себя U, т. е. UcGcR^. Алгоритм поиска экстремума предусматривает: а) выбор начальныхгс>0, Х^^Ьисоставление суммы^{X, ri) = =f {X)+S (ri) If (Х); б) решение задачи об отыскании точки безусловного минимума =2'(Х, ri) (она принимается за Х2, но в и может пока не попадать); в) выбор нового г=Г2>Г1 и новой суммы ^ {X, r2)~f{X)-\-S{r2W {X); г) повторное решение задачи на безусловный минимум ^ и определение тем самым точки Х^, д) повторение операций в), г) при возрастающих г, т. е. формирование последовательности {Х,^) до тех пор, пока равенство /(X^^+i) =/(Х^г) не будет выполнено с заданной точностью. Тот факт, что на начальном этапе поиска точки последовательности {Xf^} находятся вне U, не имеет большого значения, поскольку рано или поздно они начнут попадать в и и выйти оттуда уже не смогут (так построена <f (X)). Практическое применение рассматриваемых методов может осложняться присутствием ограничений-равенств 101
Ф,(Х)=0, определенностью f{X) не во всех X£R„ и т. m Это вызывает необходимость комбинирования алгоритмов на основе требования учета одних ограничений на протяжении всего вычислительного процесса, а других — только вблия! оптимума. Такой подход расширяет круг задач, решаемых предложенным способом. Сходимость методов штрафных функций устанавливается тем легче, чем больше «удобных» свойств имеют f{X) и фДХ). Речь может здесь идти, например, о гладкости целевой функции, компактности множества U, отсутствии изолированных экстремальных точек. Рассмотрим пример решения задачи методом внешней точки. Пример 4.2. Найти х^, A:2-^rnin{z=—х^х^} при х-^'\-х^'^0, 1—atj+atI^O. т Решение проведем для случая g^ (Х) — 2,\——Р-^ ) • и S(r)=r. 2 (=1 ' (О, ф/=аО; Учитывая, что ф/ —l9;l = S„ получим Х(Х, г) = 1%. ф,- < О, ( —XiXi, X^U\ — •{ /1 „■_L,,2\9 j_/,, \ ^ \i ^^ vtti! Поиск точек безусловного минимума JS несколько усложняется (производные dX'idxj разрывны), ио возможен практически произвольный выбор Xj. В остальном вычислительная схема сходна с той, которая рассмотрена в примере 4.1. Полагая Х^={\ ,1), /■1=1, строим последовательность {(089; 0,64), (0,77; 0,62), (0,73; 0,61), (0,67; 0,58), ...} для г, равных соответственно 1, 2, 3, 10 Ее предельной точкой является Х»,=(0,666; 0,577). Проверка достаточных условий минимума подтверждает оптимальность Х„, т. е. А:*=(0,666; 0,577) и г*=—0,385. В заключение заметим, что методы штрафных функций допускают различные приемы оптимизации ^ {X, г) и могут использоваться для решения довольно сложных нелинейных задач. § 4.4. Метод ветвей и границ. Модель технологического контроля Область определения задач математического программирования часто имеет дискретную структуру, т. е. представляет собой совокупность конечного числа точек, линий, поверхностей (см. § 2.7). В отдельных случаях удается выявить типичные признаки структуры (узлы целочисленной решетки, множества параллельных прямых и т. п.), однако в общем случае такие признаки отсутствуют, что затрудняет поиск решений соответствующих задач. Появляется необходимость применять различные комбинаторные методы, 102
простейшим (и нежелательным) представителем которых Оказывается метод полного перебора вариантов. Пусть дана задача: найти XGt^-^min {z=f{X)}, где и — дискретное множество. Предположим, что U можнй разбить на непересекающиеся подмножества Ui, U ^, . .:, и^, причем способ разбиения не оговаривается и должен выбираться применительно к конкретным условиям исследования. Кроме того, существует некоторый способ оценки нижней границы значений z на каждом подмножестве ^i ('=1. il)> позволяющий найти ряд чисел г;, обладающих свойством Zi^{X}, X^Ui. Рис. 4.1 Если допустить, что каждая подобласть Ui делится, в свою очередь, на новые Un (1^г^т), 1=1, р) и существуют пути получения соответствующих Zn, то имеет смысл исследовать процесс ветвления (рис. 4.1) с целью выявить бесперспективные подмножества U и сократить за счет этого объемы вычислений. Идея направленного разбиения области и с последовательными оценками 2;, г,-,, • • • лежит в основе метода ветвей и границ. Чтобы иметь возможность сравнивать между собой подмножества Uii, . . ., заметим следующее: каким бы способом ни была найдена оценка z, относящаяся к исходному U, она не ухудшится при рассматриваемых разбиениях (переход к более узким областям поиска исключает улучшение г), т. е. Zi'^z (t = l, п), ZiC>Zi (l^t^T); l = \, p) и т. д. Чем больше расходятся величины правых и левых частей этих неравенств, тем менее перспективным представляется соответствующее подмножество очередного уровня, однако необходимые выводы мож1ю сделать только после вычисле- 103
ния всех Zi, затем всех Zfi при некотором фиксированном i, найденном на предыдущем шаге и т. д. Результатом этих действий является постепенное сужение области поиска X*. Алгоритм метода предусматривает: получение z и выбор начальной точки Xi ^ U (правила для этого формулируются применительно к конкретным условиям задачи); сравнение z с f(Xi); если окажется f{Xi)=z, то Xi = =:Х* (это следует из определения z), в противном случае процесс оптимизации продолжается; разбиение множества U на конечное число подмножеств Ui (i = l, ц) произвольным способом; получение оценок г,- и выбор среди них z^= min {zi}, 1<г<т1 что однозначно определяет подмножество U^., предназначенное для дальнейших исследований; выбор точки Xi 6 f^v (аналог Xf) и сравнение 'zy с f{X^; если Zv=/(X2), то Х^=Х*; при f{X^>Zy — продолжение процесса; разбиение U^ на ряд подмножеств U^i (/=1,р) тем или иным способом; получение г^^ и выбор среди них Zy^l= min {Zy,i}, что позволяет указать t/^^; выбор Xu^Uy^i, и сравнение г^^ и/(Хз); в зависимости от результата — конец или продолжение процесса поиска X*. Предложенный алгоритм обладает тем преимуществом, что не налагает никаких ограничений на структуру U и при удачных разбиениях позволяет эффективно исключать бесперспективные t/;,..,. Вместе с тем разработка правил ветвления и способов отыскания очередных z и Xfi (k=l, 2, . . .) может потребовать специальных исследований, отражающих специфику конкретных задач, но часто приводящих к отрицательным (в смысле экономии средств и времени) результатам. Метод ветвей и границ хорошо зарекомендовал себя в решениях целочисленных линейных задач, ряда задач распределения ресурсов, однако в общем случае его применение требует осторожности. Рассмотрим одну из моделей, допускающих использование изучаемого метода. Для койтроля состояния и ремонт- 104
ного обслуживания автоматизированной технологической линии предполагается создать два контрольно-технических поста (КТП). Линия состоит из десяти единиц оборудования и имеет значительную протяженность, что приводит к необходимости закреплять за каждым постом зону обслуживания. Ее расширение (в пределах линии) увеличивает затраты на создание и функционирование контрольного поста (усложняется организация работы, требуется хранить больше материалов, снижается надежность всей про- al ' Оборудобание линии <S^ <^ <d ^ ?; Хг (1,10) 10 (9,10) '' Кг] 1 1 1 t 2 7 О 1 2... 10 Рис. 4.2 изводственной системы), поэтому ограничиться установкой одного КТП нельзя. Требуется определить места расположения двух контрольно-технических постов, позволяюш,ие минимизировать размеры зон обслуживания при условиях: а) все единицы оборудования линии являются одинаково важными и должны находиться под контролем; б) размещение постов допустимо только в разрешенных местах; в) расстояние между КТП не должно быть меньше заданного; г) для повышения надежности работы линии каждый пост должен иметь возможность обслужить любую ее «точку». Чтобы формализовать задачу и уточнить тем самым рассматриваемые обш,ие условия, представим технологическую линию в виде совокупности точек — мест установки оборудования (рис. 4.2, а). Их номера удобно принять в качестве координат, и тогда исследуемая схема будет представлена отрезком числовой оси (рис. 4.2, б). Если х — предполагаемая координата контрольного поста, то он должен быть рассчитан на зону обслуживания шириной max {х — 1, 10— X). В случае двух КТП их координаты Xf, Хг выбирают в соответствии с требованием Х\<.х<г, (рис. 4.2, в), а совместные технические возможности характеризуются величиной 105
max (xi—1, 10—Xi, x^—1, 10—x^, которая равна тах(л:2—1, 10—x^, поскольку при указанных Хх<Хг vA^i- полнено 10—а;2<10—Хх и х^—\<.х^—1. Пусть для определенности минимально допустимое расстояние между КТП\ и КТП2 составляет 1, а сами они могут располагаться только там, где смонтировано оборудование (т. е. Xi и Х2 целочисленны). Тогда формальная задача приобретает вид: найти Xi, A^a-^min {z=max {х^—1, 10— —Xi)) при Xi'^l, Xi^lO, x^—A^i^l, Xi и Xi — целые числа. Очевидно, условия а — г здесь полностью учтены и для удобства расчетов конкретизированы. Переходя к решению поставленной задачи методом ветвей и границ, заметим, что множество U (область определения) содержит порядка 35 узлов целочисленной решетки, попавших в треугольник с вершинами (/, 2), {1, 10), {9, 10), представленный на рис. 4.2, г. В выражении г под знаком максимума собраны величины, превосходящие единицу, поэтому оценка z есть 1. За Х^ здесь можно принять точку (/, 2), принадлежащую и. Поскольку значение /(/, 2) = тах(/, 9)=9 превосходит 2=1, необходимо продолжить поиск X*. Разобьем множество U на два подмножества — точки, лежащие на прямой x-i—1=10—Ху (т. е. а:2=11—%), и все остальные точки (это упрощает вычисления г). Таким образом, в U^ входят (/, 10), (2, 9), (3,8), (4,7), (5, 6) и легко вычисляется Zi=5. Для X^Ui выполнены либо неравенства а:2<11—Xi, либо а:2>11—Xi, т.е. f(X)^6, откуда 22=6. Сравнивая Zi с 22, приходим к выводу о том, что дальнейший анализ должен проводиться применительно к Ui , поскольку z^-Cz^. Подмножество V^ содержит всего пять элементов, и они уже исследованы. Здесь экстремальной является точка (5, 6), в которой "г достигает значения 2i=5, поэтому Х*=(5, 6), г*=5. Из полученного решения следует рекомендация разместить первый контрольный пост в точке Хх~Ь, второй пост — в точке Хг=^, и тогда расчетная ширина зон их обслуживания составит пять единиц (оба КТП должны быть одинаковыми). В рассмотренном методе ветвей и границ используется идея декомпозиции исходной оптимизационной задачи, причем допускаются различные способы ее разбиения на ряд относительно простых подзадач. С этой точки зрения представляют интерес и другие методы, развивающие принципы комбинаторики применительно к исследованию операций. § 4.5. Комбинаторные алгоритмы. Элементы теории расписаний Оптимизация на дискретных множествах и связанные с ней проблемы встречаются в практике разработок АСУ постоянно. Соответствующий пример был рассмотрен в 106
§ 4.4, однако круг задач, в которых нужно изучать какие- либо комбинации чисел или множеств, значительно шире, чем это может показаться на первый взгляд. Редко удается использовать для их анализа известные методы, поэтому долгое время считался вполне естественным и почти неизбежным простой перебор вариантов решений с целью найти среди них оптимальные. Применительно к задачам малой размерности такой подход всегда оправдывал себя, но задачи большой размерности оказывались (и оказываются сейчас) настолько сложными, что поиск эффективных (быстродействующих) алгоритмов чаще приводил к дополнительным трудностям, чем к полезным для практики результатам. Создание и широкое распространение ЭВМ значительно улучшило рассматриваемую ситуацию. Появилась возможность ускорить сам процесс перебора (если в нем есть необходимость), осуществить запоминание и хранение больших массивов промежуточной информации, повысить интерес исследователей к разработке специализированных алгоритмов, реализуемых с помощью ЭВМ. Комбинаторные алгоритмы (или комбинаторные вычисления) являются, в частности, средством анализа оптимизационных задач с дискретной структурой, для которых характерна либо расчлененность области определения на отдельные (изолированные) элементы — точки или подобласти, либо конечность множества значений целевой функции и т. п. Обычно эти алгоритмы не имеют «ядра», т. е. некоторого набора основных положений, теорем, правил, позволяющих получать общие результаты и рекомендации. Вместе с тем многочисленные исследования и опыт разработки комбинаторных алгоритмов показали, что в ряде случаев существуют единые принципы организации вычислений, отражающие особенности того или иного класса моделей. В качестве примеров можно назвать тот же метод ветвей и границ, различные способы построения кодов, исследования на графах, стандартные приемы преобразования таблиц, разновидности динамического программирования. Важной областью применения комбинаторных алгоритмов является календарное планирование (составление расписаний), приобретающее особую актуальность в связи с проблемами эффективной организации производственных процессов как в плане улучшения использования оборудования (станков, вычислительных машин, поточных линий), так и в плане повышения качества продукции. 107
Теория расписаний представляет собой единую научную дисциплину, изучающую распределительные задачи, в которых ограниченным ресурсом оказывается время. Предлагаемые ею методы находят применение не только в управляющих системах, связанных с материальным производством, но и в системах, координирующих работу вычислительных центров, научно-исследовательских институтов, конструкторских бюро. Возникновение и последующее развитие теории расписаний характеризовались попытками изучить широкий круг задач, начиная с простейшей задачи выбора очередности выполнения off работ одним исполнителем и кончая так называемой общей задачей, связанной с анализом многоэтапных технологических процессов. Несмотря на простоту постановок, лишь немногие задачи решены точно, и одна из причин этого заключается в трудностях исследования вопросов сходимости методов и алгоритмов, предлагаемых в тех или иных случаях. Построение приемлемого календарного плана (расписания) равносильно согласованию во времени многих производственных операций, что способствует совершенствованию программ деятельности систем и развитию методов оперативного управления ими. Расписанием можно назвать документ, содержащий сведения: о количестве и номенклатуре выполняемых работ, включая их этапы; о моментах начала и окончания каждой работы; о месте и технических средствах выполнения каждой работы; о затратах времени (и материальных ресурсов) на все проводимые работы. Этих сведений достаточно для формального представления расписаний, хотя на практике они могут дополняться и уточняться в интересах более полного учета той реальности, которая отражена в модели. Раписания можно задать разными способами, среди которых наиболее наглядным является геометрический, основанный на использовании графика Гантта (или Гантт- карты). Каждой работе ставится в соответствие отрезок определенной длины, каждому типу оборудования — прямая линия (ось времени), вдоль которой размещаются отрезки — работы, выполняемые на этом оборудовании. При известном начале отсчета времени ^=0 взаимное расположение отрезков дает всю необходимую информацию (рис. 4.3). Простейшая задача теории расписаний формулируется следующим образом: имеются # работ и единственный «исполнитель» (станок, технологическая линия и т. п.); из- 108
Htm Тц ... Ч Ь- ■^п,Г ^12 ^*П Тп ■ ^/ вестны и фиксированы длительности работ (Ту, /=1, #), задан критерий эффективности К; требуется найти порядок проведения этих работ, доставляющий минимум (или максимум) К. Поставленную задачу можно решить, в частности, методом полного перебора вариантов загрузки «исполнителя» при любых ограничениях на выбор перестановок работ. Даже на этом частном примере выявляются особенности, присущие вообще задачам составления расписаний. Так, обычно приходится сталкиваться с комбинаторными схемами поиска решений, большим числом исследуемых вариантов, разными способами задания К. Следствием этого является большое разнообразие приемов исследования и допустимость приближенных результатов во многих практических ситуациях. Возникновение теории расписаний связано с так называемой задачей о двух станках, выполняющих последова- -7 f'O Рис. 4.3 +^^ н—ь 124±_|'' Гп Тгг г,г Г^ \ т "к t=0 \ \ \ \ \ \ _£гг_\_5?г...\..- \---'^« -f- ■+■ Рис. 4.4 тельное работ. В начальный момент времени ^=0 первая (по установленной очереди) работа попадает на первый станок и занимает его некоторое время Тц, после чего переходит на свободный второй станок, где ее выполнение заканчивается за время т^^. Этот цикл повторяется для остальных работ, проводимых по мере освобождения станков в условиях, когда очередность работ на обоих станках одинакова; на каждом станке одновременно проводится не более одной работы; каждая работа выполняется без прерываний, и ее переход на второй станок возможен лишь после того, как она полностью завершится на первом станке (соответствующая Гантт-карта показана на рис. 4.4). Требует- 109
ся найти такой порядок проведения указанных работ, который обеспечивает минимум полного времени занятости Г^ рассматриваемой двухстаночной системы. Для названных условий С. Джонсоном предложена важная теорема, носящая его имя и утверждающая, что при возможном произвольном выборе имеющихся Jf работ порядок их выполнения, доставляющий минимум Т^, должен удовлетворять требованиям min(T^i, T^+i,2) <min(T^+i,i, т^з). i'^l. ^ЛГ—1. (4.5) Значение теоремы Джонсона определяется ее наглядностью и простотой алгоритма, к которому она приводит. Здесь имеет место довольно редкий случай, когда строго доказывается достаточность каких-то формальных соотношений [в частности, неравенств (4.5)]. Не останавливаясь подробно на доказательстве (его можно найти в [17]), заметим, что использование (4.5) резко сокращает количество перебираемых вариантов расписания (при полном переборе оно достигает off!). Сделанные замечания конкретизирует приводимый ниже пример. Пример 4.3. Даны 5 работ, выполняемых в системе, состоящей из двух станков. Затраты времени указаны в табл. 4.1. Требуется найти Оптимальный (в смысле min Т^) порядок проведения этих работ. Таблица 4.1 Работы (в произвольной нумерации) Продолжительность выполнения на первом станке Продолжительность выполнения на втором станке 1 6 3 И 0 2 111 5 4 IV 8 6 V 2 1 Для решения поставленной задачи удобно построить новую таблицу данных, в которой перечислены все имеющиеся Tj,i, т^,2 и указаны две пос.аедовательности работ, получаемые упорядочением сначала Tj,i, а затем т^,з по признаку возрастания (табл. 4.2). , г С помощью табл. 4.2. легко проверяются неравенства (4.5) для любых пар номеров v, v-\-1. 1. Предположим, что работа И, попавшая в нулевой столбец табл. 4.2, занимает (ц+1)-10 позицию в будущей оптимальной расстановке работ (2<а+1 <|т|\Г).|Следовательно, должно соблюдаться условие min(Tj,i, 2) <min(0, Tj,2) или min(Tj,i, 2)<0, где t^i, Ту^ — параметры той работы, которая займет v-ю позицию, Очевидно, это невыполнимо, так 110
Таблица 4.2 Все Тц. Тгг Первая последовательность Вторая последовательность 0 II — 1 — V 2 V II 3 — I 4 — III 5 III — 6 I IV 8 IV — как возможные значения T^i есть 2, 5, 6 и 8 (см. среднюю строку табл. 4.2). Приходится признать, что работа II не может следовать ни за какой другой работой и должна запять первое место в искомом оптимальном расписании. 2. Предположим, что работа V, попавшая в первый столбец табл. 4.2, занимает v-ю позицию в будущей последовательности работу т. е. min(2,Tj,+i, 2)<min(Tj,^i_ 1, 1). Среди возможных Tj,^i_i (средняя строка табл. 4.2) нет меньших единицы (работа II теперь не принимается во внимание), поэтому исследуемое неравенство сводится к min(2, Tj, + i, з)<1 и оказывается невыполнимым, поскольку значения tv+i, гберутся из {3, 4, 6} (см. нижнюю строку табл. 4.2). Таким образом, работа V должна идти за другими работами, т. е. попасть на последнее (пятое) место. 3. Предположим, что работа I, стоящая в очередном (третьем) столбце табл. 4.2, размещается на v-u позиции (второй столбец пропускаем, так как в него вошли уже рассмотренные работы V и II). Из неравенства min(6, Tj,^i, 2)<niin(Tj,+i i, 3) следует min (6, Tz,+ i, 2)<3, что недопустимо из-за отсутствия Tj, + i_2, меньших 4 (нижняя строка табл. 4.2). Очевидно, работа I должна занять место после III и IV. 4. Предположим, что работа III (четвертый столбец табл. 4.2) попадает на у-ю позицию и min (5, Tj,+i, 2)<niin(Tj,^i_ i, 4). После проведенных проверок единственными значениями Tj,^i_ 1 ht,j,^i_2 остаются 8 и 6 соответственно. Они нарушают рассматриваемое неравенство, поэтому работа III размещается после IV. Анализ предположений на этом заканчивается (их здесь порядка mV'). и в результате становится возможным назвать последовательность работ II, IV, III, I, V, дающую минимальную величину ^^=23. Полный перебор вариантов решений здесь исключен, поскольку теорема Джонсона позволяет ограничиться исследованием не более Jf^ пар чисел tvi' ''^оз и Tj,^i,i, Tj, + i_i (при машинном счете). Попытки распространить рассмотренные условия оптимальности на системы с произвольным количеством станков пока не привели к успеху, однако они вызвали интерес к задачам календарного планирования, изучение которых продолжается.
§ 4.6. Модель мультипроцессорной системы. Упорядочение работ Мультипроцессорной системой (или просто мультипроцессором) называется совокупность параллельно действующих одинаковых технических устройств или исполнителей, осуществляющих заданные операции. Это общее определение можно отнести и к многомашинному вычислительному комплексу, и к группе станков, и к коллективу работников какого-либо подразделения. В дальнейшем, отвлекаясь от содержательных интерпретаций рассматри- Рис. 4.5 ваемого понятия, будем называть элементы мультипроцессорных систем каналами обслуживания, процессорами, технологическими линиями. Исследуемая здесь задача упорядочения работ представляет интерес по двум причинам — она является типичной задачей теории расписаний, и к ней сводятся (с соответствующими оговорками) многие другие задачи. В частности, схему загрузки двух станков (рис. 4.4) можно отождествить со схемой мультипроцессора, выполняющего связанные между собой операции. Пусть имеются Ж работ и L каналов (процессоров), предназначенных для их выполнения (предполагаем gV^L). Любая работа может быть проведена в любом канале, и время, необходимое для этого, известно. Требуется распределить указанные Jf работ по L каналам так, чтобы полное время Т^ занятости системы было минимальным. На рис. 4.5, а показан (в виде Гантт-карты) возможный вариант распределения работ. Здесь t„ — общее начало отсчета времени; t„j — продолжительность v-n (по поряд- 112
ку) работы в /-М канале (l^v^tii, 1^/^L), A/j,_i^ i— задержка начала v-я работы относительно окончания {v—1)-й работы; А^ог—запаздывание /-го канала относительно момента t„. Время занятости процессора (канала) с номером / "1 (1^/<L) оценивается как 7"^= 2 i'^vt + ^K-i г), где v=l Hi — количество проводимых в нем работ (очевидно, 2'ii = uV)- Время Ti отличается от среднего времени ^ср=7:2.^о причем всегда ^{T^.p~Ti) = LT^^ — 1=1 I L — 2^; = О- Следовательно, нельзя ожидать значений Т,, меньших Гер, и задача заключается в том, чтобы минимизировать отклонения Г; (/=1, L) от Гер (наилучшим было бы решение, дающее Гс=^ср)- В этих условиях увеличение Гер является нежелательным, однако оно может произойти из-за неудачного выбора A^j,_i, ^- Если A^j,_i, i фиксированы заранее (например, учтены потери времени на подготовку очередных работ или запланированы какие-то вспомогательные операции), то их удобно включить в соответствующие Tj,;, изъяв формально из рассмотрения. Если же A^j,_i, I выбираются произвольно, их лучше считать равными нулю с самого начала и не вводить в оценку Г^р. Таким образом, в любом случае достаточно исследовать схему, показанную на рис. 4.5, б, с целью отыскания величины min max Г^. \i ^ Имея в виду утверждение о том, что наилучшей комбинацией величин Г1, Гз, . . ., Ti является та, в которой '^Ti=T^^, перейдем к анализу одного из возможных алгоритмов упорядочения работ в мультипроцессорной системе. Он предполагает последовательные коррекции схем загрузки каналов, начиная с некоторой предварительной схемы, получаемой эвристическим путем. Пусть известные длительности работ Ту(/'=1, Ж) упорядочены по признаку возрастания и соответственно перенумерованы (рис. 4.6, а). В таком случае легко определяется р наименьший номер /=р, отвечающий условию 2 ''^•^Т'ср' / = 1 р что позволяет сравнить между собой разности 2 'V—^ср. '"' 113
p^l Гер— 2 '^j и выбрать в качестве Т^ либо 2 Ъ (если пер /=1 р-1 /=1 вая разность меньше второй), либо 2 Ъ (если вторая раз- / = 1 ность меньше первой), исключив тем самым из дальнейшего рассмотрения т^-, составившие Ti. Повторяя эту несложную процедуру применительно к оставшимся т^-, получаем й/ г, Tj. ...Гд, Ты л. г, Гг г^! 1 I Н h ■Ты Рис. 4.6 Л сначала Т.2, затем Гд и т. д. Среди указанных Т^, Т^, . . . находится величина тахТ,, так что Г^р ^min Т^ ^ max Т,. с I Если расхождение между Гер и найденным max Т^ окажется слишком большим, то возникнет необходимость анализа большого числа комбинаций Ti, Т^, . . ., Ti, многие из которых будут затем отброшены как ненужные. Чтобы избежать этого, достаточно найти среди полученных Ti, Т2, . . ., Т^ величину ттТ^, вычислить разность max Г; — т!пТ;(на рис. 4.5,6 это было бы 7'^;_2—T,_j) и перераспределить работы между наиболее и наименее загруженными каналами с целью получить лучшее (меньшее) значение max Т^. I Поскольку трудоемкость подобных операций невелика (они могут производиться вручную даже при (>,^Г>100 и легко формализуются), имеет смысл их повторять, добиваясь приемлемых отклонений max Г^ от Т^^. I После того как рекомендуемый межканальпый обмен работами будет завершен (решение об этом принимает исследователь применительно к конкретной обстановке), станет возможным оценить погрешность результата, выражаемую либо разностью тахТ^- Г^р, либо отношением 114
fmaxTi — Т^Л1Т^^. Если эта погрешность находится в допустимых (с точки зрения исследователя) пределах, то процесс оптимизации расписания для мультипроцессора заканчивается. В противном случае приходится изыскивать способы уточнения результата. По смыслу исходной задачи все Т] и Г; есть рациональные числа. В формальном рассмотрении нх можно считать целыми (это достигается изменением масштаба чертежа, рис. 4.5, б), что, в свою очередь, определяет и целочислен- ность min Т^. Следовательно, переход от одного (сравнительно худшего) значения min Т^ к другому (лучшему) значению должен быть связан с какими-то операциями перебора. off Теорема 4.1. Уравнение ^aiXi=b с целочисленными 1=1 ui и b имеет решения (положительные, отрицательные, нулевые), если наибольший обилий делитель (НОД) рассматриваемых а; делит Ь. Это утверждение можно использовать применительно к изучаемой задаче лишь для того, чтобы выявить и отбросить заведомо непригодные значения Ti, Т^, . . ., Г^. Пусть дано простейшее равенство Ti«/i+T3«/2=S. Очевидно, найти у^, у^ в виде нулей и единиц удастся тогда, когда выполнено хотя бы одно из условий Ti=S, T2=S, Ti+Ti=9B. В общем случае {Ж переменных) число подоб- ных условий достигает 2 ^If ~2 . однако не все они т= I представляют интерес. Если упорядочить т^ и указать соответственно наименьший и наибольший номера /=р, i=q, для которых ^-С/^Зв, 2 У^^ (рис. 4.6, б), то легко отыскиваются сочетания величин т^, которые нужно исследовать (не имеет смысла брать сочетания более чем из р—1 и менее чем из Ж—q-i-1 элементов, так как р самых коротких и Ж—q самых длинных отрезков в сумме превышают Я (рис. 4.6, б). Таким образом, количество анализи- руемых вариантов уменьшается до 2 ^др' но все т = Ж-Я+' же остается значительным, поэтому целесообразно искать решения сразу для всех возможных ^ (рис. 4.6, б), а затем классифицировать их. Остается заметить, что в роли ^ должны выступать те значения Т^, которые удовлетворяют 115
требованиям теоремы 6, т. е. Гс=Гср, Гс=Гср+НОДт., Гс = = Гер+2Н0Дх., ... Если уравнение 2 t^jUj^^ решено при допустимых Si, то тем самым указаны наборы величин т^-, дающих в сумме эти S. Очевидно, план распределения работ по каналам мультипроцессора составляется только из «непересекающихся» (т. е. не содержащих одинаковые tj) наборов, и это необходимо иметь в виду при окончательном выборе решений. Проверять все варианты нужно лишь тогда, когда ставится цель найти все оптимальные решения (на практике это требуется редко). Алгоритм упорядочения работ, основанный на предыдущих замечаниях, объединяет следующие этапы поиска оптимума: оценку Гер и определение наибольшего общего делителя чисел Tj (j=\, c!f), т. е. НОД^.; составление предварительного плана путем сравнения р р-1 разностей ^ Ту—Г^р и Г^р— 2 '^/ (рис. 4.6, а); /= 1 /= 1 уточнение предварительного плана за счет перераспределений работ между парами каналов (наименее и наиболее загруженных), что дает приемлемое значение тахГ,, а также min Г,; I выбор таких целых чисел ^ из диапазона min Г^ — I —max Ti, которые делятся без остатка на НОД т^-; решение уравнения 2 т^у = .53 сразу для всех Sic одно- временной классификацией получаемых результатов; проверку гипотез т'тТ^ = Т^^, minГс = Г^р+НОДт;.^ т1пГс=Гср+2Н0Дг ...и поиск для каждой из них «непересекающихся» наборов Ту; в зависимости от его исхода — конец процесса или обращение к новой гипотезе. Ниже дан пример применения рассмотренного алгоритма. Пример 4.4. Четырехканальный мультипроцессор (L=4) загружается семнадцатью работами (gj\f*= 17), продолжительность выполнения которых указана ниже: Работы . . 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Ту, усл. ед. 54 60 60 72 75 78 90 90 96 108 111 120 120 123 135 150 150 116
требуется найти оптимальный (в смысле минимума Т^} план распределения работ по каналам. 17 Решение начинается с подсчета Г^р =-j-^ ту = 423 и НОД^ =3, после чего составляются суммы "У] tj^^^^i < 423, "V Ту = 399 < /=1 /=1 7 7 < 423 2'Ту = 489 > 423, что дает р=7. Величина 2 т — /• = 1 /=1 ^ б —7'ср = 66 сравнивается с Г^р — 'У]'^/=^'^ и фиксируется T'i=399 (в первый канал идут работы с номерами 1—6). Далее составляются суммы T7+Tg= 180<423, Т7+Тз+Т9= =276<423, ..., из которых первой, превысившей Гер, оказывается И И 10 2^7 = 495. Сравниваются 2''"у — ^ср = 72 и Г^р—2''^у' = 39, /=7 !=Т !=Т откуда следует Т'2=384 (во второй канал идут работы 7—10) и т. д. В результате формируется следующий предварительный план загрузки каналов: 54 60 60 72 75 78 90 90 96 108 111 120 120 123 135 150 150 /=1, Г1 = 399 1=2, Г2=384 1 = 3, Гз = 474 / = 4, Г4 = 435' где maxTi=Ts; minTi = T2; Ts~T^ = 90 I I Производится перераспределение работ между вторым и третьим Каналами (процессорами) с целью уменьшить Т^ (и соответственно увеличить 7*2) примерно на (Гз—Т'2)/2=45 единиц, что приводит к передаче в третий капал работ с длительностями 90, 96 вместо 111, 120 и получению нового (улучшенного) плана (54 60 60 72 75 78), (90 108 111 120), (90 96 120 123), (135 150 150), в котором разность max Г^ — т'шТ[ = Т^—T'i = 36 еще довольно велика. I 1 Имеет смысл повторить операцию уточнения плана, передав из первого в четвертый канал работы 60, 72 (вместо 150), и получить 54 60 75 78 150 90 108 111 120 90 96 120 123 60 72 135 150 1=1, Ti = U7 1 = 2, Г2 = 429 1 = 3, Гз = 429 / = 4, Г4 = 417' Здесь max Т, = 429, и погрешность результата относительно Т'ср= I = 423 составляет примерно полтора процента, однако разница загруженности каналов (12 единиц) все же представляется большой, и нужно попытаться ее уменьшить. Считая дальнейшие межканальные обмены малоэффективными (становится все труднее подбирать подходящие работы), оценим возможные .59. Из всех чисел, входящих в интервал [417, 429], на НОД^ ,= =3 делятся только 417, 420, 423, 426, 429, и они должны быть приняты в качестве .59. 17 Решается уравнение 2 4^/^/ = ,58 сразу для найденных пяти зна- 117
6 7 off Ч01ИЙ S. Поскольку 2 fy < 417, 2 ''J > ^29, 2 ^y < 417, 2 ty > 429, величины p и <? составят 7 и ;V—2, т. е. сочетания из 17 элементов по т должны рассматриваться при 3<m<6, и их число есть ~22 000. Получаемые варианты сводятся в табл. 4.3. Таблица 4.3 93 417 420 423 426 429 т = 3 — 150 150 120 150 150 123 — — т = 4 150 60 135 72 150 54 123 90 135 72 120 90 135 75 120 90 150 60 135 75 120 120 108 72 120 120 108 75 150 54 123 96 150 78 135 60 135 90 123 78 150 75 123 78 120 120 108 78 135 54 120 120 т — Ъ 54 60 75 78 135 54 60 75 108 123 54 60 78 108 123 60 72 90 90 111 60 75 78 90 120 60 75 90 90 111 60 78 90 90 111 т = 6 — — — — — Принимается гипотеза: min Т'с=Т'ср=423. Для ее проверки достаточно проанализировать лишь одну (третью) строку табл. 4.3. «Непересекающимися» наборами х/ здесь являются либо (60 72 90 90 111), (120 120 108 75), (150 54 123 96), (150 78 135 60), либо (60, 75 78 90 120), (150 54 111 108), (135 72 120 96), (150 60 123 90). Они представляют собой два возможных оптимальных решения исследуемой задачи. Дальнейшее накопление сочетаний Ту привело бы к получению всех оптимальных решений, но это представляло бы чисто академический интерес. Методы оптимальной организации работ дают возможность найти расчетные режимы функционирования той или иной производственной системы и ввести тем самым своеобразное начало отсчета, отклонения от которого нежелательны. Это важно для практики, однако во многих 118
случаях затраты времени на составление планов превышают допустимые пределы. Возникает необходимость исследования проблем вычислительной сложности алгоритмов с целью выработки обоснованных требований к ним и достижения большей гибкости систем планирования. §4.7. О вычислительной сложности экстремальных задач В обш,ем случае задачи дискретной оптимизации предполагают поиск элементов конечного или счетного множества и, доставляюш,их экстремум функционала /, заданного Hat/.Сюда относятся задачи целочисленного программирования, теории расписаний, теории графов и многие другие, имеюш,ие дискретную структуру и являюш,иеся формальными моделями исследования операций. Для того чтобы раскрыть суть вопроса о вычислительной сложности, рассмотрим примеры. Пусть имеется множество U, состоящее из п неотрицательных целых чисел Uj. Каждому из его подмножеств U ставится в соответствие определенное значение функционала /= 2 "/— — 2 "У (символ и\и читается как «t/ без t/» или «остаток от U "j6U\V _ после исключения U). В этих условиях требуется: найти подмножество U'^U, состоящее из k чисел (1<й<л) и минимизирующее |/(t/)| (задача 1); найти подмножество U^U, минимизирующее \f(U)\ (задача 2). Если оценивать вычислительные затраты необходимым количеством элементарных операций сложения, умножения, сравнения, то задача 2 оказывается гораздо сложнее задачи 1, хотя по постановке они похожи. Действительно, задачу 1 можно решить путем выбора k наименьших чисел из множества U, что осуществляется простым упо- ^1Ядочением всех его элементов по признаку неубывания. Как известно 27], объем вычислений при этом есть линейная функция О параметра п log^n, т. е. 0(п log2 п). В то же время для решения задачи 2 на сегодня не найдено ничего, кроме полного перебора всех подмножеств U, число которых равно 2". Поскольку вычисление модуля / всегда требует 0{п) операций, затраты, связанные с задачей 2, оцениваются как 0(п'2"), т. е. оказываются значительными даже при небольших п. На практике это приводит к трудностям получения решений за приемлемое время. Так, быстродействующая ЭВМ, выполняющая миллион операций в секунду, сможет найти ответ для задачи 2 при л=50 только через несколько десятков лет, хотя задачу 1 она решает в доли секунды. Причины таких различий заключаются в том, что согласно введенным оценкам сложность задачи 1 ограничена полиномом второй степени {п log^n-Cn^), а сложность задачи 2 подчинена экспоненциальному закону. С увеличением п экспонента чрезвычайно быстро опережает рост любого полинома, и исследователь получает удобный критерий сравнения изучаемых задач с позиций их сложности, П9
Сделанные замечания относились к конкретному п-элементному множеству и и связанному с ним функционалу /. В общем случае основу анализа вычислительной сложности составляет понятие размера задачи, определяемого количеством чисел, образующих ее исходные данные. Это определение в достаточной мере условно и может потребовать уточнений в каких-то случаях, однако его широко используют на практике для различения так называемых полиномиальных и экспоненциальных алгоритмов. Алгоритмы, решающие ту или иную задачу за число элементарных «шагов», являющееся полиномиальной (экспоненциальной) функцией ее размера, называются соответственно полиномиальными (экспоненциальными). Из сказанного следует, что сам факт существования полиномиального алгоритма для некоторой оптимизационной задачи объективно свидетельствует о меньшей ее сложности по сравнению с задачей, для которой найден только экспоненциальный алгоритм. Конечно, имеются в виду задачи большого размера, для которых резкое увеличение продолжительности расчетов становится реальностью. При малых же размерах задач ситуация упрощается и введенные градации алгоритмов могут стать даже ненужными. Например, величина я^" превосходит величину 2" вплоть до я=59, однако это не влияет на рассмотренные оценки вычислительной сложности, связанные с предположениями о принципиально возможном неограниченном возрастании размеров исследуемой задачи. С практической точки зрения более ценными (предпочтительными) являются полиномиальные алгоритмы низших степеней, обеспечивающие медленный рост объемов вычислений в условиях значительного роста размеров задач. Именно такие алгоритмы следует искать в первую очередь, и именно к ним относятся два важных вопроса: в каких случаях поиск окажется успешным? во всех ли случаях успех может быть достигнут? Ответы на них пытается дать теория NP-полноты, получившая развитие в последнее 10—15 лет и вносящая существенный вклад в понимание проблем вычислительной сложности. Некоторые положения этой теории обсуждаются ниже. Теория NP-полноты изучает только задачи распознавания, формулируемые весьма просто; существует ли объект Q, обладающий определенным свойством Q? Вариантами решения здесь являются ответы «да» или «нет», причем никакая другая информация не требуется. Интерес к подобным формулировкам объясняется, в частности, тем, что любая оптимизационная задача может быть интерпретирована как задача распознавания. Чтобы убедиться в этом, достаточно сравнить знакомое требование «найти Х^ £/-)-ш1п /(X)» с требованием подтвердить существование такого Х^и, для которого f{X)<:c, где с — произвольная константа. На интуитивном уровне задачи распознавания вспринимаются как более «легкие» по сравнению с соответствующими задачами оптимизации. К такому выводу можно прийти, рассматривая далеко не простые методы поиска экстремума, однако главное заключается в другом. Решив экстремальную задачу, исследователь автоматически решает и связанную с ней задачу распознавания. Обратное утверждать нельзя,- поэтому получаемая так или иначе оценка сложности процесса распознавания служит своеобразным ориентиром в оценке сложности процесса оптимизации, который обязательно должен быть более «трудным». Все задачи распознавания, решаемые с помощью запрограммированных и реализованных иа ЭВМ полиномиальных алгоритмов, образу- 120
ют класс Р. Любой алгоритм, допускающий реализацию, называется детерминированным, т. е. является тем обычным алгоритмом, который можно встретить в повседневной практике. Ему противопоставляется (чисто теоретически) алгоритм особой природы — недетерминированный, осуществляющий «угадывание» решения исследуемой задачи и последующую его проверку. Считается, что на этапе угадывания все происходит мгновенно, а используемые при этом правила никому не известны. Очевидно, ни человек, ни технические устройства не могут реализовать рассмариваемый «алгоритм», хотя представление о нем занимает важное место в теории NP-полноты. В частности, все задачи распознавания, которые могут быть решены с помощью полиномиального недетерминированного алгоритма, относятся к так называемому классу NP. Ясно, что P^NP, поскольку любой детерминированный алгоритм превращается в недетерминированный путем включения операции угадывания. Формула P^NP означает либо совпадение классов (множеств) Р и NP, либо их несовпадение. Первое кажется почти невероятным, второе — правдоподобным, но ни то, ни другое пока не доказано. Тем не менее, введенные выше понятия дают возможность установить важные свойства и задач распознавания, и экстремальных задач с дискретной структурой. Пусть рассматриваются две задачи распознавания I и II. Для задачи I определены числовые значения ее параметров с помощью которых можно определить числовые значения параметров задачи II за полиномиальное количество шагов. Если в этих условиях задача I имеет решение «да» то1да и только тогда, когда решением задачи II тоже является «да», то задача I называется полиномиально сводимой к задаче II. Отсюда следует важное определение: некоторая задача ff, относящаяся к классу NP, называется NP-полной, если любая задача I, относящаяся к тому же классу, полиномиально сводима к задаче //. Таким образом, NP-полные задачи оказываются самыми «сложными» в классе NP с той точки зрения, что для них нет полиномиальных детерминированных алгоритмов, а каждый известный экспоненциальный алгоритм можно «приспособить» (с умеренными затратами времени) к произвольно взятой задаче из рассматриваемого класса. Если бы для какой-либо NP-полной задачи удалось найти полиномиальный алгоритм, то все задачи класса NP стали бы полиномиально разрешимыми. Наконец, имея ту или иную NP-полную задачу, можно утверждать NP-полноту многих других задач, которые к ней полиномиально сводятся. Возникает вопрос: есть ли вообще доказательства NP-полноты каких-то конкретных задач? Утвердительный ответ на него дают исследования, результаты которых обсуждаются, например, в [22]. Так, NP- полными являются следующие задачи распознавания: 1) Существует ли набор значений Xf, ..., х-:, при котором булева Функция^(а:1, ..., а:„), заданная в конъюнктивной нормальной форме, оказывается равной единице? 2) Существует ли в ненаправленном графе полный подграф с точно определенным числом вершин? _ 3) Существует ли такое подмножество U^U, что 2 "У = ujeV uj6U\17 Ценность подобных результатов заключается в расширении возможностей предварительного анализа той или иной модели с целью ра- 121
еумного выбора средств и путей ее исследования. Пусть необходимо рет шить некоторую задачу дискретной оптимизации. Сначала нужно дот пытаться найти для нее полиномиальный алгоритм с возможно более низкой степенью полинома. Если это удастся, задачу следует считать «легкой», а сделанную попытку — определенно удачной. В противном случае придется привести изучаемую задачу к соответствующей задаче распознавания и доказать NP-полноту последней, ориентируясь на известные доказательства. Если задача распознавания окажется NP-полной, то поиск алгоритма точного решения исходной оптимизационной задачи станет практически ненужным. От него можно отказаться, направив усилия на разработку эффективного приближенного алгоритма. Это целесообразно делать даже тогда, когда доказательство NP-полиоты не удалось. Теория вычислительной сложности, не затрагивая вопросов непосредственного «конструирования» аналитических методов, оказывает возрастающее влияние на характер прикладных исследований. Она позволяет по-новому оценить перспективы использования разработанных и разрабатываемых моделей операций в таких областях деятельности, как автоматизация процессов планирования и управления, эффективное применение ЭВМ, создание современных производств. Глава 5. СЕТЕВОЕ ПЛАНИРОВАНИЕ МНОГОЭТАПНЫХ ОПЕРАЦИЙ В практике исследования операций часто приходится сталкиваться с задачами планирования разнообразных по своему содержанию работ, процесс выполнения которых нельзя отразить в формульных зависимостях. Примерами здесь могут быть работы, связанные со строительством крупного промышленного предприятия, созданием разветвленной сети вычислительных центров, разработкой сложной научно-исследовательской темы и вообще реализацией каких-либо широкомасштабных проектов. Характерная особенность каждого такого проекта — взаимная обусловленность проводимых работ, выраженная в требовании соблюдать определенный порядок и определенные «правила» их производства. Так, при создании сети ВЦ монтаж вычислительной техники можно начать лишь после того, как будут подготовлены нужные помещения, которые, в свою очередь, будут построены (или арендованы) в местах, выбранных в результате предварительного анализа вариантов сетевой структуры и т. д. Следовательно, подготовка решений в рассматриваемых условиях должна проводиться с учетом многих факторов, отражающих ограниченность сырьевых, денежных, энергетических 122
ресурсов, а также времени, отводимого на предполагаемые работы. При попытках осуществить тот или иной крупный проект обычно возникают различные вопросы, например, «в какие моменты начинать и заканчивать отдельные работы?», «как распределить между ними имеющиеся материальные ресурсы?», «какие препятствия могут встретиться на пути к достижению поставленной цели?», «как изменятся параметры плана в случае непредвиденных задержек?» и т. п. Ответы на них можно пытаться получить из соображений «здравого смысла» (прежде всего тогда, когда количество и объемы проводимых работ невелики), однако в общем случае такой подход превращается в угадывание решений и приводит в конечном счете к материальным потерям, нарушениям установленных сроков, моральным издержкам. Возникает необходимость в специальных расчетах, позволяющих обоснованно выбирать стратегию поведения применительно к складывающейся обстановке. Одним из методов, широко применяемых в исследовании проблем организации крупномасштабных мероприятий, является метод сетевого планирования, использующий идею графического отображения связей между выполняемыми работами. Удобство зрительного восприятия, возможность выявить главное, относительная простота вычислений делают рассматриваемый метод пригодным для анализа систем различной природы. Метод сетевого планирования позволяет решать как прямые, так и обратные задачи исследования операций. Первые связаны с оценкой последствий выбора вполне определенного решения, вторые — с поиском наилучших в каком-то смысле решений. Это расширяет области применения метода и делает его эффективным средством совершенствования целенаправленной деятельности. § 5.1. Сетевой график комплекса работ. Основные характеристики Исходными данными в сетевом планировании являются перечни проводимых работ, установленные для каждой из них сроки, а также описания существующих между ними зависимостей, выраженных отношениями предшествования. Эти данные можно свести в таблицу (табл. 5.1) или представить в виде Гантт-карты (см. § 4.5), что позволяет получить соответствующий сетевой график, который может рассматриваться как своеобразная, более наглядная ин- 123
Таблица 5.1 Работы / 2 д 4 5 6 7 Установленные сроки, 1-я 2—4-я 2—3-я 2—5-я 5-я 6-я 4—8-я Отношение предшествования «работы с номерами к, 1, ... предшествуют рассматриваемой работе t>i и делают ее возможной» или 5?г *" '3^* 5?f —г- 5?2 .Й1 -^ 5?з ^1^5?4 i7t2 >- o/j5 1Л.5 >- Л^ 5^3 >- 5?7 Работы S 9 10 п 12 13 14 Установленные сроки, 4—10-я 6—8-я 9—11-я И —14-я 7—8-я 15-я 16-я Отношение предшествования «работы с номерами к, 1, ... предшествуют рассматриваемой работе c/t и делают ее возможной» или i^^k' 5ii *" 5?» 5?3 —>- 5?8 5?4 —>- 5?9 ^7i 5^12—>-5iio o/J7> ^Лз» ^>19> 5?i2 ^ .5?ii o/ie —>- 5?12 5?io> 5iii —>- 5?i3 .5^13—>,^ 14 7LlLib I !. I I ?? /2 У « №*« I III. терпретация той же Гантт-карты. Рис, 5.1, а представляет собой пример использования данных табл. 5.1 в графических построениях. Очевидно, сетевой график подчерки- aj вает прежде всего характер отношений предшествования. Конкретные сроки производства работ определяются надлежаш,им выбором масштабов чертежа (рис. 5.1, б). Рассматриваемый сетевой график построен с соблюдением ряда правил. Так, каждая сплошная стрелка изображает определенную работу. Ее начало и конец представляют собой события «работа начата», «работа завершена» (выделены кружками), их взаимное расположение позволяет выявить структуру составляемого плана и, кроме того, вести отсчет времени. Пунктирные стрелки означают отсутствие работ непосредственно между событиями / и //, /// и IV, ... в графике с выбранным масштабом времени. Отказ от при- Рис. 5.1 124
нятых пропорций чертежа не изменил бы его смыслового содержания, хотя могла бы появиться необходимость в специальных символах или надписях, указывающих продолжительности работ. Существует и другая форма представления графика, ставящая в соответствие каждой работе точку, которая соединяется стрелками — логическими связями с другими такими же точками. В результате внимание исследователя концентрируется на логике событий, количественные оценки становятся менее наглядными, хотя полностью сохраняют свое значение. На рис. 5.1, в показан график, полученный из табл. 5.1 и являющийся аналогом графика, приведенного на рис. 5.1, б. В практике Исследований и разработок чаще используется тот способ графических построений, которому соответствует рис. 5.1, б, поэтому в дальнейшем речь будет идти только о нем. Отвлекаясь от содержательной стороны дела, можно рассматривать любой сетевой график как совокупность G некоторого количества точек Xi, Х^, ... и установленных между ними соответствий (связей). Объект G называется графом, точки Xi, X^t . . ■— его вершинами, связи между ними — дугами. Граф G считается заданным, если заданы все его вершины и дуги (рис. 5.2, а — в). Ориентация дуг, т. е. указание «начала» и «конца» каждой из них, делает граф ориентированным (рис. 5.2, б). Любые две вершины называются смежными, если их соединяет дуга. Граф, в котором какие-то две вершины соединяются несколькими дугами, называется мультиграфом (рис. 5.2, в). Путем в графе G называется такая последовательность дуг, что конец каждой предыдущей дуги совпадает с началом последующей (например, Xi, Х^, Х^, Х,^ на рис. 5.2, в). Путь является простым, если никакая дуга не встречается в нем дважды, и составным — в противном случае. Путь 125
является элементарным, если никакая вершина не встречается в нем дважды. ■ V' Понятия н методы теории графов дают возможность исследовать системы различной структуры независимо от физической природы входящих в них элементов. При этом удается выявить и наглядно отобразить причинно-следственные связи между указанными элементами, их характеристиками, параметрами различных процессов, что в большинстве случаев и составляет предмет исследования. Учитывая сказанное, можно назвать сетевой график на рис. 5.1, б ориентированным графом, вершины которого отождествляются с событиями, а дуги —■ с выполняемыми работами. С практической точки зрения удобно подразделять все работы на последовательные, параллельные, последовательно-параллельные и составные. Последовательными называются работы, лежащие на некотором пути (или образующие путь) в графе G. В отличие от них параллельные работы не могут составить путь и изображаются несколькими дугами, соединяющими одни и те же вершины (в этом случае G становится мультигра- фом). Так, на рис. 5.2, б стрелки (дуги), идущие от Xi к Ха, от Ха к Хз и от Хд К X,, ЯВЛЯЮТСЯ последовательными, а на рис. 5.2, в изображены параллельные дуги, связывающие Xi с Хг или Хз cXj> ^Xj- Хд Xf Xi X2 ^Ск Рис. 5.3 Составной называется работа, формально заменяющая собой группу работ, расположенную между какими-то двумя событиями (вершинами) сетевого графика. Примером служит рис. 5.3, а, где показан один и тот же график до 126
и после включения в него составной работы 91. Подобные преобразования упрощают исследование и широко используются на практике. Допустимы и обратные операции, при которых какая-то одна работа искусственно разделяется на части с целью выявить характер промежуточных результатов или указать на возможность начала незапланированной работы &1 (рис. 5.3, б) и т. д. Важную роль в теории и практике сетевого планирования играет понятие фиктивных работ, вводимых в те или Рис. 5.4 иные графики для того, чтобы подчеркнуть различия между параллельными работами, их общими началами и окончаниями, а также для унифицированного изображения дуг в виде отрезков прямых. На рис. 5.4 даны примеры мульти- графа G, содержащего параллельные дуги di, d^ (рис. 5.4, а), и традиционного сетевого графика (рис. 5.4, б), к которому приводится G после введения фиктивной работы 5^ф нулевой продолжительности (5?ф всегда обозначается пунктиром). В любом сетевом графике можно выделить событие, которому не предшествует никакая работа, и событие, за которым ие следует никакая работа. Первое из указанных событий называется начальным, второе — конечным (например, Xi и ^9, см. рис. 5.3, а). Каждая работа представляет собой процесс, связанный с затратами труда, материальных ресурсов, времени. Одна из основных целей сетевого планирования заключается именно в экономии времени, поэтому важнейшей характеристикой работ является их продолжительность, влияющая на «длину» тех путей, которые существуют в данном графике. Например, на рис. 5.3, а таковыми являются {Xi, Х2, Хз, Х-^, Xff, Хс,,}; {Хх, Xg, Xj, Xg, Х^,}; {Xi, Х^, Хз, Х^, Х^, Х^, Х^}; {Х-х, Хг Х^, Х^, Xf,, Х^.}. Вообще любой сетевой график, каким бы сложным он ни был, состоит из цепочек работ, т. е. путей. Следовательно, можно говорить о путях, связывающих произвольные события (в частности, начальное н конечное), а также об их длинах, характеризующих график в целом. 127
Путь, имеющий в данном сетевом графике наибольшую длину, называется критическим, а работы, расположенные на нем — критическими. Основное свойство критического пути состоит в том, что его длина определяет общее время проведения всего комплекса работ от момента начального события до момента конечного события. Иллюстрацией здесь служит рис. 5.1, на котором выделяется критический путь, составленный из работ 1, 3,8, 11, 13, 14 и имеющий длину 7"= 16. Особенность критических работ определяется необходимостью их четкого выполнения. Малейшее запаздывание любой из них приводит к увеличению Т", т. е. ухудшает главный показатель плана. Этим объясняется особый интерес к анализу критических путей и их возможному сокращению. Что касается остальных (некритических) работ, то они располагают определенными резервами времени и не требуют повышенного внимания, хотя нельзя допускать их чрезмерного затягивания, срывов и т. п. Знание критического пути в том или ином сетевом графике полезно по двум причинам: во-первых, можно выделить наиболее «опасные» работы, контролировать и, если нужно, форсировать их; во-вторых, можно правильно использовать скрытые резервы «обычных» работ, рдзумная задержка которых дает дополнительные средства для улучшения ситуации с критическими работами. Подобные сдвиги по времени позволяют говорить не о каком-то одном моменте появления интересующего нас события, а о периодах, в которые оно произойдет. Наиболее ранний ti из возможных сроков запланированного события X; определяется максимумом длины путей, связывающих это Xi с начальным Xi. Например, вершина Хв сетевого графика (см. рис. 5.3, б) связана разными путями с Xi, и каждый из них имеет свою длину. Наибольшая из этих длин и имеется здесь в виду, поскольку без ее уменьшения нельзя ускорить событие Х^. Наиболее поздний ti из допустимых сроков события X; определяется разностью между длиной Т" критического пути и максимумом длины путей, связывающих Х; с конечным Хк. Например, для вершины Х^ (см. рис. 5.3, б) существуют разные пути в Х^^^Х, и в рассматриваемом определении должен учитываться самый длительный из них. Названные /;, ti используются для вычисления резервов времени, характеризующих общую обстановку, в которой будут проводиться планируемые работы. Если в сетевом 128
графике вершины Xi, Xj соединены дугой, обозначающей работу продолжительности iij, то полный резерв времени. этой работы есть rij=tj—ti—t;^, а свободный (независимый) резерв pij=t)—if—т,-^. Величина Tj^ показывает, на сколько {ложет возрасти продолжительность т,-; без изменения других продолжительностей и общего планового срока Т", а величина р,-^ — на сколько может возрасти т^ без изменения резервов времени других работ. Полезно заметить, что для работ, составляющих критический путь, резервы времени отсутствуют, т. е. ги~ри=0. Наглядное отображение связей между выполняемыми работами и возможность расчета различных плановых показателей делают сетевые модели важным объектом исследования. Создается хорошая основа для планирования, сбора данных, оперативного управления в крупномасштабных операциях, требующих согласованных действий многих участников. Внимание руководителей сосредоточивается на первоочередных задачах, вытекающих из анализа критических путей и способов их сокращения. Автоматизируются процессы подготовки управленческих решений на базе использования ЭВМ и тем самым совершенствуется методологическое обеспечение АСУ. S5.2. Формальные оценки параметров плана, птимизационные задачи Графические средства построения и анализа планов при всех преимуществах не могут полностью заменить собой аналитические методы. Причины этого заключаются не только в стремлении проводить какие-либо расчеты (например, оценивать резервы времени), но и в трудностях разработки самих графиков при большом числе работ, связанных друг с другом сложным образом. На практике встречаются случаи, когда приходится организовывать реализацию крупных проектов в строительстве, производстве новых видов продукции, космических исследованиях. Соответствующие сетевые графики настолько усложняются, что их вычерчивание становится трудоемким и дорогостоящим занятием, которое, к тому же, теряет смысл из-за невозможности сохранить в полной мере наглядность и целостность восприятия получаемого результата. В этих условиях требуется помощь ЭВМ, берущей на себя задачу хранения всех данных и их обработку в соответствии с формальными соотношениями, отражающими все особенности изучаемой сетевой модели. 5 Дегтярев Ю. И. 129
Таблица 5.2 Работы / 2 3 4 5 6 7 Длительг ности, недели (дни) 1(7) 3(21) 2(14) 4(28) 1(7) 1(7) 5(35) Моменты 1}ачзла работы t ■ 0 7 7 7 28 35 21 Моменты окончания работы 7; 7 28 21 35 ^ 35 42 56 Работы 8 9 10 11 12 13 14 Длительности, недели (дни) 7(49) 3(21) 3(21) 4(28) 2(14) 1(7) 1(7) Моменты начала работы t ■ 21 35 56 70 42 98 105 Моменты окончания работы Т.- 70 56 77 98 56 105 112 Чтобы получить необходимые формулы, достаточно обратиться к табл. 5.1 и построенным по ней графикам (см. рис. 5.1). Первым шагом здесь должно быть упорядочение записей, что и сделано при составлении таблицы. Единственным дополнением мог бы служить конкретный перечень моментов начала и окончания работ, которые даны в табл. 5.2. Ее можно считать составной частью табл. 5.1. В третьем столбце указаны самые ранние из возможных моментов начала каждой работы (при заданных длительностях т), т. е. величины tj{j—\, 14). В четвертом столбце даны самые ранние моменты tj окончания работ, вычисленные по формуле /;=/j-f-Tj. Изучая табл. 5.1, 5.2, нетрудно получить аналитические зависимости, характеризующие сетевой график, представленный на рис. 5.1.6. В частности, ^1=0, ti=t3=t^=T:i, = fg—Тх+Тз, tj—т^т-т^, i] = Т1+Тз+Т,, /ii=max {/,^ tg, /„ /jj, /i2 = Ti+T2+Tj+Te, /i3=max{/i„, til}, ^i4,=^i3. В этих зависимостях отражены общие формулы / J+1" -tj, tj=ti+Tj (/=1, 2, . . .,), Г» = max{/j}—ti (длина критического пути), 7'^=/^—t^ (длина пути в k-ю вершину) и т. д. Описательная часть исследования сетевой модели подготавливает переход к анализу критических работ и перспектив улучшения показателей составляемого плана за счет использования скрытых резервов. Чтобы обнаружить критические работы (и, следовательно, критический путь), нужно определить тот номер /=б, при котором достигается max {tj}=ts (самый поздний из моментов Ij). Работа Мс оканчивающаяся в этот момент, 130
обязательно будет критической, и ее продолжительность удобно обозначить через те. Далее необходимо сформировать множество {/}б номеров j=k, /,..., удовлетворяющих условию ^1,, ^1, . . .-^S\6 (отношение предшествования), после чего повторяется операция поиска max {t} по всем /€{/}б- Это позволяет найти новое значение /=>с, указывающее еще одну критическую работу Sl^- Если нет каких- либо оснований для задержки Sle. то Ги=^е=^б—те. Третья (в принятой последовательности) критическая работа опре- ределяется отысканием max (ij) по всем /6 {/}и. где {/}и — множество номеров работ, приводящих к началу §1^ и т. д. Процесс завершится тогда, когда будут исчерпаны возможности анализа очередных отношений предшествования. Эти рекомендации легко проверяются на примере уже встречавшегося сетевого графика (см. рис. 5.1, б). Здесь / принимает значения от 1 до 14, максимум tj достигается при /=14, так что 6=14, ^б==16 недель, работа §114 является критической. Из условия ^^з-^^ц (см. также табл. 5.1) следует {/}б={13}, поэтому тах{^у}==^и или >с=13 (вто- рой критической работой оказывается Slis). Теперь достаточно рассмотреть {/}={10. 11} (поскольку Sljo, Slii->-§li3)H получить max {^Л = ^11 (третья критическая работа есть /6{10, 11) 5iii). Затем будут идти Slg, SI3. S^i. так как 5i,, Stg, 5?,, 5ii2 —^ 5iii и max (iA = t^; Э1^-^ Э1щ и max {(,-] = /е{7,8,9, 122 _ /e{3) = h\ Sil—ySii И max {?,-}=^i- Таким образом, критиче- ский путь длиной Т''' = тах{/^}—ti=tn составляют работы 1, 3, 8, 11, 13, 14. Поиск критического пути существенно облегчается предварительным упорядочением таблицы исходных данных (см. выше) и введением строгих соответствий между вершинами (событиями) сетевого графика и шкалой времени (см. рис. 5.1, б). Часто встречаются случаи, когда обнаруживается неоднозначность оценок максимумов tj. Это указывает на существование нескольких критических путей, и в процессе расчетов приходится хранить всю необходимую информацию о возможных б, х, ... и связанных с ними множествах {/}б, {/}и, ■ • •• Например, если бы в сетевом графике (см. рис. 5.1, б) присутствовала дуга, соединяющая вершины III и IV (реальная работа ^и), то от- 5* 131
ношение gR,, gRs, gRs, сЯхз-^сИц перешло бы в gR,, cHg, Siu, Siu^'-^Siii, a max {7Л оказался бы равным tg и l^^. /е{7, 8, 12, 15} Это, в свою очередь, привело бы к необходимости раздельного анализа отношений сИз-^сИд и сЯ^-^сИи, сИз-^сЯд и cJl4-^Giv9 и т. д. В результате были бы найдены критические пути, образованные работами 1, 3, 8, 11, 13, 14 и 1, 4, 9, 15, 11, 13, 14. Вычисления, определяющие критический путь, и связанные с ним параметры сетевого графика (резервы времени) служат основой для исследования главного вопроса о том, каким должен быть оптимальный план производства работ. Как известно, понятие оптимальности относительно и определяется теми целями, которые ставит перед собой оперирующая сторона (в данном случае — руководители проекта или ответственные исполнители комплекса работ). Следовательно, представляют интерес различные постановки оптимизационных задач, и некоторые из них рассматриваются ниже. Пусть задан директивный срок Гд завершения всех предполагаемых работ. После составления сетевого графика выясняется, что при выбранных нормах времени т^ длина критического пути превосходит Гд, т. е. Г''>>Гд. Возникает необходимость уменьшить Т", что достигается сокращением продолжительности той или иной критической работы. Очевидно, существуют пределы указанного сокращения, определяемые и реакцией Т", и реальной возможностью появления новых критических путей на том же сетевом графике. Например, изучая найденный критический путь 1, 3, 8, 11, 13, 14 (см. рис. 5.1, б), можно утверждать, что ускорение работ 13, 14 в два раза позволит пропорционально снизить Г", поскольку r"=14+Ti3+Ti|. Вместе с тем ускорять работу 8 имеет смысл только в 1,4 раза, сократив ее длительность до пяти недель, иначе возникнут новые пути 1, 2, 5, 6, 12, 11, 13, 14 или 1, 4, 9, И, 13, 14 со своими особенностями. Трудности выбора решений в этих условиях усугубляются неизбежностью допштнительных затрат средств (ресурсов) на реализацию более напряженных планов. В результате возникает задача — найти способ распределения дополнительных средств по выполняемым работам, обеспечивающий получение Г"^Тд при минимальных общих затратах. Если эта задача будет решена, то станут известны работы, длительности которых уменьшаются, масштабы рекомендуемых сокращений длительностей, стоимости ус-
коренного производства работ, минимальные суммарные затраты, связанные со всеми вносимыми в план изменениями. Несколько иная ситуация имеет место в случае, когда требование Г'^Гд удовлетворяется за счет внутренних резервов исследуемого сетевого графика, т. е. за счет перераспределения ресурсов между запланированными работами с целью ускорения каких-то из них. Выше было замечено, что всегда существуют резервы времени /■;;, р,;, которые можно использовать для перестройки плана, приводящей к уменьшению Г" и сопровождающейся соответствующими изменениями Xj (в меньшую сторону для критических и в большую — для некритических работ). Стремление перестроить план наилучшим образом приводит к задаче — найти Tj, доставляющие min Г" при ограничениях Г'^Гд, Tj^Tyn,in (/=1, 2, . . .), сумма всех Xj постоянна (здесь Tjn,-,n — нижняя граница т^, определяемая физическими возможностями выполнения работ). Если задача будет решена, то станут известны новые значения (т|) длительностей всех работ (часть этих т/ может, вообще говоря. Совпадать с прежними rj), размеры перераспределяемых капиталовложений, связанных с вводимыми коррекциями kf—Xj, минимальная величина Г'^Гд, которую нельзя уменьшить без привлечения средств и ресурсов со стороны. Еще один подход к проблеме оптимизации сетевых графиков следует из предположения о том, что в каких-то случаях сразу достигается Т^<Т^, и нет необходимости сокращать сроки работ. Здесь речь может идти о различных видах экономии, получаемой за счет разумного маневрирования имеющимися избыточными ресурсами. Конкретно это выражается, например, в переброске техники с одного производственного участка на другой, в сокращении количества рабочих смен и т. п. Формально задача ставится так: найти предельно допустимые моменты окончания каждой работы, позволяющие достичь максимальной экономии средств при Г'^Гд. Решение задачи должно дать сведения о рекомендуемых задержках работ, характере и масштабах выигрыша от предпринимаемых действий, длине (Т") критического пути в новых условиях. Очевидно, рассматриваемые задачи относятся к классу задач математического программирования (линейного или нелинейного) и могут решаться методами, предложенными в гл. 2—4. Для сетевых графиков со сложной и разветвленной структурой иногда проще применять численные методы, основанные на операциях перебора, сравнения, отсеи- 133
вания вариантов решений. Положительный эффект могут дать также эвристические алгоритмы поиска приближенных оптимумов, использующие специфику отдельных задач в сочетании с возможностями ЭВМ и опытом исследователей. § 5.3. Модель научных разработок. Рациональное расходование ресурсов Методология сетевого планирования может применяться, как уже отмечалось, для решения разнообразных практических задач. Чтобы еще раз проследить за формированием' плана и провести конкретные расчеты, рассмотрим модель научных разработок* выполняемых группой специалистов по исследованию операций. Исходные данные для анализа приведены в табл. 5.3. Нормативные сроки по каждой работе назначены на основании накопленного опыта. Состав исследовательской Группы определен штатным расписанием и не меняется. В нее входят руководитель, пять инженеров-математиков, два инженера-системотехника, три инженера-программиста, четыре оператора ЭВМ. Расстановка имеющихся сил Зависит от специфики проводимых работ, квалификации исполнителей, принятых сроков и осуществляется руководителем применительно к складывающейся ситуации. Возможность привлечения каких-то исполнителей из состава группы к отдельным работам или освобождения от них характеризует те резервы, которые находятся в распоряжении руководителя. Таким образом, знания и опыт исследователей, а тйкже используемая ими вычислительная техника являются средствами достижения поставленной цели, выраженной в требовании успешно завершить всю работу за время, не превосходящее Гд. С помощью табл. 5.3 устанавливаются отношения предшествования и уточняются некоторые параметры будущего плана. taK, работы 2 и 3 могут начаться в принципе одновременно вслед за работой 1, причем знакомство с литературой должно ускорить формирования модели. В связи с этим работа 3 представлена в виде двух составляющих — За и 36, введено промежуточное событие, означающее переход к более благоприятным условиям продолжения исследований; (рис. 5.5). Далее для простоты можно считать, что количество основных процедур алгоритма равно трем и работа 6 выполняется тремя инженерами-программистами параллельно, т
Таблица 5.3 Работы Исполнители Продожи- тельность работ, недели 1. Общая постановка задачи и определение характера исследований 2. Подбор литературы, ее изучение и обсуждение 3. Разработка математической модели исследуемой операции 4. Разработка алгоритма решения задачи в соответствии с моделью. Формирование блоков (процедур) и их характеристика 5. Обсуждение полученных результатов, их корректировка и выдача заданий на прогр аммирование 6. Написание программ основных процедур, реализующих алгоритм 7. Перфорация подготовленных программ, проверка результата и исправления 8. Отладка программ 9. Написание единой программы, реализующей разработанный алгоритм 10. Перфорация единой программы, проверка результата и исправления П. Отладка единой программы и решение контрольных примеров 12 Проведение исследований с использованием разработанной программы и имеющейся вычислительной техники 13 Обработка, анализ и обсуждение результатов исследований Руководитель группы Инженеры-математики, инженеры-системотехники из состава группы, руководитель Инженеры-математики, системотехники Инженеры-математики, системотехники, программисты Руководитель и все участники работы Инженеры-программисты Группа устройств под- готовк данных (УПД) Инженеры-программисты, операторы ЭВМ нз состава исследовательской группы Инженеры-программисты УПД Инженеры-программисты, операторы ЭВМ Инженеры-математики, системотехники, программисты, операторы ЭВМ Руководитель и все участники работ ;1.35
14. 15. 16. 17. 18. Работы Дополнительные исследования в рамках разработанной модели с целью уточнения и обобщения результатов Написание отчета о проведенной работе Обсуждение отчета Оформление отчета Утверждение отчета руководством и передача материалов заказчику Продолжение табл. 5.3 Исполнители Инженеры-математики, системотехники, программисты Участники работы Руководитель и все участники работ Группа оформления Руководитель Продолжительность работ, недели До 6 4 2 2 3 Т. е. распадается на составляющие 6а, 66, 6в с длительностями по 8 нед. То же самое происходит и с работой 7, которую производит самостоятельно стороннее подразделение (УПД) в течение 3 нед независимо от объема и момента поступления (рис. 5.5). 02 6 Рис. 5.5 П 21 Ih Зг 35^ 40 Vt 't6 50 Stt \ 58 61 66 6в 72 \ 16 79 56 74 t, неделя Перфорация и промежуточные отладки (7 и 8) идут одновременно с написанием общей программы {9) после того, как завершатся работы 6а — в. Затем начинаются основные {12) и дополнительные {14) исследования, которые проводят, вообще говоря, разные участники работ (параллельность) и т. д. В результате строится сетевой график, ука- 136
зывающии все отношения предшествования и моменты, связанные с событиями Xi, . . ., Х30 (рис. 5.5). Конечно, всю информацию, которую дает построенный график, можно представить в числовой форме, свести в таблицы, разместить в памяти ЭВМ и т. д. Это не изменит сути дела, заключающейся в необходимости расчета основных параметров процесса производства работ и последующей его оптимизации. Рассмотрим следующие параметры — длину Т" критического пути и резервы времени каждой работы. Как уже отмечалось (см. § 5.2), Т" определяется разностью самого позднего из моментов tj и начального момента ti- В нашем случае ti— =0 (событие Xj), max {iy} = 79 (событие Хзо); следовательно, 7"= 79 / (рис. 5.5). Способ отыскания критических работ подробно обсуждался в § 5.2, поэтому здесь достаточно их просто назвать — 1,3а, 36, 4, 5, 6, 9, 10, 11, 12а, 13, 146, 15, 16, 17, 18 (выделены двойными линиями). Вычисляя резервы времени, необходимо иметь в виду, что длины путей, связывающих все события исследуемого графика с начальным Xf и конечным Хзо, заданы. Так, для работы 2 самый ранний и самый поздний моменты ее начала есть ^2(и)=2, ^2(и)=2 соответственно, а самый ранний и самый поздний моменты окончания — ^2(к)=6, ^2(н)=6. Следовательно, и полный, и свободный резерв составляют /"2=0, Р2=0. С этой точки зрения работу 2 следует отнести к категории критических, однако можно предложить другой вариант расчета, основанный на уточт нении характера работ За, 36. Допуская произвольное деление дуги $ на части За и 36, легко находим 0<:г2<:8. Чем больше /-2, тем менее зависимы работы 2 и 3. Обратимся теперь к работам 7 и 8. Очевидно, ^7(и)=^7(н)=32,- ^(к)=^(Н)+'^7> ^7(к)=^7(Н)+'^7 И ^8(И)=^7(К); ^8(И)'=^ ^7(к) > ^8(к)= ^8(Н)+'^8> ^8(к)=^8(н)+'^8=44 (индексы а, 6, в здесь роли не играют, так как начала и окончания работ, составляющих 7 и 8, совпали). Отсюда следует либо /■,=0 и /"8=4, либо /"7=4 и /-8=0, что свидетельствует о наличии общего резерва времени для «связки» 7, 8 который можно использовать любым способом. Продолжая анализ, нетрудно получить значения г для остальных (некритических) работ и свести все результаты в табл. 5.4. Таблица 5.4 Работы Полные резервы времени 2 0—8 7а —в 0 или 4 8а —в 4 или 0 126, в 4 14а, в 2 Следующий шаг — оптимизация построенного сетевого графика (рис. 5.5). Для этого необходимо задать директивный срок Гд завершения всех работ, указать средства, которыми располагает рассматриваемая исследовательская группа, оценить эффективность этих средств 137
с позиций возможных изменений длительности каждой работы и, следовательно, величины Т". Пусть Гд=64. В распоряжении руководителя находятся два вида средств — организационные (перевод сотрудников с одних работ на другие, оказание помощи группе УПД) и денежные (оплата сверхурочного рабочего времени, увеличение премий, хозяйственные договоры с другими организациями). Первоначальное распределение сил отражено в табл. 5.5. Таблица 5.5 Критические работы Количество исполнителей (из имеющегося состава) Резервы (средства) организационные денежные , 1 Р — 3 3 м 2 с 2 м 4 3 м 2 с 3 п 1 м 5 1 Р 3 м 2 с 3 п — 6 Зп — 9 Зп 3 0 10 УПД 3 0 // 3 п 3 0 3 м 12а 3 м 2 с Зп 3 0 — 13 3 м 2 с 3 п — 146 3 м 2 с Зп 3 0 — 15 1 Р 3 м 2 с Зп — 16 1 Р 3 м 2 с Зп — 17 Оф 2 0 /^ 1 Р — Примечание, р —руководитель, м —инжеиер-математик, с —инженер-системотехник, п —инженер-программист, о —оператор, Оф —группа оформления Будем считать, что участие каждого дополнительного сотрудника в /-Й работе сокращает ее длительность на 15% до тех пор, пока общее число таких сотрудников не достигнет половины первоначально установленного числа исполнителей. После этого эффект увеличения численности исчезает и ее дальнейшее наращивание становится бесполезным из-за возникающих трудностей распределения заданий, сопоставления результатов и т. п. Например, подключив к работе 3 одного инженера (в дополнение к ранее назначенным трем инженерам-математикам и двум инженерам-системотехникам (табл. 5.5), можно уменьшить Тз на 15%. Подключив сюда же двух инженеров, можно сократить Тд на 30%, однако это будет пределом, который нет смысла переходить, так как рост численности приближается к предельно допустимому. То же самое можно сказать и об остальных работах. В дальнейшем количество специалистов, помогающих ускорить /-Ю работу тем, кто ее выполняет, будем обозначать через t/j, так что «/з<2, (/4<:1, J/9<3 и т. д. Относительно эффективности дополнительных денежных затрат предположим, что зависимости времени (ту) выполнения /-й работы от размера Xj соответствующих выплат является линейной и выражена формулой ту=[1—л://(106у)]ту(и) при 0<;л:у<:&у, где ту(и) — начальное значение Ту, заданное исходным сетевым графиком (рис. 5.5). Очевидно, нельзя ожидать уменьшения т/(н) сверх 10% даже при полном расходовании резервных денежных средств, указанных в табл. 5.5. 138
Независимые воздействия выбираемых Ху, j/y на конкретные ту (/=3, 4, 9, 11) суммируются, если резервы Обоих типов используются одновременно. - , Принятые предположения позволяют рассматривать Г" как сложг ную (нелинейную) функцию многих переменных Ху, j/y, значения которых могут варьироваться в известных пределах. Таким образом, приходим к следующей оптимизационной задаче: найти ху, j/y->min{r"= = Г''(ху, j/y)} при ограничениях 0<ху<:6у, 0<:(/у<:ду, Г^^Гд, j/y— целые числа (номера / определяются по табл. 5.5). Прежде чем перейти к исследованию поставленной задачи, полезно обратить внимание на важное обстоятельство. Минимизировать 7^ можно, либо сохранив имеющийся перечень критических работ, либо изменив его. В первом; случае критический путь, показанный на рис. 5.5, остается таковым и лишь укорачивается. Во втором случае он заменяется новым (или новцми), и задача приобретает комб?1наторный характер, следствием чего обычно является рост объемов вычислений со всеми вытекающими отсюда; трудностями (см. §4.7). Следовательно, целесообразно находить min 7^ в два этапа — сначала без изменений критического пути, а' затем с его уточнениями в пределах сравнительно малого количества альтернатив. Существенная роль (см. § 4.7) должна принадлежать здесь оценкам качества промежуточных результатов, т. е. Степени приближения получаемых Г" к min Г". Учитывая сказанное, обратимся к первому этапу исследования задачи о минимуме Т". Прежде всего разбиваем множество критических работ, указанных в табл. 5.5, на три непересекающихся подмножества I, И, П1. В первое входят работы, длительности которых уменьшить нельзя (/, 5, }3, 16, 18); во второе — работы, длительности которых можно уменьшить настолько, насколько позволяют привлекаемые резервы (3, 4, 6, 10, и, 12а, 146, 15, 17); в третье — работы, длительность которых уменьшается до тех пор, пока сохраняется неизменным существующий критический путь (9). Ясно, что подмножество 1 не представляет интереса, и нужно анализировать работы, вошедшие в подмножества П и 1П, Единственным элементом подмножества П1 оказывается работа Р, причем Тд свободно варьируется в пределах 8—12 нед (рис. 5.5). Наилучшим является значение Т9=8, которое будет достигнуто при (/9=2, Xg=bjd, что допустимо по ограничениям задачи. Работы, составившие подмножество П, поглощают все дополнительные ресурсы, поэтому достаточно выбрать соответствующие ху н yj равными 6у и dj, чтобы получить Тз=7,2; Т4=6; Тб=7,2; Тхо=1,1; Тй=1.8; Ti2a=7,2; Т14б=5,4; Тх5=3,6; Ti,= 1,4. Вместе с найденным Т9=8 и оставшимися неизменными Тх=2, Т5=2, Ti3=4, Ти=2, Ti8=3 это дает T°=6l,9<Tt,. Таким образом, результат оптимизации сетевого графика при сохраняющемся критическом пути имеет вид Х8=6з. ^8=^3=2, х^=Ь^, ^4=^4=" 1.^^=*». f9=V3, Ув=2<^д^, 5vo=dif,=3, Xii=6ii, (Ги=д11=3, ^12=^12. ^14=^14. Ji5=*is. ^17=^17=2, 7*=61,Э. Остзлись неиспользо- ванными резервы в количествах 2bJ3 и д^—2. Директивный срок Гд= = 64 выдержан с небольшим «перевыполнением». Построенный ранее сетевой график практически ие изменился, за исключением того, что момент окончания работы 8 совпал с моментом окончания работы 9 и начала работы 10. За счет этого на критическом пути оказалась «связка» работ 7, 8. • Второй этап поиска niin 7^ связан с анализом тех критических путей, которые могут возникнуть при попытках дальнейшего уменьше- 139
ния каких-то ту. В рассматриваемой задаче это относится к Xg, Т7, Xg, Т9, поскольку для них еще сохраняется запас средств, оставшихся от проведенной операции ускорения работы 9. Если предположить, что указанные средства одинаково эф(рктивны в применении к работам 6, 7, 8, 9, то лучше всего одновременао укоротить дуги (б, 7, 8)а, (6, 7, 8)ff, (6, 7, 8)в и 9 или (7, 8)а,'{7, 8)g, (7, 8)^ и Р на одну и ту же величину, составляющую примерно 5% их длины. Эта оценка следует из принятых зависимостей между размерами дополнительных затрат (здесь они составляют 269/8, 0^—2) и ожидаемыми уменьшениями (на 6—15%) сразу четырех длительностей т^—т^. Таким образом, предшествующий результат Г''=61,9 можно улучшить на 5%, т. е. min 7""= 7^= 58,8. На сетевом графике сохраняются *jeTHpe критических пути, отличающиеся друг от друга только последовательностями дуг (6а, 7а, 8а), (66, 76, 86), (6в, 7в, 8в), (66, 9). Резервами времени теперь располагают работы 2 (О—7,2), 126 и 12в (по 3,2), Мак 14в (по 1,4), и можно ставить вопрос об использовании этих «внутренних» резервов для поиска новых вариантов оптимального плана. Как И следовало ожидать, полученные решения зависят от величины Гд, принятых bj, dj, характера связей ij с Xj, Dj. Всякое изменение исходных данных задачи скажется на результатах ее анализа. Например, выбор Тд^58 привел бы к необходимости пересмотра условий оптимизации изучаемого графика, снижение эффективности воздействия подключаемых резервов на Xj увеличило бы Г" и (или) Г" и т. д. Следовательно, методология сетевого планирования позволяет изучать проблемы организации работ достаточно широко, с позиций экономии ресурсов различной природы, и это расширяет области применения сетевых моделей. § 5.4. Выбор начальных норм времени. Выполнимость планируемых мероприятий Проведенный выше анализ различных аспектов сетевого планирования не затрагивал вопроса о способах выбора начальных значений ту,„), определяющих основные параметры исследуемого графика и влияющих на результаты его оптимизации. Могло показаться, что ту,н) назначаются произвольно, а затем уточняются по мере изучения и корректировки предлагаемых вариантов плана. Если бы это всегда было так, то составляемые сетевые графики часто оказывались бы невыполнимыми из-за просчетов в оценках тех ресурсов, которыми обеспечены работы. Некоторая свобода действий оперирующей стороны объясняется тем, что процесс] оптимизации графика все равно приводит к пересмотру первоначальных Ту,н), упорядочению рас- 140
ходования средств, выявлению резервов, т. е. служит своеобразным средством исправления явных ошибок выбора ту,и). К тому же, выбираемые Ту(н) обосновываются хотя бы интуитивно и отражают накопленный опыт планирования, общую обстановку проведения работ и т. п. Все это упрощает проблему определения Ту,в), однако не может полностью устранить ее, поскольку необходимые (или имеющиеся) ресурсы расходуются в разных случаях по-разному, степень их влияния на продолжительность отдельных работ колеблется в широких пределах, количественные оценки несовершенны и обычно связаны с таким «универсальным» показателем, как сметная стоимость комплекса мероприятий, предусмотренных составленным планом. В результате возникает самостоятельная задача согласования разрабатываемого сетевого графика с материальными, энергетическими, денежными ресурсами, выделенными для его реализации. В этих условиях обычно приходится приспосабливать существующие приемы количественного анализа к конкретной обстановке, что сопровождается многочисленными предварительными расчетами, уточнениями позиций плана, пересмотром принятых норм расходования ресурсов, т. е, серьезными исследованиями, приводящими в итоге к некоторому приемлемому сетевому графику, который целесообразно оптимизировать. Следовательно, полный цикл сетевого планирования должен включать в себя оценку необходимых средств обеспечения планируемых работ (кадры, технику, энергию, материалы и другие ресурсы); определение возможностей, которыми будет располагать оперирующая сторона при заданном (ограниченном) уровне расходования ресурсов, и выбор на этой основе значений т^,н); разработку исходного сетевого графика (или нескольких его вариантов) и расчет основных параметров — величины Г", моментов начала и окончания каждой работы, резервов времени; оптимизацию принятого графика с учетом его «внутренних» резервов или дополнительных средств, привлекаемых для ускорения работ. Если не удается быстро осуществить весь цикл расчетов (особенно при нехватке информации), то приходится идти на компромисс, вводя в рассмотрение единый стоимостный эквивалент используемых ресурсов. Это, естественно, приводит к упрощению формальных выкладок, однако не повышает точности оценок ту,н). Тем не менее на практике широко распространены методики, ориентированные на показатель «время — стоимость», причем обычно считается 141
приемлемой линейная аппроксимация реальных зависимостей т^ от производимых затрат Cj. На рис. 5.6 приведен пример, иллюстрирующий возможность замены реальной (но часто неизвестной) функции Cj—Cj {Xj) ее приближенным аналогом — линейной функцией Су,д, сГ- тг-ту (ту—T'/')-fcJ;", построенной по заданным {%f\ с'/'), (т^^', cf) (показана на рисунке жирной линией). Если для каждой работы, включенной в сетевой график, найдена зависимость Сл=Сл(т), то можно ставить задачу об отыскании таких Ty(„), которые минимизируют сумму соответствующих С/(д,, не выходя за установленные пре- Рис. 5.6 делы т'У, T*-f\ Чем точнее подобраны соответствия между т'/' и с"', %f и df\ тем полнее отражаются в принимаемых Ту(н) 6 [т/*', ту'] реальные возможности обеспечения работ ресурсами. Из сказанного следует, что практическое применение метода сетевого планирования требует определенных усилий, направленных на четкое взаимодействие служб информации, материально-технического снабжения, финансирования, оперативного управления. В этом смысле видимая простота сетевых моделей обманчива. За ней скрыты многочисленные вопросы, нуждающиеся в проработке с разных точек зрения, и важная роль принадлежит здесь исследователям операций, подготавливающим обоснованные варианты решений. § 5.5, Организация работ неопределенной длительности Обсуждавшиеся выше трудности оценки т/(ц) часто приводят к тому, что исходные точные значения Ту=ту,„, оказываются неизвестными, и приходится вводить различные предположения об ожидаемых длительностях выполнения работ. Это, конечно, усложняет задачу планирования, придает ей определенную специфику и требует дополнительных исследований, связанных с уточнениями критических путей и величин Г". Здесь возможны два случая: 1) известны пределы варьирования всех Ту(ц,, но ничего нельзя сказать о природе 142
или механизмах возникновения конкретных rJ^„■,; 2) известны пределы варьирования всех Ту,н) и утверждается, что конкретные ty,^, возникают стихийно как результат стечения обстоятельств, не поддающихся контролю. Внешне эти случаи сходны между собой, однако приемы их формального анализа должны быть разными. В первом случае речь может идти о выборе ту,н) на разумной основе, неизвестной исследователю, или о весьма редких попытках произвольного выбора Ту,н), за которыми не скрывается никакая закономерность, кроме общего требования соблюдать установленные пределы т}'', tfK Подобные ситуации характеризуются возможностью использовать в расчетах только параметры т}'', т'/'. Во втором случае есть все Основания говорить о Ту,„) на языке вероятностей, считая источником непредвиденных отклонений Т/,„, от т'/', т'/* какие-то природные процессы — поломки машин, болезни людей, аномалии погоды, обладающие устойчивостью в массовых проявлениях. Это позволяет оперировать не только величинами т'/', ■Tf\ но и различными статистическими показателями, относящимися к tJ^щ (например, средними значениями, частотами событий и т. д.). Пусть рассматривается случай 1 при заданных т'/', rf и общем условии т'/'^ту,н)^т^^'. Естественно поставить вопрос: что изменится в методологии сетевого планирования и каковы будут его результаты по сравнению с изучавшимися ранее? По-видимому, ожидать здесь принципиальных изменений не приходится, так как всегда есть возможность построить и исследовать обычным порядком ряд сетевых графиков при Т^,н) = т"', Ту(н)=т'/' и других допустимых Ту(н). Это позволит проследить за изменениями их структуры, выявить критические пути, вычислить ожидаемые Т", а также указать «опасные» работы, вносящие наибольшую неопределенность в оценку параметров плана. Таким образом, на этапе предварительного анализа разброс значений Ту,„, приводит к необходимости (или желательности) рассмотрения нескольких вариантов сетевого графика, отвечающих разным Ту,„), причем количество вариантов определяется возможностями исследователя, предоставленными ему оперирующей стороной (временем, вычислительной техникой и т. п.). На этапе оптимизации разрабатываемого плана должны подготавливаться решения, сводящие к минимуму риск оперирующей стороны оказаться в худшем, чем предсказанное исследователем, • положении. Другими .словами, 143
.реальный ход работ, выполняемых в соответствии с предложенным графиком, должен опережать плановые сроки и, следовательно, приводить к лучшим значениям Г". Это возможно тогда, когда расчетные Ту,^) 6 [т/", t'/'] будут наверняка больше тех неизвестных заранее Ту,н) 6 [т'/*, t'?'], которые проявятся лишь в процессе реализации подготовленного графика. Отсюда следует вывод о преимуществах выбора Ty(H)=T'f. позволяющих изучать, оптимизировать и рекомендовать к использованию наиболее трудные (в смысле затрат времени) варианты плана, исключающие непредвиденные задержки работ в будущем. В итоге оперирующая сторона получает гарантию того, что наблюдаемая на практике величина Т" никогда не превысит вычисленного предельного Г". Сделанные замечания определяют общую последовательность действий в случае 1, предполагающую: составление и анализ сетевых графиков при различных ту,н, (из ■диапазона [xf\ т'/']); оптимизацию графика, построенного (Цля «худвдих» значений длительностей работ (ту(н)=т',^'); оценку полученных результатов и подготовку соответствующих рекомендаций. Рассмотренный подход к задачам сетевого планирования использует известный принцип гарантированного результата, требующий поиска лучших решений в худших ситуациях, как об этом говорилось в гл. I. Обратимся теперь к случаю 2. С ним связано предположение о вероятностной природе возможных Ту,н). Основной вопрос, на который должен ответить исследователь, сводится здесь к следующему: как организовать выполнение имеющихся работ, чтобы величина Г" была меньше заданного Тд с достаточно высокой вероятностью? В общем виде ответить на поставленный вопрос практически невозможно. Причины этого заключаются в необходимости знания характеристик случайных Ту,н), законов формирования критических путей при различных комбинациях Ту(н), правил вычисления Г" и т. д. В итоге приходится упрощать задачу всеми доступными способами (например, предполагать Тцн), t2(H)- ••• независимыми, ограничиваться расчетами средних значений Т", оценивать лишь приближенно вероятность превышения установленного Гд), и это отрицательно сказывается на достоверности получаемых результатов. Для иллюстрации возможностей приближенной оценки вероятности р(Г"<Гд) удобно использовать модель, рассмотренную в § 5.3г Пусть все работы сетевого графика (см. рис, 5.5) имеют такие случай- 144
ные длительности, что найденный критический путь сохраняется и лишь «еияет свою длину Г" в зависимости от появляющихся значений Ti, Тз, .... Tg, Tg, ..., Tj^s Поскольку Г" есть сумма этих ту, можно с достаточным основанием говорить о нормальном распределении Г", которое характеризуется двумя параметрами — математическим ожиданием /Пу-о и дисперсией Dj-o. Пусть в результате вычислений /Пу-о и Dj-o оказалось m7-o=6I, Dj-o=3,6 и, следовательно, р(Г° < Гд)^ i \ g-''-^'/''^ d^= ]/ 7,2я J^ з!=ф(Гд) (см. гл. 6). Выбрав, например, Гд=64, находим с помощью 'таблиц р (Г"<64)«0,93. Высокая вероятность успеха объясняется здесь, t одной стороны, малым разбросом значений Т" относительно среднего т =61, а с другой — довольно большим Гд. Детерминированный подход к задачам исследования операций позволяет разрабатывать самостоятельные классы моделей, главная особенность которых состоит в том, что с их помощью определяются желаемые («идеальные») пути достижения целей 'в тех или иных случаях. В то же время практический опыт указывает на необходимость учета специфических неопределенностей, влияющих на принимаемые решения. Этому посвящены последующие главы книги,
Раздел третий ВЕРОЯТНОСТНЫЕ МОДЕЛИ ОПЕРАЦИЙ, ПРИНЯТИЕ РЕШЕНИЙ С УЧЕТОМ СЛУЧАЙНЫХ ФАКТОРОВ Глава 6. АНАЛИЗ СЛУЧАЙНЫХ ЯВЛЕНИЙ Многие проблемы практической деятельности автоматизированных систем различных классов могут рассматриваться с теоретико-вероятностных позиций, отражающих стремление исследовать неопределенные факторы той или иной операции. Часто приходится наблюдать явления и события, обладающие, по меньшей мере, двумя особенностями — многократной повторяемостью (реальной или принципиальной) и непредсказуемостью в каждом отдельном случае (нет ответа на вопрос «произойдет ли интересующее нас событие в. назначенный момент времени и в назначенном месте?»). Последнее обстоятельство обусловлено большим количеством малоизученных и просто неизвестных причинных связей конкретного явления с внешним миром. Простейшими примерами здесь можно считать присутствие ошибок в записях на магнитной ленте (или другом носителе информации), выход из строя вычислительной машины (или другого технического оборудования), успешное завершение заданного комплекса работ в течение смены (и вообще достижение цели данной операции). Этим определяется в общих чертах смысл понятий «случайное явление», «случайное событие», широко используемых в прикладных исследованиях. Необходимо иметь в виду, что успех подобных исследований всегда связан с попытками установить закономерности путем длительного наблюдения за случайностями, поэтому в дальнейшем речь будет идти о явлениях, которые можно в принципе наблюдать практически неограниченное число раз (их называют массовыми случайными явлениями). Если искомые закономерности обнаружены, то разрабатывается соответствующая теория и с ее помощью изучаются новые, более сложные явления и события без непосредственного их наблюдения. В этом заключается смысл существования любой теории, в частности элементарной теории вероятностей, математической статистики, теории массового обслуживания, изучающих разнообразные проявления случайностей. Эти разделы науки, основанные на Н6
небольшом числе простейших положений (аксиом), взятых из повседневного опыта, позволяют предсказывать и открывать новые факты и закономерности поведения сложных систем. §6.1. Частота и вероятность события. Аксиоматика Колмогорова Исследование операций как наука, широко использую- ш,ая математическое моделирование, анализирует прежде всего явления и события, имеюш,ие количественную характеристику. Например, изучая факты, связанные с наруше* нием графика производства, исследователь интересуется количеством нез'авершенных к заданному сроку работ, непроизводительными потерями времени, единицами простаивающего оборудования. В результате происходит формализация описания событий, о них начинают говорить на языке цифр, их смысл сводится к утверждению существования тех или иных отношений между элементами числовых множеств. Примерами здесь служат следующие события: «суммарные потери времени t за смену превысили 1 ч», или «^>>1», «число негодных перфокарт у составило не более 1%», или «г/^0,01», «из т] процессоров успешно функционируют т]-—2 процессора», или «Ат]=2». Количественные характеристики массовых случайных событий называются случайными величинами. Их конкретные значения невозможно предсказать заранее, до завершения соответствующих наблюдений, поэтому необходимо различать понятия «случайная величина», «возможные значения случайной величины», «реализованное (появившееся) значение случайной величины». Многократно повторяя наблюдения за некоторой случайной величиной X, можно убедиться в том, что ее реализованные значения хи ..., x„ принадлежат множеству О возможных значений, которое либо известно, либо определяется в ходе проводимых экспериментов. Примеры этого нетрудно найти в операциях контроля правильности набивки перфокарт, точности обработки деталей, состояния трудовой дисциплины коллективов. Так, оценивая количество X ошибочных символов на произвольно взятой перфокарте, можно утверждать, что Й есть множество натуральных чисел, и конкретные Ki {i—\, 2, ,..), фиксируемые после просмотра очередной перфокарты, обладают свойством x,-6^. К сожалению, это еще не позволяет сделать обобщающие выводы относительно свойств величины X. ■ '
Наиболее ценным результатом наблюдений некоторого случайного события (и его характеристики X) является ответ на вопросы «как часто происходит интересующее нас событие в рассматриваемых условиях?» или «как часто реализуется каждое из значений Xi, х^, ... в данной серии экспериментов?» Получив ответ, можно найти частоту события как отношение числа его появлений к общему числу проведенных наблюдений, а также распределение частот по возможным Xi для рассматриваемой случайной величины X. В приведенном выше примере контроля перфокарт событие состояло в наличии ошибок на очередной перфокарте, и его частота F определилась бы отношением числа отбракованных перфокарт к общему числу проверенных. Для величины X, представленной своими Xt (/=1, 2, ...), картина была бы совершенно иной: частоты Ft соответствующих возможных Xt, обладая очевидным свойством ^Fi= F, i приняли бы значения, объективно отражающие качество перфорации. В частности, при F=0,2 могли бы появиться распределения частот, имеющие вид; Количество ошибочных символов в перфокарте 01 2 3 4 5... Частота появления случай 1 О 0,1 0,05 0,05 О 0.;, случай 2 0 0 О 0,1 0,1 0... Ясно, ЧТО в первом случае перфорация проведена более качественно. Понятие частоты позволяет ввести объективную меру возможности того или иного события, не имеющую непосредственного отношения к процессу наблюдений и связанную лишь с абстрактными представлениями исследователей. Выбору такой меры способствуют два обстоятельства — интуитивное признание того, что более частое (по прошлым наблюдениям) событие является более вероятным в предстоящих подобных наблюдениях, и осознание факта стабилизации частот событий при неограниченном росте числа наблюдений, что подтверждено многими экспериментальными данными. Устойчивость частот указывает на существование у каждого события стабильного количественного признака, называемого вероятностью этого события. Вероятность как объективная мера возможности широко используется в исследовании операций на абстрактном уровне, освобождающем исследователя от необходимости длительного экспериментирования. Все сказанное пол- И8
ностью относится и к случайным величинам, с которыми связано важное понятие распределения вероятностей, лежащее в основе формального анализа многих прикладных проблем. Основные свойства вероятности следуют из нескольких исходных положений (аксиом), основанных на существующем опыте и его обобщениях. Пусть рассматриваются п событий Si, ..., S„, каждому из которых приписана определенная вероятность. В этой ситуации можно говорить и о противоположных (по своему содержанию) событиях Si S„ состоящих в непоявлении соответствующих Si, ..., 5„, а также — о более сложных событиях, выраженных в появлении различных сочетаний Si Sn. На рис. 6.1 условно изображены Si, ..., 5i Sz Sj 54 Sj- -^ r\ rt rt n rt /rj» 00000 00000 f6\ о 'oj 4o\ /o\ Sg Sj Sg Sp Sf0 4e_^-^ '^—^z' Рис. 6.1 Sn (n=10). Сложное событие-пересечение (Si, S„, S,) обозначено через A, событие-пересечение (Ss, S4, Sg, S9) — через J5 и т. Д, Событие-объединение [Si, Sg, S,] состоит в том, что произойдет либо одно из Si, Sg, S,, либо одно из (Si, S„), (Si, S,), (S„, S,), либо (Si, S„ S,). Очевидно, на базе сложных событий А, В, ... можно построить еще более сложные события подобно тому, как это было сделано для «элементарных» Si, ..., S„. Смысл бсего этого заключается в необходимости найти способы оценки вероятностей сложных явлений на основе знания «элементарных» вероятностей p(Si), ..., p(S„) и законов их преобразования. Решающая роль принадлежит здесь аксиоматике, на которой строится теория, и в первую очередь — аксиоматике А. Н. Колмогорова [16]. Чтобы познакомиться с ней, нужно ввести понятие достоверного события, т. е. такого, которое обязательно произойдет (не может не произойти) в тех или иных условиях. Классический пример достоверного события — объединение некоторого S и противоположного S. Заметим, что событие, противоположное достоверному, оказывается невозможным .(нельзя предположить непоявление достоверного S, поскольку оно обязательно появится). В принятых обозначе- ниях невозможными будут события [Si, Sil, [А, А], [В, В]. 149
Предположим теперь, что рассмотренное выше многообразие случайных событий образует множество М, элементы которого обозначаются единым символом S, если нет необходимости их специально различать. Вводятся аксиомы [19]: — каждому событию S ^М поставлено в соответствие неотрицательное действительное число — вероятность р (S), — вероятность достоверного события равна 1, — вероятность объединения несовместных событий из х^ножества М раьна сумме их вероятностей. Эти утверждения позволяют сформулировать ряд известных правил, Широко применяемых на практике, например: вероятность любого события S меняется в интервале 0-1; вероятность невозможного события равна О (обратное утверждение неверно хотя бы потому, что здесь просто указан факт стабилизации частоты около нуля с тем или иным приближением); вероятность пересечения {Si, Su) независимых событий Si, Sii есть произведение p(Si)-p(Sii), вероятность пересечения зависимых Si, Sii есть p(5[)>p(iiS/5i), где второй сомножитель представляет собой условную вероятность Sii, вычисляемую в предположении, что Si произошло (очевидно, для независимых S;, S^, имеет место p{Sii/Si) = =p{Sii) и p(5,/Sn)=p(5i)); вероятность объединения [5,, SnI есть алгебраическая сумма p{Si)+p{Sii)~p{{Si, Sn)); сумма вероятностей событий, образующих полную группу, равна единице (в частности, полную группу образуют 5 и противоположное S, для которых всегда p{S)-\-p{S)= = 1); вероятность события S, связанного с событиями Si, ..., Sn, образующими полную групну, вычисляется по фор- п муле полной вероятности p(S)= '2tp{Si)-p{S/Si). Таким образом, существуют эффективные средства анализа случайных явлений на уровне формальных (математических) моделей.
§ 6.2. Распределения вероятностей. Числовые характеристики случайцык величин Вероятностные модели, учитывающие, влияние неопре; деленных факторов той или иной операции, чаще всего отражают закономерности поведения слу51айных величин, а не только рассматривают события как таковые. Скалярной называется такая случайная величина X, возможные значения которой Xi, Х2, ... представляют собой действительные числа. Векторной случайной величиной (или случайным вектором X) называется любая упорядоченная совокупность Х'^', Х'2' Х'"', обозначаемая обычно (Х<", ..., Х'"*). Составляющие Х^^\ ..., Х'"' можно считать координатами вектора X в i?„, Если число возможных значений случайной величины X конечно (или бесконечно, но счетно, см. гл. 1), то она называется дискретной. Если же возможные значения величины X образуют континуальное множество Q, то она называется непрерывной. Нетрудно себе представить и смешанные (дискретно-непрерывные) случайные величины с присущими им особенностями, выраженными, например, в существовании изолированных элементов множества й. Иллюстрацией приведенных определений служат следующие утверждения: «количество выполненных сверх плана работ является дискретной случайной величиной с возможными значениями О, 1, 2, 3», «температура воздуха в машинном зале является непрерывной случайной величиной, принимающей любые значения в интервале от 18 до 22 градусов», «напряжение питания в сети колеблется случайным образом в пределах 220—230 В и падает до нуля при внезапных отключениях из-за перегрузки». Наиболее полной характеристикой любой случайной величины является ее функция распределения,- заданная как вероятность события, состоящего в выполнении неравенства Х<^х, где X — некоторое число. Таким образом, в основу изучения свойств X положено событие «X оказд- лась меньше выбранного л:», поэтому рассматриваемая функция всегда определена на множестве Q, и ее удобно обозначить F{х), так что p{X<ix)~F{х). Данное определение относится к скалярным X, что облегчает анализ свойств F {х) и делает его наглядным. Здесь можно сказать следующее: Р(х) есть неубывающая функция х (увеличение х благоприятствует событию «Х<;л:» и, следовательно, сопровождается ростом вероятности p{X<ix)); 151
F{x) стремится к нулю при неограниченном убывании х и к единице — при неограниченном возрастании х (событие «Х-<.г—CXJ» невозможно, событие «Х<сх>» достоверно); поведение F{x) в тех или иных интервалах значений х (и даже в отдельных точках) отражает объективные свойства изучаемой случайной величины X; для дискретных X характерны скачкообразные изменения F (х) при x—Xi, ..., х=Хп (рис. 6.2, й), для непрерывных X — гладкость F{x) (рис. 6.2, б), для смешанных X — кусочная непрерыв- 2ecmi,{x„.,.,x„} Si есть [а, b] \Я.ест одьединеиие Ut],Xo,[C,d] ность F{x) (иногда в сочетании с неопределенностью F в каких-то точках, рис. 6.2, в). Все сказанное допускает обобщения и на случай векторных X. Если X''' есть i-я составляющая вектора Х, то вероятность совместного появления событий «X^^'<; '(п) ления X, т. е. F{x''\ <х in) » называется функцией распредв' Ха) <; ;^а) ■ .,х<"')=Р ХМ ^ х<-" Ее свойства аналогичны свойствам функции F{x), рассмотренный выше, с той лишь разницей, что теперь приходится учитывать поведение всех л:'", ..., л:'"'. Например, f(л:^^^ ..., л:'"') стремится к нулю, когда хотя бы одна из координат х'-^\ ..., х'"' неограниченно уменьшается, F {х^^\ J 52
, ..., x*"') стремится к единице, когда все х*", ..., л;*"' неограниченно возрастают и т. д. В практических приложениях (в частности, в исследовании операций) функции F(х) используются довольно редко. Обычно исследователя интересует плотность распределения вероятностей той или иной случайной величины X. Чтобы определить это понятие, достаточно обратиться к скалярным непрерывным величинам X, для которых множество Q является множеством всех действительных чисел (рис. 6.3, а). 1} т X x*dxa fi Рис. 6.3 Плотность /(х) представляет собой производную dF{x)/dx, следовательно, F{x)= ^ f(x)dx и \^ f{x)dx^ — GO — со = f (сх>) = 1. Дифференциал dp (x)=f{x)dx называется элементом вероятности, поскольку существует приближенное равенство f{x)dxxp{x^X<:.x-\-dx). Кроме того, широко известна формула р (а < X < Р) = f (Р) — f (а) = ^ / (х) dx (рис. 6.3,6), определяющая вероятность р(а^Х^Р). В более сложных ситуациях приходится искать другие средства формального описания «неудобных» функций F (х) и их производных. Типичным примером являются дискретные величины X, применительно к которым можно рассматривать вместо f{x) просто перечень значений р(Х= =Xi) р{Х=Хп), т.е. распределение вероятностей по имеющимся Xi (J=l, п). Очевидно, F(х) = 2 p{^=^i)> х- < X причем для х>Хп эта сумма равна единице. Другой способ представления F (х) связан с понятием единичной ступенчатой функции Е{х—а), определяемой f I, х> а; как Е{х—а)=-!„ где й — произвольное действи- тельное число (в частности, a=Xi, рис. 6.4). С помощью J 53
E (x—a) легко формализуется описание разрывных функций, поэтому можно выразить функцию F (л?), изображенную гра- фически на рис. 6.^, а, формулой F{x) — ^ piE{x—Xi), i= 1 В которой символ Pi обозначает р{Х=х^. Ее удобство состоит в том, что присутствие функции Е{х—Xt) автоматически исключает прн выбранном £(х-о1 xi ненужные слагаемые общей ■ п суммы 2 Pi. поскольку Е{х^- 1 1 = 1 , , , —Xi)=0 при x^Xi. кроме того, л, Xz X} а /*... л появляется Возможность найти Рис. 6.4 производную F{x) в виде комбинации так называемых делыпд,- функций S (х—Xi), представляющих ■. собой производные соответствующих Е{х—Xi) и обладающих свойствами: b{x—Xi)={ ' " J 8{x—Xt)dx= J 8{x—x,)dx=l, (e>0), так что F'{x)=^f{x)=tpi^{x-xd и 1 = 1 \ /(х:)йл:=: 2 J pib{x—Xi)dx =^ pi = l. Рассмотренные соотношения позволяют распространить понятие плотности на случаи дискретных и смешанных распределений, а сами £ и б оказываются удачными абстракциями, облегчающими формальный анализ случайных явлений. Полезно заметить, что F называют интегральным, а f — дифференциальным законом распределения случайной величины X или X. Законы распределения вероятностей наиболее полно характеризуют ту или иную случайную величину, однако получить их непосредственно из экспериментальных наблюдений удается далеко не всегда, даже если собрана представительная статистика (неизбежны погрешности в оценках параметров, возможны существенные отклонения реальных закономерностей от предполагаемых и т. п.). В этих условиях часто оказывается достаточным знание и практическое использование более скрсмных, неполных 154
характеристик X лли X, которые объективно связаны с законами распределения, но легче отыскиваются. К числу таких характеристик относятся в первую очередь математические ожидания и дисперсии случайных величин. Математическое ожидание тх скалярной величины X вычисляется по общей формуле т^— \ xf{x)dx. Если/(х) п задана в виде суммы 2 —pj^i^—Х;),то формула сводится (=1 п К т^(= 2 ^iPi- Очевидно, тх представляет собой средне- 1=1 взвешенное значение X, поэтому его часто называют просто средним значением X. Для случайного вектора Х=(Х'*', ..., X'"') математическое ожидание определяется как вектор тх={т'}\ ...; /h!?>). Дисперсия скалярной величины X есть 0^^= \ {х—тхУ X п Xf{x)dx или Dj^= 2 (•'^i—1ПхУр1- Однозначно обобщить по- i= 1 нятие дисперсии применительно к произвольному вектору X не удается, поскольку система его случайных составляющих X'*' X'"' характеризуется и математическими ожиданиями квадратов Х'*'" Х'-"'" т. е. собственно дисперсиями D*." Щ и математическими ожиданиями произведений Х'''"''Х'*"', l^u^n, l^y^n u^v (так иа-. зываемыми ковариациями). Следовательно, каждый случайный вектор Х=(Х"', ..., X'"') имеет своеобразную характеристику— квадратную (пхп) ковариационную матрицу, элементами которой являются указанные выше ко- вариации /г„^,, причем для u=v выполнено fe„„=Di"'. Полезно обратить внимание на содержательную сторону рассматриваемых понятий. Так, математические ожидания тх или ш^ определяют в Ri или /?„ положение центра, вокруг которого группируются точки, образующие множество Q. Дисперсия D^ есть мера рассеяния точек относительно тх (с уменьшением D^ точки располагаются все более тесно). Ковариации fe„j, указывают на существование (или отсутствие) зависимости между величинами Х'"', Х<"', поэтому в любой ковариационной матрице отражаются взаимозависимости координат вектора X. В прикладных исследованиях i вместо k^j, обычно используются безразмерт 156
Та блица Распределения скалярных случайных величин Причинное (вырожденное) Равновероятное (дискретное) Пуассона (дискретное) Равномерное (непрерывное) Нормальное (непрерывное) Показательное (непрерывное] 6.1 Плотности распределений 6(х—а) п (■= 1 ( = 0 ■ Хб(д;—г) (?1>0) 1 ■; , а^х^Ь i Ь—а \Q, х<а, х>Ь (х — ту 1 ^ 2D У 2лО Яе-^^(>.>0) Функции распределений Е {х — а) п со 1 = 0 XE{x-i) (0, х<а; 1 X — а 1 b—a ll, x>b Функция Лапласа Ф (х) \ — е-^''(к>0) '"х а п (=1 п X Ь + а 2 т 1 ""^ 0 п (=1 п X 12 D 1 ные коэффициенты корреляции г^^ = k^J]/^D'x'D'^\ составляющие корреляционную матрицу данного вектора X, диагональ которой, как легко видеть, занимают Га„ = \. Любые две величины X*"*, X*"* называются коррелированными, если ruv¥=0, и некоррелированными, если Гик—О. Сведения, приведенные выше, обобщают табл. 6.1 и 6.2, в которых представлены распределения, часто встречающиеся на практике. Трудно, конечно, отразить все многообразие законов, найденных экспериментально или теоретически и ставших общеизвестными. В вероятностных 156
Таблица 6.2 Распределения векторных случайных величин Плотности распределений Моменты распределений Многомерное Пуассона Х1 ^=1 ,-=о'' m['^ = Ki т[">-. все йщ, = 0 Многомерное нормальное It ft ехр{-21 ^^С^*"'-'"») V(2n)4K\ X = m„ «(«)= ... D'") моделях операций, как правило, используются предположения о соответствии реальных распределений эталонным, указанным, в частности, в табл. 6.1, 6.2. Выбор тех или иных предположений облегчает формальные выкладки, расширяет возможности применения вычислительной техники, позволяет предсказать поведение сложных систем. § 6.3. Модель формирования рабочей группы. Учет неопределенностей В § 6.1, 6.2 даны основные понятия элементарной теории вероятностей, позволяющие разрабатывать модели конкретных операций. В связи с этим рассмотрим задачу о выборе нужного количества участников работы, состоящей в исправлении ошибок перфорации. Пусть в результате каких-то контрольных мероприятий были выявлены и направлены на повторное изготовление некачественные перфокарты, собранные в единый комплект из (Jfi штук. Работа поручается группе технических исполнителей, каждый из которых затрачивает одно и то же 157
+Гз+..., и время т на набивку и проверку одной новой перфокарты независимо от характера устраняемых при этом ошибок. Можно было бы ожидать, что вся работа будет выполнена за время Ti=oH'it/k, где fe-^ количество исполнителей (й<^сАГ), однако в изготовленных заново перфокартах опять обнаруживаются ошибки, и процесс корректировок затягивается. Дополнительные потери времени, связанные с устранением неточностей во второй раз теми же исполнителями, составят Ti^^itlk, где cJVa — число повторно переделываемых перфокарт (olfa^cATi). Очевидно, off а есть случайная величина, вследствие чего случайной будет и Т^, (при фиксированных т и k). Продолжая эти рассуждения, нетрудно предположить возможность третьего «цикла» переделок, имеюш,его случайную продолжительность Тз=(М'зт:/к (сМ'а'^Жз) и т.д. В jiTore обш,ие затраты времени достигнут T'=T'i+T'a+ предсказать точное значение Т не удается. Приходится обраш,аться к вероятностным оценкам в следуюш,ей задаче: найти минимально необходимое количество k участников работы, обеспечиваюш,ее ее выполнение с заданной вероятностью ^ за время, не flj^^-^; превосходяш,ее Т. Чтобы упростить формальный анализ задачи и сделать его наглядным, имеет смысл учиты- нать пока только Ti, Т^, Уз. а затем провести необходимые уточнения. Событие, представляющее перноочередиой интерес, состоит _ в выполнении неравенства Т<Т, причем р(Т'<Г) определяется конкретными значениями Jff,. (Л^2. сАГз. т, k, т. Полагая р(Т^Т)=^, можно попытаться найти эти значения в различных допустимых комбинациях и указать тем самым искомые k для всего диапазона рассматриваемых условий. Очевидно, Р(Т: -Т):^рШ1 + £^. о1\ГзТ k IT =Р(оГа+сГз kT % -oATi)* поэтому все последующие рассуждения будут относиться к'' сДГа. Jfs и связанным с ними вероятностным характеристикам исследуемого процесса корректировок. ■ 158
Пусть возможные значения п^, п^ дпскретных случайных величин сДГг» сДГз имеют вероятностир (Лг) и р(п^1п2), первая из которых может быть задана непосредственно! а вторая — н предположении, что стало известно Лг- Следовательно, вероятность совместного появления каких-то «а и Лз есть р{П2) pi/ig/rii). Ее удобно обозначить как pin^, ris) (рис. 6.5, а). Теперь остается найти П2, Пз, удовлетворяющие условию л2+Лз<Л^> где Л^— произвольная константа и Лз<Л2 (по смыслу задачи). Соответствующие точки плоскости Лг, Лз должны лежать по контуру н внутри треугольника, образованного пересечением прямых Л2+Лз=Л^, n^^tisi Пз=0 (рис. 6.5, а). Сложение вероятностей pin^, из) уДобно проводить сначала «по горизонтали» (фиксируя Лз и меняя л^ от Лз до Л^—1ц), а затем суммировать (по Лз) результаты, получая тем самым значение p'{Jf2-^Jfd<-^)- Таким образом, N/2 N-n, р(оДГ2+оДГз<л?)= 2 2 р(«2. «з)- Если принять N—kTix—о1\Г1 (с округлением правой части до ближайшего целого) и нернуться к исходным соотношениям, то в равенст- N/2 N-Пз вах р(Г<Г)= 2 2 Р(«а,пз) = 5'; N^kf/t-Jfi будет от- ражена взаимосвязь всех параметров изучаемой задачи. Возможность конкретных расчетов появится после того, как будет задано то или иное распределение вероятностей р(Ла, Лз), характеризующее (в статистическом смысле) квалификацию и организованность коллектива участников рассматриваемой работы. Предположим, что сведения о названном коллективе являются неполными и дают представление лишь о предельно ожидаемых n2=sJCi и пз=5П2, где S — коэффициент пропорциональности, устанавливающий верхние границы значений Л2, Лз («процент брака» в худшем случае). Об остальных Ла, Ла сказать ничего нельзя, поэтому появление любых пар (п2-<Иа> Пз<-Пз) считается равновероятным. Геометрическая интерпретация этих предположений дана на рис. 6.5, б, который построен при условии N<^S(iffi. Все ожидаемые («а, Пз) отмечены точками, попавшими в прямоугольный треугольник Д с вершинами (0,0), (Л2; 0), (лг, Пз)- Его пересечению с треугольником, обнеденным двойной линией, принадлежат те (п^, Лз), для которых Л2+Лз<Л^. Принятые допущения позволяют представить р(<2ДГ2+сДГз<Л^) в виде отношения площадей треугольников OMN и Д (см. рис. 6,5, б) без подсчета суммы всех р(Л2, «з) (точность такой оценки вполне достаточна в услониях ограниченной информации). Таким образом, (для N/yi-if-s > sjfi можно положить 5*='. и задача теряет смысл). Несложные преобразования рассматринаемых равенств, связанные с исключением 1^,. приводят к окончательной формуле k = (TqjVi/T') X X{l+sV^(14-s) ^]. Здесь tJCi есть номинальное нремя выполнения работы одним исполнителем, поэтому отношение t^ilT характери- 159
зует минимально необходимую численность kg работников при заданном Г, а сумма в квадратных скобках может быть названа коэффициентом увеличения численности ц, учитывающим влияние s и 5^, так 4то k=r]ko. Оценка kg не составляет труда (нужно только выбрать Г), но для коэффициента *) положение осложняется из-за необходимости иметь статистические данные, определяющие s. Их отсутствие оставляет открытым вопрос о более или менее надежном знании ц и, следовательно, k, хотя ориентировочные расчеты показывают, что при малых s (например, s<0,l) величина ц близка к 1 и почти не зависит от^', а с ростом S становится все более чувствительной к вариациям ^. В этом находят объективное отражение и факты высокой работоспособности хорошо Организованной группы квалифицированных исполнителей (s->-0, к-^кц), и факты нежелательного увеличения к, компенсирующего потери времени на многократное переделывание работ недостаточно подготовленными исполнителями (fe->-2,4 йо, если s->-l, ^^-^-l). Полученные результаты можно уточнить, вводя в рассматриваемую модель новые элементы и выявляя новые зависимости. Так, положив T=Ti-\-T2-\-T3-^Ti (учитывается четвертый этап доработок), получаем Далее следует анализ соотношений между p(/i2, п^, п^ и S^, приводящий в конечном счете к определению к как функции к^, s, 5^. Очевидно, с ростом числа слагаемых Т будут возрастать трудности формальных исследований, поэтому необходимо сначала убедиться в целесообразности проводимых уточнений. Если ориентироваться на худший случай, то на четвертом этапе нужно ожидать появления щ бракованных перфокарт, причем п^= =^(j{'i- Чтобы сохранить выбранное ранее f, приходится увеличивать к uar]^xJfi/T единиц (с округлением до большего целого), но делать это целесообразно тогда, когда r)s-''teJ\fiT'"'i>l илиг)5^>1/й|). Например, для йо=10, s=0,3 и ц—1,5 последнее неравенство не выполняется (дополнительные силы привлекать не имеет смысла), но для йо=25'и тех же S, ц оно выполнено, и вместо к принимается к-{-2. Таким образом, анализ усложненных моделей в данном случае представляется излишним, поскольку коррекция результатов проводится простыми средствами, не требующими перестроек первоначальной модели. В заключение заметим, что практическое использование приведенных выше оценок может быть затруднено, если станут известны какие-то конкретные нестандартные распределения вероятностей pin^, Пз). В подобных ситуациях решающее значение приобретают численные методы поиска решений с помощью ЭВМ. § 6.4. Неравенство Чебышева. Статистический аналог задачи о мультипроцессоре Выше было замечено, что во многих реальных ситуациях знание законов распределения вероятностей оказывается неполным. Это объясняется, в частности, отсутстви- 160
ем статистических данных о системах, эксплуатируемых непродолжительное время, переживающих период развития или созданных в опытных образцах. Наглядным примером здесь могут служить автоматизированные системы управления организационного типа, разработки которых еще продолжаются, а опыт практического использования ставит новые проблемы перед исследователями. В этих условиях важное значение приобретают аналитические методы, обладающие достаточной универсальностью и позволяющие отказаться от необоснованных пред- т- Pi Я Рг-'\ Р< Т лл •г-ГА ^ Р^ Iu = {r,rff,...,n} О X. ill Рп Рис. 6.6 положений, вводимых иногда в исследования. Количество таких методов весьма невелико, их применение дает возможность получать лишь ориентировочные оценки, но сохранить при этом простоту модели, умеренные требования к исходным данным, однозначность рекомендаций. Названными свойствами обладает неравенство Чебышева, рассматриваемое ниже. Пусть X есть неотрицательная скалярная случайная величина с возможными значениями Xi, ..., х„, вероятности которых заданы как p{X=Xi)=pi, i = \, п. Зная их, нетрудно найти вероятность события «Х^а» при произвольном а>0, определяемую равенством р(Х>а) = 2 Р/. где J а — множество таких номеров г, что Xt'^a (рис. 6.6). Если теперь обозначить множество всех г (от 1 до п) через J и составить суммы 2 ^Pi< 2 ^iPi< 2 api = a 2 Р/. TO окажется m^=^ ^iPt'^ 2 ^iPi^^ 2 Pi> посколь- ку JaS/ И а^г(г€/а)- Таким образом, p(X>a)<m^/a, а > 0. (6.1) Соотношение (6.1) дает верхнюю оценку вероятности р(Х^а) и представляет собой неравенство Чебышева. Оно 6 Дегтярев Ю. И. 161
верно и в случае, когда X является непрерывной величиной (в соответствующих выкладках суммы заменяются интегралами). Существует его обобщение, снимающее требование неотрицательности X за счет перехода к центрированной величине Х''=Х—/Пх и имеющее вид p(|X-mJ>a)<D,/a^ а > 0. (6.2) Важная особенность формул (6.1), (6.2) заключается в их универсальности, в способности аппроксимировать любой закон распределения и, следовательно, заменять его собой (достаточно знать только т^ или D^, чтобы без труда построить нужную аппроксимацию). Такой подход к изучению случайных явлений, связанных с деятельностью АСУ, вполне оправдан, хотя имеет и слабые стороны — трудность оценки погрешности и необходимость уточнения получаемых результатов. Для их преодоления необходимо привлекать другие средства анализа и новую информацию об изучаемых объектах. Чтобы убедиться в этом, рассмотрим простой пример. Случайная неотрицательная величинах имеет «,= 1, следовательно, р(Х'^х)<. <.\1х (здесь в роли а выступает текущее значение л;) или 1—р(Х<л;)< <1/л;, или f(A;)>l—\1х. Правая часть последнего неравенства определяет нижнюю границу F{x), и можно утвфждать, что график реальной F{x) будет расположен выше графика функции у=\—1/л;илн касаться его. Иллюстрацией служит рис. 6.7, где вместо {/<0 на интер- р^£_ 5.7 ^З'"^ [—«>, 1] принято {/=0. Если дополнить условия приведенного примера какими-либо сведениями об F(x), то появится возможность оценить точность введенной аппроксимации у=\—\1х. Так, для f (л;)=1—е~* (см. табл. 6.1) %= = \imx=\ разность F{х)—у=\1х—е~* достигает максимума ~0,63 где-то в окрестности точки х=\ (по-прежнему полагаем у=Ь при л;<1) и уменьшается при возрастании х или стремлении л; к 0. В других условиях оценки, естественно, будут другими. Например, если иметь в виду равномерное распределение с параметрами а==0, й=2, тх=\ (табл. 6.1), то (\ + \1х + х12, х^[\,2]; Р(к) — у= { \1х, х>2; U.5«, х^[0, 1], и наибольшее расхождение между F (х) и у наблюдается в точках х=1, х=2 (здесь оно равно 0,5). Очевидно, точность аппроксимации в рассмотренных случаях оставляет желать лучшего, однако следует помнить, что знание F(x) вообще снимает вопрос об использовании приближений, ценность которых проявляется только при явной недостаточности информации 162
о сройствах X (к сожалению, последнее встречается довольно часто). Кроме того, всегда есть возможность провести анализ многих законов распределения и скорректировать на этой основе функцию у= l—tUx/x, добиваясь уменьшения погрешностей аппроксимации применительно к множеству анализируемых F(x). Неравенство Чебышева, вводимое в практические задачи, дает возможность не только получить тот или иной результат, не и наметить общие подходы к проблеме исследования детерминированных и вероятностных моделей операций. С этой точки зрения здесь рассматривается статистический вариант задачи о мультипроцессоре (см. § 4.6). Пусть, как обычно, имеются параллельно действующие независимые процессоры, объединенные в вычислительную систему, перед которой поставлена цель провести обработку данных, поступивших от заказчика в виде комплектов перфокарт. Каждый /-й комплект (/=1, 2, ...) является неделимым и должен обрабатываться без перерывов на одном произвольно взятом процессоре, причем необходимое для этого время представляет собой случайную величину Ту с известным математическим ожиданием mj (других сведений нет).. Требуется исследовать возникшую ситуацию и предложить рациональную схему загрузки мультипроцессора, для чего необходимо: 1) выбрать критерий эффективности его функционирования как единой системы; 2) указать характерные особенности предлагаемых схем (планов) загрузки; 3) дать (или назвать) алгоритм расчета оптимальных (в смысле принятого критерия) планов. Если распределить каким-то образом обрабатываемые комплекты по отдельным процессорам, т. е. рассмотреть некоторый план проведения вычислительных работ, то времена занятости (Ti) процессоров будут случайными, поскольку они составляются из определенного количества случайных Ту. Очевидно, математические ожидания ш; величин Ti легко находятся как суммы соответствующих mj (рис. 6.8, а). Обращаясь к формуле Чебышева (6.1), можно утверждать (значения milt>\ заменены единицей,/ = 1, L). Графическая интерпретация этих соотношений дана на рис. 6.8, б, откуда следует, что уменьшение всех mi {1—\, L) улучшает 6* 163
одну из важнейших характеристик мультипроцессора — его производительность, т. е. способность завершить все работы в возможно более короткие сроки. Действительно, чем "l т, \ (т,) (mj) +Н( (mJ ■Л—I- {•^i} Рис — 1 от Г=^^2тг. Оказывается меньше гпи тем меньше вероятность нежелательных событий «Гг превысило заданное h (/=1, 2, ...), и это нужно учитывать при формировании плана загрузки. Говоря об изменениях /П;, необходимо иметь в виду следуюш,ее. Сумма всех rrij фиксирована (она определяется обш,им объемом обрабатываемых данных), следовательно, фиксирована и сумма всех mi- Чтобы выявить здесь закономерность, достаточно рассмотреть отклонения /п^ 2(7^ т L 1= 1 i)= l^T. 1= 1 TL— ^ m.i = 0, поэтому нельзя ожидать значе- НИИ max {/пЛ, меньших Т, и наилучшим планом загрузки мультипроцессора будет тот, который обеспечит выполнение равенств T=mi (/=1, L). Эти условия и выводы полностью совпадают с тем, что имело место в классической детерминированной задаче (см. гл. 4). Различия заключаются лишь в замене т; (/'= = 1, о)\Г) их математическими ожиданиями nij и критерия T' = max{T'J — критерием Т'^ = max {/пJ. Тем самым ут- I I верждается допустимость использования алгоритма d[T, Xj], решаюш,его задачу о загрузке мультипроцессора по критерию Т при фиксированных Tj, в качестве алгоритма ЖТ-т, rrij], решаюш,его ту же задачу по критерию Тт при случайных Т; с известными rrij. Важно подчеркнуть, что это утверждение относится к любому ЖТ, т^]. Проведенный анализ позволяет считать выполненными исходные требования 1—3; выбран критерий Т'т.обраш.ено внимание на необходимость иметь rrii^T (/=1, L), признаны допустимыми все алгоритмы класса А [Т, xj]. 164
преимущества предлагаемого подхода заключаются в следующем: обнаруживаются универсальные свойства алгоритмов ti[T',Tj-] и расширяются области их применения; оказываются минимальными требования к уровню информированности исследователя о свойствах случайных величин Xj (нужно знать лишь mj, /=1, сЛГ); устанавливается соответствие между Т и Тт, что исключает произвольный выбор критерия при переходе от классической задачи о мультипроцессоре к статистическому аналогу. Полученные рекомендации отражают специфику исследований, ориентированных на использование неравенства Чебышева. Ограниченность средств, находящихся в распоряжении исследователя, приводит к необходимости поиска аналогий, анализа «крайних случаев», отказа от детализации изучаемых явлений и т. д. В результате формируются представления о главных особенностях систем и протекающих в них процессов, отбрасываются второстепенные факторы операций и тем самым подготавливаются условия для создания более совершенных моделей. § 6.5. Функции случайного аргумента. Распределения максимумов и модулей Понятие функциональной зависимости (см. § 1.4), широко используемое в различных областях знания, можно рассматривать применительно к случайным величинам, хотя здесь оно приобретает своеобразный оттенок вследствие многозначности проявлений случайностей. Если две скалярные величины X п Y с возможными значениями x^Qx и У^^у связаны отношением Y=(p(X), то можно утверждать следующее: для любого x^Q^ вычисляется у=(р{х), чем и определяется множество Q^. Другими словами, зависимость между X п Y трактуется как зависимость между допустимыми х и у, знание которой позволяет найти Q,^ при известном Q^ (или «отобразить» Q^ в Qy). Естественно, подобные отображения можно построить для различных подмножеств множества Qx< поскольку в основе всего лежат «элементарные» связи г/=ф(л:). В частности, рассматривая все х^а^ и отыскивая соответствующие y<ajj, ау=(р{ах), нетрудно установить соответствие между функциями распределения F^ix) и Ру{у), а затем перейти к изучению свойств У, в которых так или 165
иначе отразятся свойства X. Именно такие возможности предоставляет исследователю знание функции У=ф(Х). Предположим, что равенство Y=(p{X) приводится к виду X=(p{Y), т.е. существует обратная функция ф. Событие «Y<.y» произойдет, если окажется «Х<;ф(г/)» (рис. 6.9, а); следовательно, Fy{y)=F^{(p{y)). Это соотношение хорошо иллюстрирует принцип перехода от F^{x) к Fy{y), однако на практике оно используется редко, так как обычно бывает задана плотность вероятностей fx{x), Рис. 6.9 (у) (х) и искать Fx{x) ради подстановки в формулу нецелесообразно. К тому же есть опасность получить несколько значений x—(f{y), и тогда приходится выявлять допустимые интервалы варьирования х при данном у (двойные линии на рис. 6.9, б), после чего оценку вероятностей нужно проводить путем интегрирования fx(x) по названным интервалам, объединяя их в множество QciQ^. Отсюда следует F^{y)='^fAx)dx. Простейшим примером функциональной зависимости между скалярными случайными величинами является равенство Х''=Х—т^, связывающее X с центрированной величи- х' + гпх ной Х« (СМ. §6.2). Здесь F(a:'')= С fx{x)dx (рис. 6.10) и / {х") = j-o ^ {х") = fx i^" Л-гПх), следовательно, Х" распределена по тому же закону, что и X, но с математическим ожиданием, равным 0. Конечно, такое простое правило перехода от /^ {х) к / {х") является следствием простоты исходного 166 соотношения Х'>=Х—т^. В более сложных
л" X' Шх / 1 >[ H'+Wf, Рио, 6,10 ■случаях задача получения Fy{y) становится предметом самостоятельного исследования, сводящегося иногда к численному эксперименту или имитационному моделированию. В практике разработки и эксплуатации современных технических систем значительную роль играют экстремальные задачи, многие из которых имеют статистические аналоги. В этом смысле представляют интерес распределения максимумов, рассматриваемые ниже. Пусть случайная величина Y задана как наибольшая из Xi, Ха, т. е. У=гаах {Xi,X2}, и требуется найти ее характеристики при известной плотности вероятности /(xi, х»). Специфика этой задачи выражается только в своеобразии функциональной связи между Xj, Ха, К и не влияет на содержательную сторону рассуждений. Очевидно, событие <иУ<у» произойдет тогда, когда произойдут вместе события «Xi<y», «X2<f/», и точка с координатами Xi, Х2 попадет внутрь области, заштрихованной на рис. 6.11. Отсюда у у следует формула Р{у)= \ \ f{Xi, Л/ _ да _ да У (Xt) X2)dxidx2, которая оказывается достаточно простой и допускает обобщение яа случай произвольного числа компонент Х( Х„, определяющих Y как y=raax{Xi Х„}.Здесь при заданной f{Xi л:„) функция F(y) определяется у у формулой F(y)= \ ... \ f{Xi, .... xjdxi-. .dx„. Удач- — да — да ный выбор подынтегральных функций или их аппроксимаций позволит вычислить интегралы в квадратурах. Важным для практики является вопрос о распределениях модулей. Если X — скалярная случайная величина с возможными значениями x^Q^ ^ плотностью fxix), а У—-ее модуль (т.е. Y=\X\), то р{У<.у)=р(—у<Х<у), у 1/>0 или Fy{y)= '\^fx{x)dx, 1/>0 (рис. 6.12, а). -у Рис. 6.11 167
Последнее равенство легко преобразуется путем представления интеграла в пределах (—у, у) разностью интегралов в пределах (—оо,у), (—с», —у), так что Fy(y)=F^{y)~ -FA-y) и f,{y) = fy[F,(y)-FA-y)] = fAy) + fA-yh у'^0. Отсюда следуют простые правила: для отыскания }у{у) при известной /^(х) достаточно заменить X на у и —у в выражении f^ix), а затем сложить fxiy) с fA—y); для отыскания Fy{y) при известной F^ix) достаточно найти приращение /\(л:) на интервале [—у, у]. В качестве иллюстрации полезно рассмотреть случай, когда множество Q^ ограничено, т. е. представляет собой некоторый отрезок оси х, и fx{x) определена условиями fAx) = U In (рис. 6.12, б). Здесь все зависит от принадлежности элемента х=у и (или) х=—у заданному Q^, поэтому приходится делать различные предположения относительно [а, Ь]. Если й>0 (отрезок la, b] лежит справа от оси у), то /х(—У)=0 и fyiy)=fx(jy)> a<f/<ft- Если Ь<0 ([а, Ь] слева от оси у), TofAy)=0 и fAy)=fx{—y), —Ь<г/<—а. Эти два случая малоинтересны, так как имеет место либо равенство Y = X, либо Y——X. Остается предположить й<0<й (рис. 6.12, б) и провести анализ изменений fy(y). Пусть принятое значение у таково, что точки х=у, х=—у принадлежат {а, Ь\. Это возможно при одновременном выполнении неравенств а^у^Ь, а^—у^Ь, у'^0 или а^^Ь, 168
■—fr^i/^—a, y^O или (}^«/^min(—a, b). Выход у за указанные пределы означает выход точек х=у и (или) х=—у из [а, Ь], причем необходимые уточнения можно сделать, сравнивая а п Ь. Если Ь>—а, то первой «уходит» точка х=—у, и fx (—у) обращается в нуль; если Ь<—а, то наблюдается обратная картина. В результате получаем (для а<0<Ь) fx{y) + fxi—y)> 0<i/<min(—а, й); f (,л^ ) fxiyh -~а<у^Ь, Ь>—а; f'^^^^-< fA-y), b<y^-a, b<-a- ^^'^^ 0, г/<0, I/> max (—a, b). Ha рис. 6.12, b приведен пример использоваШ1я формулы (6.3) в случае, когда f i ^_['^^' ^€[-1.2]; Здесь й=—1; Ь—2\ min(—а, Ь) — \, тах(—а, й)=2, т.е. Qy=[0,2]. Следует подчеркнуть, что равенства (6.3) не противоречат приведенным выше общим правилам определения /у (г/), а лишь конкретизируют их, облегчая формальные исследования ограниченных (непрерывных и дискретных) множеств Qjf, а также их отображений в Qy В задачах, решаемых численно с помощью ЭВМ, одинаково приемлемы все полученные формулы, поскольку они программируются заранее специалистами, имеющими соответствующую подготовку. Как известно, понятие модуля относится и к векторным величинам, поэтому полезно обратить внимание на особенности преобразований /(х"' л:'"') в этом случае. Для простоты положим сначала п=2 и заметим, что при К=|Х| условие У<г/равносильно условию 0^ Y'^\^'^\ < У, следовательно f^ (у) = \ \ /(Xj, x^dxidx^. Другими сло- вами, Fy{y) вычисляется как вероятность попадания точки {Хх, х^ в круг радиуса г/, не содержащий собственной границы х\-^гх\=у'^. Этот вывод легко обобщается на произвольные п>2 с той лишь разницей, что вместо круга рассматривается открытый шар Я (О, у), и интеграл, определяющий fy(f/), становится п-кратным, т. е. f^ (г/) = \ ... \ /(a:'*', ;.<'*Ч...+.("*^<^' 169
.-., x'^"^)dx^^\. .dx^"K Упростить приведенные формулы удается тогда, когда подынтегральная функция обладает «удобными» свойствами (например, представляет круговое нормальное распределение или задана в полярных (сферических) координатах, что бывает довольно редко). Выявленные закономерности позволяют находить решения многих прикладных задач, связанных с проблематикой АСУ. § 6.6. Модель согласования сроков. Минимизация непроизводительных затрат Распределения максимумов встречаются в самых обычных ситуациях. Пусть осуществляется монтаж оборудования на двух производственных участках, которые должны взаимодействовать друг с другом в некотором техноло- al 0 1 i-2 , f _ 7"l_. •^ h tl 6} T, 4^f M- .t'}b. i 7 ±Л< a t O, Рис. 6.13 гическом процессе (примерами могут служить участки подготовки и обработки данных, сборки и испытания механизмов, комплектации и настройки радиоаппаратуры). Работы ведутся двумя специализированными бригадами параллельно и независимо, их начало и окончание определяются соответственно моментами времени t^, ti и U, ti, а продолжительность — величинами Ti=ti—ti и T2=t2—^2 (рис. 6.13, а). По ряду причин (непредвиденные задержки, неудачное выполнение отдельных монтажных операций) величины Ti и Т^ оказываются случайными, поэтому моментом полного завершения работ становится /=max(^i, 4), и первоначальный временной график (рис. 6.13, а) приобре- 170
тает более простой вид (рис. 6.13, б). Здесь Tf, Т^ включают в себя интервалы [О, 4], [О, Q, что вполне допустимо с точки зрения формального анализа, поскольку всякие отклонения ti, /а от о могут интерпретироваться как вариации Ti, Га. Множество Ти JT^jl_Т= max {Т^, TJ, обозначаемых соответственно /i, 1г, t (рис. 6.13, б), характеризуется теперь плотностью вероятности f{tu t^, которая предполагается известной. Пусть к моменту / приурочено начало пусконаладочных работ, выполняемых на всем установленном оборудовании с целью добиться устойчивого и согласованного функционирования рассматриваемых участков в едином технологическом цикле. Для этого приглашается группа специалистов, прибывающая в заранее оговоренный момент времени /". Если монтаж хотя бы одного участка еще не будет закончен (^>/''), то возникнет необходимость оплаты простоя наладчиков. Если же окажется /</", то придется оплачивать простой монтажников, которые должны сдать свою работу. Наиболее благоприятная ситуация /=^ практически исключена из-за случайности величины Т. В этих условиях следует попытаться так выбрать /", чтобы свести к минимуму вероятность слишком больших непроизводительных затрат, связанных с простоями. Формализация задачи и необходимые уточнения основываются на знании «функций штрафа», определяющих размеры выплат за простои. Будем считать, что эти функции заданы в виде ^ _ (с„(t-п, 1> t\ ^ = ( 0. "^> tj_ " to, /</»; " \с„(/»-0/<^«, где с„. См — удельные стоимости простоев наладчиков и монтажников. Следовательно, суммарные затраты составят На рис. 6.13,6 дан график зависимости r~r{t). Ясно, что г представляет собой любое возможное значение случайной величины R и объектом исследования должна стать вероятность p{R'<r''), где г"—допустимые затраты, на которые можно пойти, учитывая обстоятельства выбора ^. Очевидно, событие «R^r"» произойдет, если будет выполнено /"—Го/с„</<;/''4-/'о/с„ (рис. 6.13, б), поэтому для вычисления p{R<ir'>) нужно знать либо F{t), либо /(/). т
Пусть F(t) определяется общей формулой F{t) — 77 _ _ _ _ _ _ — { {f(iij t^)dtidt^ (вследствие неотрицательности ti, t^ о о нижние пределы интегрирования положены равными О вместо—оо, см. § 6.5). Из условия независимости действий двух бригад следует независимость величин Ti, Т^ и тогда f{k, ^2)=/i(^1)72(^2)- Подставляя это произведение в формулу для F{t) я проводя раздельное интегрирование, получаем для рассматриваемой задачи F(t)=Fi(t)-F2(t), где Fi есть функция распределения Ti, а F2 — функция распределения Т^. Таким образом, p{R<: г») = Л (<» + /-»/с„) F^ it' + rVc„)~ -F,(t<>--rVc„)F,(to-rVc„). Полученное равенство определяет в общем виде характер зависимости р {R<ir'') от г", с„, с„, /" и позволяет окончательно сформулировать задачу: при известных Л, ^2, г", с„, с„ найти такое значение f^Q, которое доставляет максимум вероятности p(R<ir'>) или минимум p(R'^r°) = = l—p(R<r«). Геометрическая интерпретация этих условий дана на рис. 6.13, г. Требуется так разместить отрезок [fi—Wc„, ^+Wc„] на оси t, чтобы приращение F(t) (двойная вертикальная линия) оказалось максимальным. Интуитивно ясно, что приемлемое решение достигается тогда, когда на указанный отрезок приходится наибольшая крутизна кривой F(t), однако руководствоваться только этими соображениями нельзя. Для упрощения формальных выкладок удобно считать f(ti) и /(У одинаковыми, например, / (/i)=——=/(^а) при/j, ti^la.b], f(ti)= =/(^2)=0 при ti, t^^la, b] (равномерное распределение на интервале fa, b]). Отсюда ^W = l7r-^. a</<6; (рис. 6.13, д), а искомый тахр (R < г") достигается в точке /»=&—/■%», если длина интервала [t"—r^ic„, /"+/*/£»] меньше или равна Ь—а, и в точках fi^la-i-r^/cM, b—г^/с^], если она больше b—а. Чтобы убедиться в этом, достаточно рассмотреть разность значений F(t) при /=/"+/■''/% и t=fi—r''/c„. Ее увеличение с ростом fi происходит до тех пор, пока fi не превышает b—г'/сн, затем производная по f терпит разрыв и либо сразу становится отрицательной (случай /*/£„+/■%»<&—а), либо сохраняет перед этим значение О (случай 172
л"/с„+г"/см>&—a). Здесь max р (/? — /■") равен \ Сн СмУ L Ь — а\с„ ' с„У J и 1 соответственно. Для практики интерес представляет условие г"/сн+г"/см<&—а,- так как в нем отражена реальная ситуация, в которой принятая величина г" достаточно мала и не может полностью компенсировать разброс / в пределах от а до й (иначе вопрос об экономии средств был бы снят или решен более просто на основе требования полностью перекрыть интервалы [а, Ь] и достичь max р (/?</■")= 1). Приведенные выше формулы показывают, что каждому г" соответствует некоторое значение max р(/?</*)< 1, поэтому рассмотренная задача является одновременно и .задачей выбора г" при заданном max p(R<r°). Анализируя полученные результаты, полезно обратить внимание на разнообразие данных, которые пришлось использовать в проведенном исследовании. Необходимость в этом явилась следствием попыток найти подробный ответ на поставленные вопросы, т. е. дать более полную информацию о возможных решениях. § 6,7. Предельные теоремы. Некоторые правила вычисления моментов Важный класс функций случайного аргумента представляют собой суммы некоторого количества скалярных случайных величин Xi, ..., Х„, совместное распределение которых задано плотностью f(xi, ..., х„). Чтобы выявить закономерности поведения таких сумм, рассмотрим сначала простейшее равенство Y=Xi+X2. Очевидно, со y-Xi Р(у)= J J f(Xi,x^)dXidXi= J J f{Xi, x^)dxidxi; Xi + X^ < у -00-00 00 00 /(у) = J fixi, y—xi)dxi= J f{x^, y—x^jdx^. — 00 — 00 в последнее выражение входят интегралы от f(xi, х^) по проекциям прямой Xi+X2=y на координатные оси xt или Х2. Они связаны с интегралом по самой прямой П известными соотношениями 00 J fiXi, X2)dl= J f(Xi, y—Xi)V^dXi=i Ш) -«> 00 = J f{x^,y—X2)V2'dxi, — 00 . 173
так что f{y) = ^= \ f(Xi,X2)dl. Здесь d/ есть элемент Я, а 1 ^ (Я) множитель {/"2 — значение корня Vl+{dxJdxiY, не зависящие в данном случае от Xi и х^. Пусть полученные формулы используются для отыскания f(y) при условии I О, Xi, X^^iixuX^'t где Qxi, xi — множество возможных значений xt, x^; С — константа, определяемая равенством С I \ dxi dx^ = 1 Xt, X, (равномерное распределение в ограниченной области Q^., ^J. Для конкретизации расчетов удобно принять в качестве Рис. 6.14 ^xi,x^ круг радиуса р с центром в произвольной точке плоскости Xi, Xi (рис. 6.14, а), и тогда /О, л;? + л1>р^; t(Xi,x,)-y j^^p,^ х\ + х%<,р^; а величина интеграла от f{Xi, дга) по прямой Я становится пропорциональной длине S хорды /—/, т. е. f О, г/ ^ [г/„1„, г/шах]; /(г/)= Х{у) г , Из анализа этих простейших зависимостей следуют важные выводы. Во-первых, распределение Y оказывается модальным, т. е. имеющим моду — явно выраженный экстремум (рис. 6.14, б), поскольку с увеличением у определенным образом меняется ^. Во-вторых, длина интервала 174
1Утт> ymaJ превосходит 2р (диаметр множества Qx,.x,)f что является прямым следствием суммирования Xt и Х^. Подобные выводы интересны тем, что приводят к идее существования устойчивых «предельных» распределений Y, к которым стремятся «промежуточные» распределения, получаемые при различных (возрастающих) п. Эта идея подтверждена известными теоремами, формулировки которых даны ниже. Если Xi Х„ — независимые случайные величины, имеющие одинаковые распределения с математическим ожиданием т^<оо и дисперсией 0<D^<oo, то случайная величина У =—У\ Xj всегда получает при п->оо асимпто- /= 1 тически нормальное распределение с параметрами гПу—Шх и D„=D^, т. е. {центральная предельная теорема /). Если Х± Х„ — независимые случайные величины, имеющие различные распределения с конечными математическими ожиданиями mi m„ и дисперсиями Di, .... п ..., D„, то случайная величина 1^= 2 ^j получает при /1->оо асимптотически нормальное распределение с парамет- п п рами m = 2 %> D = 2 Dyтолько тогда, когда выпол- /=1 /= 1 нено условие Линдеберга {центральная предельная теорема 2). Суть условия Линдеберга удобно пояснить, исходя из известной формулы 00 D/ = J {х/—mjY- f, {Xj) dxj (/ = Т~п). — 00 Заменив здесь пределы интегрирования на mj—еа Г- (нижний) и /лу+еа (верхний), где а = 1/ 2 Dy , е > О, получаем выражение величины Dg/, причем D,E<D^ (интеграл в конечных пределах есть, вообще говоря, часть того же интеграла в бесконечных пределах). Рассматриваемое п п условие сводится к требованию Ит 2 D/e/ 2 Dy = l при fJ-J- 00 /=1 1=1 175
любом е>-0. Его ^мысл состоит в том, чтобы воспрепятствовать применению теоремы 2 в случаях той или иной вырожденности распределения fj{Xj). Например, нельзя выбирать в качестве fj{xj) причинные распределения 8{xj—nij), для которых D;-=0 (соответствующая Xj перестает быть случайной величиной в обычном понимании этого слова). Попытка суммирования таких Xj приведет к неслучайности Y и никакого нормального распределения не будет. Значение теорем 1 и 2 состоит в том, что они объясняют причины широкого распространения нормального закона в повседневных явлениях и раскрывают механизм его формирования. На этой основе можно разрабатывать различные модели операций, связанные с процессами расходования материальных и иных ресурсов, накопления производственного потенциала, управления качеством продукции. Функциональная зависимость между случайными величинами проявляется и в соотношениях, связываюш.их моменты (математические ожидания и дисперсии) этих величин. Иногда удается получить необходимые формулы непосредственно из анализа обш.их выражений Y=(p{X), иногда — непосредственно из анализа функций F{y) и f{y), но независимо от этого знание правил перехода от т^, ^х к Шу, Dy (если они суш.ествуют) помогает избежать сложных или просто громоздких выкладок, которые сами по себе не представляют интереса. Чтобы понять основные принципы преобразования мо- ментных характеристик X или X, достаточно обратиться к простейшим примерам. Пусть Y~aX, где а — постоянный коэффициент. Математическое ожидание случайной величины аХ опреде- 00 ляется по известной формуле т^х^ \ axf{x)dx, следова- — 00 ТеЛЬНО Шах^О-тх—ГПу- Пусть теперь F=Xi+X2 и ставится вопрос об отыскании Му при заданной f{Xi, х^. Здесь гпх, + х,-=\\^ (Xi + х^)f(Xi, х^)dxidx^ = — со со со со со = j Xidxi j f {хи х^)dx^-\- J x-^dx^ J fdXi = mx^-\- 176
(правило сложения математических ожиданий). Объединяя этот результат с предыдущим, нетрудно найти т.у для Y=aiXi+a2X2 и т. д. Ниже даны правила, позволяющие определять Шу только на основе знания т^ и соответствующей зависимости К=ф (Х). 1. Математические ожидания т^, Шу не ограничены по знаку, т. е. могут быть и положительными, и отрицательными. 2. Если Y—aX, то ту=атх при любом постоянном а (правило сохраняется и для У=аХ). п п 3. Если Y='^a/X/, то m =2^/'"а:- при произ- /= 1 /=1 ^ вольных постоянных Uj (математическое ожидание линейной комбинации случайных величин Xj определяется той же линейной комбинацией матмематических ожиданий); в частности, при Vaj—1 получаем ту=т.х^+. . .+тх^. п 4. Если Y =11 Ху, где Xj взаимно независимы, то «= 1 п т =YLmx. (математическое ожидание произведения неза- висимых Xj равно произведению Шх); это правило легко п обобщается для случая У = Т1 cljXj при Vay=const,поскольку каждый сомножитель ajXj может рассматриваться как случайная величина Xj с математическим ожиданием ujmxj. 5. Если Y^O, то Шу'^О (математическое ожидание неотрицательной случайной величины неотрицательно). 6. Если У=\Х\, то т.у'^т.^ (математическое ожидание модуля случайной величины X не может быть меньше т^.). 7. Если Y^X, то т.у'^т.^ (отношение неравенства между X и F распространяется на их математические ожидания). Правила 1—7 оказываются полезными не только в практических приложениях, но и при изучении взаимосвязи дисперсий Dj^, Dy. Обращаясь к общему определению «дисперсия есть математическое ожидание квадрата центрированной случайной величины» (см. § 6.2), находим ^у= =аЮ^ для Y=aX, поскольку здесь т —ат^, Y°=Y— — т^-^аХ" и (Yoy^a^XT- Далее, для Y^Xi+X^ имеем Yo=Y—tn,,=X',+Xl и {Уоу^(Х1У+2Х1Х1+(ХТ, следовательно D^^D^^+2ki,,+ 177
+Djf^, где ^i, 2— ковариация Xi, X^, принимающая значение О, если' Xi и Х^ независимы. Точно так же, 0^= =D^_—2^1-, 2+D;(j для F=Xi—Xi и т. д. В результате формулируются новые правила в дополнение к предыдущим, позволяющие определять D^. 1. Дисперсии D^, D всегда неотрицательны (т. е. D^, 2. Если Y=aX, то В^=аЮ^ при любом a=const (правило распространяется на случай Y=aX с той лишь разницей, что на а^ умножается ковариационная матрица). п 3. Если 3^ = 2 ^/> ^^Дб Xj взаимно независимы, то /=1 п D,, = 2 D^ (дисперсия суммы независимых Xj равна сумме их дисперсий); это правило справедливо и для арифметических, и для алгебраических сумм. 4. Если F = 2 ^;> где Xj— произвольные (в том числе /= I п зависимые) случайные величины, то D = 2 D^ +2 2 *// /= I / i>i (дисперсия суммы произвольных Xj есть сумма их дисперсий и ковариаций); это утверждение обобщает предыдущее и, п кроме того, может быть использовано в случае F = 2 ^j^j путем представления каждого сомножителя ajX^ в виде Xj, так что п D = 2 ар;.. + 2 2 afij-ki). /= 1 / < > / 5. Если У^Х или К^Х, то сказать что-либо определенное о Dj^ нельзя (отношение неравенства на дисперсии не распространяется); например, при х^Ю, И и О^^>0 достаточно положить у^11, l+e], 8>0, чтобы обеспечить Y'^X, а затем изменениями 8 достичь либо Dy^D^ (8->0), либо Dy>Djf (е->оо). Рассмотренные свойства математических ожиданий и дисперсий проявляются всегда, поэтому знакомство с ними дает исследователю определенную свободу действий и позволяет изучать математические модели операций в условиях ограниченной полноты данных о реальных событиях. 178
§ 6.8. Метод статистических испытаний В предыдущих параграфах неоднократно отмечалось, что анализ статистической неопределенности в различных ее проявлениях связан с поисками аналитических моделей, отражающих основные закономерности развития случайных событий и позволяющих находить оптимальные (или близкие к ним) решения прикладных задач. Вместе с тем были отмечены ограниченные возможности формального аппарата, усложнение которого далеко не всегда оправдывает себя, вызывая необходимость новых подходов к изучению вероятностных проблем. Важная роль в этом принадлежит численному эксперименту как основе метода статистических испытаний, называемого еще методом Монте-Карло по ассоциации с известным центром азартных игр, имеющих случайный исход. Конечно, в научном понимании данный метод не имеет никакого отношения к играм и лишь использует идею искусственного воспроизведения случайностей с последующей обработкой получаемых результатов. Другими словами, имеет место статистическое моделирование изучаемых явлений, позволяющее более полно отразить их особенности путем многократного повторения стандартных ситуаций. Общая характеристика метода статистических испытаний (или статистического моделирования) сводится к следующему: метод является универсальным, так как позволяет моделировать любые процессы и явления, содержащие элемент случайности; используемый алгоритм весьма прост и состоит в повторяющейся реализации некоторого случайного события с целью искусственного накопления статистики, на основе которой делаются те или иные выводы; трудоемкость метода достаточно велика, поэтому главная роль в его практическом освоении принадлежит ЭВМ с их способностью быстро провести многочисленные испытания изучаемой модели и собрать нужную информацию; результаты статистического моделирования дают приближенные представления о реальных процессах и редко обладают необходимой степенью общности, что затрудняет поиск устойчивых закономерностей или оптимальных вариантов решений; метод в ряде случаев является единственно возможным, поскольку возрастающая сложность прикладных задач, 179
связанных, в частности, с развитием АСУ, оказывается серьезным препятствием для теоретических разработок. Таким образом, сфера применения метода статистических испытаний — исследование сложных операций со многими неопределенностями, проверка и уточнение аналитических результатов, подбор аппроксимирующих формул — должна расширяться и проникать в различные области знаний. Основные проблемы практического использования рассматриваемого подхода к анализу вероятностных задач заключаются в поиске удобных форм организации отдельных (единичных) испытаний как источника статистических данных и оценке качества получаемых результатов при некотором уровне затрат машинного времени. Этим определяется содержание конкретных действий исследователя, проводящего статистическое моделирование. Единичным испытанием (или единичным жребием) называется любой способ получения ответа на вопрос «произошло ли интересующее нас событие S?», или «какое из событий Sj, ..., S^r имело место?», или «какое значение приняла скалярная случайная величина X?», или «какие значения приняли составляющие случайного вектора X?» Слова «любой способ» указывают на допустимость произвольного выбора средств имитации случайностей (физические опыты и наблюдения, обращение к готовым таблицам и т. п.). Применительно к ЭВМ это означает прежде всего возможность генерирования случайных чисел по специально подготовленным стандартным программам, осуществляющим «синтез» каждого такого числа с учетом требования обеспечить нужную частоту его появления. Например, берется любое 6-значное число af и возводится в квадрат. В полученном 12-значном числе а? вычеркиваются три первых и три последних знака, а оставшиеся шесть знаков образуют новое 6-значное число «j, для которого все сказанное повторяется. Найденные таким «арифметическим» путем aj, «g, ... считаются случайными и могут быть использованы в расчетах (метод середины квадратов). Конечно, искусственно воспроизведенные на ЭВМ значения X отличаются по своим общим свойствам от «естественных», наблюдаемых в природе, и поэтому называются псевдослучайными числами. Целесообразность их практического использования обусловлена простотой вычислительной схемы, допустимостью ее многократного применения в различных задачах, достаточностью имитации какого-либо одного закона распределения величины (обычно это равномерное распределение на интервале [0,1]. все другие получаются функциональными преобразованиями X). Возвращаясь к понятию единичного испытания, рассмотрим более подробно принципы, на которых оно основано. Пусть имеется некоторый датчик случайных чисел, равномерно распределенных на интервале [О, 1] (например, большая таблица или вычислительная машина с готовой программой), и требуется ответить на первый из поставленных выше вопросов при условии, что известна вероятность p(S) события S. Очевидно, ту же вероятность имеет событие «случайное число х, полученное от датчика, удовлетворяет иеравен- 180
ствам a<x<.b», где а, b — концы произвольного интервала длиной p(S), включенного в [0,1] (см. рис. 6.15, а). Следовательно, появление S отождествляется с «а<^х<.Ьу>, и можно утверждать, что S произошло, если взятое значение х принадлежит [а, Ь\. Такая же простая схема позволяет ответить и на второй вопрос, касающийся Sj, ..., S^y с извес-шыми p(S{) p(Sj\!). Если рассматриваемые события ие пересекаются и образуют полную группу, то N 2 p(S/)= 1.Другими словами, интервал [0,1] делится без остатка па 1=1 отрезки с длинами p(Si), ..., p(S^), а попадание х на какой-то из них равносильно соответствующему событию S,- (см. рис. 6.15,6). Пусть теперь ставится вопрос о значениях непрерывной случайной величины X с известной функцией распределения F{x). Одно из главных свойств F(x) состоит в том, что 0<Р(л:)<1, поэтому удобно использовать датчик для получения случайных f ^[0,1], от которых нетрудно перейти к х (рис, 6.15, в). Чтобы произошло событие <ia<.X'^bf>, достаточно иметь a<.F<.b, следовательно p(a<X<.b)=b—а (числа F распределены по закону равной вероятности). Но Ь—а есть приращение функции F(x) на интервале изменения л: от а до fc, и можно утверждать, что принятый принцип генерирования чисел F обеспечивает равенство p(fi~^X<^b)—F (b)—F (а). Таким образом, случайные х, получаемые пересчетом F, представляют собой возможные значения величины X, подчиненной закону F(x). Оценивая качество результатов, получаемых методом статистических испытаний, предположим, что х — характеристика, которая должна быть определена (вероятность события, моменты случайной величины и т. п.), ах — ее значение, уточняемое по мере накопления данных, но остающееся случайным вследствие ограниченности числа о)\Г проведенных наблюдений. В этих условиях можно говорить_о вероятности р(1х—1\<г), о законе распределения X, о математическом ожидании или дисперсии х и других понятиях, отражающих особенности х "ли х—Х- Очевидно, |х—х1 представляет собой погрешность в оценке X, а е — некоторый допустимый ее предел. Из неравенства Чебышева (см. §6.4) следуетр(1х—х1<е)^1—^хГ^^^' причем D- есть функция о)\Г, поскольку единственным источником сведений о дисперсии (и других параметрах) х 181
являются проводимые исследования. Обозначив для краткости левую часть рассматриваемого неравенства через р, а D- через В(оЛГ), получим формулу D(#)Xl-p)e% (6.4) позволяющую найти предельно необходимое оЛГ при заданных р и е, если только известен характер зависимости D- от #. _ Вообще говоря, DCcJV) как показатель рассеяния х относительно X уменьшается с ростом оЛГ, и обычно D{iM')= —d/(Jf, где d — коэффициент пропорциональности. В простейших схемах экспериментирования d принимает значения до 0,25, так что для ориентировочных расчетов D(oAr)^l/(4QJV'). Следовательно, неравенство (6.4) переходит в 1/(4оЛГ)>В(оЛГ)Х1—р)е2 или о)\Г<[4(1—р)82]-1 и предельное число испытаний есть #„р=1/[4(1-р)8^]. (6.5) Во многих практических ситуациях оценка (6.5) оказывается завышенной, однако ее всегда можно уточнить в той или иной задаче на основе конкретных данных, если они появятся. Кроме того, сам факт превышения минимально необходимого оЛГ не несет в себе никаких опасностей, за исключением дополнительных затрат времени на поиски решений. В остальном равенство (6.5) отражает общие закономерности изменения Ж в зависимости от р и е. Проведенный анализ позволяет сделать следующие выводы: качество результатов статистического моделирования характеризуется вероятностью того, что при заданном оЛГ погрешность оценки х не превысит е (другими словами, та или иная точность достигается лишь с некоторой степенью вероятности, возрастающей с ростом оЛГ); увеличение точности результатов, т. е. уменьшение е, при любой фиксированной величине р может произойти за счет существенного увеличения #, так как е обратно пропорциональна КоЛГ (чтобы уменьшить е в два раза, нужно увеличить оЛГ в четыре раза и т. д.); совершенствование приведенных оценок путем привлечения дополнительной информации о свойствах конкретных задач изменит соотношения (6.4), (6.5) лишь в деталях, касающихся, например, коэффициента d; основа этих соотношений (формула Чебышева в общем случае, уточненные ^82
аппроксимации р в частных случаях) останется неизменной. Изучение вероятностных моделей операций будет продолжено в гл. 7 применительно к проблематике массового обслуживания как специфической формы деятельности сложных систем. Глава 7. ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ ', Своеобразный класс вероятностных моделей образуют модели массового обслуживания, отражающие особенности поведения систем, подвергшихся воздействию потока тех или иных событий. Наиболее распространенными примерами таких систем являются вычислительные центры с поступающими на обработку массивами данных, складские комплексы с требованиями принять на хранение какую- либо продукцию, ремонтные службы с заявками от потребителей их услуг и т. п. Во всех подобных случаях можно говорить о потоке однородных событий, выраженных в поступлении очередной заявки (требования) в некоторый случайный момент времени, а также — о системе, реагирующей определенным образом на эти события и называемой системой массового обслуживания (CMO).j) Очевидно, каждая СМО осуществляет ряд стандартных операций в процессе работы с отдельными заявками (требованиями), причем содержание этих операций определяет характер проводимого обслуживания, а их продолжительность является обобщенным показателем технических возможностей системы. Момент t^, начиная с которого поступившее требование считается выполненным, играет важную роль в оценках деятельности различных СМО, поскольку сам факт окончания очередного обслуживания свидетельствует о достижении цели, поставленной перед системой. Обычно время обслуживания одной заявки считается случайным, что хорошо согласуется с практикой, и, кроме того, придает необходимую общность разрабатываемым моделям. Неопределенность начинает проявляться не только в характеристиках потока заявок, поступающих в СМО, но и в характеристиках самой системы, хотя она работает по неизменной программе (имеют место внутренние неувязки, непредвиденные осложнения и т. п.). Следствием этого является невозможность точного предсказания t^ даже тогда, когда стал известен момент прихода заявки 183
Каждая СМО объединяет некоторое количество параллельно действующих технических устройств, называемых каналами обслуживания. Они могут самостоятельно (независимо) выполнить все операции, лежащие в основе функционирования СМО, и увеличить тем самым пропускную способность системы, определяемую числом обслуживании, завершенных в единицу времени. Физически канал обслуживания представляет собой какое-то устройство (в частности, вычислительную машину) или технологическую линию (например, линию контроля электронных приборов) или специализированный отдел учреждения и т. д. Следовательно, в структурном отношении любая СМО может рассматриваться как мультипроцессор (см. § 4.6, 6.4), работающий в условиях неопределенности, связанной с действием случайных факторов. Названные особенности СМО позволяют предположить, что существует опасность возникновения очередей заявок в одни периоды времени и простоя оборудования из-за отсутствия заказов в другие периоды, поэтому главная задача исследований состоит в поиске связей между показателями (критериями) эффективности той или иной системы, ее структурой и условиями работы. В качестве критериев, выбираемых неформально, можно взять среднее время обслуживания поступающих заявок, среднюю длину очереди, вероятность получить отказ по причине перегруженности СМО, вероятность слишком больших потерь времени на ожидание обслуживания (понятие «слишком большое» уточняется в каждом конкретном случае) и т. д. Полезно заметить, что оценки эффективности СМО редко сводятся к какому-либо одному условию. Обычно исследователь стремится построить такую математическую модель, которая позволяет дать ответы и на вопросы создателей системы, и на вопросы ее пользователей, с тем чтобы добиться хотя бы приближенного соответствия между возможностями одних и требованиями других. ' Ниже рассматриваются конкретные модели массового обслуж^1вания, основанные на различных предположениях, вытекаю11щ!С либо непосредственно из практического опыта, либо из общих представлений о природе СМО.
§7.1. Случайные процессы. Потоки событий В гл. 6 основное внимание было уделено фактам, связанным со статикой явлений, постоянством характеристик объектов, неизменностью законов распределения вероятностей («произошло событие А», «случайная величина обладает свойством неотрицательности», «математическое ожидание оказалось равным О» и т. д.). Главная особенность рассмотренного подхода к изучению случайностей состояла в том, что фактор времени либо просто не учитывался в модели, либо играл второстепенную роль. Ставилась цель получить однозначный результат, отражающий те закономерности, которые будут наблюдаться в стандартных ситуациях независимо от момента их возникновения. Все это безусловно необходимо, однако не удовлетворяет полностью запросы практики. Деятельность современных автоматизированных систем во многом определяется процессами, развивающимися во времени. В частности, совершенствование технической базы АСУ, разработка новых средств программного обеспечения, меняющиеся условия взаимодействия с внешней средой создают предпосылки для изучения динамики явлений. Важное место отводится теории случайных процессов, имеющей приложения и в исследованиях проблем массового обслуживания. Предположим, что некоторая скалярная случайная величина X начинает менять со временем свои характеристики. Например, с приобретением навыков работы за пультом ЭВМ оператор добивается большей (в среднем) производительности труда, т. е. улучшает при прочих равных условиях один из главных показателей — среднее значение коэффициента использования оборудования. Чтобы подчеркнуть предполагаемую зависимость от времени t всех параметров, характеризующих X, достаточно ввести символ t в принятые ранее обозначения, рассматривая X{t), m-xit), Dx(t), ... в качестве новых изучаемых объектов. \ Функция времени X{t), принимающая при каждом фиксированном t случайные значения, называется случайным процессом. В основе исследования таких процессов лежат понятия и методы, встречавшиеся ранее, и данное определение всего лишь отражает естественный переход от неизменных в своих проявлениях величин X к изменчивым. Таким образом, для любого ^=const X (t) есть случайная величина в обычном понимании этого слова.\ Выбор 185
с; I) t, t2 m~ Рис. 7.1 некоторого ^=const и получение соответствующей X ассоциируются с сечением процесса по этому t. Своеобразный класс случайных процессов образуют так называемые потоки co6bmuut Представление о них складывается под влиянием часто повторяющихся однотипных ситуаций, приме15ы которых нетрудно найти во всех сферах целенаправленной деятельности. Так, можно говорить о потоке отказов вычис- "^ лительного комплекса, бракованных изделий на произ- t водстве, заданий на выполнение каких-то работ и т. п. t Общее понятие потока основано на предположении о том, что интересующее нас событие будет происходить в заранее неизвестные моменты времени ti, <2. ■•• (обычно их считают случайными), поэтому удобны графические изображения потоков в виде точек ti, /2, ••• на оси t (рис. 7.1, а). Если события, о которых идет речь, являются однородными с точки зрения их сущности и форм проявления, то и поток называется однородным. Изучение такого потока состоит в поиске отношений между ti, t^, ..., определяющих его свойства и позволяющих проводить необходимые расчеты в конкретных задачах. В практике прикладных исследований, связанных, в частности, с проблемами разработки и эксплуатации АСУ, встречаются, как правило, только однородные потоки. Если некоторые события следуют друг за другом через строго определенные промежутки времени (исключительный случай), то соответствующий поток называется регулярным. В качестве примера можно назвать начала и окончания рабочей смены или предусмотренные перерывы в утомительной работе, повторяющиеся в установленном порядке. Для случайных потоков характерна непредсказуемость моментов ti, t^, ..., в которые происходит вполне определенное событие. Чтобы упростить формальный анализ таких потоков, приходится обращаться к различным предположениям, позволяющим сосредоточить усилия на изучении упрощенных моделей, а затем по мере необходимости уточнять найденные закономерности. Бажной характеристикой любого потока является число Н событий, происшедших за время т (рис. 7.1, а). Вообще 186
говоря, Н есть случайная величина с возможньми значениями т) 6 {0,1,2,...}, поэтому приходится рассматривать либо вероятности р (Н=т)), либо математические ожидания Шц и дисперсии D„, зависящие так или иначе от т. Пусть при любом т) величина р (Н=т)) зависит только от продолжительности интервала наблюдения т и не зависит от положения этого интервала на оси t, т. е. момент начала наблюдения роли не играет. Поток, для которого это условие выполнено, называется стационарным. Другое важное свойство случайных потоков выражено в предположении о практической невозможности попадания двух и более событий на достаточно малый («элементарный») интервал т. Здесь вероятность р (Н^2) пренебрежимо мала по сравнению с вероятностью р(Н=1) и поток называется ординарным (события в нем не могут повторяться мгновенно). Если на любых непересекающихся интервалах Тх, т^ оси t происходят Hi, Hj событий и случайные величины Hi, На независимы, то в потоке отсутствует последействие (предшествующие события не оказывают влияния на последующие) . Указанные особенности часто проявляются в реальных потоках, что способствует упрощению моделей, ускоряет инженерные расчеты, а также создает предпосылки для классификации потоков и обобщения опыта теоретических исследований. Сегодня известен целый ряд хорошо изученных потоков, сведения о которых используются в анализе систем, моделировании операций, различного рода экспериментах . Tla практике широко распространено понятие простейшего потока, обладающего одновременно свойствами стационарности, ординарности, отсутствия последействия. Интерес к нему вызван двумя обстоятельствами — сравнительной простотой формального описания всех его статистических характеристик и возможностью выразить в нем эффект взаимного наложения многих независимых произвольных потоков (тоже стационарных и ординарных). В простейшем потоке величина Н подчиняется распределению Пуассона (см. §6.2), т.е. р(Н = г,) = (^.-^\ где Я — интенсивность потока (среднее число событий в единицу времени). В частности, р(Н=0)=е~^'^ и р(Н^1) = — \—е""^'^, следовательно, функция распределения времени 187
Т между соседними событиями (рис. 7.1,6) есть F {t) — Простейший поток называется еще и стационарным пуассоновским, что подчеркивает его главные особенности, однако требование стационарности в каких-то случаях может быть снято (например, если речь идет об обработке последовательностей сигналов в системах оперативного сбора информации). Тогда приходится рассматривать нестационарные пуассоновские потоки, в которых А, меняется во времени, и формула вероятности р (Н=т]) содержит вместо t+x произведения А,т интеграл \ A,(i) dt, указывающий на яв- t I ную зависимость р (Н=л) от t. ' Важный класс образуют потоки Эрланга, получаемые «прореживанием» простейших потоков, т. е. отбрасыванием некоторых событий как несостоявшихся. Если в простейшем потоке сохраняется каждое k-e событие (считая от условно «первого»), а остальные просто не учитываются, то возникает поток Эрланга ^-го порядка (^=1, 2, ...), обозначаемый 5ft. Очевидно, время Г^ между любыми соседними событиями потока 5ft есть сумма k независимых величин Т (рис. 7.1, б), распределенных по показательному закону, поэтому ■ {k-1) 1 Ш-'iP^e'^^, t>0. Приняв k=l, получим fi{t)—ke~^\ следовательно, простейший поток можно рассматривать как 5i. Числовые характеристики величины Tft (математическое ожидание и дисперсия) находятся суммированием mi=l/A, и Di=l/A,^, так что mh=k/X, D^=k/i^ или mft=l/Xft, Dft=l/(^ft), где A-ft — интенсивность потока 5ft, равная k/k. Полезно обратить внимание на следующее: потоки Эрланга являются стационарными и ординарными, но обладают последействием, усиливающимся с увеличением k при A,ft=const. Дальнейшее изучение свойств потоков, базирующееся на экспериментальных данных, связано с анализом произвольных распределений величины Т (рис. 7.1, б). Считая некоторый поток стационарным и ординарным, можно предположить, что начало интервала т совпадает с одним из событий (рис. 7.1, б) и при этом условии существует вероятность ру(Н=т]), равная 9ii(t). Оказывается, полная вероятность р (Н=т]) попадания т] событий на произволь- 18S
ный отрезок т оценивается здесь как ~% р (Н = п) = Л J [ф^_1 (т)—ф^ (т)] di, о где Л — интенсивность потока, представляющая собой в данном случае математическое ожидание числа событий, происходящих в единицу времени. Функция распределения времени Т есть F {t) = \—фо(0 (эта формула верна для любых Т, наблюдаемых после появления первого события). Таким образом, рассматриваемый поток характеризуется параметрами Фо(т) {функция Пальма) и Фт1(т) {функции Пальма — Хинчина, 11 = 1,2,...), выбор которых должен отражать в каждом случае реальности исследуемых процессов. Например, полагая Л=Л и Ф„(т) =^--у—е~^^, нетрудно получить р {R—v^)—py{Yi—r\) (отсутствие последействия) и фо(т)=е~^'', т. е. прийти к простейшему случаю, обсуждавшемуся выше. Потоки, определяемые функциями Фо(т), Фт^Ст), называются потоками Пальма. Они обобщают изученные ранее особенности других потоков и служат удобной моделью многих сложных явлений, с которыми сталкиваются исследователи операций в практической деятельности. § 7.2. Одноканальная система с отказами. Простейшая модель обслуживания Рассмотрим задачу анализа характеристик СМО при следующих допущениях; 1) система имеет один канал обслуживания; 2) поток заявок — стационарный пуассонов- ский с интенсивностью Л (см. §7.1); 3) время обслуживания Т есть случайная величина с возможными значениями /£[0, оо], распределенная по показательному закону f{t) — \ie~^, ^>0, где |л — интенсивность освобождений канала; 4) заявка, заставшая систему занятой, сразу же покидает ее (в этом случае говорят об отказе в обслуживании, а сама СМО называется системой с отказами). Требуется найти пропускную способность СМО и вероятность того, что заявка, пришедшая в момент t, получит отказ. Пусть состояние рассматриваемой СМО характеризуется занятостью (или незанятостью) единственного канала, так что при любом />0 система оказывается либо в состоя- 189
НИИ So (канал свободен), либо в состоянии St (канал занят). Переход из Si в So осуществляется, как только очередное обслуживание завершится. Переход из So в Si связан с появлением заявки и немедленным началом ее обслуживания. На рис. 7.2 показан граф переходов для изучаемой СМО, определяющий все возможные их «направления», что позволяет получить общую картину изменений происходящих в системе (в Лереходо^6а_в5^^ш^оШстшЛ ^^^^^^ ^^y^gg 3^g ВЫГЛЯДИТ пре- ^ ^"^ дельно просто) ^ д SJl^ При произвольно взятом ^ сам п я ггт""^ А факт пребывания системы в сос- Перекод из S,6 SnC интенсивносшш и ^ ^^ г, г, тоянии So или Si является слу- Рис. 7.2 чайным, поскольку нельзя точно предвидеть ни момента прихода заявки t„, ни момента завершения ее обслуживания t^. Следовательно, вероятности состояний So, Si есть функции времени ро(0> Pi (О соответственно. Для определения Ро(0. Pi (О Рассмотрим на оси времени две точки —t и t-\-M, где А/ — малая положительная величина. Чтобы в момент /+А/ система оказалась в состоянии So (вероятность этого есть ро(^+АО). достаточно либо появления So в момент t и отсутствия перехода в S^ за время М (событие Ао), либо появления Si в момент t и наличия перехода в So за А/ (событие At). Таким образом, po(t+l!!s.t)=p{Ao)+p{At), и остается найти р(Ло), p{At), имея в виду, что Ао и At являются сложными событиями. Очевидно, р(Л^)=ро(0(1—?^А0 и р(Л^^)=р1(0 |лА^ где Xt^t—вероятность прихода заявки в промежутке А/, |лА/— вероятность освобождения СМО в течение А/, если до этого проводилось обслуживание. Оценки справедливы только для малых А/ и следуют из формул, определяющих вероятность одного события за время А^ в потоке заявок (см. § 7.1) и «потоке освобождений», обладающем такими же свойствами согласно исходным условиям 1—4. Подставив выражения р(Ао), p{At) в формулу для Po{t+M), получаем {po(t+^t)~po(t)\!M=^—'kpo(t)+\ipx{t) или (переходя к пределу при А^-уО в левой части) dpo(t)l ldt=—Jipo(0+M'Pi(0- Замечая теперь, что po(0+Pi(0=l (система обязательно находится в каком-то из двух возможных состояний So, Si), приходим окончательно к дифференциальному уравнению dpo{t)/dt=^—(Х+|л)Ро(0, интегрировать которое нужно при естественных начальных условиях ро(0)=1, pi(0)=0 (в начальный момент t=0 систе- 190
ма свободна). Это дает графики зависимости ро, pi от t приведены на рис. 7.3, а—в. Легко заметить, что с ростом t вероятности рог р1 стремятся к пределам po=|^/(^+l^) и р1=Л/(Л+|л) (установившийся режим работы СМО). Обращаясь к оценкам пропускной способности и вероятности отказа, можно утверждать следующее: заявка, пришедшая в момент t, не будет обслужена (получит отказ), Рис. 7.3 если система окажется занятой (Sj), и вероятность этого события есть pi (t). Для любого t средняя величина отношения числа обслуженных заявок к общему их числу равна ро(0 (относительная пропускная способность), а полное количество обслуживании в единицу времени есть q='kpo(t) (абсолютная пропускная способность). Таким образом, основные характеристики рассмотренной СМО меняются, вообще говоря, во времени, но стремятся к некоторым установившимся значениям, зависящим от % и \1 (табл 7.1.). Таблица 7.1 Абсолютная пропускная способность 1?^(.^ Относительная пропускная способность "^ 'уст Вероятность отказа "уст Я{1/(Я+Ц) ц/(Я+ц) Я/(Я+ц) Анализ полученных формул (табл. 7.1) позволяет сделать выводы, отражающие в целом специфику взаимодействия СМО с потоком поступающих заявок. Так, потоки, интенсивность которых значительно превосходит возможности 191
системы (А^ц), ставят ее в трудное положение — вероятность отказа стремится к 1, относительная пропускная способность падает до О и т. д. Наоборот, с потоками сравнительно малой интенсивности (Я^ц) СМО справляется довольно легко (руст~^0, <7уст-^1, <7уст~^^)' хотя опасность отказов в обслуживании не исключается полностью. Нельзя указать какие-либо предпочтительные соотношения между Лиц, которые позволили бы оптимизировать систему в обычном понимании этого слова (^усп <7уст> Руст как функции л, ц меняются монотонно, и СМО проявляет себя тем лучше, чем больше ц превосходит к). Выбор приемлемых значений ц при том или ином A=const можно осуш,ествить, задав «разумные пределы» увеличения <7уст, <7уст или уменьшения рует- Например, требование руст^О,!, выполняется при |л^9Л, для достижения <7уст^0,8 нужно иметь |л^4Л и т. д. Сказанное выше хорошо согласуется с обш,ими представлениями о характере реакций системы на воздействия в виде приходящих заявок и оправдывает изучение простейших моделей, однако необходимость поиска более общих закономерностей, расширяющих сферу приложений теории, сохраняется. § 7.3. Многоканальная система с отказами. Пропускная способность Первым шагом на пути обобщения результатов, полученных в предыдущем параграфе, может служить предположение о многоканальности СМО. Пусть выполнены условия: 1) система имеет г каналов обслуживания (/■^2); 2) поток заявок — стационарный пуассоновский с интенсивностью Л; 3) время обслуживания распределено по показательному закону с параметром ц (интенсивность освобождений каждого канала СМО); 4) заявка, заставшая все каналы занятыми, покидает систему (СМО с отказами). Требуется найти основные характеристики рассматриваемой СМО и оценить приемлемость тех или иных числовых значений исследуемых показателей. Как обычно, состояния СМО удобно определять, исходя из факта занятости каналов, поэтому в любой момент />0 можно говорить о состояниях So (все каналы свободны). Si (занят один канал), . . ., Sr (заняты все г каналов). Из исходных условий 2 и 3 следует, что переходы осуществляются по схеме, показанной на рис. 7.4 (практически исключено одновременное появление двух и более заявок, а также 192
одновременное освобождение двух и более, каналов). Отличие от простейшего случая (см, рис. 7,2) заключается здесь в разной интенсивности переходов «справа налево». Действительно, если СМО находится в состоянии Sr, то возврат в Sf-i может произойти многими способами (освободится или первый, или второй, или какой-то другой канал), что увеличивает интенсивность до гц. То же самое можно сказать о переходах S^-i-^-Sr-i, Sr-i-*-Sr-a, ■■, S^-^Si, для которых ц заменяется на (г—1)ц, (г—2)ц, ..., 2ц соответственно. Именно в этом проявляется эффект многоканаль- ности, приводящей к убыстрению обслуживания в среднестатистическом смысле. Рис. 7.4 Переходя к дифференциальным уравнениям для вероятностей ро(0. pi(0. •••> Prii), необходимо иметь в виду, что достижение того или иного S^il^k^r—1) за малый промежуток времени А^ определяется теперь либо возможностью переходов Sh~i-^Sk, Sk+i-^-S/^, либо сохранением самого Sft в течение А^. Исключение составляют So и S„ имеющие «одностороннюю связь» с Si и Sr-i, что отражено в структуре уравнений dpo {t)ldt = —Лро {t) + npi {t)\ dp, (t)ldt = -(Л + А;ц)p,it) + lp,_,it) + ik+\)lip,.,,(0; dp,{t)/dt==-riip,{t) + lp,_i{t). (7.1) Уравнения (7.1) называются уравнениями Эрланга. Их интегрирование проводится при начальных условиях ро(0) = = 1, рй(0)=0 {k=2, г) и дает в пределе (при t-^oo) формулы Эрланга Ро = а=0 1 ^EЯ^,a а! V (А Я\» Pk=[j] Р» (^=1. '■). определяющие установившиеся (предельные) значения вероятностей состояний. 7 Дегтярев, Ю. И. 193
Знание ро i^ pk (k=U г) позволяет оценить вероятность отказа в обслуживании как руст^рг, относительную пропускную способность — как ^уст==1—Рг и другие важные показатели, сведенные в табл. 7.2. Таблица 7.2 Абсолютная пропускная способность ^уст Относительная пропускная способность Z ^уст Вероятность отказа „ '^уст Среднее число заявок v. обслуживаемых одновременно 4'-(т)'-^] ^ У Ро Ро 7['-(i)'-?l] В приведенных формулах главную роль играет отношение к/[1, следовательно, рассмотренная система с г каналами функционирует одинаково хорошо (или одинаково плохо) при любых К, |л, для которых сохраняется неизменной величина Х/|л. Например, двухканальная СМО высокой производительности (|л = 10), подвергающаяся воздействию интенсивного потока заявок (Я=10), ведет себя (в статистическом понимании) так же, как двухканальная СМО низкой производительности (|л=0,1), взаимодействующая со «слабым» потоком заявок (Я=0,1). И в том, и в другом случае величины ро, pk, 9уст. Руст, "v остаются неизменными, только 9уст меняется пропорционально Я. Представляет интерес зависимость исследуемых параметров от г при X/|j,=const. С увеличением г вероятности ро, ри (k = l, г) уменьшаются, так как ро=(^-\—) ДЛя г=1; 1 + V 2!ц2 ■дляг=2;р„=( 1 + V А,з 2!|г2 ' 3!ц' ДЛЯ г=3 И Т. Д., а pfe В соответствии с формулами Эрланга пропорциональны ро. Происходит перераспределение вероятностей в условиях увеличивающегося числа состояний Sfe (k=0, г) при общем требовании р„+ 2 Pk = K которое k=i выполняется всегда и отражает тот факт, что в любой момент ^>0 СМО находится в каком-либо состоянии из названных. Кроме того, рост г приводит и к уменьшению коэффициента V ;rf-r При ро в формулах табл. 7.2, поэтому улучшаются все характеристики системы (отношение %/ц предполагается 194
постоянным). Например, ру„ стремится к нулю (г-^оо), '7уст стремится к единице (г-^-оо) и т. д., хотя опасность отказов полностью не исчезает. Выбор конкретных г можно осуществить только путем назначения верхнего предела либо для р^„, либо для q^^.^, либо для какого-то другого из рассмотренных выше параметров. Так, в случае Я/|л= 1 можно потребовать р^^^0,03 и тог- / 11 1 да ро1г\^0,03, или г\/ро^ЗЗ, или г! 1 +7-;- +кг+к['+ ■.. 3! ...-(- —1^33. Неравенство начинает выполняться при г=4, что и определяет решение. Оценим теперь влияние величины Х/ц на показатели качества работы системы, имеющей фиксированное число каналов. Очевидно, увеличениеЯ/ц неблагоприятно для СМО (заявки приходят в среднем чаще, чем появляется возможность их обслужить) и это способствует снижению вероятности ро, меняющейся обратно пропорционально г-й степени К/ц. Относительно р^ (k = l, г) можно сказать, что их сумма обязательно увеличится, поскольку сохраняется равенство г Ро + 2 Pfc = 1> Причем отдельные слагаемые этой суммы бу- дут вести себя по-разному в зависимости от конкретных вариантов выбора к/ц. Другими словами, если %/ц станет возрастать, то в системе будут преобладать состояния занятости какого-то числа каналов, значения ру^т- '/уст устремятся так или иначе к 1 и О соответственно, а величина v — к г (см. табл. 7.2). Отсюда следует рекомендация уменьшать Я/(1 за счет увеличения ji, с тем чтобы улучшить показатели эффективности СМО. В заключение сравним формулы таблиц 7.2 и 7.1. Как и следовало ожидать, при г=1 все сводится к случаю, рассмотренному в §7.1. В_частности, выражение ро (см. табл. 7.2) приобретает вид po=po=^i/(^"+!-i), и три первые столбца табл. 7.2 переходят в соответствующие столбцы табл. 7.1. Модели систем, допускающих отказы в обслуживании, отражают далеко не все реальные ситуации. Обычно заявки, нашедшие систему занятой, становятся в очередь, и это должно привести к пересмотру ряда выводов, полученных ранее.
§ 7.4, Одноканальная система с очередью. Время ожидания обслуживании Примеры систем с очередью встречаются часто, что объясняется спецификой тех видов обслуживания, необходимость в которых однозначно определяет включение заявки в очередь. Здесь можно говорить о пунктах медицинской помощи, учреждениях службы быта, вычислительных центрах с поступающими на обработку массивами данных и других объектах, изучаемых с позиций теории массового обслуживания. Рассмотрим сначала простейшую задачу в следующих предположениях: 1) исследуемая СМО является одноканаль- ной (/■=!); 2) поток заявок — стационарный пуассоновский с интенсивностью %; 3) время обслуживания распределено по показательному закону с параметром |л; 4) заявка, пришедшая в занятую систему, становится в очередь, если ее длина, т, е. количество ожидающих единиц, не превышает т); в противном случае заявка уходит необслуженной. Анализ характеристик указанной системы с ожиданием (или системы с ограниченной очередью) удобно проводить, различая ее состояния по признакам занятости единственного канала и изменения длины очереди. Таким образом, в произвольный момент времени />0 СМО оказывается в одном из состояний So (канал свободен). Si (канал занят, очереди нет), Sa (канал занят, в очереди одна заявка), Ss (канал занят, в очереди две заявки), ..., S^+i (канал занят, в очереди г) заявок). Граф переходов приведен на рис. 7.5. Его особенность заключается в одинаковой интенсивности переходов, связанных с появлением каждой новой заявки или окончанием очередного обслуживания. В остальном рис. 7.5 полностью совпадает с рис. 7.4, поэтому уравнения, определяющие ро(0 Pn+i (0. имеют вид { dp„{t)/dt^ — Xp„{t) + iip^{t); I dp,{t)/dt ==-{X+i,)p,{t)+Xp,_i+i,p,^iit),'k==17% (7.2) I dpr^^j_{t)/dt = — HPr^^-,(t) + Xpr^{t), a формулы предельных вероятностей "Т1+ 1 2 (Ш' Ро = а=0 ; Pk^i^'p» ik=U Ti+i). Нетрудно заметить, что в правой части выражения ро суммируются члены геометрической прогрессии 1, (А-/|л), 196
(к/ц)\ (X/l,) 1+1 следовательно p, = (Vti)*(Vti-l)[(Vtir^-l]. Полученные результаты позволяют найти уже встречавшиеся показатели эффективности СМО (см. § 7.2), а также оценить среднюю длину ц очереди как математическое ожидание дискретной случайной величины Н с возможными зна- Рис. 7.5 чениями 1, 2, .... Г), вероятности которых р^, заданы. Очевидно, Рз, Рт,4 т] = р2 + 2рз + • С понятием Г) тесно связано понятие среднего_ времени пребывания заявки в очереди на обслуживание /„ч- Если заявка приходит в некоторый момент />0, то она либо застанет систему свободной и сразу будет обслужена (вероятность этого события есть ро), либо застанет систему занятой, но не имеющей очереди, и будет вынуждена ждать начала обслуживания в течение какого-то времени (его среднее значение равно 1/|л, а вероятность рассматриваемого события есть pi), либо застанет очередь из одной заявки, пришедшей ранее, и будет ожидать большее время (в среднем 2/|л; вероятность события есть рг) и т. д. Наконец, застав очередь длиной т), заявка не будет терять время на ожидание и останется необслуженной. Таким образом. 7 — Pi I ^Ра 1+2-+, + п или ^oq = Обратив внимание на возможность замены суммы 1 + +2 Я/|л +... в формулах для г), t^^ ее обш,им выражением 1-(г1 + 1)(У(х)>1+Г1(У(х)>1+1 (l-bW^ , получим окончательный перечень 197
характеристик одноканальной СМО с ограниченной очередью (см. табл. 7.3). Таблица 7.3 Относительная пропускная способность q уст Вероятность отказа 7Г ^'уст Средняя длина очереди 1 Среднее время 7 'оч пребывания в очереди 1 — Я\1+1 •Ро 1+1 Ро (Ь. .-.,+.)1|)"- Л. к 1+1 1+- Ро Как и в случае многоканальной СМО с отказами (см. § 7.2), здесь все определяется отношением Х/ц, т. е. имеет место своеобразное подобие ситуаций, в которых оказываются различные системы с одинаковыми г) и к/ц. Увеличение ^/ц, при Tj=const неблагоприятно влияет на показатели СМО (повышается вероятность отказа в обслуживании, снижается пропускная способность, возрастает среднее время ожидания и т. д.), однако определенный результат дают попытки добиться улучшений за счет роста предельно допустимой длины очереди Г). Интуитивно ясно, что в этих условиях каждая заявка рано или поздно будет обслужена (отказы практически исключаются или становятся маловероятными), следовательно, представляют интерес оценки всех параметров системы в предположении tj-^oo. Переходя к пределу при г)->-оо в формуле для ро, легко убедиться в том, что для /\,/|л<1 он суш,ествует в виде lim ро=^1 — VM', а для к/ц'^! —в виде^ lim ро = 0. По- Я->вс х]-^ ОС следнее равенство означает, во-первых, почти полную невозможность достичь состояния So и, во-вторых, [указывает на опасность возникновения сколь угодно большой очереди f Чу^ \ [ сохраняется условие Ро+ 2 Рл = ' • Это обстоятельство \ й=1 / необходимо учитывать при выборе характеристик реальных систем, добиваясь такой их производительности, которая обеспечит приемлемые ^/|л<:1.
в случае У|л<:1 система становится устойчивой в том смысле, что вероятности нежелательных состояний 5^+i, S„, 5,,_i, ... стремятся к О с ростом г\. Действительно, для любого конечного k'^l выполняется равенство lim Pfc = ik/ii)" lim po = (1 —Х/ц) (Vfi)*, Г]~^ GO X]~^ GO Причем (1—?1/|л)(?1/|л)*<(1—?i/|j,)(;i/|j.)*+i, поскольку к/^<1. Следовательно, lim p„+i= lim Pft = 0. Остается уточнить характер изменения показателей, содержащихся в табл. 7.3. Очевидно, lim Руст = 0 и lim (7уст = 1 (эти показатели непосредственно связаны с p^_i). Более интересны оценки пределов г] и t„^, имеющие вид . Они показывают, что и т] и ^оч конечны, т. е. каждая заявка находится в очереди ограниченное (в среднестатистическом смысле) время. Вместе с тем опасность больших задержек существует даже при близких к нулю вероятностях pk{k=l, 2, ...), но во многих практических ситуациях ею можно пренебречь или как-то подготовиться к подобным нарушениям установившегося режима работы СМО, Важную роль здесь может сыграть анализ верхней границы вероятностей р(Гоч^1) с помощью неравенства Чебышева p{To4^i)^ioJi> где Гоч — время пребывания заявки в очереди (случайная величина); t — некоторое возможное значение Г^,, (см. § 6.4). Таким образом, средствами обеспечения работоспособности исследуемой одноканальной СМО являются прежде всего надлежащая, производительность системы {к/ц<а1) и достаточно большая допустимая длина очереди (т]->-оо). Нарушение этих условий вызывает неконтролируемый процесс роста числа необслуженных заявок, что равносильно постепенному выходу СМО из строя. Преодолеть указанные трудности удается в какой-то мере за счет увеличения количества каналов обслуживания.
4 7.5. Многоканальная система с очередью. Эффект взаимодействия каналов Модель многоканальной СМО с очередью представляет собой естественное обобщение модели, изученной в § 7.4. Вводятся предположения; 1) система является многоканальной (/■>1); 2) поток заявок — стационарный пуассоновский с интенсивностью Я; 3) время обслуживания для каждого канала распределено по показательному закону с параметром ц; 4) заявка, пришедшая в момент />0 и заставшая 1 So) {S, М Очереди нет Рис. 7.6 систему занятой, становится в очередь, если ее длина не превышает Г). Состояния СМО различаются, как обычно, по признакам занятости каналов и изменения длины очереди, так что в дальнейшем будут рассматриваться So (все каналы свободны). Si (один канал занят, остальные свободны), ..., Sr (все каналы заняты, но очереди нет), S^+i (все каналы заняты, в очереди стоит одна заявка), ..., S^+n (все каналы заняты, в очереди у\ заявок). Граф переходов показан на рис. 7.6. В нем отражены особенности исследуемой модели, которые частично проявлялись и в схемах, приведенных на рис. 7.4, 7.5. Например, эффект многоканальности выражен в последовательном изменении характеристик переходов между Sr, Sr-i, ■■■, Si, So, эффект суш,ествования очередей — в учете состояний Sr+i, ■.., S^+n при неизменной интенсивности переходов между ними и т. д. Это определяет структуру правых частей системы дифференциальных уравнений, в которой для упрош,ения записи везде опуш,ен аргумент t dp^idt = - dpr+v/dt = -(^ + kii)p^ + lp„_. —(k + rii)pr+y + lp + ik+l)iipk+i. л+v—1 ~r fl^pr+v+n k = V = = 1, 0, r-1; (7.3) 11—1; I i dpr+r^idt = — r\ipr+.^ + 'kpr+^_^ 200
Решение уравнений (7.3) приводит к следующим формулам предельных вероятностей состояний: ^о={1+т+^тч... k=l, r V = 1, T) V' 2! \, n 1 (r-1)! Vn ЯХ/--! + +яШ'.М'-Ш']('-.^)-'Г- Методы определения основных характеристик СМО при известных ро, Pki Pr+v остаются здесь теми же, что и ранее (см. § 7.3, 7.4), поэтому можно сразу построить табл. 7.4, содержащую перечень знакомых показателей. Таблица 7.4 Относительная пропускная способность Z Чует 1 fky 1 г - X г1 \tij ^ f ^ Y X "ТГ ' Ро \Ф J Вероятность отказа Руст 1 f ху f х\г\ —г - — X г1 \nJ \Ф/ Хро Средняя длина очереди Ц 1 fXy / к \ —г - — X г1 Vfi/ \Ф/ Х.Л ^ '\-^ X 1 — • Ро \ Ф/ OS о 1 ■» ^ и £ 3 П. П. 0) О со. г\ X В полученных соотношениях главную роль играют параметры i/ц, г, ц. Как и следовало ожидать, рост К/ц при r=const, т]—const отрицательно сказывается на работе системы (возрастает ру^^, уменьшается 9у„ и т. д.). Компенсировать этот нежелательный эффект можно за счет увеличения числа каналов г, однако такой подход не всегда допустим с практической точки зрения (по существу требуется перестройка СМО, связанная обычно со значительными затратами средств). Определенную помощь оказывает и увеличение ц, позволяющее приблизиться к приемлемым установившимся режимам обслуживания. Чтобы исследовать поведение системы в этом случае, достаточно перейти 201
к пределу г]^-оо в рассматриваемых формулах. Очевидно, Г\ \Ц J ГЦ\ ГЦ J J (для 1/(ф)<:1); lim/?o=0 (для1/(ф)^1), следовательно, име- Т1->-оо ет смысл проводить анализ работы СМО только при 1/(ф)<;1 (аналогичная ситуация встречалась в § 7.3). Если l/(/-fi)<;l, то в системе возникает устойчивый (предельный) режим функционирования, характеризуемый условиями lim Pr+,i = 0; lim Руст = 0; lim ^уст=1; Т1-> со Т1-> со Т1-> X lim 11 =—( — )( — )( 1 ) lim ро; lim 7о„ =-т-Jim ti . Выводы, которые можно здесь сделать, совпадают в принципе с выводами § 7.4. Формально_разница заключается лишь в том, что роль к/ц выполняет ^/(гц), однако это расхождение говорит о возможности иметь в многоканальной СМО каналы сравнительной малой «индивидуальной» производительности (l/fi>l) при общем требовании 1/(/-|и)<;1. В заключение полезно заметить, что все обсуждавшиеся результаты были связаны с предположением о стационарности и ординарности потока заявок, а также отсутствии в нем последействия (простейший поток). Важную роль играл и показательный закон распределения времени обслуживания. На практикеэти условия часто нарушаются, вследствие чего существенно усложняются аналитические зависимости [см. (7.1) — (7.3)], характеризующие поведение той или иной СМО. Приходится обращаться к таким методам исследования, как статистическое и имитационное моделирование, расчет приближенных средних оценок и т. п. С этой точки зрения представляет интерес идея поиска таких показателей эффективности СМО, которые обладают малой чувствительностью к вариациям параметров потока заявок и освобождают исследователя от необходимости иметь слишком подробную информацию о реальных процессах, происходящих в обслуживающей системе.
§ 7.6. Формула Литтла Пусть дана система массового обслуживания, подвергающаяся воздействию произвольного потока заявок (требований). Она характеризуется случайным временем «обработки» каждой заявки, распределенным по тому или иному закону, свойства которого заранее не оговариваются. Общая картина изменений, происходящих в системе, достаточно проста: с течением времени возрастает и число поступивших требрваний, и число проведенных обслуживании, причем ч Число поступивших заябок Рис. 7.7 это происходит скачкообразно в моменты прихода очередной заявки и завершения очередного обслуживания (рис. 7.7). Очевидно, выбор начала отсчета времени (^=0) не имеет здесь значения, и для любого f^Q количество обслуживаемых (занимающих систему) заявок определяется разностью ординат точек Л и Б. Предположим, что изучаемый процесс является стационарным на интервале Т, и в качестве его характеристик удобно принять общее число заявок Hj-, пришедших за время Т, среднюю интенсивность их поступления 1г. суммарное время занятости системы обслуживания Sax в период наблюдения Т, среднюю продолжительность обслуживания одной заявки Tj-. Эти параметры связаны соотношениями Лг=Нг/Т', Тг=1^7-/Нг, откуда следует 'к^-'^х—^тП' или Vr = lr%> (7-4) где Vx—SutIT — среднее число заявок, находившихся на обслуживании в период Т. 203
Таким образом, при весьма общих условиях (произвольно взятая СМО, произвольный поток заявок, любое распределение продолжительности обслуживания и т. д.) среднее число заявок, находящихся в системе, равно произведению интенсивности потока на среднее время обслуживания. Формула (7.4), выражающая это правило, называется формулой Литтла. Она допускает обобщение на случай Т-^оо в предположении стационарности режима работы СМО, поэтому индексы «Т» в (7.4) можно опустить и использовать равенство v=Xt без ссылок на ограниченность Т. Проведенные рассуждения основывались на анализе объективных изменений, происходящих в любой QVIO, что и было отражено на рис. 7.7. Главное внимание было сосредоточено на поступлении все новых и новых заявок (требований) в случайные моменты времени и накоплении результатов работы системы в виде завершенных обслуживании. Отсутствие каких-либо других, более подробных характеристик деятельности СМО и привело к общему соотношению (7.4), которое можно отнести не только к обслуживающим системам, но и к объектам, допускающим аналогичные оценки своих состояний. Здесь прежде всего следует назвать очереди заявок, образующиеся перед той или иной СМО и исследуемые с целью лучшей организации ее работы. Так, рассматривая некоторую очередь как своеобразную систему, в которую поступают (включаются) заявки и из которой они уходят со временем, нетрудно провести аналогию с тем, что показано на рис. 7.7, и получить формулу Vo,=Xto4, связывающую среднее число заявок в очереди Vq, со средним временем Точ пребывания в ней каждой заявки при данной интенсивности потока и установившемся процессе «движения» очереди. Полезно заметить, что то же самое соотношение встречается в табл. 7.3, 7.4, относящихся к частным моделям массового обслуживания. Неопределенность, обусловленная случайными факторами, возникает в практике автоматизированного управления постоянно и обладает рядом важных свойств, облегчающих количественное обоснование принимаемых решений. Вместе с тем многие практические ситуации характеризуются неопределенностью иного рода, вызванной столкновением интересов сторон, взаимодействующих друг с другом тем или иным способом. В подобных случаях речь идет о неопределенности, создаваемой специально с целью получить какое- то преимущество, и приходится исследовать новые классы моделей, называемых игровыми, в которых идея случайности теряет свое значение.
Раздел четвертый ИГРОВЫЕ МОДЕЛИ ОПЕРАЦИЙ. РАЦИОНАЛЬНОЕ ПОВЕДЕНИЕ В КОНФЛИКТНЫХ СИТУАЦИЯХ Главаг 8. ВЫБОР СТРАТЕГИЙ В АНТАГОНИСТИЧЕСКИХ ИГРАХ В различных сферах целенаправленной деятельности, в частности в практике разработок и эксплуатации АСУ, часто возникают так называемые конфликтные ситуации (от латинского conflictus — столкновение), характеризуемые наличием противоположных интересов и устремлений отдельных индивидуумов или коллективов, которые пытаются достичь своих целей часто в ущерб друг другу. Размеры ущерба и его конкретное выражение могут быть самыми раз-, ными. В повседневной жизни приходится быть свидетелем военного, экономического, морального ущерба, и в этом разнообразии отражена сложность конфликта как общественного явления. Особое место в изучении проблем конфликта занимает выбор и сравнительный анализ возможных (допустимых) способов поведения противоборствующих сторон, что дает основу для принятия каждой стороной разумных решений относительно своих действий. Следует подчеркнуть, что ответственные представители сторон, принимающие решения в рассматриваемых условиях, должны учитывать не только поставленные перед собой цели, но и цели, преследуемые другими участниками конфликта. Соответствующую информацию удается получить далеко не всегда, и это создает дополнительные трудности как для исследователей, под- готавливаюш,их варианты возможных решений, так и для лиц, принимающих окончательные решения. Очевидно, каждая сторона, участвующая в конфликте, является оперирующей стороной (см. гл. 1). Она формулирует свои цели, имеет активные средства для их достижения, разрабатывает и оценивает по принятым критериям стратегии, осуществляет рациональный (оптимальный) выбор поведения применительно к складывающейся обстановке, т. е. ведет своеобразную игру с разумными противниками. Раздел исследования операций, связанный с математическим моделированием условий конфликта и поиском на этой основе оптимальных решений, называют теорией игр. В дальнейшем термин «игра» будет употребляться только в значении «математическая модель конфликта», а противо- 205
борствующие стороны будут обозначаться символами А, В, ..., лишенными каких-либо содержательных признаков (исключение составят модели, относящиеся к реальным явлениям). §8.1. Определение игры. Разновидности игровых моделей Чтобы раскрьггь содержание того или иного конфликта, достаточно получить ответы на следующие вопросы: «какие стороны участвуют в рассматриваемом конфликте?», «какие стратегии может применять каждая сторона?», «каковы ожидаемые результаты применения сторонами своих стратегий?», «кто заинтересован в указанных результатах?», «в чем выражается эта заинтересованность?». Математическая интерпретация поставленных вопросов и возможных ответов на них позволяет строить и исследовать игровые модели операций в широком диапазоне исходных условий. Пусть оперирующие стороны — участники конфликта — известны и образуют множество 41. Произвольно взятая сторона С^'U располагает некоторым набором (множеством) 5с допустимых стратегий «ю, s^c, ■■■, т. е. 5^ = {sic, s^a, •■■)■ Использование каждой стороной какой-либо из своих стратегий определяет один из возможных исходов конфликта, принадлежащий множеству J всех возможных исходов. Полезно заметить, что в общем случае какие-то комбинации применяемых стратегий могут оказаться недопустимыми, поэтому число элементов J предсказать заранее нельзя, оно выявляется лишь в конкретных моделях. Очевидно, интерес к различным исходам конфликта должен возникать прежде всего у его участников, однако было бы неверно полностью отождествлять оперирующие, т. е. активно действующие, и вообще заинтересованные стороны. Наглядным примером могут служить спортивные соревнования, результаты которых вызывают различные реакции групп болельщиков, преданных своим командам. Следовательно, наряду с множеством % необходимо рассматривать и множество %, образуемое теми лицами и коллективами, которые проявляют определенное отношение к возможным исходам данного конфликта, участвуя или не участвуя в нем непосредственно. В простейших моделях можно полагать Ч1~Ш, в более сложных моделях приходится устанавливать другие отношения между % и 41 (например, Ч1сЧ1 или даже 206
Формы выражения заинтересованности в исходах того или иного конфликта, как показывает практика, тоже довольно разнообразны. Рассуждая отвлеченно, можно утверждать, что каждая заинтересованная сторона С ^11 предпочитает одни исходы другим, т. е. устанавливает отношения предпочтения на множестве J. В формальной записи это выглядит как UiflCui, где ПС — названное отношение, установливаемое стороной С между исходами Ui, u^^J. Обычно ПС предполагается бинарным, т. е. связывающим попарно элементы множества J, поэтому можно говорить о позиции стороны С в конфликте как о совокупности всех ПС. Для количественных оценок требуется задавать на множестве J числовую функцию выигрыша ЯС (м), называемую еще платежной функцией. Она определяет размеры выигрыша (положительного или отрицательного), получаемого стороной С^41 от исхода м^У. В этом случае отношение UiHCUi можно выразить неравенством ПС{ui)>nc(и^). Таким образом, общее формальное описание конфликтной ситуации состоит в том, что определяется система <^, объединяющая перечисленные выше взаимосвязанные компоненты 41, Sc, J, ..., т.е. S'=<%, {S^)ciu\ J; Щ {ЯС}-^^>, и называемая игрой. Чтобы лучше представить себе структуру игр, обратимся к простому примеру. Предприятия А и В могут выпускать одинаковую продукцию нескольких видов и должны разработать свои производственные планы с учетом имеющегося спроса на нее. Существует опасность того, что стремление каждого предприятия самостоятельно обеспечить выпуск либо всех, либо произвольно взятых видов продукции приведет к нежелательным последствиям — перепроизводству одних и нехватке других изделий. Сбалансировать эту ситуацию помогает игровая модель, в которой множество действующих (конкурирующих) сторон ограничивается указанными А н В, т. е. Ш = {А, В). Их стратегии Si^, Ss^, ••• и Sij,, S26, ... соответственно заключаются в выборе различных вариантов производственного плана, а возможные результаты действий (исходы) определяются содержанием принятых планов. Так, если сторона Л реализует стратегию (план) s,„, а сторона В — стратегию (план) Syj,, то в итоге потребители получат только ту продукцию, которая предусмотрена этими планами (исход Ujj). Выигрыш (прибыль) Л 207
при этом составит ПА (и^) единиц, выигрыш В — ПВ%ии) единиц. Следовательно, можно говорить о заинтересованности Л и В в тех или иных исходах, т. е. о принадлежности Л и В множеству Ш. Здесь 41=41. Таблица 8.1 \. в А N,^^ Si а Saa • ^ia • ЧЬ ПА (ип) ПВ (un) "21 ПА («2i) ПВ («21) ; "26 «12 ПА («12) ПВ («12) "22 ПА («22) ПВ («2-2) 1 ... ... ... ... Чь "1/ ПА (иу) ПВ (u^j) ПА («2/) ПВ (u^j) '• ПА {uij) ПВ (Uif) '• ... ... ... В табл. 8.1, которую тоже можно назвать игрой, присутствуют все элементы системы jr. Обычно исследователи оперируют лишь частью из них. Так, в количественных оценках фигурируют прежде всего величины nA(Uij), ПВ{иц), а сами Uij могут даже не упоминаться. Часто между ПА(ии) и nB(Uij) устанавливается какое-либо отношение, например, nB(Uij)=^ ПА (uij) или с их помощью вычисляется новый показатель и т. д. В результате табл. 8.1 упрощается и принимает вид табл. 8.2, где символы а,/ (' = 1, 2, ...; /=1, 2, ...)обозначают размеры выигрышей, непосредственно используемые в расчетах и отражающие характер исследуемого конфликта. Если принято ЯВ(м;у)=—ЯЛ(м,у) = то возникает бескомпромиссная ситуация (все, что выигрывает Л, проигрывает В и наоборот). Если же в качестве а^ рассматри- 208
Т a^ л и ц a 8.2 \^ в А ^\^ Sia '■ ^ia hb On ; an ... ... V6 «1/ '• «/■/• • ... ... ... вается какая-то комбинация величин nA(ui}), ПВ(иц) — сумма, среднее арифметическое и т. д., то тем самым утверждается возможность объединения усилий сторон, ведения переговоров между ними, заключения соглашений в интересах достижения и личных, и общих целей. Таким образом, главным в теории игр является принцип рационального (от латинского rationalis — разумный) выбора оперирующими сторонами своих действий. Решающая роль здесь принадлежит информации, которой располагают стороны. Основные вопросы, определяющие содержание исследований игровых моделей, состоят в следующем: «что считается рациональным (оптимальным) решением той или иной игры?», «существуют ли в данной игре решения, которые могут быть названы оптимальными?», «как найти оптимальные (или близкие к ним) решения исследуемой игры?». Ответ на первый из поставленных вопросов должен отражать то понимание оптимального выбора и те взгляды на возможные критерии оптимальности, которыми руководствуются оперирующие стороны. Как было отмечено в гл. 1, отбор критериев обычно выходит за рамки собственно математической модели, хотя и оказывает определяющее влияние на характер получаемых решений. В теории игр это замечание относится в первую очередь к выбору системы платежных функций, знание которых еще не исчерпывает проблемы оптимизации стратегий. В дальнейшем для простоты будем считать, что известны значения функций выигрыша конфликтующих сторон. Это позволит со- 209
средоточить усилия на изучении специфики сформулированных выше вопросов. Игры, как и любые другие математические модели, можно классифицировать по разным признакам, и наиболее распространенные из них приведены ниже. В качестве основного рассматривается случай, когда множество 41 содержит более одной заинтересованной стороны (иначе конфликта как такового не будет). Если в игре участвуют две (и более) активно действующие стороны, то такая игра называется стратегической. Ей противопоставляется нестратегическая игра с одной действующей, но несколькими заинтересованными сторонами. Если у каждого участника игры имеется только конечное число стратегий, то игра называется конечной. Если хотя бы один участник имеет в своем распоряжении бесконечно много стратегий, то игра называется бесконечной. Конечные игры удобно представлять в табличной (матричной) форме (см. табл. 8.2), и их часто называют матричными играми. __ Во многих стратегических играх предполагается %=% (каждая оперирующая сторона является одновременно и заинтересованной стороной), и тогда они называются бескоалиционными играми. Здесь исключено возникновение коалиций участников игры на основе совпадения их целей и интересов. Бескоалиционная игра, в которой противодействуют две стороны Л, В и выполнено условие nA(Uij) = =—ПВ{ац)—ац, называется антагонистической (или игрой двух лиц с нулевой суммой, поскольку ПА («;j)+ +ПВ(ии)=0). По аналогии можно говорить о бескоалиционных играх N лиц, понимая под словом «лицо» соответствующую оперирующую сторону. Конечно, любой из названных признаков игр может быть заменен другим (по крайней мере теоретически), и тогда возникнут новые понятия, связанные с играми. Например, отказ от условия ПА{иц)-{-ПВ{иц)=0 приведет к понятию игры двух лиц о произвольной суммой, предположение о возможности образования коалиций в игре с N участниками позволит говорить о кооперативных играх и т. д. Несмотря на такое разнообразие признаков и условий, многие основополагающие идеи поиска решений развиты в теории антагонистических игр, изучение которой представляет первоочередной интерес.
§ 8.2. Антагонистическая игра в нормальной форме. Принцип гарантированного результата Как уже отмечалось, конечные антагонистические игры обладают тем свойством, что выигрыш одного участника (А) полностью определяется проигрышем другого (В), поэтому все необходимые данные содержатся в табл. (матрице) 8.3, элементами которой являются веш,ественные Таблица 8.3 \^ в А ^^. Sia Saa • ^та hb «и «21 ; "ml ^2b «12 «22 ; «/Я2 ... ... ... ... ^nb «in «2n : ^mn числа Uij (г = ], 2, ...; /=1, 2, ...). Такая матрица представляет собой нормальную форму игр рассматриваемого класса и называется платежной (игровой) матрицей, указываюш,ей платежи ац (выигрыши — проигрыши) участников. Следует заметить, что вопросы построения платежных матриц требуют специальных исследований и выходят, вообш,е говоря, за рамки собственно теории игр, предполагаюш,ей условия той или иной игры известными заранее. Игру, представленную матрицей 8.3, называют игрой тХп. Пусть задана некоторая конечная антагонистическая игра в нормальной форме. Нужно наметить пути ее решения, состоящего в выборе сторонами А и В рациональных (оптимальных) стратегий из имеющихся Sj^, ..., s^^, Sjf,, ..., s„j,. Предположим, что сторона А пытается найти наилучшую из своих стратегий, оценивая выигрыши aij поочередно для 8,ц, Sja. ..., s^g. Очевидно, при использовании стратегии Sja безусловно достижимым (гарантированным) будет наименьшее из значений ац, aia, ..., ai„. Лучшего ре- 211
зультата ожидать не приходится из-за активных действий противника, который стремится минимизировать выигры' ши А за счет надлежащего выбора своих Sj;, s„j. Точно так же при использовании Sao сторона Л может рассчитывать на выигрыш, равный min {a,i, Ягг, ..., а2„} и т. д. Следовательно, произвольно взятая стратегия s,„ (1^/^ш) характеризуется показателем а, = min {a^i, ..., ai„} = 'inin ац и наилучшей с точки зрения А оказывается та стратегия, для которой величина а,- максимальна и равна а. Она называется максиминной стратегией, обеспечиваюш,ей выигрыш: а= max a,- = maxmina;y. 1 < i < m I / Предложенный подход к выбору способа действий стороной А отражает идею получения гарантированного результата а. Здесь отсутствует какой бы то ни было риск или расчет на возможные ошибки стороны В. Если А будет придерживаться максиминной стратегии, то выиграет не меньше а при любом поведении В и тем самым оградит себя от неожиданностей. В силу этого величина а называется нижней ценой игры или максиминным выигрышем. Предположим теперь, что аналогичные рассуждения проводит сторона В, причем речь идет о проигрышах стороны Л, поскольку в антагонистической игре nB{Uij) = =—nA(Uij)——Uij. Следовательно, произвольно взятая стратегия s,^ (1<./^п) должна характеризоваться показателем Ру = max {fljy, a^j, ..., а^у} = max а^, опреде- ляюш,им наибольший из ожидаемых проигрышей. В этих условиях наилучшей для В становится стратегия, даюш,ая минимум Pj, равный р. Она называется минимаксной стратегией, так как Р= min Py = minmaxa/y. Величина Р 1 < / < л / с называется верхней ценой игры или минимаксным проигрышем. Как и в предыдуш,ем случае, здесь прослеживается стремление получить гарантированный результат р, не за- висяш,ий от поведения стороны Л. Нетрудно заметить, что в проведенном анализе каждая из сторон была ориентирована на худшую с ее точки зрения ситуацию — минимальный выигрыш или максимальный проигрыш при любой фиксированной стратегии. Обе стороны должны были улучшить, насколько возможно, свое положение, выбирая максиминную и минимаксную стратегии с целью ослабить (и даже исключить) зависи- 212
мость получаемых результатов от действий противника. В этом находит свое выражение принцип гарантированного результата, предполагающий, как было замечено, отсутствие риска и связанных с ним нежелательных последствий. Таким образом, рассматриваемая модель обладает симметрией в том смысле, чт<©оба участника игры основывают свои действия на одинаковых принципах, и сами понятия мак- симинной и минимаксной стратегии оказываются взаимозаменяемыми. Действительно, если называть величину atj проигрышем, то для А рекомендуемая стратегия будет минимаксной, а для В — максиминной. В формальных исследованиях для краткости часто употребляется только один термин «минимаксная стратегия», относящийся и к Л, и к S. Сделанные замечания дают ответ на важный вопрос о возможных подходах к пониманию оптимального выбора стратегий в играх двух лиц с нулевой суммой. Оперирующие стороны могут использовать принцип гарантированного результата, называемый еще принципом минимакса, в качестве основы принятия решений и добиваться за счет этого вполне определенных, заранее предсказанных значений выигрыша. Рассмотрим теперь ситуации, которые могут возникнуть в результате применения сторонами А и В своих минимаксных стратегий. Есть основания предполагать, что разнообразие указанных ситуаций будет определяться разнообразием свойств платежных матриц, уровнем информированности сторон о действиях друг друга и, наконец, возможностью многократно выбирать и применять те или иные стратегии из числа допустимых (т. е. производить «ходы» в игре). Эти три момента следует всегда иметь в виду, поскольку от них зависит успех исследования игровых моделей. § 8.3. Проблема равновесия в игре. Чистые и смешанные стратегии Простейшим, но редко встречающимся на практике является случай а=Р (нижняя цена игры совпадает с верхней). Равенство а=р означает, что в платежной матрице присутствует элемент ар^, который одновременно оказывается минимальным в р-й строке и максимальным в ^-м столбце (l^p^m, l^^n, а^^^=а=Р). Примером может служить матрица 213
16 II 6 2 —22 10 —9 6 —7 8 6 —5 14 15 13 —3 —8 21 — 13 4 где в роли Орд выступает а2з=о. Очевидно, рассматриваемый элемент Ор представляет собой седловую точку, соединяющую в себе и свойства точки минимума (по одной группе переменных), и свойства точки максимума (по другой группе переменных) (см. гл. 3). Эта особенность отражена в названии «игра с сед- ловой точкой». В любой игре с седловой точкой стороны Л и 5, решившие придерживаться минимаксных стратегий, попадают в ситуацию, характеризуемую тем, что и для Л, и для В выгодно сохранять неизменными эти стратегии. Действительно, если Орд — седловая точка, то Sp^, Sgi, — минимаксные стратегии. До тех пор, пока сторона А применяет Sp^, а сторона В — соответственно s^, значение Прд остается постоянным. Если в какой-то момент один из участников попытается изменить свою стратегию, то выгоду из этого извлечет другой участник, так как всякий переход к новой стратегии означает отказ от принципа минимакса и ведет к проигрышу. Положение, при котором ни одна из сторон не имеет никаких разумных оснований для изменения своей стратегии, называется ситуацией равновесия. В играх с седловой точкой такая ситуация возникает и сохраняется сколь угодно долго, если стороны Л, В используют Sp^, s^f,, называемые в этом случае чистыми стратегиями. Величина a^,^, совпадаюш,ая с а и р, называется чистой ценой игры. Очевидно, стратегии Sp^, s^f, могут рассматриваться здесь как огупимальные, образуюш,ие решение игры. Применять чистые стратегии имеет смысл тогда, когда А и В располагают сведениями о действиях друг друга и достигнутых результатах. Если допустить, что хотя бы одна сторона ничего не знает о поведении противника, то идея равновесия нарушается, и игра ведется бессистемно, вслепую. Выигрыш либо становится делом случая, либо целиком принадлежит тому, кто хорошо информирован о ходе операции. Следовательно, необходимо различать игры с полной информацией, в которых каждый участник в любой 214
1 p г 1 q O-pq O-rq t Opt a. . ' момент времейи знает всю пре- Таблица 8.4 дысторию данной игры, т. е. все, что было сделано и достигнуто ранее всеми оперирующими сторонами, и игры с неполной информацией, в которых знание предыстории так или иначе ограничено (например, возможностью скрыть от противника сделанный ход). В дальнейшем речь будет идти прежде всего об играх с полной информацией как наиболее изученных объектах. Могут встретиться случаи, когда платежная матрица имеет несколько седловых точек, однако это не изменит характера рекомендуемых решений. Для простоты рассмотрим сначала матрицу (табл. 8.4), имеющую две седловые точки йрд, a,t (1<р, г^т; 1<^, t^n). По определению, и йр^, и a^t есть минимальный элемент своей строки и максимальный элемент своего столбца, следовательно, a^gS^ ^^pq^^pt' Opt^o.rt^^rq- Очевидно, ЭТИ нерзвенствз выполнимы лишь при ap^=a^f, поэтому в матрице с двумя сед- ловыми точками значения йр^ и а^< обязательно будут одинаковыми. Аналогичный вывод можно получить и для матриц с произвольным числом седловых точек путем попарных сравнений неравенств, которым эти точки удовлетворяют. Таким образом, в рассматриваемых играх существует несколько ситуаций равновесия, причем все они эквивалентны, поскольку связанные с ними платежи Up^, a^f, ... равны между собой. Эта особенность позволяет рекомендовать чистые стратегии Sp^, s^^; s^^, s^^; ... в качестве оптималь- ныу (см. § 8.2). ^На практике наиболее распространенным является случай, когда платежная матрица вообще не имеет седловой точки и а=7^Р^;Анализ ситуаций, которые могут при этом возникнуть, удобно провести на числовом примере. Пусть платежная матрица некоторой игры имеет вид. табл. 8.5, причем а=тах {—5, —15,-9, —7}=—5 и p=min{l7, 14, 10, 8, 12}=8. Очевидно, минимаксной стратегией для А оказывается стратегия Sia, а для В — стратегия зц,. Если стороны независимо выбирают и реализуют свои стратегии'только один раз (игра допускает один «ход»), то 215
Таблица X На На На ^4 а ^16 6 17 —9 —1 8.5 ■•^26 И —2 14 —7 hb —5 1 3 10 ■^46 2 0 8 4 ^^ь 8 —15 5 12 лучшим будет решение sja-, Sjj,- ;Еслл же ходы производятся многократно, и имеется полная информация о прошлом, то возникают условия, в которых каждая сторона может добиться временного преимущества за счет изменения своей стратегии. Действительно, сохраняя Sia, сторона Л вместо ожидаемого выигрыша ац^2 может на очередном шаге получить а,з^—5 (проигрыш в 5 единиц из-за непредвиденного перехода противника 0TS4(,KS3b). Во избежание этого сторона А должна будет применить S4a в качестве меры против 5зй, однако сторона В, в свою очередь, постарается сде^лать стратегию Sia неэффективной, выбрав «2й, и т. д. В, результате каждый ход станет проблематичным и потребует разработки специальных правил. Таким образом, решения в чистых стратегиях оказываются здесь неустойчивыми, и это связано, в частности, с хорошей информированностью сторон о действиях друг друга. В рассматриваемой ситуации каждой стороне необходимо как-то скрыть свое поведение от противника, чтобы ослабить влияние информационного фактора и получить желаемое преимущество. Это трудно осуществить, ориентируясь только на разумный выбор конкретных стратегий, так как любые рассуждения могут быть воспроизведены противником. В то же время полный отказ от рационального начала и переход, например, к бессистемному поиску вариантов решений означал бы прекращение игры как танковой и замену ее неуправляемым случайным процессом. Приемлемый компромисс достигается здесь путем обоснованного, разумного введения элемента случайности в действия сторон, так что каждый отдельный ход остается непредсказуемым, но вся совокупность ходов обладает вполне определенными, заранее заданными свойствами. Другими словами, участники конфликта чередуют (смешивакя) в случайном порядке свои стратегии в соответствии со специально разработанной схемой, обеспечивающей нужную частоту (вероятность) реализации каждой из Sj^, ..., s^^, Если pi^—вероятность появления s^^ (/=1, 2, ...), то можно говорить о распределении вероятностей на множестве т стратегий стороны А, причем всегда Sp/a=l (событие, i = 1 состоящее в реализации некоторой допустимой стратегии на очередном ходе, является достоверным). Произвольно 216
рзятгч^ рэсгфсделенке (р,^, ..., р„а}=5^ называется смешанной стратегией, которой располагает сторона А в данной игре.~j По аналогии, некоторое распределение^ {/?,;,, ..., Рпь)^^в бсть смешанная стратегия стороны В. Возможность широкого выбора смешанных стратегий S^, 5д делает содержательным исследование игр в случае а=й=Р. Более того, введенные понятия сохраняют смысл и при а=Р, поскольку любые чистые стратегии (в частности, упоминавшиеся выше s^,д и s^^) представимы в виде {О, ..., О, 1, О, ..., 0}, где 1 занимает соответствуюш,ую позицию (применительно к s^,д — позицию р, применительно к Sj^—позицию q, l^ps^m, Is^q^n). Естественно возникает вопрос: какими соображениями можно (или нужно) руководствоваться при выборе смешанных стратегий? Оказывается, принцип минимакса сохраняет свое значение и в этом случае. Пусть {5^} — множество всех смешанных стратегий стороны А в некоторой матричной игре, а {Sg} — множество смешанных стратегий стороны В. Если А выбирает стратегию 5^6{S^}, а В — стратегию Sg^{Sg}, то средняя величина (математическое ожидание) платежа определится т п суммой 2 !S ^ijPiaP/b' которая может рассматриваться в «■=1 ;=1 качестве характеристики выбранных S^, Sg lee удобно обозначить через a(Sji, Sg)]. Для определенности будем считать a(Sji, Sg) выигрышем стороны А и соответственно проигрышем стороны В. Формируя свою стратегию S^ в антагонистической игре с полной информацией, сторона А должна ориентироваться на худшее, т. е. оценивать ожидаемый выигрыш как min а (S^, 5д). Тогда лучшей (оптимальной) оказывается стратегия S^, позволяющая достичь max min а (5^, ^AH^A}SB4Sg} Sg) = aji. Аналогичные рассуждения, связанные с поиском наилучшего способа действий стороны В, приводят к рекомендации применять стратегию Sg, дающую min max а(5,, S„) = a„. Таким образом, Sj можно назвать максиминной, а Sg — минимаксной стратегиями. Проведенный анализ общих условий ведения антагонистических игр позволил сформулировать универсальный принцип действий сторон А и В, основанный на идее гарантированного результата. Конкретные решения, вытекающие из этого принципа, легко отыскиваются лишь в простей- 217
шем случае а=р (чистые стратегии s^,з, s^j,). В более сложных ситуациях приходится вводить вместо a,, новые критерии оценки исходов игры, в частности, средний ожидаемый выигрыш a{Sji, 5д). Таблиц а 8.6 § 8.4. Теорема о минимаксе. Устойчивость получаемых решений Пусть дана игровая матрица ||аг;|| (см. табл. 8.3), и для нее вычислены значения а, Р, совпадающие (по определению) с а^;= max minOf^- и agf^ = mmmaxa;j {l^k, g^m; i i II 1^/, h^n). Очевидно, а^ь являясь минимальным элементом k-й строки, удовлетворяет неравенству а^1^а^,г (табл. 8.6). Точно так же для Qgfi, являющегося максимальным элементом /i-ro столбца, выполнено agf^'^a,;/^. Отсюда следует aj^i^ag/^ или а^р. Таким образом, нижняя цена игры никогда не превышает верхнюю цену, и условие (х=7^Р, обсуждавшееся в § 8.3, нужно понимать как а<р. Заметим, что в случае а<СР применение смешанных стратегий S^, Sfl должно привести к улучшению (в среднем) положения участников игры. Это следует, во-первых, из самой идеи случайного чередования S-, X I k !У т 1... h 4h • ^gh I аы ... n "fb ('=1, m; /=1, n) с целью получения преимуществ и, во-вторых, из факта принадлежности любых чистых стратегий множеству {5^,} или {5д} (чистая стратегия представляет собой частный вариант смешанной). Каждая из сторон Л, S не ухудшает своих возможностей, допуская применение S^, S'b вместо однообразных s,,^, s^,j„ поэтому а^^а, Сд^р. Весьма важным для теории и практики является вопрос о том, связаны ли между собой величины Од и Од. Ответ на него дает теорема о минимаксе, играющая большую роль в понимании особенностей антагонистиче- 218
ских игр и утверждающая, что в конечной игре двух лиц с нулевой суммой и полной информацией имеет место равенство а^=ад при аф^. Доказать эту теорему можно разными способами, например, путем анализа эквивалентных задач линейного программирования (см. § 8.7, 8.8). Теорема о минимаксе указывает на существование ситуаций равновесия для случая аФ^ и, следовательно, оптимальных стратегий S^, S'b, т. е. решений игры, позволяющих добиваться среднеожидаемого выигрыша y=aj^=ag. Величина у называется ценой игры. Из приведенных выше оценок следует а^^^Р- Ни одна стратегия S_4, применяемая против любой стратегии Sg, не приведет к результату лучшему, чем у, и, наоборот, ни одна Sg, действующая против S^, не улучшит указанного результата. Чтобы конкретизировать это утверждение, предположим, что для игры тХп найдено решение S^"={pta, •••, Рта}, 5'в = {р1ь, .... Рпь}- Вообще ГО- воря, некоторые из р1а, р]ъ (' = 1, tn; 1 = 1, п) могут оказаться равными нулю, так как нет никаких оснований заранее требовать безусловного включения всех s^^ и Sj^ (/= =1, т; / = 1, п)в рассматриваемые S^ и 8%. Те из s^^, s^j,, которые входят соответственно в 5^, 8%, можно назвать активными стратегиями в составе 5^, 8%- Существует теорема об активных стратегиях: если один из участников игры придерживается своей оптимальной смешанной стратегии, то ожидаемый выигрыш останется неизменным и равным у независимо от характера действий другого участника в пределах его активных стратегий. Доказательство. Пусть Уд, Уд — множества таких номеров (, /, что р^>0 для i^Jj^ и р}г.>0 для /g Jд (другими словами, s,-^, Sj^ есть активные стратегии при i'^JА, i^Jв)- Пусть далее у — цена игры, достижение которой обеспечивается оптимальными 8\, 8%, а v^ — средний выигрыш стороны А, получаемый при использовании 8\ против Sj^ а ^Jв)- Очевидно, у, как и всякое математическое ожидание, удовлетворяет равенству Y = 2 Y/P/fe. причем 2 Р/г>= 1 (см. гл. 6). В то же время для любого У g Jд ДОЛЖНО выполняться Vy^V (переход от оптимальной стратегии 8в к неоптимальной Sy^ может только увеличить проигрыш стороны В). Сохранить в этих условиях предыдущее равенство удается, лишь положив все 7^ равными у, 219
что и доказывает утверждение теоремы в случае, когда стратегия S*^ противопоставляется отдельно взятым Sy^. Аналогичные выводы нетрудно получить и при сравненик S\ с произвольной смешанной стратегией Sg, определяемой вероятностями jt>/[,T^jt>/{, (/€^в)- Здесь ожидаемый выигрыш А (проигрыш В) составит v = 2 У/Р/ь- О" должен всегда _ /«•'в оцениваться как v^V из-за неоптимальности Sg, однако нельзя ожидать v>V. так как это означало бы неоптимальность 8*л, что противоречит исходным предположениям. Остается, как и ранее, считать v^V- Естественно, все сказанное можно повторить применительно к ситуациям, в которых неизменной сохраняется только стратегия S*g, и завершить тем самым доказательство, р Таким образом, стратегии S^, S'b остаются оптимальными и в случаях, когда они применяются друг против друга, и в случаях, когда они применяются против любых иных стратегий, допустимых по условиям игры. Полезно отметить, что каждая пара оптимальных смешанных стратегий игры с платежной матрицей N«,/11 сохраняет свою оптимальность и в игре с матрицей 11аг/+с'11. где с — произвольная константа. Существует строгое доказательство этого утверждения, однако интуитивно ясно, что одновременное изменение всех а,-у на одну и ту же величину с означает просто изменение начала отсчета размеров выигрыша. В этом смысле, например, игры —1 1 5 —2 0 — 1 0 —3 1 —4 0 2 1 3 7 0 2 1 2 — 1 3 —2 2 4 —2 0 4 —3 —1 —2 — 1 —4 0 —5 — 1 1 равноценны, и нет необходимости обсуждать в каждом конкретном случае заданные значения Oif. Важным результатом проведенного анализа является подтверждение того факта, что каждая конечная (матричная) игра с полной информацией имеет хотя бы одно решение либо в чистых (при а=Р), либо в смешанных стратегиях (при а=7^Р). Иначе говоря, любая такая игра имеет ситуацию 220
равновесия,, которую целесообразно сохранять, выбирая для практического использования соответствующие ей оптимальные стратегии. § 8.5. Способы поиска оптимальных стратегий. Общие подходы Выше отмечалось, что простейшим является случай су- ш,ествования седловой точки игры. Поиск оптимального решения сводится здесь к перебору элементов матрицы Ца^И с целью выявить ард=а=р. Другими словами, исследование свойств игры автоматически приводит к отысканию оптимальных чистых стратегий s^^, s ь, если обнаруживается равенство а=р. Для теории этот случай не представляет большого интереса, хотя он встречается на практике. В дальнейшем имеет смысл уделить основное внимание условию аФ^. Пусть установлено, что некоторая игра mXn не имеет седловой точки и, следовательно, ее решение нужно искать в смешанных стратегиях, анализируя те или иные распределения вероятностей {р^, P^a}=S^, {рц, Р„ь}=5й. Можно ожидать, что процесс отыскания оптимальных 5^, S's окажется довольно трудоемким, особенно при больших тип, поэтому целесообразно для начала рассмотреть вопрос об упрощении (редукции) игр как средстве, с помощью которого убыстряется подготовка решений. Если матрица ||а,у|| обладает свойствами a/^j'^a^j (l-^k, r^m; кфг; / = 1, п) и ahi>a^j хотя бы для одного номера /, то ее k-я строка доминирует г-ю строку. Аналогично, при an^Uif^ (1^/, h^n; 1фк; i=\, т) и aify<iaii хотя бы для одного номера (столбец / доминирует столбец ft. Очевидно, сторона А всегда должна предпочесть стратегию Siia стратегии s^a, а сторона В — стратегию s^, стратегии s^[,. поскольку такое предпочтение улучшает общую ситуацию, в которой находятся А и В (предполагается, что речь идет о выигрышах А и проигрышах В). Следовательно, цена игры должна остаться неизменной при сохранении в матрице ||ог,11 только доминирующих строк и столбцов, что позволяет уменьшить т и п, т. е. упростить исследования. В качестве примера можно привести игру, заданную табл. 8.7. Здесь второй столбец является доминирующим по отношению к четвертому, поэтому допускается переход к новой игре (табл. 8.8). В ней третья строка оказывается доминирующей первую, и возникает еще более простая игра (табл. 8.9), в которой второй столбец доминирует 221
третий. В результате приходим к игре (табл. 8.10), не допускающей дальнейших преобразований и являющейся простейшим аналогам исходной игры (см. табл. 8.7). Редукция игр не представляет особых трудностей, но требует многочисленных (поэлементных) сравнений строк и столбцов матрицы ||а/|| между собой. Она оправдана тогда, когда доминирование существует объективно и его удается выявить. Таблица 8.7 Таблица X Sia Sao S3a .С) со 2 1 4 « 0 2 ' •С) И со 1 5 3 •С) 4 3 2 \ в Ча На 5за ''lb 2 1 4 -'2b 0 2 1 Sb 1 5 3 Таблица 8.9 Таблица 8.10 /5 \ Saa «За hb 1 4 Sb 2 1 hb 5 3 \ в /5 \ 5га S3a -'lb 1 4 ^2Ь 2 1 Другим распространенным способом упрощения игр является искусственная замена исходных чистых стратегий Sja, ..., 5,дд, Sjb, .••, s„j,очевидными смешанными стратегиями с внесением соответствующих корректив в платежную матрицу. Пусть дана игра (табл. 8.11), в которой существуют стратегии, допускающие «смешивание» в равных пропорциях при использовании против любых стратегий противника. Так, в силу одинаковости элементов первых двух столбцов матрицы 8.11 стратегии в^ь, s^b нужно применять с частотой 12 (если исключить нз расс>.ютрения s^b, sjb!- Таким же, свойством обладают 5зй и 5^1, ■ поэтому исходные условия (табл. 8.11) можно заменить новыми условиями (табл. 8.!2) считая, что в распоряжении стороны В нахоятся две смешанные стратегии S^j, 5д.2, полученные соответственно из Sjb, S2b и з^Ь' ^чь< применяемых с вероятностями 0,5. Новые значения платежей вычисляются по формулам а11=(ац-\- 222
Таблица 8.11 Таблица 8,12 Таблица 8.13 Sla На Sua ^ 0 -' 7 £) « 7 0 —7 7 3 — 1 £) 3 7 — 1 X На На «За ^Bi 3,5 —3,5 0 ^В2 5 5 —1 X На На ^В1 Wm 0 ^В2 5 —1 +о,'2)/2, ai2={a,-3+a,-4)/2, i=l,3, где a,-j, о,-2, а/з, а,-4 — элементы i-й строки табл. 8.11. В игре, представленной табл. 8.12, легко обнаруживается доминирование стратегии siq над Sjo, и становится возможным переход к еще более простой игре (табл. 8.13). Здесь элемент ап=3,5 является седло- вой точкой и, следовательно, оптимальным является решение (Sx^, Sjji). Тот факт, что оно получено в условиях, когда сторона В располагает только смешанными стратегиями, не меняет сути дела. Следует лишь помнить о том, что речь идет о среднем выигрыше в результате многократного повторения ходов. Таким образом, приступая к исследованию любой игры тХп, необходимо сначала проверить, имеет ли матрица ||аг;|| седловые точки и связанные с ними решения в чистых стратегиях. Если этого нет, то нужно попытаться выявить доминирующие стратегии (строки и столбцы), а также стратегии, приводящие к одинаковым (дублированным) результатам. Затем следует перейти к формированию (по возможности) очевидных смешанных стратегий, объединяю- щих в себе какие-то из s,a(j=l,m) или 5у;,(/=1,п). В итоге должна быть найдена, вообще говоря, упрощенная игра т'Хп' {2^т'-^т; 2^п'^п) без седловых точек, представляющая собой аналог исходной игры тХп. Если рассматриваемые операции дадут желаемый результат, то упростится поиск оптимальных решений (за счет снижения размерности задачи). В исключительных случаях (см., например, табл. 8.13) могут появиться и сами решения, однако уверенности в таком благоприятном исходе нет. Более того, всегда существует опасность получить отрицательный результат {т'=т, п'=п), убеждающий исследователя в сложности изучаемого объекта и необходимости разработки специальных методов решения игр. Чтобы ближе познакомиться с идеями и содержанием этих методов, обратимся сначала к простейшим играм 2x2. 223
Таблица 8.14 §8.6. Решения игр 2x2, 2Xftj mx2. Графоаналитический метод Предположим, что некоторая игра 2x2 (табл. 8.14) не имеет седловой точки, и требуется найти ее решение 5^= = (Ры, р1а), Sh= (Plb, pS)- Согласно теореме об активных стратегиях (см. § 8.4), сторона А, придерживающаяся своей оптимальной смешанной стратегии S\, обеспечит себе выигрыш у даже тогда, когда сторона В по каким-то причинам откажется от 5Ь и будет применять, например, либо Si^, либо Sib- Допуская теоретически подобные ситуации, можно утверждать следующее: aiipla+anpla=y (5л действует против Sj;,), ai3pla+ +022Рм=Т {Sa действует против з.^ь), причем всегда pL+Pm=1. Аналогично aiiplb+ai2plb=y (Sh против s^), fl2iPi&+fl22P2&=T (Sb против SsJ, pj&+pj&=l. Неизвестными в этих уравнениях являются р1а, р1а, Р\ь< р1ь< вычисляемые по формулам X На Sao hb «u an Чь Oia «22 Pia Y = Огг — Qai «п + ага —«12 — Q22Q11 — ЯцЯп 011 + 022 — 012 -021 ^i*" Ou + a22 —Oi2—021' pla = 1 — Ри; P2*& = 1 —P'lb- (8.1) Таким образом, существует общее решение игр 2x2, в котором все определяется заданными значениями платежей Ог;(г = 1,2; /=1,2). Чтобы соотношения (8.1) имели смысл, необходимо требовать fls2—«21 > 0; Ац—fli2 > 0; ^22—«12 > 0; оц—«21 > 0; а. «21 < о «И—«12< о «22—«12 < о «И—«21 <0 (8.2) и тогда 0<ри<1; 0<р1й<1. Нетрудно заметить, что в этих неравенствах отражено предположение об отсутствии в рассматриваемой игре седловой точки. Действительно, ни один из четырех элементов Оц, Oi2, flai, fl22 не может удовлетворить неравенства (8.2), будучи минимальным в своей строке и максимальным в своем столбце. Обратимся к геометрической интерпретации полученных результатов. Пусть ух — среднеожидаемый выигрыш, полу- 224
чаемый стороной А при использовании ею произвольно взятой смешанной стратегии S^^ipia, Р20) против чистой стратегии з^ь стороны В. Как отмечалось, Ti=o;uPio+ +a2iP2o или 7i= (йц—агОРхо+йз! (всегда Р2о=1—Pia)- Пусть далее 7 а — среднеожидаемый выигрыш стороны Л при использовании SJ против 8^ь> причем 7a=o;]:2Pia+ + а2аР2а= («12—йаг) Рю+^га- В СИЛу ТОГО, ЧТО НИ Sj;,, НИ Sab не ЯВЛЯЮТСЯ, вообще говоря, оптимальными для В и почти наверное не будут применены как чистые стратегии, сторона А должна рассчитывать лишь на выигрыш у= = min(7i, 72)-Если ац, а^, ai^, «за заданы, то^ есть функ- I Рис. 8.1 ция только Рю, и ее значения совпадают либо c^i (при 7i<; <:7а), либо с 7а (при 71^7г)- Следовательно, можно построить график 7=T(Pia)'n с его помош,ью попытаться найти, например, S*j. На рис. 8.1, а даны два варианта этого графика (показан жирной линией), относяш,иеся соответственно к первой и второй системам неравенств (8.2). Естественно, сторону А должно интересовать то значение р^а при котором 7 достигает максимума. Очевидно, оно определяется равенством 7i=T2 (рнс. 8.1) или (а^— —а.п)р1а+о.п^{о-ц—а.^г)р1а+агг, откуда сразу же следует первая формула (8.2), а также утверждение max 7=7- Итак, геометрический способ решения игр 2x2 заключается в построении прямых 7i(Pia)> тЛРхй) по двум точкам (О, aai), (1, ац,) и (О, а^г), (1, «хз) с последуюш,ей оценкой координат р\а> 7 точки пересечения, что позволяет найти и р1а=\—р\а- Величины pjj,, р1ь определяются в прин- 8 Деыярев Ю. И. 225
ципе так же, но в построениях участвуют точки (О, а^), (1, аи) и (О, Огг), (1, «2i) (рис. 8.1, б), а вместо у рассматривается 7=max(7|, 7ii). где 7i=«uPi&+ai2P2b; Tii = =«21^16+022^26 (сторона В стремится минимизировать проигрыш у). Ниже дан пример решения игры 2x2. Пример 8.1. Имеется игра 2 —1 —3 4 матрица которой содержит элементы а^^=2, aj2=—1, flai——3, 022=4. Требуется найти оптимальные стратегии сторон. Решение. Убеждаемся прежде всего в том, что в игровой матрице нет седловых точек. Для этого вычисляем а=тах{—1, —3) = — 1, P=min(2,4)=2 и приходим к выводу а^^р. По точкам (О, —3) н (1,2) строим прямую Yi (Pio), по точкам (0,4) и (1, —1) — прямую V2(pio)> по точкам (О, —1), (1,2) — прямую Vl(Pi6) Рис. 8.2 и по точкам (0,4), (1, —3) —прямую Vijipib) (Рис. 82,а б). Тем самым определяются графики функций Y(pifl) и Y (р1б) (показаны жирными линиями). Максимум у достигается при Pio = 0,7=pja, минимум у — при pi[,=0,5=piu (следовательно, р2а=0,3 и р2б=0,5). Значение у находится с помощью псютроенных графиков (рис. 8.2) и ссютавляет 0,5. Правильность полученного результата можно проверить по формулам (8.1). Таким образом, оптимальными стратегиями сторон являются 5д= {0,7; 0,3}, Sb= {0,5; 0,5} (сторона А должна чаще применять Sia, сторона В — чередовать зц, в s^f, с одинаковой частотой). Цена игры у равна 0,5. Исследование игр 2X2 позволяет разработать простые и наглядные методы поиска решений, а также облегчает изучение более сложных игр, представляющих практический интерес. Речь идет, в частности, об играх, в которых одна из 226
Таблица 8.15 сторон имеет в своем распоряжении только две стратегии, а другая —■ произвольное (конечное) число стратегий {т или «). Пусть дана некоторая игра 2Х/г (табл. 8.15), не имеющая седловых точек, и нужно найти ее решение S'^= {р1а, pQ, 5^== (pib, • ■ ■. Pnb)- Допуская, как и ранее, принципиальную возможность применения S*^ против каждой из Sj^ (/=1, п) в отдельности и имея в виду теорему об активных стратегиях (см. § 8.4), получаем fliiPla + a^ipla = у; CiiiP'ia + а.^^Рт = 7'. • • ■ i аыР\а + а^пР1а = У- Точно так же, aiiPi*6+. . .+fli„p„*6=Y; П a-nplb^. . . +fl2-zPnb=7; S Р/б=1 (стратегия ЗЪ действ;)ет против Sia И 5.,д). Как и следовало ожидать, анализ полученной системы линейных уравнений оказывается более сложным, чем анализ такой же системы в случае п=2. В то же время сохраняет свою наглядность и эффективность геометрический А *1а *га ''lb Оц 02 1 ■^26 «12 022 ^пЪ 0-ln аш споссб поиска решений, суть которого остается прежней и заключается в построениях прямых Vi=(an—rt-2i)P]a~ Ч-о..; ?2-= (cii—fl2-2)P!„-bfl-22; .^.\ у,,---=(а,„~-а,„)р,а^а,,„ определяюишх [-рафик ип/нкцин Y=min(Yi, v.,,. . ., у.,) (показан па piic. 8.3, а жирной линкей). Максимальное у достигается в точке (pj^, у), которую легко найти на рассматриваемом граф!;ке. Очевидно, результат решения пе изменится, если внимание будет сосредо'ючено только на тех прямых yj^ioj;— 8* 22?
Таблица 8.16 "~^2;)Pia + Й2;, которые пересбкаются В точке (pJa, 7) и, следовательно, указывают стратегии Sjb, входящие в 8% с вероятностями руь Ф 0. Остальные чистые стратегии стороны В не представляют интереса как заведомо невыгодные (для них всегда у; >?. и необходимо положить pjb=0), поэтому построенный на рис. 8.3, а график функции у= =у(р1а) определяет вместе с р1а, у всю совокупность активных стратегий В. Зная их количество, можно конкретизировать задачу оценки значений р]ьФ^, и на этой основе выбрать S'b. Предположим, что для исследуемой игры (табл. 8.15) построен график 7"T(Pia) ^ активными стратегиями В оказались з^ь, s^b, в^ъ и s^^ (1^^, г, и, v ^ п; кф г Ф Фифь). Тем самым исходная игра упростилась и приняла вид табл. 8.16, а график у=у{ры) освободился от лишних деталей и стал, например, таким, как показано на рис. 8.3, б. Возникает ситуация, в которой сторона В может по своему усмотрению выбрать две, три, четыре стратегии из перечисленных в табл. 8.16 для включения их ъ8*в. В геометрическом смысле это означает сохранение на рис. 8.3, б двух (или более) прямых, пересекающихся так, что точка {р1а, у) остается точкой экстремума функции у=у {p^a)■ Другими словами, определяются допустимые парные комбинации прямых, оставляемых для дальнейшего исследования. На рис. 8.3, б ими будут у г, Ту или у г, У и, НО НС 7 г. Ук ИЛИ 7и, То (здесь точка пересечения теряет экстремальные свойства). В первом случае коэффициенты наклона прямых имеют разные знаки, во втором — одинаковые. Стедовательно, существуют такие решения игры 2хп, в которых число активных стратегий стороны В равно двум. Иначе говоря, можно свести игру 2хп к игре 2x2 после того, как построена табл. 8.16. Общая схема поиска S\, 8% представляется теперь такой: по данным табл. 8.15 вычерчивается график функции y—y{Pia) и иа нем отыскивается экстремальная точка (Pia, Т); выбираются любые две прямые с противоположным наклоном из пересекающихся в этой точке; 228 X Sio Sia ^kv Oik a^h 'rb 4r Sir 'ab Sfa Огя ^vb Slv O-iv
отвечающие им стратегии sj-],', S/ь' включаются в игру 2X2 против Sia и Sja', полученная игра 2x2 решается либо с помощью формул (8.1), либо графическим способом. Аналогичную последовательность действий можно рекомендовать и для анализа игр тХ2. Единственное отличие будет состоять в том, что придется строить прямые yi= = {йп—aj2)Pib+Ot2. i—\,m и по ним определять у как точную верхнюю границу значений yi (рис. 8.3, в). Минимум у достигается при р1ь=р1ь и точка {р1ь, у) должна использоваться в последующем переходе к игре 2x2. Дополнительные пояснения даны в приведенном ниже примере. пример 8.2. Дана игра 6X2 (табл. 8.17), не имеющая седловых точек. Требуется найти оптимальные стратегии сторон. Решение. В соответствии с общей схемой поиска S^, Sb строим прямые, определяемые уравнениями Y;=(Oii—o.i2)pib~\~o.iiy i^l,6, т. е. Yi=—р1ь; Y2=2pib+1; Y3=—5pib+3; Y4=4pib—4; Тз=8р1Ь—3; y^ =—1,5 р1ь-|-2 (рис. 8.4). Экстремальная точка графика функции у= Г - Рис. 8.4 Таблица X На ^га s.4a ^ia «ба %а 'lb — 1 3 —2 0 5 1/2 8.17 hb 0 1 3 —4 —3 2 =Т(р1ь) (показан жирной линией) имеет координаты р1г,к0,29; уя wl,56, и через нее проходят прямыеуг, Уз> Те- Следовательно, сторона А имеет, вообще говоря, три активные стратегии s^a, На' «ва, из которых можно выбрать две, например, s<i,a,S3a или s^a, s^a- Выбор s-ia,s^a исключен, так как точка (0,29; 1,56) перестает быть экстремальной. Пусть выбираются стратегии SiaiHa- Тогда игра 2X2 приобретает вид табл. 8.18 и для нее по формулам (8.1) вычисляются р1а=^Ъ17, р1а=2/7, pi6=2/7, pjj=5/7, y—11/7. Как и следовало ожидать, три последние оценк_и_совпадают с теми р'хь, pjb, у, которые найдены с помощью графика y(pib)- 22S
другой вариант игры 2X2 получается при использовании стороной А стратегий «га, ssa (табл. 8.19). Здесь формулы (8.1) приводят к результатам pia=3/7; р2а=4/7; pib=2/7; p2i=5/7, Y=ll/7. Таблица 8.18 Таблица 8.19 N fi \ А \ На «За hb 3. —2 ^2Ь 1 3 \в \ А\ «га «6а hb 3 1/2 '2b 1 2 Таким образом, оптимальными стратегиями сторон являются либо 5л= {О, 5/7, 2/7, О, О, 0}; S*b= {2/7, 5/7}, либо S^= {О, 3/7, О, О, О, 4/7}; Sb= {2/7, 5/7}, при одном и том же значении y=\\l7. §8.7. Решения игр тхп. Эквивалентные задачи линейного программирования Игры, рассмотренные в § 8.6, отличаются тем, что допускают простую геометрическую интерпретацию, делающую наглядным и удобным процесс поиска решений. Естественно, с увеличением тип возрастают трудности анализа игр, на первое место выходят численные методы оптимизации, однако основные принципы формирования зависимостей, связывающих р,-а, pjb, У у остаются прежними. Пусть дана игратХп в нормальной форме (см. табл. 8.2), п требуется найти условия, определяющие S'^, S'b- Предположим, как обычно, что существует реальная возможность применения S*^ против какой-либо чистой стратегии -'/(-(!</<"). и тогда a.fpla + a^jpla + ■ ■ ■+ amjPma='T' т 2]р?а=1- Аналогичное предположение о возможности ис- 1= I пользования 5Ь против некоторой S/a приводит к равен- п ствам fljiPib + a^plb + • • • + аыР'пь = Т. 2 р]ь = 1 • Посколь- /=1 ку эти соотношения устанавливаются для любых г, /, их можно рассматривать как систему неоднородных линейных уравнений с неизвестными р\ау р]ь, У- 230
Если по каким-то причинам прямой путь решения системы aypla + • • • + ат/Р*та — У = 0. 1 =- U П; апр1ь+ ■ ■ ■ +ainPnb—y = 0, i = Г~т\ (8-3) р1а+ ■ • • + Р*па = 1; Plft + • • • + Рпй = 1 ,оказывается неприемлемым, то существует возможность перехода к эквивалентным задачам линейного программирования, позволяющим найти pja, р*1ь, У- Вводя в рассмотрение функции У/ = fli/pxo + • • • + a^jpma а =J7n); 7 = min(7^); 7 = max (7;), / "' получаем auPla +■■■+ amjPma >Ъ I ="й~П; ацр1ь+--- +ai„p„b<y, «' = 1, m; (8-4) Pla + • • • + Pma =^ 1; Plb + • • • + P„b = 1 • Заметим теперь, что допустимо полагать у, 7^0. так как к этому случаю сводятся остальные путем одновременного увеличения всех элементов исходной игровой матрицы \\аи\\. Как подчеркивалось в §8.4, переход от \\аи\\ к \\aij-\- +с\\, c=const не нарушает оптимальности S^, Sb, н с этой точки зрения безразлично, какую из указанных матриц исследовать. Для получения 7. 7 ^'^ достаточно выбрать с таким, что все элементы исследуемой матрицы окал^утся положительными. Учитывая сказанное, нетрудно перейти от системы (8.4) к системе I й/,н, + •.. + а,-„у„ < 1; _ (8,5) 1 л'1 + • • • +Хш = 1/7; yi + ---+Un = l/Y. где Xi = piJy > О {i==l, т)\ г/;=Р/г,'7> О (/=1, п). Стремление стороны А максимизировать свой выигрыш V равносильно требованию минимизации величины 1/у или, что то же, минимизации суммы Xi+. . .+х,п [см. (8.5)]. Сторона В преследует противоположную цель — достичь максимума суммы yi+. . .+г/п, н это позволяет сформули- 231
ровать следующие оптимизационные задачи: ( т -\ найти л:1>0, ..., x^'^0-^mm\z = 2 ^i f "РИ I. t=i ; aijXi + • • • + a,„jX„ >h i = U n; (8.6) найти (/i^O, .. ., (/„^ 0—* max ]г = ^ (/,!■ при V /=i J an+ ■■■ +«,-„^/„<l. i= I. m. Таким образом, проблема поиска решений системы (8.3) свелась к проблеме решения задач линейного программирования (8.6). Появилась возможность привлечь к исследованию матричных игр методы, применяемые в линейном программировании и реализованные в стандартных программах для ЭВМ. Общая последовательность действий, приводящая к отысканию решения произвольной матричной игры тХп без седловых точек, должна быть такой: исходная матрица Ца^Ц приводится к виду ||a,-j-|-c||, так что все элементы ац+с оказываются строго положительными (это преобразование имеет смысл, если среди заданных ajj есть неположительные); каждый элемент а,-/ -f с считается новым ац, и ставятся задачи (8.6); поставленные задачи (8.6) решаются любым доступным методом, и это должно дать оптимальные значения х} (i= = 1, т); у] (/=1, п); г*; г*; искомые p'la, p'jb, у вычисляются по формулам 7=1/г* = = 1/г*; pia=yX{=xl/z* (i=I, т); р)ь=Уу1=уУ^* (/=!.«) [см. (8.5)]; если возникает необходимость возвратиться к исходной игре с матрицей ||fljy||, то для нее/^^д, р]ь останутся неизменными, а у уменьшается на величину с. Ниже дан пример применения рассмотренной методики. Пример 8.3. В игре 3x3 (табл. 8.20) нет седловых точек. Требуется найти решение этой игры двумя способами — непосредственным анализом уравнений (8.3) и переходом к задачам линейного программирования. Решение. Способ 1. По исходным данным составляем систему: 1 3pJ,-6p-^ + 5p;^-V = 0; \ 3pJ,-6p^*+5p*,-v=0; { Pla + Pla + Pla=^' \ РГь + "2*6 + P|b = •' 232
Таблица 8.20 Таблица 8,21 1 —4 3 4 3 -е 3 —6 5 8 3 10 3 10 1 10 1 12 анализ которой приводит к результату pia=l/4; р2а=1/2; рза=1/4; PiVl/4; р2й=1/2; рзй=1/4; V=-l или 5л={1/4, 1/2, 1/4}; Sh= = {1/4, 1/2, 1/4}, v=—1- Способ 2. Замечаем, что среди элементов исходной матрицы есть отрицательные, причем меньший из них равен —6. Следовательно, переход к новой матрице (табл. 8.21) с положительными элементами можно осуществить, назначив с=7. На этой основе формулируются следующие задачи линейного программирования: найти х^, Хз, Хз->-т!п {2=Х1+Х2+Хз} при ■8х1+3х2+10хзйг 1; 3xi+10x2 + X3Ss 1; 10xi+x2+12x3Ssl; Xi, Х2, Хз& 0; найти yi, 1/2, 1/3-^ niax{z=i/i+i/2+</3} при ■8i/i + 3</2+10i/3<l; 3i/i + 10i/2 + i/3<l; 10</i + i/2+12i/3<l; У1, Уг. Уз&О. Поставленные задачи можно исследовать в произвольном порядке, поэтому выбираем, например, вторую. Ее нужно привести к стандартному виду: найти </i, </2. Уз, ,г/4. Уъ, У^-^ тах{г=у-^+у2+Уз} при ,'81/1+31/2+10(/з +1/4=1; I 31/1 +101/2+ 1/3+1/5=1; I 101/1+1/2+121/3+1/6=1; Метод решения задачи (8.7) представляет в данном случае второстепенный интерес. Достаточно ограничиться простым перебором допустимых базисных решений системы (8.7), среди которых должны быть и оптимальные (в общем случае такой перебор малоэффективен). Число свободных переменных равно здесь трем, поэтому анализируем сочетания из шести имеющихся yj по три. Пусть i/i, 1/2, 1/з — первое из рассматриваемых сочетаний. Полагая 1/1=1/2=1/3=0, находим с помощью (8.7) значения 1/4=1, !/5=1, 1/б=1. которые вместе с принятыми нулевыми ух, у^, Уа образуют допустимое базисное решение системы (8,7), Для него 2=0, (8.7) 233
Пусть теперь новым сочетанием будет 1ц, у^, ш. При у^=уъ=у&=4 уравнения (8.7) дают у^=\12А, £/2=1/12, уз=\-12А и, следовательно, 2=1/6. Это решение лучше предыдущего, так как позволяет получить большее значение z. Продолжая начатый перебор возможных сочетаний (их число составляет Сб= 20), нетрудно убедиться в том, что максиму.м z достигается прп уже встречавшемся условии г/4=У5=Уб=0. Таким образом, решением задачи (8.7) является £/i=l/24; £/2=1/12; £/з= 1/24; z*=l/6. Аналогичным способом решается и задача на отыскание минимума г=Х1-{-Х2-\-Хз, Здесь оптимальными оказываются Xi= 1/24; Х2=1/12; Хз=1/24; г*=1/6. Остается вычислить у=\!г*=\1г*=Ъ\ р\а=ух\=\-1А; р1а=ух1— = 1'2; P3a=Y^3=l/4 и далее pi6=vt/i= 1/4: р2б=7У2= 1/2; р1ь=уу1= = 1/4. Эти результаты связаны с условиями игры, заданными табл. 8.21. Чтобы найти результат, связанный с табл. 8.20, достаточно вычесть с=7 из найденной величины у, и тогда S^ = {l/4, 1/2, 1/4};5в = {1/4, 1/2, 1/4}, у = ~\. В рассмотренном примере первый способ решения выглядел более простым, однако никаких общих выводов делать из этого нельзя. Трудоемкость исследования систем линейных уравнений большой размерности сравнима с трудоемкостью решения задач линейного программирования, и на практике следует использовать весь арсенал имеющихся средств, выбирая те из них, которыми лучше владеет исследователь. § 8.8. Разрешимость игровых задач. Практическое использование выводов теории При анали,зе игр возникает вопрос существования решений задач (8.6). В гл. 2 было замече1Ю, что произвольно взятая задача линейного программирования разрешима тогда, когда система ее ограничений имеет хотя бы одно решение и, кроме того, це.левая функция ограничена на мно- жестие И. Покажем, что этим требованиям удовлетворяют задачи (8.6), т. е. их регчекпя всегда существуют. Пусть все коэффициенты а^ в ограничениях-неравенствах (8,6) строго положр'.тельны (это обеспечивается несложными преобразоватитямн нт'ровой матрицы, с.м. выше). Тэгд;! для выполнения условий Oiy.Vi + . . . -{-a„^jX,n'^l достаточно выбрать положительны.е л', ^ l/fli;,. . ., х,,,^ '^-I'arrij и тем самым доказать существование очевидных решенрп"! первой группы неравенств (8.6), Точно так же можно исследовать условия СпУгЬ ■ ■ - ~*~^'г.-гУ;1=£'Л, которые улослетворяются по крайней мере при (/i= . . .= г;„~-0. 234
Относительно ограниченности целевых функций гиг заметим, что каждая из них есть сумма неотрицательных величин, поэтому всегда г^О, г^О. Неравенство г^О ограничивает г снизу, и задача минимизации г обязательно должна иметь решения, поскольку существует достаточно широкий выбор ^1^0,. . ., х^^О, допустимых по условиям uxjXx + . . . +fimj^m^l. Задача на отыскание максимума г тоже разрешима, так как условия a^yi + . . .+ + а^пУп^^ при положительных йц,. . ., ttin препятствуют неограниченному увеличению ух,. . . , Уп, что гарантирует конечность значений г. Таким образом, существует единый метод определения оптимальных смешанных стратегий S^, S*b для произвольных антагонистических игр тХп. На этом утверждении основывается приводимое ниже доказательство теоремы о минимаксе, сформулированной в § 8.4. Пусть дана конечная игра двух лиц с нулевой суммой и полной информацией при условии а Ф ^. Ее решение (в смешанных стратегиях) вытекает из анализа задач линейного программирования (8.6) и может быть получено всегда, причем выигрыш стороны А и проигрыш стороны В составят соответственно а^=у, ад=у. Следовательно, а^= = йв=7, что и доказывает теорему. Полученные результаты позволяют обобщить понятие ситуации равновесия (см. §8.3), распространив его и на случай а Ф f>. Для этого достаточно рассматривать множество значений среднего выигрыша а {S^, Sg) и среди них отыскивать ал=ад=у. По своему характеру эти действия не отличаются от тех, которые приводят к получению а и fj. Разница заключается лишь в том, что а и fj находятся среди элементов исходной игровой матрицы, а й^, н йд — среди элементов матрицы, которую можно было бы построить, перечислив все допустимые смешанные стратегии 8д, Sg н оценив для каждой их комбинации величину а (S^, 8д). Таким образом, любая игра тХп с полной информацией имеет устойчивое решение либо в чистых, либо в смешанных стратегиях, причем в первом случае (а=р) можно говорить о существовании седловой точки матрицы ЦйгуЦ, а во втором (а=?^Р) — о существовании седловой точки матрицы ||й(5^, 5д)||. Рассмотренные выше особенности игровых моделей и вытекающие из них рекомендации основывались на принципиальном предположении о повторяемости «ходов» в игре, т. е. возможности многократного применения стратегий 235
Sia> Sjb В различных комбинациях. Естественно, выводы теории будут полезны для практики тогда, когда удастся найти хотя бы приближенные способы реального смешивания стратегий. Это особенно важно в условиях ограниченного времени существования образцов техники, высокой стоимости эксплуатации сложных систем, непрерывного их совершенствования и т. п. В указанных ситуациях большая роль принадлежит понятию физической смеси стратегий. Задачи исследования операций (связанные, в частности, с проблематикой АСУ) можно условно разделить на две группы: 1) задачи выбора рациональных конструктивных параметров различных технических комплексов; 2) задачи поиска наилучших способов использования потенциала систем в тех или иных условиях. Для краткости задачи, относящиеся к первой группе, удобно называть «техническими», а задачи второй группы — «тактическими». Очевидно, идею смеи1ивания стратегий легче осуществить тогда, когда исследуемая игровая модель наполнена «тактическим» содержанием и отражает проблему выбора конфликтующими сторонами своего поведения. Здесь оптимальные смешанные стратегии реализуются путем неожиданных переходов от одного способа действий к другому в соответствии с найденными решениями р]а, р)ь (^'=1. tn; /=1, п). Целесообразность такой тактики подтверждена многолетним опытом, а методы теории игр позволяют дать количественные оценки требуемых частот (вероятностей) применения стратегий s,-a, Sj^. Несколько иная ситуация имеет место в задачах «технического» характера. Получаемые здесь решения воплощаются в конкретных изделиях, рассчитанных на длительную эксплуатацию, и вряд ли можно говорить о допустимости случайного подбора технических показателей таких изделий. В этих условиях игровые принципы проявляются в так называемой физической смеси стратегий, предполагающей реализацию сразу нескольких конструкторских или технологических решений в тех пропорциях, которые рекомендованы исследователями соответствующей модели. Например, разумная организация складского комплекса, выраженная в подготовке хранилищ различного назначения, оправдывает себя при поступлениях разнородных грузов, требующих определенных режимов хранения. Конечно, такой подход лишь приближенно отражает суть формальных результатов, получаемых при исследованиях игровых моделей, однако на практике он часто оказывается единственно возможным (особенно тогда, когда речь идет о создавав
НИИ уникальных систем, строительстве капитальных сооружений, крупносерийном производстве и других долгосрочных мероприятиях, требующих значительных затрат). Ниже дан пример обоснования физической смеси стратегий. § 8.9. Модель комплектации вычислительного центра Предполагается организовать вычислительный центр коллективного пользования, который может быть оснащен ЭВМ четырех типов, выпускаемых промышленностью. На обработку будут приниматься данные, относящиеся к одному из пяти видов задач (календарное планирование, распределение материальных ресурсов, статистическая отчетность и т. п.), причем заранее нельзя указать моменты их поступления. Процесс обработки поступивших данных сводится к решению соответствующей задачи, и это требует определенного времени, зависящего от характеристик используемой ЭВМ, сложности вычислений, их объема и т. д. Расходы, связанные с деятельностью ВЦ, оплачивают заказчики, которым предъявляются счета за проведенные работы. Платежи — условные стоимости решения соответствующей задачи — указаны в табл. 8.22. Таблица 8.22 \. Виды N. задач \. Типы \, ЭВМ N. 1 2 3 4 1 200 300 400 700 и 400 400 500 300 111 600 600 600 500 IV 400 500 500 200 V 700 800 800 100 Будем рассматривать возникшую ситуацию как игровую. Сторона А (организаторы ВЦ) располагает четырьмя стратегиями 1—4 (по числу типов ЭВМ). Она стремится увеличить приток средств от заказчиков за счет ускорения обработки заказов и даже применения дорогостоящих ЭВМ там, где можно было бы обойтись более простыми машинами. Сторона В (заказчики — пользователи ВЦ) старается разумно расходовать свои ограниченные средства, отказывается от чрезмерных требований к срокам выполнения работ с целью экономии, корректно формулирует задачи, выбирает те из них, которые представляют первоочередной интерес и т. д. (стратегии I—V). В этих условиях табл. 8.23 является, по существу, игровой матрицей. Ее исследование показывает, что для стороны А стратегия 1 заведомо невыгодна по сравнению со стратегией 2 (размеры выигрышей 237
Таблица 8.23 Таблица 8.24 А ^\^ 3 4 1 400 700 11 500 300 111 600 500 IV 500 200 V 800 100 А ^\^ 3 4 1 400 700 IV 500 200 V 800 100 в первой строке табл, 8.22 не превышают того, что указано во второй строке). Точно так же, стратегия 2 уступает стратегии 3, и исход1!ые условия игры упрощаются (табл. 8.23). Заметим, что для стороны В стратегия I!! невыгодна по сравнению с П, а стратегия !! — по сравнению с IV. Следовательно, имеет смысл анализировать игру 2x3, заданную табл. 8.24. Составляем уравнения (см, § 8.6) 400рза+700 p4a=Ti; 500p3a+200p4a=Y2; 800 р8а+100р4а = =Y3; Psa+Pia= 1 или Yi=-300p.3a+700; у2=300рза+200; Y3=700p3a+ -rlOO, где рзд, р4а—вероятности применения стороной А стратегий 3 и 4 соответственно. График функции Y=™'n (Vi'Y2. Ys) показан на рис. 8.5. Очевидно, рза=^5/6; y=450 и pl^=l~pl^=l/Q, Таким образом, найдена пропорция р4а/рза=1/5, указывающая на целесообразность комплектации организуемого ВЦ только машинами 3-го и 4-го типов, причем количество машин 3-го типа должно в пять раз превосходить количество машин 4-го типа. Кроме того, ВЦ следует ориентировать на решение задач !, IV и V вида, т. е. делать его более специализированным (иначе уменьшится средний гарантированный выигрыш y= =450). Вопрос об абсолютном числе тех и других ЭВМ решается другими методами, например путем оценки интенсивности потока заказов. Й-? i/A '0,6 О,В 1 р,^ Pia Теория антагонистических Рис. 8.5 игр не затрагивает всех аспектов проблемы разумного поведения в конфликтных ситуациях. Miionie конфликты, воз- ннка;о1Ц1ге в процессе деятельности различных систем, носят неантагонистический характер и часто заканчиваются заключением приемлемых соглашений между их участниками. С этой точки зрения представляют интерес тзк называемые кооперативные игры, отличающиеся большим разнообразием содержания. 238
Глава 9. МЕТОДЫ ИССЛЕДОВАНИЯ КООПЕРАТИВНЫХ ИГР Конфликтные ситуации, встречающиеся в различных областях целенаправленной деятельности, не всегда носят антагонистический характер. Очень часто участники конфликта, преследуя свои цели, выражают готовность вступить в переговоры друг с другом, заключить какие-то соглашения и даже объединить усилия в надежде извлечь из этого выгоду. Один из наиболее важных и интересных выводов теории состоит в том, что определенные формы кооперирования «игроков» при внешне различных их устремлениях действительно имеют смысл. Это объясняется, в частности, большой ценностью информации, которая может быть передана одним участником игры другому, возрастающей ролью решений, принимаемых сообща, эффектом хотя бы частичного объединения ресурсов и т. д. Практика производственной, экономической, политической деятельности подтверждает целесообразность (а иногда — необходимость) подобных действий. С формальной точки зрения имеет смысл в первую очередь рассмотреть конечные игры двух лиц с произвольной суммой, в которых отсутствует условие ПА{ии)+ПВ(ии)=0 (см. §8.1). Эти игры называются также биматричными, поскольку они определяются либо двумя матрицами, указывающими платежи каждой стороны (табл. 9.1, 9.2), либо одной блочной матрицей, элементами которой являются пары или блоки {at}, Ьц) (табл. 9.3). Таблица 9. Таблица 9.2 Таблица 9,3 \ ^ Sla ^та Ub an ami 'nb 0-ln ^in 'I A \ Sla ^ma hb hu bm\ 'nb bin bm-: X Si a ^ma 'lb («11, (Oml. bml) ■•■ \:b bm) («m-i- bmn) Существуют две разновидности биматричных игр — бескоалиционные {некооперативные) игры, запрещающие какое бы то ни было сотрудничество сторон, и кооператив- 23Э
ные игры, допускающие такое сотрудничество. Очевидно, кооперативные игры представляют собой более сложный объект исследования (хотя бы потому, что формы кооперации могут быть самыми разнообразными), и их изучению должно предшествовать изучение бескоалиционных игр. §9.1. Биматричная игра. Ситуации равновесия и поведение участников Развитие любой бескоалиционной игры двух лиц происходит по правилам, обсуждавшимся в гл. 8. Конфликтующие стороны А и В используют независимо друг от друга какие-то свои стратегии (чистые или смешанные), в результате чего добиваются определенных выигрышей (положительных, отрицательных, нулевых), зависящих от конкретных значений ац, Ьц, (г = 1, т; /=1, п) и характера предпринимаемых действий. Можно предположить, что указанное общее сходство моделей распространяется и на трактовку понятия оптимальности решений, и на методологию их поиска. К сожалению, редко удается предсказать исходы биматричных игр, и одна из главных причин этого заключается в отсутствии, как правило, связи между платежами (выигрышами) Utj, bij сторон. В результате ослабляется влияние одной стороны на другую, для каждой из них появляется возможность действовать более самостоятельно, ориентируясь только на свой выигрыш, хотя подобная самостоятельность в каких-то случаях (обман, предательство) может дорого обойтись. Важную роль, как и ранее, играют ситуации равновесия, характеризуемые тем, что ни одной из сторон невыгодно нарушать их. Формально это означает следующее. Допустив возможность многократного повторения «ходов» в игре (табл. 9.3), естественно предположить, что существует некоторое множество смешанных стратегий Sn~{pia, ■ ■ ■• Рта), Si,= {pih, ■■■',, Pnb), применяемых сторонами с целью достижения средних выигрышей т п т п Тл = 2 2 ai.piaPjb и Та = 2 2 bi,pi^Pjb соответственно (чистые стратегии оказываются частным случаем и отдель!ю не рассгу!атриваются). Если среди 1;аз- ванных стратегий S^, Sb есть S\—{p\a, ■ ■ ■ , рта} и 240
X Si a S2a hb (5.2) (0,0) '2b (0,0) (2,5) 8в=^{р1ьу - • M Pnb }, удовлетворяющие требованиям m n m n m n 2 S a.ijPiaP]b < 2 S aifplap)b\ 2 2 bifplaPjb < 1= 1 /= 1 1=1 /= 1 i = 1 /= 1 < 2 2 bijp*iap}b, (9-1) i = 1 / = 1 TO использование 5^, S*b создает ситуацию равновесия. Теория утверждает, что каждая биматричная игра имеет хотя бы одну ситуацию равновесия, определяемую неравенствами (9.1), однако это утверждение нельзя применить непосредственно для Таблица 9.4 поиска 5^, Sb- В тех же случаях, когда удается найти 5^, 5Ь (например, угадыванием или перебором вариантов), полученный результат может оказаться неоптимальным и даже содержать неопределенности [10]. Чтобы убедиться в этом, достаточно рассмотреть простой пример. Дана матрица (табл. 9.4), определяющая конкретную игру, в которой чистые стратегии §^^={1,0} и 5д={1,0}, а также 5д= {0,1} и §в= = {0,1} образуют ситуации равновесия (проверка производится подстановкой этих данных в формулы$(9.1)). Применение первой пары стратегий дает выигрыши ул=5; Yfl~2, а второй пары — выигрыши ул=2; Yfl=5. Очевидно, ситуация SjH, 5д предпочтительна для стороны А, ситуация 5д, 5д — для стороны В, и остается неясным, к какому решению должны прийти участника игры. Если В обращается к стратегии Sfls=s2ft, то А может либо придерживаться Sj^—Sia и выигрывать Y^ii=2, либо обратиться к S^ij=Sio в надежде заставить В перейти к §дг= essk, (пара SjH, Sg дает Y4~Yfl~0, и стороне В выгоднее заменить 5д на §в с целью получения Yfl=2, но это сразу увеличит Y4 Д" пяти). В случае успеха рассматриваемый «маневр» стороны А создаст ситуацию §д, 5д, которая будет благоприятной для аналогичного «маневра» стороны В и т. д. В итоге трудно понять, к какому результату могут прийти А п В н как они должны действовать. Этот вывод не зависит от того, какими стратегиями (чистыми или смешанными) созданы ситуации равновесия. Может показаться, что неудачная попытка найти решение рассмотренной игры (табл. 9.4) объясняется неоднозначностью выбора _S^, Sb [ими оказываются и 5д, 5д, и 5д, 5д, и даже S^ij=(4/5, 1/5); 5д= = (1/5, 4/5)]. В этом смысле представляет интерес еще один пример. Дана биматричная игра (табл. 9.5), в которой стороны А к В располагают доминирующими стратегиями $2^ и Sj;,. Следовательно, равновесие достигается при5^=(0,1), Sb=(0,1), что дает сторонам гарантированные выигрыши по одной единице. В то же время, переход каждой из них к «неправильным» [сточки зрения требований (9.1)] стратегиям 5^-^(1,0), 5д=(1,0) приводит к выигрышам по шесть еди- 241
\ в A \ Slo Sjio hb (6,6) (9,0) Чь (0,9) (1.1) Таблица 9.5 ниц. Казалось бы, такой результат выгодно сохранять, однако соответствующие договоренности запрещены правилами игры, и в этих условиях каждой стороне приходится опасаться «маневров» противника, выраженных в неожиданных изменениях поведения с целью достичь еще большего преимущества. Подобное «предательство» общих интересов могло бы дать его инициатору выигрыш в девять единиц, после чего последовали бы ответные меры потерпевшей стороны (ее выигрыш снизился до нуля), и отыскание приемлемых решений стало бы проблематичным. Таким образом, основные выводы, к которым можно здесь прийти, состоят в следующем: существование ситуаций равновесия в бескоалиционных играх не определяет, вообще говоря, их решений, и однозначные рекомендации для оперирующих сторон пока отсутствуют; во многих случаях полезны (и даже необходимы) контакты и соглашения между участниками игр, поэтому модели, допускающие возможность кооперирования, более предпочтительны; частные постановки задач не исключают использования теории бескоалиционных игр, и вопрос о целесообразности поиска ситуаций равновесия, их последующего анализа и учета в решениях должен исследоваться в каждом случае специально. Сделанные замечания целиком относятся и к конфликтам с yV участниками, имеющими непротивоположные интересы, но действующими вне коалиций {N >2). Чтобы завершить обсуждение вопросов разрешимости бпматричных некооперативных игр, рассмотрим конкретную модель, отражающую проблему воздействия производства на природную среду. § 9.2. Модель экологического конфликта. Варианты исхода игры Два промышленных предприятия (Л и В), расположенные вблизи обширного водоема, берут из него воду для технических нужд и после использования сбрасывают ее обратно в водоем. Если суммарный объем сбрасываемой (загрязненной) воды не превышает некоторого предела, то происходит ее естественное очищение, и общий водный ресурс сохраняется. Если же указанный предел нарушен, то загрязненность водоема интенсивно растет. Возникает проб- 'Л-г
лема его восстановления за счет предприятии и, возможно, уплаты штрафов. Чтобы избежать неприятных последствий, приходится строить очистные сооружения, состоящие из отдельных стандартных блоков, рассчитанных на определенные объемы пропускаемой через них воды. Стоимость отдельного блока известна, поэтому затраты на очистку увеличиваются пропорционально количеству монтируемых блоков, и вопрос заключается в том, как выработать разумную политику по отношению к эксплуатируемому водоему. Суть конфликта, возникающего между рассматриваемыми предприятиями, сводится к их стремлению обеспечить-еебе- благоприятные условия деятельности путем более свободного расходования природной воды, отказа от полного ее восстановления и т. п. Это отрицательно влияет на состояние источника и через него — на ход производства, технологические режимы, качество продукции обоих предприятий. Все оказывается взаимосвязанным, и появляется заинтересованность в поиске решений, приемлемых для конфликтующих сторон, хотя никакой договоренности между ними может и не быть. Очевидно, имеет смысл представить возникшую ситуацию как бескоалиционную игру двух лиц и попьпаться получить на этой основе необходимые теоретические результаты. Пусть количество воды, потребляемой каждым предприятием в его технологическом цикле, принято за единицу (100 т, 10 цистерн и т. д.). Количество очищаемой воды составляет 1—ж^ на предприятии А; 1—л'д на предприятии В (Qs^x^^A; О^Хд^Х), причем конкретные значения х^, Xg определяются числом очистных блоков и их мощностью. Будем считать, что каждый блок восстанавливает 25% используемой воды, и тогда возможными стратегиями сторон оказываются: Si.j' S,a- S:ia< S,a< S,a s-.b- s,b- ^?,b ~ ■546 ~ Sob- - очистка всей воды, т. е. x^=0, Хд— 0; - очпстка 75% воды, т.е. л; ^4= 1/4, Ха=--1/4 -очистка 50% воды, т.е. а"л=1/2, Хд=А.'2 - очпстка 25% воды, т. е. х,5=3,'4, Ха=3/4 — отсутствие очистки, т. е. л'^ = 1, Хв= 1. Пусть затраты на приобретение, монтаж и эксплуатацию одного оч1-;стного блока достигают в денежном выражении х рублей, а затраты каждого предприятг.я на реконструкцию водоема в случае его загрязнения (включая штрафы) — ■& рублей. Предельно до!1устимый сброс загрязненной воды установлен на уровне 6 = 1/3, следовательно, потери (рас- 243
ходы) предприятий Л и В оцениваются как I 4х(1—xj, х^ + хд^б; \ 4х(1—Хд) + ^, х^ + Хв>б; I 4х(1—Хд), ^^+^л<б; ) 4Х (I —Хд) +Ь, X^-^Xg> б. (9.2) Формулы (9.2) позволяют определить при заданных Хд, Xg размеры платежей (проигрышей), в результате чего может быть составлена игровая матрица (табл. 9.6), характеризующая обстановку конфликта. Предстоит найти и исследовать ситуации равновесия. Таблица 9.6 \ в А \ Sla ^2а 5эа S4a Ssa "^Ib (4х, 4х) (Зх, 4х) (2х + д, 4х + «) (х + 0. 4х + д) (д, 4х + 0) "^26 (4х, Зх) (Зх + д, Зх + д) (2x + fl-, Зх + 0) (х + д, Зх + 0) (0, Зн + д) ^эь (4х + д, 2х + д) (Зх + д, 2х + д) (2х + д, 2х + д) (х + д, 2x + fl-) (0, 2х + 0) "^46 (4х + д, х + д) (Зх + д, х + д) (2x + fl-, У. + Щ (х + д, х + д) (в, х + «) ''.^Ь (4х + д, д) (Зх + д, д) (2х + д, 0) (>« + ©, «) (в-, «) Очевидно, результаты проводимого анализа должны зависеть от соотношений между к и ■&, поэтому представляют интерес случаи, рассматриваемые ниже. Случай I. Затраты на восстановление водоема и выплату штрафов пренебрежимо малы по сравнению со стоимостью одного очистного блока (д<^/< или д~0). Игровая матрица (табл. 9.6) приобретает вид табл. 9.7, в которой легко обнаруживаются доминирующие строки и столбцы. Так, крайний справа столбец, состоящий из нулей (платежи предприятия В при использовании им стратегии sjj,), доминирует остальные Столбцы (речь идет о проигрышах стороны В, которые нужно уменьшать). То же самое относится к последней (нижней) строке, указывающей на возможность снижения затрат остороны А. Следовательно, единственная ситуация равновесия есть S'/^^^s^a, Sh^^S;,!,, причем она является устойчивой и пренебрегать ею нельзя из-за опасности увеличения собственного проигрыша. Это позволяет рассматривать стратегии s^at ЧЬ в качестве решения игры при ■&<ф1. Подтверждается естественный вывод о том, что перспектива слишком малых пс- 244
Таблица 9.7 (4х, 4х) (Зх, 4х) (2х, 4к) (к, 4х) (0. 4к) (4х, Зх) (Зх, Зх) (2х, Зи) (х, Зх) (0, Зх) (4х, 2х) (Зх, 2х) (2х, 2х) (X, 2х) (0, 2х) (4х, х) (Зх, х) (2х, X) (к,>.) (0, X) (4х, 0) (Зх, 0) (2х, 0) (X, 0) (0, 0) терь практически освобождает предприятия от забот об охране окру- жа1ои1ей среды. Случай 2. Затраты на восстановление водоема и выплату штрафов значительно превосходят стоимость сооружений для полной очистки воды (б'^4х). Здесь исходная матрица (табл. 9.6) сводится к табл. 9.8. Таблица 9.8 (0, 0) (0, 0) (0, 0) {&,Щ (0,0) (0,0) (0, 0) (0, 0) (0,0) (0,0) (0, 0) (»,0) (0,0) (0, 0) (й.О) (», 0 (*,0) (0, е-) (0, 0) (0,0) {&, г")) {&, 0) (0,0) (I'J, 0) (0,0) в ней тоже обнаруживается доминирование первой (верхней) строки и первого (слева) столбца. В итоге легко отыскивается единственная устойчивая ситуация равновесия S^^^sia, Se^^Sib, которую можно считать решением игры. Действия сторон сводятся к установке относительно недорогих очистных блоков, и это позволяет избежать ущерба (материального и, возможно, морального), выраженного в единицах 0. Найденные решения не содержат в себе ничего необычного, однако они демонстрируют возможности теории, а также наводят на мысль о существовании предпочтительных (выгодных) значений 0. С этой точки зрения полезно исследовать еще один вариант рассматриваемой игры. Случай 3. Затраты на восстановление водоема и выплату штрафов соизмеримы со стоимостью сооружений для очистки воды, хотя и превышают ее (Oaj5x). Несложный пересчет данных табл. 9.6 позволяет, как и ранее, найти домпнирующие э.;!Рмеит1.1 р выявить заведомо невыгодные стратегии. Ими oKaJUBaroicM i^u, ^la> л;ь. jb. после нею игра ста- 245
новится более простой и может быть задана табл. 9.9. Поиск ситуаций равновесия теперь ведется с использованием формул (9.1), причем необходимо иметь в виду следующее: 1) знаки неравенств (9.1) заменяются на противоположные, так как речь идет о проигрышах сторон; 2) целесообразно провести сначала анализ чистых стратегий как наиболее подходящих по смыслу задачи (смешанные стратегии имели бы практическую ценность при многократных повторениях рассматриваемых ситуаций); 3) для упрощения исследований можно уменьшить каждый элемент полученной матрицы (табл. 9.9) вхраз (или условно принять X за единицу), и это не изменит окончательных выводов. Таблица 9.9 \ в А \ S-ia ^•2. а Ча hb (4х, 4х) (Зх, 4х) (5х, 9х) \ь (4х, Зх) (8х, 8х) (5х, 8х) hb (9х, 5х) (8х, 5х) (5х, 5к) Нетрудно видеть, что поддержать искомое равновесие могли бы стратегии (sia, sk,), (si^, Sas), (S2a, s^b) И, возможно, (Sf^a, SBb). Проверить это позволяют формулы (9.1). Так, стратегиям (sj^, sn,) отвечают вероятности pla=h р1Ь= 1 (остальные pia, pjb равны нулю) и неравенства (9.1), переходящие в A^Apia+'ipia+^Pba\ 4<4pi(,-]-3p2i,-]- 4-5р5Ь, нарушаются при pia = p2a = Plb = p2b=0; Рба=РбЬ=1. т. е. Sia, Sib должны быть отброшены. Стратегиям Si^, S2(, отвечают вероятности р1а=1, р2ь=1, и неравенства (9.1), принимающие вид 4<4р1д+8р2а-]- -f 5р5д; 3<4р1(,+3р2ь+5рбь, сохраняются при любых допустимых сочетаниях значений р,-д, pyj,, т. е. Sj^, S26 образуют ситуацию равновесия. Стратегиям S2a, Sif, отвечают вероятности р2а=1, pib=h что дает 3<4pia+3p2a+5p5a;4<4pi(,+8p2(,+5pBh, и ситуация (S2a, Sib) оказывается равновесной. Наконец, стратегиям Ss^, «вь отвечают вероятности р5а=1; р5Ь=1 и 5<9р1а+8р2а+5рва; 5<9pi(,+8p2i,+5p5(, (ситуация равновесия). Последний из полученных результатов наименее интересен, так как потери сторон достигают 5 единиц (см. табл. 9.9). Стороне В выгоден вариант (Sia, S2(,), стороне А — вариант (S2a. sib) и необходимо какое-то соглашение, но в бескоалиционной игре оно формально запрещено. Возникшую неопределенность нельзя устранить и произвольным переходом к sb^, sm,, который может привести лишь к пересмотру принятого Q (в сторону увеличения) и последующему возврату к первым стратегиям. Полезно заметить, что более действенным средством оказывается уменьшение 6. Если, например, назначить 6=1/5, то габл, 9.9 при тех же дяй5х, xs=l принимает лругой вид (табл. 9.10) и устойчивое равновесие дают стратегии «щ, ^к,, определяющие решение игры. Таблица 9.10 (4,4) (9,8) (9,5) (8,9) (8,8) (8,5) (5,9) (5,8) (5,5) 246
Представляет интерес и «универсальная» рекомендация ха= =Хй=б/2, позволяющая сделать потери сторон равными 4х(1—6/2), как это следует из формул (9.2). Она полезна в случае, когда есть возможность соответствующего выбора х^, xg, 6. Например, допустив в рассматриваемой задаче 6= 1/2, можно было бы считать S2a > S2b решением игры при fl'>4x (1—6/2). Таким образом, теория бескоалиционных игр эффективно применяется в исследовании операций и помогает изучать важные проблемы организации производства, расходования природных ресурсов, совершенствования сложных систем. В то же время она указывает на необходимость кооперирования участников того или иного конфликта и получения каждым из них за счет этого определенных выгод. § 9.3. Проблемы и формы кооперирования. Понятие характеристической функции Переход конфликтующих сторон к различным формам сотрудничества (кооперирования) создает качественно новые ситуации по сравнению с тем, что было рассмотрено в § 9.2. Можно назвать три уровня взаимодействия, допустимого в играх с N участниками: 1) обмен информацией о ходе игры и складывающейся обстановке; 2) совместный выбор стратегий на основе общей договоренности и взаимной информированности; 3) объединение активных средств (ресурсов) с соответствующей координацией предпринимаемых действий. Каждая ступень кооперирования предполагает передачу каких-то сведений одними участниками игры другим ее участникам. Наиболее простым с точки зрения исследователя оказывается случай добровольного предоставления точной инфор.мации, что можно считать составной частью применяемых стратегий. Характер сведений трудно оговорить заранее вне связи с конкретной задачей, однако ясно, что спи могут касаться и целевых установок конфликтую- щи.х сторон, н их готовности пойти на компромисс, и непредвиденных обстоятельств, мешающих какой-либо стороне достичь желаемого результата [51. Рассматриваемые общие условия благоприятного развития игр могут быть нарушены передачей неправильных (искаженных) сведений их участникам, причем наибольший эффект такие действия приносят в антагонистических играх, где одна из сторо,!! оказывается жертной собственной доверчивости. Наглядпы.\; примером этого служит любой обман 247
(«военная хитрость»), вводящий в заблуждение даже осторожного противника, имеющего часто собственные достоверные, но неполные данные о сложившейся обстановке. Важно заметить, что необходимой предпосылкой для обмана является точное знание цели, которую преследует против- HPiK, поэтому в реальных конфликтах (прежде всего антагонистических) цель приходится скрывать, уменьшая тем самым опасность быть обманутым. В дальнейшем будем предполагать, что сведения, которыми обмениваются участники конфликта, имеют объективную ценность. Это позволит сосредоточить внимание на более высоких уровнях кооперации и соответствующих подходах к проблеме поиска решений. Распространенным видом коллективных действий участников некоторой коалиции является выбор ими своих стратегий с учетом поведения тех, кто не вошел в нее. Этот способ сотрудничества предполагает выработку единого критерия (целевой установки) коалиции, получаемого, в частности, осреднением критериев ее участников, после чего коалиция может рассматриваться как самостоятельная оперирующая сторона. Важным фактором, определяющим характер кооперирования, оказываются так называемые побочные платежи, которыми обмениваются конфликтующие стороны в стремлении либо образовать какую-то коалицию, либо присоединиться к уже существующей коалиции, либо противостоять ей. В этом смысле понятие «побочный платеж» можно интерпретировать как «вступительный взнос», «налог на кооперацию», «штраф за выход из кооперации», «плата за нежелание сотрудничать» и т. п. Очевидно, во всех подобных случаях речь идет об изменениях в ту или иную сторону выигрышей, указанных в исходных условиях игры (игровых матрицах), поэтому побочные платежи становятся частью применяемых стратегий и влияют на исход конфликта. в качестве примера рассмотрим следующую ситуацию. Конфликтующие стороны А, В, С поставлены перед проблемой кооперирования, причем сотрудничество любых двух из них неизбежно приводит третью сторону к дополнительному проигрышу в 20 единиц, отчисляемому в пользу созданной коалиции (побочный платеж). Полученный таким, образом доход делится поровну между объединившимися участниками игры, и ее возможными результатами становятся: 1) выигрыши сторон Л, S по 10 единиц, проигрыш С в 20 единиц (коалиция А и В); 2) выигрыши сторон Л, С по 10 единиц, проигрыш S в 20 единиц (коалиция А и С); 3) выигрыши сторон В, С по 10 единиц, проигрыш Л в 20 единиц (коалиция В и С); 4) равные О выигрыши и проигрыши при отсутствии коалиций, 248
Каждый вариант кооперирования вряд ли будет здесь устойчивым, так как всегда есть опасность отказа А, В или С от достигнутых договоренностей и образования новых коалиций. То же самое можно сказать о варианте 4, который в этом смысле ничем не отличается от вариап- тов 1—3. Некоторую ясность в рассматриваемую ситуацию вносит предположение о неодинаковых пропорциях в распределении побочного платежа. Пусть В в случае объединения с С получит 15 единиц выигрыша, а С — только 5 единиц. Может показаться, что позиции В улучшились по сравнению с первоначальными условиями кооперирования, обещавшими прибыль, равную 10, однако это не так. Коалиция В, С практически исключается, поскольку А к С предпочтут возврат к старому варианту 2, дающему им по 10 единиц выигрыша за счет В. Следовательно, сторона В попадает в более трудное, чем прежде, положение, и причина этого заключена в появившемся у А к С стимуле к кооперированию. Идея побочных платежей может быть выражена также в договоренности об объединении (обобществлении) ресурсов участниками коалиции, создании неприкосновенных запасов, отчислении средств на приобретение дорогостоящего оборудования и т. д. Развитие этой идеи в различных игровых моделях позволяет находить приемлемые решения, отвечающие в достаточной степени интересам конфликтующих сторон. Чтобы перейти от общего обсуждения проблем кооперирования к анализу конкретных вопросов теории кооперативных игр, необходимо ввести ряд новых понятий, не встречавшихся ранее. Если в некотором конфликте участвуют Л/сторон (или Л^ лиц), то их совокупность, обозначаемая {Л/}, есть множество всех участников игры. Любое непустое подмножество {N} множества {N} будет представлять собой коалицию, образованную N участниками. Очевидно, общее число N _ способов составления коалиций достигает _^ Сд^ ^ 2^. Если результат, получаемый коалицией {N} в данной игре, имеет количественное выражение, то возникает проблема выбора наилучшей в каком-то смысле стратегии Srjr. . Обычно к 8гщ предъявляется уже знакомое требование обеспечить максимальный гарантированный средний выигрышу, сохраняющий неизменное значение при любых допустимых действиях других участников игры, оставшихся за пределами {^V}. Такая постановка вопроса позволяет рассматривать у как функцию, заданную на множестве всех коалиций {N}, которые могут появиться (хотя 6jbi_ теоретически) в кооперативной игре сЛГ лиц, т. е. 7=7({Л/}. Функция 7({^}) называется характеристической функцией игры. 249
Необходимо заметить, что сущность кооперативных игр заключается прежде всего в поиске устойчивых коалиций, обес!1ечивающих своим участникам наибольшие дополнительные выигрыши по сравнению с теми, которые были бы получены в индивидуальных действиях. В этом состоит принципиальное отличие кооперативных игр от бескоалиционных, связанных только с проблемой поиска оптимальных (предпочтительных) стратегий. Важным следствием указанных различий является возможность (и даже целесообразность) отказа от матричной формы задания кооперативных игр и замены ее так называемой позиционной формой, предполагающей знание {N} и у ({Л/}). Это оправдывает себя, поскольку характеристическая функция оценивает коалиции с точки зрения их предельных (наилучших) покс1.зателей, уже достигнутых в ходе реализации стратегий SjVi-Свойства характеристических функций должны отражать некую общую закономерность, присущую тому или иному конфликту, а не его частные особенности. Естественно считать, что y(0)=O (у отсутствующей коалиции {Л/}=0 отсутствует результат). Далее, для любых двух непересекающихся подмножеств {N}i, {N}2, вклю- ченгшх в {Л/}, выполнено y{{N}i{ + y{{N}.2) ^y{{N}i[j и {Л/}о), т. е. объединение {N}i и {N}^ в новую коалицию может только увеличить их выигрыши (свойство супераддитивности). В этих предположениях отражена идея полезности кооперирования, и в дальнейшем имеет смысл ее придерживаться, конкретизируя тем самым изучаемые проблемы. ^'словие супераддитцвности легко обобщается (по индукции) иа случай произвольных коалиций {N}i,. . . , {Л^}дг, Л! объединение которых есть {Л'}, т. е. 2 Y ({^^'}ц) ^ м _ ^Vi'-'V}), П {Л'},| = 0. Игра, допускающая возмож- 1.1=1 м ность получеи!!я одинаковых 2т({'^} ) " Y ({■"'''}). назы- U вае^.'я несу1цествгнний. Если же такая возможность ис- кл;(:ч(.-ка (имеет место строгое неравенство), то соответ- ств\'ч_лцая игра называется существенной. После того как та или и.пая кооперативная игра заверши; ■■•■:. В03ПИ1--ПСТ г'Г)ирпс о разделении общего вынгрьпиа ■у'({\;) между всеми ее участниками. Очевидно, раздел 250
может быть произвольным, но он должен удовлетворить каждую сторону, стремящуюся получить выигрыш не меньший того, который был бы получен в индивидуальных действиях. Пусть указанное разделение дало участникам выигрыши Yi,. . . , Yv,- • • . Ya'- Если бы v-й участник действовал самостоятельно, то его результат оценивался бы величиной Y({1}v), так как в этом случае речь шла бы о «коалиции» {1}^с:{Л/}. Следовательно, вступать в коалицию целесообразно тогда, когда выполнено условие индивидуальной рациональности, т.е. Yv^Y({1}v)- Вектор Д=(Y^ Ya')' удовлетворяющий требовани- N ям 2yv = Y({^^}) и Yv^Y({1}v). v=1, л/, называется v= 1 ■дележом в игре N лиц с характеристической функцией 7({ЛГ}). Таким образом, исходом кооперативной игры является дележ как результат соглашений между конфликтующими сторонами. Главный вопрос заключается в том, какой из дележей будет считаться решением. Однозначный ответ можно дать только для случая несущественной игры, в ко- N торой 2 Y({1}v) = y({^}) (по определению), и, следова- v=l тельно, единственным дележом оказывается Д—[у ({1 }i),. . ., Y({1}jv)]- в любой существенной игре с числом участников Л/^2 множество дележей бесконечно, и проблема поиска решений усложняется. Тем не менее, существуют возможности разработки ряда принципов сопоставления получаемых результатов и выбора среди них предпочтительных. § 9.4. Дележи в кооперативных играх. Принципы формирования решений Важная роль в формировании решений кооперативных игр принадлежит идее доминирования дележей. Основываясь на этой идее, исследователь может сравнивать одни дележи с другими и давать соответствующие рекомендации той оперирующей стороне, к которой он принадлежит. Пусть Д1={Уи Ут), Д2=(Yl2,. ■ . , Yiva) — Два дележа и {N} — возможная коалиция в некоторой игре с участниками {l}v. Говорят, что Д^ доминирует Да до коалиции {N} (обозначается Дх^Д^), если Yvi>Yv2 для каж- Ш 251
дого {Ijv^V'^} При 2yvi^Y({^})- Последнее ус- {Uv е{^} ловие означает способность коалиции {Л''} предложить участвующим в ней сторонам {1 }v выигрыши Yvi, которые оцениваются как Yvi^Y({1}v)- Следовательно, исключено доминирование по коалициям {N}^{1}^ {v — l,N), а также {N}^^{N}. Это необходимо иметь в виду, рассматривая следующее определение: Д^ доминирует Да (обозначается Д1УД2), если существует такая произвольная коалиция {¥}с:{Ы}, что ДгУ^Дг. {Л/} Рассматривая отношения «>» на множестве дележей в той или иной игре, можно надеяться найти также Д~Д, которые будут доминировать все остальные дележи. Естественно предположить, что участники игры проявят интерес к Д и определят тем самым один из вариантов ее удовлетворительного решения. Учитывая это, будем называть множество С недоминируемых дележей Д ядром игры или С-решением. Таким образом, основу компромисса между конфликтующими сторонами составляет в каких-то случаях поиск ядер. Теорема 9.1. Ядро игры есть множество таких дележей Д, составляющие которых Yv('v = l, N) удовлетворяют условиям 2Yv = y({'V}); 2_Yv>Y({^/}) для всех {¥}с:{М}. Ограничимся доказательством достаточности утверждения теоремы. Пусть некоторый дележ Д={у1,. . . , у^) отвечает рассматриваемым условиям, а какой-то другой дележ Д={уи. . , , Yjv) оказывается таким,_что Yv < Yv при {\}^^{N}. Это значит 2 _ Vv > Y({^^}) и, следо- вательно, Д не может доминировать Д по коалициям {Л^}, даже если у < Ya' (доминирование возникло бы при 2 Yv^Y({''V}), см. выше). Таким образом, Д^С. П Недостатком решений, связанных с дележами Д, является неопределенность ситуаций, возникающих при С=0 (дележи Д отсутствуют), поэтому необходимы другие кри- 252
терии приемлемости получаемых Vi.- • • . Yiv- В первую очередь следует обратиться к так называемым решениям по Нейману—Моргенштерну (или НМ-решениям). В них используется та же идея доминирования дележей, но на уровне множеств. Предполагается существование некоторого множества {Д}, элементы которого Д представляют собой «равноценные» дележи (доминирование между ними исключено), но вместе с тем любой дележ Д^ {Д} домини- руется хотя бы одним Д^ {Д}. Понятие НМ-решения в какой-то мере обобщает понятие С-решения. Так, если для некоторой игры С=^ 0, и НМ-решение существует, то С содержится в нем. Основная трудность анализа множеств С и {Д} заключается в том, что в общем случае не удается установить их свойства. Например, известны игры, имеющие либо одно, либо сколь угодно много НМ-решений, либо не имеющие их вовсе. Следовательно, проблема поиска каких-то иных подходов к исследованию кооперативных игр остается актуальной. В частности, оказывается полезным принцип «справедливого дележа», связанный с попытками разрешить тот или иной конфликт путем арбитража, т. е. передачи права принимать окончательные решения некоему стороннему «арбитру». Пусть в результате какой-либо договоренности или на основе заключения арбитра для игры с характеристической функцией y{{N}) определены yl,. . ■ , yl/, причем сделано это в следующих предположениях: 1) величины Yi>- • • . У% сохраняются неизменными при любой перестановке участников игры, т. е. один участник может занять место другого в соответствующей коалиции без ущерба для остальных; 2) сумма выигрышей у1,. . . , у% равна значению харак- ,v теристической функции при N=N, т.е. 2vv = y({^})'> 3) участник {1 }v (1 < V < N), присоединяющийся к любой коалиции {N}c:{N}, но не приносящий ей пользы, ничего не выигрывает, т. е. Yv=0 при y({^'}U {1 }у)=у({^})', 4) игра, характеристическая функция которой y({^'}, есть сумма характеристических функций двух других произвольных (самостоятельных) игр, должна дать любому участнику {1 }v выигрыш, равный сумме выигрышей, которые он получил бы в указанных (самостоятельных) играх. 263
Этими правилами (или аксиомами) может руководствоваться исследователь, изучающий конфликтные ситуации и принимающий на себя тем самым роль арбитра. Наиболее существенным является то, что аксиомы 1—4 позволяют получить в любой игре единственный вектор (дележ) Д" = = (y5 у%), называемый вектором Шепли. Его составляющие вычисляются по общей формуле в явном виде. Если гарантированный средний выигрыш y{{N}) некоторой коалиции {N}c:{N} возрастает до y{{N}[}{l}^) после включения в нее «полезного» участника {1}^, то {Л') и {1)^, с{Л') v = 1, N. (9.3) Таким образом, выигрыш v-ro участника игры (l^vs^^V) зависит от состава всех коалиций, которым он приносит пользу своим присутствием, а также от размеров этой пользы, выраженных разностями в квадратных скобках формулы (9.3). Заметим, что в общем случае принадлежность Д" ядру С не гарантируется. С помощью формулы (9.3) легко проверяются исходные предположения (аксиомы 1—4). Например, для «бесполезного» участника любая из разностей y{{N}[) {1 }v)—у({^}) равна нулю, т.е. Yv=0. Далее, замена y{{N}) суммой Yi({^'}) + Yu({'V}) дает 7у=71г_+ Y?iv и т. п^ В силу супераддитивности (см. §9.3) Y ({Л'} и {l}v)>Yl'{A^})+Y({l}v), поэтому Y\'^Y({1}v)- и можно утверждать, что Д" есть дележ. Следуя принятой терминологии, будем называть его Д-'-решением. Рассмотренные понятия оптимального (предпочтительного) выбора дележей в кооперативных играх (С-решения, НМ-решення, Д"-решения) по-разному трактуют интересы конфликтующих сторон, но всегда указывают разумную основу для соглашений. Говоря о практическом использовании полученных выше рекомендаций, необходимо учитывать вычислительные трудности определения дележей н реальность (приемлемость) исходных предпосылок, вводимых из теоретических соображений. Это позволит обоснованно выбрать модель для исследования и более точно оценить получаемые с ее по- Д!01цью результаты. 254
Чтобы конкретизировать замечания, касающиеся кооперативных игр и путей их анализа, обратимся к задаче распределения расходов между участниками строительства. Аналогичные задачи возникают в различных сферах деятельности, где есть возможность объединения усилий сторон, заинтересованных в достижении общих целей. § 9.5. Модель финансирования строительства Несколько перерабатывающих предприятий собираются строить хранилища дорогостоящего сырья (например, нефти, химикатов, редких металлов и т. п.), которое они потребляют для производственных нужд. Затраты на строительство являются некоторой возрастающей функцией ¥ вместимости хранилищ, и перед предприятиями ставится вопрос о возможном объединении денежных средств для финансирования строительных работ на договорных началах. Пусть разрешено обращаться за сырьем лишь в определенные моменты времени ^i,. . . , 4, не зависящие от будущих способов его хранения и одинаковые для всех предприятий. В промежутках между указанными моментами запасы сырья должны пополняться, поэтому очередные заявки на него обязательно удовлетворяются. Если количество предприятий равно УУ и их потребности меняются во времени по законам lv(0> ^ = 1, N, то расчетный объем хранилища, предназначенного для обслуживания всех Л' потребителей, есть ( N N -^ шах 2 Iv(^i). •-••> 2 iv{ik)\- Vv=I v= I / Если же какие-то предприятия с номерами v g Я, Яс:{1, 2,. . . , Л'} отказываются от идеи общего строительства и объединяются с целью создания отдельного хранилища, то оно должно быть рассчитано на объем, равный max J 2 ^v(^i)i •••; 2 ivih)}- Эти предположения по- зволяют, во-первых, говорить о возможных коалициях с Л' участниками (число элементов множества Я) и, во- вторых, оценивать расходы каждой такой коалиции как ^Гтах 2 ^v(Ol. 1'де <г^ — функция затрат, упоминав- i \-еН J шаяся выше. 255
требуется найти количество хранилищ и состав коалиций, которые будут их строить, а также распределить соответствующим образом расходы на строительство. Рассматриваемую задачу можно интерпретировать как кооперативную игру N лиц, характеристическая функция которой задана в виде y{{N}) = ¥' max 2 ^v(0 ' 0)^e{N) Символ {l}v обозначает, как и ранее, v-ro участника игры, т. е. предприятие с номером v, а 2 ^v(0~~ суммар- {Uv 6 т ные потребности коалиции {N} в сырье в момент t. Поскольку y({^}) определяет здесь затраты на строительство, понятие выигрыша (дохода) нужно связывать с минимизацией у, т. е. с эконохМией средств за счет кооперирования. Заметим теперь, что сформулированные условия согласуются с предположениями 1—4 (см. § 9.4). Действительно, каким бы ни был дележ Д={у1,. . . , ул). его составляющие Yb- • • . Ул' сохранят свои значения и дадут в сумме г /V " величину (F max 2 ^v(0 [_ i v-l номеров V и их соответствия тем или иным предприятиям. Далее, по принятому определению функции y({N}) участник {1 }v, для которого lv(0=0> ничего не вносит в строительство и, следовательно, освобождается от участия в дележе расходов, теряя место в готовом хранилище. Наконец, любое предприятие {l}v (l^v^yV) в игре с характеристической функцией вида -y{{N}) независимо от порядка Г, max 2 _ ^v(01+<^iirinax 2_^v(0 должно сохранить те позиции, которые оно имело бы при прочих равных условиях в играх с характеристическими функциями (F[ и (F[,, т. е. вносить вклад Vv. равный сумме вкладов Yiv, Yiiv Это равносильно предположению о поэтапном финансировании строительства при неизменной общей структуре игры (сохраняются коалиции, пропорции в платежах и т. п.). Таким образом, можно попытаться найти Д"-решение, основанное на принципе «справедливого дележа». Пусть для определенности N=3. Тогда возможными коалициями оказываются {l}i — первое предприятие; {1)2 — второе предприятие; {1}з — третье предприятие; {2}i2—пепвоо и второе предприятия и далее {2}]з, {2}аз, {3}i23 Расходы на строительство заданы табл. 9.1!. 256
Тэбяица 9,11 Коалиции Стоимость строительства, тыс. руб. (характеристическая функция) {Ui 200 {1)2 300 {I}. 250 {2},г 400 {2}.а 390 {2}» 500 {3},„ 600 Данные табл. 9.11 показывают, что расширение кооперации снижает удельную стоимость строительных работ. Так, хранилище, рассчитанное на всех потребителей, обходится в 600 тыс. руб. а три индивидуальных хранилища — в 750 тыс. руб. Источниками [экономии здесь "могут быть уменьшение транспортных издержек, улучшение форм организации труда, снижение накладных расходов и т. п. Но даже в этих условиях окончательные выводы следует делать только на основе количественных оценок вариантов кооперирования и связанных с ними дележей. Если все названные выше коалиции допустимы, то (Л^} есть (3}i23> a(N} — либо (2}i2, (2}i3, (2)23, либо {l}i, (1)2, (1}з, либо (0}. Из формулы (9.3) следует 7;= ^ [7((ЗЬз)-7((2Ы)1+-^[7((2Ь)-7 ((1Ь)Ц- 1!1 +-5|-[7((2Ьз) ■7((l}з)Ц-^^[7((l}l)-7((0})l или7?=(600—500)/3+(400—300)/6+(390—250)/6+(200—0)/3= 140. Точно так же 72=(600-390)/3+(400-200)/6+(500-250)/6+(300-0)/3= =245 и 7з=(600—400)/3+(390—200)/6+(500—300)/6+(250—0)/3=215. Полученные Vv дают в сумме величину y{{N})=600. Теперь необходимо оценить размеры взносов, которые придется делать предприятиям, решившим объединиться в коалиции (2}i2, (2}i3, {2}23- Правила расчетов остаются теми же, но числовые характеристики вариантов кооперирования меняются. Пусть создана коалиция {2}^. Для нее N=2, N есть 1 или О, поэтому V;«,2,=^[V((2}l2)-7((l}2)l+^щ^[7((l}i-7((0})l = = i- (400 —300)-j--i- (200 —0)= 150! /2а, 2>=^ [V ((2Ы-7 ((l}i)H-^^ [7 ((1Ь)-7 ((0})] = = i. (400 - 200) -f-l (300 - 0) = 250. Участник (1}з, оставшийся вне рассматриваемой коалиции (2}i2> вынужден действовать самостоятельно, расходуя средства в размере 7((1}з)=250=7з<1,а). 9 Депярев Ю. И. 257
Аналогичная,картина наблюдается и в случае создания коалиции {2}i3 без участия {1}2. Здесь Vid, з>=(390—250)/2+(200--0)/2s=170; Y3(i. з)=(390—200)72+2(250—Q)/2=220; yla. з>=у({1Ь=300. Наконец, для коалиции {2)23, исключающей {l}j, получаем V2(2, з>= = (500—250)/2+(300—Ь)/2=275; 7з(2,3)=(500—300)/2+(250—0)/2=225; Y?(2.3,=Y({l}i)=200. Далее нужно было бы анализировать результаты, к которым придут коалиции очередного (низшего) уровня {l}i, {1)2, {1}з, однако в этом нет необходимости, так как соответствующие данные приведены в первых трех столбцах табл. 9.11. Остается сравнить все найденные величины y" и сделать окончательные выводы. Очевидно, Yi<Yi(i, 2><Yi(i. 3><Yic2, з>, поэтому первому предприятию выгодно участие в общей коалиции {3}i23- То же самое можно скаазть о втором и третьем предприятиях. Следовательно, к решению иГры для принятых исходных условий приводит первый вариант ко; оперирования, т. е. {3}i23; Д"=040, 245, 215). Получаемые выигрыши составляют 60 тыс. руб. для {l}i; 55 тыс. руб. для {1)2, 45 тыс. руб, для {1}з. Полезно заметить, что изменения данных табл. 9.11 приводят не только к переоценкам размеров платежей участников игры, но и к распаду коалиций. Так, увеличение Y({3}i23) До 750 даст при прочих равных условиях Yi=190, Y2=295, y.s=265, и коалиция {3}j23 станет невозможной. От нее откажется третье предприятие из-за возросшего взноса. Предпочтение будет формально отдано коалиции {2}i2 с дележом Д"=(150, 250) при Y3(i, 2)=250, хотя ничто не мешает предприятиям выработать какие-то соглашения о взаимной помощи и передать, например, 25 тыс. руб. в фонд участника {1}з из сэкономленных коалицией {2}i2 средств. Теория кооперативных игр продолжает развиваться, привлекая к себе внимание исследователей прикладных проблем, в частности, проблем АСУ. Противоречия и конфликты, разрешаемые путем разумных компромиссов, влияют на характер деятельности сложных систем, стремящихся к совершенствованию.
Раздел пятый НЕПОЛНЫЕ МОДЕЛИ ОПЕРАЦИЙ. СПОСОБЫ ДЕЙСТВИЙ В УСЛОВИЯХ ОГРАНИЧЕННОЙ ИНФОРМИРОВАННОСТИ Глава 10. ЭКСТРЕМАЛЬНЫЕ ЗАДАЧИ С НЕОПРЕДЕЛЕННОЙ СТРУКТУРОЙ о Методы решения оптимизационных задач, рассмотренные в предыдущих главах, предполагали проведение ряда исследований, связанных с изучением особенностей той или иной задачи, различного рода доказательствами, построением вычислительных схем и т. п. Основой этого служило четкое представление о характере целевой функции. Вместе с тем в практике исследования операций встречаются случаи, когда целевая функция не имеет аналитического выражения. Ее значения при данных значениях аргумента определяются экспериментальным путем, экстремумы отыскиваются в ходе проводимых экспериментов, число которых ограничено. Здесь имеет смысл расширить понятие эксперимента, считая, что таковым является и обращение к каким-либо таблицам, и считывание информации, введенной в память ЭВМ, и непосредственные измерения или вычисления. Модели, характеризуемые неполнотой исходных данных (в частности, неопределенностью целевой функции), будем называть неполными. Эксперимент призван компенсировать в какой-то мере эту неполноту и дать информацию о свойствах изучаемого объекта. В дальнейшем целесообразно использовать те обозначения, которые были приняты в гл. 2—4. Следовательно, речь будет идти о действиях, составляющих процесс поиска экстремума функции 2=/(Х) в рассматриваемых специфических условиях. Правила, в соответствии с которыми ведется поиск, называются стратегиями. Это понятие аналогично тому, что встречалось в § 1.1. Поскольку для решения одной и той же задачи можно выбрать различные стратегии, естественно пытаться найти ту из них, которая является наилучшей в смысле уменьшения объема необходимых вычислений. Конечно, такой подход возможен и в случаях, когда вид зависимости 2=/(Х) известен, но аналитические методы исследований по каким-то причинам не удается применить. 9* 259
§ 10.1. Роль эксперимента в исследованиях. Критерий оценки получаемых результатов Чтобы лучше представить себе основные идеи, связанные с организацией поиска X*, z*, обратимся к изучению детерминированных стратегий. В первую очередь целесообразно рассмотреть случай скалярного аргумента Х^^х, т. е. простейшую задачу поиска. Предположим, что выполнены следующие условия: а) целевая функция имеет только один максимум на интервале т 6) У --г^ X Л,<Л2 Л* X X» Л,< Xi Рис. 10.1 определения [а, Ь] (свойство унимодальности, рис. 10, \,а), хотя может не удовлетворять требованиям непрерывности, суш,ествования производной во всех точках и т. п.; б) х меняется в пределах О—1 (любой другой интервал [а, Ь\ легко приводится к [О, И). Эти предположения исчерпывают априорные сведения, которыми располагает исследователь, и приходится вводить формальное определение унимодальности с целью его использования для организации поиска х*, z*. Пусть Xt и Х2 — значения х в двух экспериментах, даюш,их соответственно Zi и z^, ах* — значение х, достав- ляюш,ее max z=z*, причем X2>Xi. Функция z=f{x) является унимодальной, если из условия Xi >■ х* следует неравенство Zi>Z2, а из условия Х2<.х* — неравенство Zi <. Za (рис. 10.1, б, в). Другими словами, более близкой к X* точке X отвечает большее значение z (случай максимума Z). Приведенное определение исходит из возможности найти Z при данном X только путем эксперимента и поэтому не затрагивает никаких свойств функции z=f{x). Формулируется важный вывод о том, что результат любых двух экспериментов должен указать такой интервал значений х, который меньше исходного интервала [О, 1J и обязательно содержит X*. Действительно, до проведения экспериментов было из- 260
вестно лишь 0^л;*^1. Если Xi и Хз выбраны из условия Xi<.X2 и для них получены Zi, Z2, то эти Zi, z^ могут находиться в отношениях Zi >Z2, Zi<Z2, Zi=Z2 (рис. 10.2, a—в). При Zi>Z2 точка X* не будет лежать правее точки л;2 (иначе нужно требовать Zi < Za), и подьштервал [х^, 11 должен быть исключен из рассмотрения. Далее, при Zi <; Z2 точка а/ Z, е! я^' г) t^t гг О X, О X, X* не может находиться левее Xi (иначе Zi > Z2) и отбрасывается [О, Xi]. Наконец, при Zj = Z2 точка х* должна находиться между Хх и Xi. Любой из найденных подынтервалов, содержаш,их х*, меньше исходного интервала [О, 1]. Таким образом, использование введенного определения унимодальности позволяет организовать пошаговый процесс последовательного сужения указанных подынтервалов с тем чтобы в конце концов приблизиться к х*. Кг гШ А h- о X, (Хо) Рис. 10.3 \. V ъ Лу., Xqtl, *»- ■Хм 1 Для получения формальных зависимостей рассмотрим случай произвольного числа экспериментов Л^, находящихся в распоряжении исследователя (yv>2). Схема, отра- жаюш,ая возможные исходы N экспериментов, строится по принципу: ^-й исход (^=1, 2,. . . ) состоит в том, что наибольшее из найденных z оказывается в точке Хд (рис. 10.3). Оценка интервалов, содержаш,их х*, происходит здесь так же, как и в примере с N=2 (рис. 10.2). Очевидно, неравенства x,_i<x*<x^^i (10.1) справедливы для всех д, если точки х=0 и х==1 обозначены Хо и а;//+1, а функция f{x) унимодальна. 261
,„ Срртношения (10.1). позволяют ввести меру эффективности поиска X*, Z* и определить на этой основе рациональные схемы его организации. Назовем Ix^^i, Хд+,] интервалом неопределенности. Его длина lff=Xg+i—х^^^ при известном Л^ зависит от исхода всех экспериментов, дающего номер q, и выбранных Xi,. . . , х^, т.е. In—In{'X; <?)> где X — совокупность принятых Xi,. . . , Xi^. Чтобы определить рациональную стратегию (или ее начальную фазу) заранее, не приступая к экспериментам, достаточно рассмотреть интервалы ix^^i, x^+J iq=l, N) и счй- xajrb длину наибольшего из них /дг = max (a;,+i—^^^^ характеристикой х. Можно быть уверенным в том, что рейльный результат поиска х* при этих Xi,. . . , х^, оцениваемый величиной In, будет лучше (по крайней мере, не хуже) 1^. Очевидно, 1^ есть функция только я. Если теперь рассмотреть множество стратегий х с их )$арактеристиками /дг, то наиболее выгодной следует приз- рать ту, которой соответствует наименьшая величина 1^- Преимуш,ество такого выбора состоит в том, что сохраняется гарантия реально достичь величины In, непревышающей min/;v^. Обозначив минимум In как Ln, получим L^ = mmmax{Xq^i—Xq_i). (10.2) и q Величина L^ определяет единственную стратегию, называемую минимаксной. Всякое отклонение от нее приведет лишь к опасности ухудшения результата будущего поиска. Критерий Ьц/ позволяет выбирать оптимальные стратегии априори, до начала поиска х*, z*. Существует два вида стратегий — пассивные (в них еще до проведения экспериментов названы все xt,. . . , х^) и активные (в них выбор очередных значений х зависит от результатов предшествующих экспериментов, т. е. накапли- йается и активно используется информация о свойствах Целевой функции). На практике обычно применяются активные стратегии (они более эффективны), однако каждая из них несет в себе элементы так называемой двухточечной пассивной стратегии, рассматриваемой ниже. Пусть N=2, и нужно выбрать хи х^ в соответствии с (10.2), т.е. сформировать минимаксную стратегию ■л^=(Хх, дга) и предсказать ожидаемый результат La. Очевидно, длина In=U представляет собой в данном случае наибольшую 262
1 Ofi 0,6 OA о,г <г h'1 1,-0,3 / 1г'0,б/ 0 о.г ол 0,6 0,8 1 Рис. 10.4 ИЗ двух разностей х-,,—х^, Хз—Xi, где д^о й Хз равны соответственно нулю и единице, т. е. /2=тах(д:2, 1—Xi). Исследовать /» как функцию переменных Xi, х^ удобно путем построения линий /2=const на плоскости {хи Хц) (рис. 10.4). По условиям выбора оптимальной стратегии нужно среди возможных U найти min/"2=^2- Оказывается, /.2=0,5 при д;1=д:2=0,5, однако принять эти Xi, Xs в качестве «рабочих» значений X нельзя, поскольку нарушается введенное ранее общее требование Xi < Xi (различимость точек). Устранить возникшую трудность удается путем перехода к j;i=0,5—е/2 и ^2=0,5+8/2, где е—минимально до- i/ , , . , ly, пустимое расстояние между Xi и х^, при котором они еще различимы (выбирается применительно к конкретным условиям задачи). Таким образом, искомая стратегия и гарантированный результат определяются как X, = (1-е)/2; X, = (1 +е)/2; Ц={\ +е)/2. (Ю.З) Стратегию (10.3) обычно называют двухточечной г-мини- максной. Ее особенность состоит в том, что точки Xi, Хг, где проводятся эксперименты, располагаются симметрично относительно середины интервала [О, 1] на расстоянии е друг от друга. Независимо от соотношений между получаемыми Zi, Z2 остаточный интервал неопределенности будет иметь длину, равную L^ (им окажется либо [О, Xi]\ либо [лгь 1]). В исключительных случаях (их вероятность практически равна нулю) можно ожидать Zi = Zj, х* ^ € Ixi, х^. Идея симметрии проходит через все минимаксные схемы поиска экстремума, поскольку исключает влияние конкрет^ ных Z на конечный результат Lj^. Аналогичные соображения положены в основу анализа игровых моделей (см. гл. 8), что говорит об универсальности принципа минимакса, применяемого в условиях неопределенности. § 10.2. Активные стратегии поиска экстремума. Сравнительная эффективность методов Любая стратегия, предусматривающая последовательное (пошаговое) проведение опытов и оценку возникающих ситуаций, представляется прогрессивной, так как позво- 263
ляет экономить средства и время, с расходованием которых неизбежно связана постановка эксперимента. Именно это характерно для активных стратегий, изучаемых ниже. Полезно заметить, что они тоже являются е-минимакс- ными. Метод дихотомии. Метод дихотомии (половинного деления) — один из самых простых методов поиска х*, z*. Его идея и содержание заключаются в следующем. Из Л^ экспериментов, находящихся в распоряжении исследова- "> " iL-p !, ^^? 1-''^ .,f^ и ^ I 'iJi—|i.w (^,>^^} I [' |\ i' 1 1^„ , I : I : I bwi 'От ' ■ I ) » t—t I el 6]О Xr0.m Хг'ИВ i i : U{xl2) £. Рис. 10.5 iL4£ I I t I I I ' ^^4 теля, выбираются первые два, и соответствующие им точки Xi, Хз размещаются на исходном единичном отрезке наилучшим (в смысле критерия La) образом (рис. 10.5, а), В результате сравнения полученных zi и Za обнаруживается интервал неопределенности длиной L,2)i=(H-8)/2, предназначаемый для дальнейшего исследования (будем считать, что он смещен влево, хотя это не играет роли). Применительно к нему можно повторить указанные действия, используя для этого еще два эксперимента (точки Хз, х^, и прийти к новому интервалу неопределенности, положение которого связывается с серединой предыдущего интервала, а длина есть La,2)= (b,2,i+8)/2=(l+38)/4. Затем выбирается третья пара точек Xj, х^, размещаемая у середины L2(a) и позволяющая получить Ьа(3)= (^2(2) + 8)/2=(1+78)/8. Процесс продолжается до тех пор, пока не будут проведены два последних эксперимента в точках x^r.j и Xj<!. Длина оставшегося интервала неопределенности, характеризующая эффективность метода, есть 1^ = [1 + (2Л'/2_1)8]/2Л'/2. (10.4) Особенностью рассматриваемой схемы является то, что эффект от очередных двух экспериментов уменьшается по 264
сравнению с эффектом от двух предыдущих экспериментов. Действительно, если к некоторому моменту будут размещены 2Н точек, то величина интервала, содержащего л:*, составит L2(H)= [1+(2и— 1)81/2^. Если сделать еще один шаг, т. е. выбрать две новые точки, то окажется L2(h+i)= = [1+(2н + 1—1)8]/2н+1. Тем самым интервал L2(H) сократится на величину A=L2(H)—Z'2(h+1)=(1—8)/2н + '. Нетрудно видеть, что Д тем меньше, чем больше Н (номер шага). В пределе (при Н-»-оо) величина Д стремится к нулю, хотя теоретически возможность размещения очередных точек сохраняется всегда. Практически же нет смысла проводить более 10—12 экспериментов. Преимущество метода дихотомии — предельная простота, однако существуют более совершенные активные стратегии. Метод чисел Фибоначчи. Содержание этого метода связано с использованием последовательности целых чисел, открытой математиком ХП1 в. Леонардом Пизанским (Фибоначчи). В основу схемы поиска х*, z* положены два исходных соотношения L,-i=-L,_i + L^ iq=3, N); L^= (L^_i + 8)/2. (10.5) Первое из них связывает длины трех соседних (по номерам) интервалов неопределенности, второе требует, чтобы процесс экспериментирования всегда завершался одинаково — симметричным размещением двух последних точек {х^-1 и Xjf) на интервале L^_i. С помощью равенств (10.5) строится табл. 10.1, содержащая формулы для Lq при ^=Л^, N—1,. . . (первые две очевидны, остальные получены подстановками). Нетрудно заметить, что коэффициенты при L^^^ и 8 в рассматриваемых формулах составляют последовательность чисел Фибоначчи, определяемую условиями F„ = Fi= I; Ff^ = Ffi_i+Ff,_^, й=2,3,. . . Это позволяет дать общее выражение Lq, приведенное в нижней строке табл. 10.1, откуда следует Li= =^F^L\yr—8^дг_2. Но Li есть исходный единичный интервал неопределенности (Li=l), поэтому L^ = {1 + eF^_,)/Fj,. (10.6) Соотношение (10.6) позволяет оценить эффективность метода чисел Фибоначчи в сравнении с методом дихотомии. Приравнивая правые части формул (10.6), (10.4) и обозна- 265
Таблица 10.1 Q N N—l N — 2 N-3 ■ ' Формула для L Ljv=Ljv Ljv-i = 2Ljv—E Ljv-i = 3Lj^—e Ljv-3 = bLj\^—2e Ц = pAf-q+Фаг— Pn- q~i^ чая N в (10.4) через Л^д, получаем l—eFjv A^a=21og, 2 i_e(F^-FN.i) Расчеты показывают, что в диапазоне реальных значений N (от 4—5 до 25—30) отношение (Л^—N^)/N^ колеблется в пределах 20—30%, т.е. метод чисел Фибоначчи оказывается более эффективным. Это объясняется тем, что сокращение длины очередного интервала Lq требует здесь проведения одного нового эксперимента (рис. 10.5, б), тогда как в схеме дихотомии их требовалось два. В заключение рассмотрим вопрос о графической интерпретации формул (10.5). Схему переходов (рис. 10.5, б) приходится строить от конца к началу, поскольку граничное условие (10.5) связывает L^v и L^^^i. В итоге обнаруживается, что положение точки Xi зависит от выбранных N и 8. Этот вывод формально подтверждается равенством Xi = = 1—La, которое должно выполняться всегда (иначе нарушается принцип минимакса). Но Li=F^_iLn^—е/^дг-з (табл. 10.1) или с учетом (10.6) La^l^iv-i + 8(f ;v_if ^у^г— —^iv^iv-3)]/^iv Отсюда следует, что Xi=Xi{N, е), и первый шаг можно сделать лишь тогда, когда заданы Л^, г. Указанное обстоятельство затрудняет в ряде случаев решение задач, так как делает невозможным изменение Л^ после начала экспериментов. Следовательно, было бы полезно найти стратегию, не требующую предварительного задания N, но приближающуюся по своей эффективности к исследованному методу чисел Фибоначчи. 266
Метел золотого сечения. Выше было показано, что использование рекуррентного соотношения Lq^i=Lq^i+Lq приводит к весьма эффективным результатам. Можно построить и другие. Схемы поиска х*, г*, основанные на том же соотношении, но ориентированные на свои граничные условия в отличие от (10.5). Пусть в качестве исходных приняты равенства Vi!= Vi + ^e ((?= 37IV); 1,-1/1,= const = t. (10.7) Разделим обе части первого из них на Lg^O и тогда t будет определяться уравнением х^=х+1 (здесь x'^^Lq-J /Lq). Положительный корень этого уравнения есть t= (l-f -\'V^5)/2 х 1,618. Зная его, нетрудно найти последовательность точек, начинаюш,уюся с Xi=l—1/т=1—£2=0,382 и ^2=12=0,618 (рис. 10.5, в). Одна из точек очередного интервала неопределенности переходит в следуюш,ий интервал, как это было и на рис. 10.5, б. Поскольку на каждом шаге длина Lq уменьшается в х раз, формула для L^ принимает вид L^ = l/x^'-K (10.8) Сравнение результатов (10.8) и (10.6) можно провести на основе анализа отношения соответствующих величин Ljv при одинаковых Л^ (обозначается как L). Разделив почленно (10.8) на (10.6), получаем L = F^/[{1 +8^дг_2) t^'-i]. Очевидно, наибольшее значение L принимает при 8=0. Начиная с N=4 оно стабилизируется около 1,17. Таким образом, по своей эффективности метод золотого сечения занимает промежуточное положение между методами дихотомии и чисел Фибоначчи. Представляют интерес оценки предельно допустимого количества экспериментов в схемах, показанных на рис. 10.5, б, в. Для первой из них должно выполняться условие Ь^^г или с учетом (10.6) f лг-1=^1/8, для второй — одновременно 2Ljv^Ljv-i + е и L^r-i = tL^v. т. е. yV^ ^l+[lg(2—х)—Igel/lgt. Следовательно, в отличие от метода дихотомии методы золотого сечения и чисел Фибоначчи ограничивают возможные Л^. Так, при 8=0,02 неравенство Fjv_i^l/8 существует лишь для N^9 и выбор yV>9 теряет смысл. В конкретных расчетах удобно пользоваться рассчитанными заранее числами Фибоначчи: Число ^11 . . . ...0123456 7 .. 1 1 2 3 5 8 13 21 8 9 10 11 34 55 89 144 12 233 267
в дальнейшем при анализе более общих задач придется обращаться и к методологии решения простейшей задачи поиска а;*, z*, рассмотренной выше. § 10.3. Модель геодезической разведки. Оптимальная последовательность действий Для оборудования морского порта в естественной бухте необходимо провести геодезическую разведку будущего входа в порт, образуемого узким коротким проливом между бухтой и морем (рис. 10.6, а). О рельефе дна известно, что б) Рис. 10.6 ОН не имеет пологих выступов и сформирован так, как показано на рис. 10.6, б. Прибрежная зона пролива отводится под инженерные сооружения, а наиболее глубокая его часть остается свободной для движения судов. Смысл предполагаемой разведки заключается в промерах глубины вдоль линии, соединяющей берега пролива в наиболее узкой его части (точки О и 7). Стоимость операции достаточно высока, поэтому желательно получить необходимые данные с возможно меньшими затратами средств, т. е. ограничиться возможно меньшим количеством промеров. Вводя в рассмотрение ось х (рис. 10.6, а) и считая глубину h функцией л; (О ^^ х^^ 1), будем интерпретировать поставленную задачу как задачу поиска экстремума h{x) на единичном интервале значений х. Экспериментом здесь является очередной промер глубины, дающий конкретную величину h (рис. 10.6, б). Единственное необходимое предположение об унимодальности целевой функции h(х) удовлетворяется. Пусть решено провести шесть экспериментов (Л^=6), причем по условиям работ выбрано е=0,1. Требуется найти 268
Xi,, . . , jfe. т. е. места промеров, длину остаточного интервала неопределенности Lg, положение ;с*. Если ориентироваться на метод дихотомии, то следует взять Xi= = (1—е)/2=0,45; X2=(l+e)/2=0,55. Сравнение hi=h{xi) и h^=h(Xi)i определяемых из рис. 10.6, б, показывает, что h{>h^. Следовательно* для дальнейшего анализа остается интервал [О, х^. Новым точкам л:з=' =0,225; X4=0,325 соответствуют такие h^, h^ что h^Khi, и новый интервал неопределенности есть [л:з=0,225; ^2=0,55]. Наконец, последние два эксперимента, проводимые в точках лг5=0,338; Xe=0,438, дают к^<. </ie и остается интервал [X5=0,338; лг2=0,55] длиной 1-8=0,212^^1^^. Его положение показано иа рис. 10.6, б (вверху). ■ Попытка решить ту же задачу методом золотого сечеиия приводит к следующему. В качестве ХхИ х^ выбираются, как обычно, 0,382; 0,618 и тогда h{>h^ (рис. 10.6, б). В оставшийся интервал [О, х^ переходит точка Xi, а Хз выбирается из соображений симметрии, т. е. лгз=0,23б. Сравнение h^ с h^ дает к{>кз, и далее нужно исследовать интервал [л:з= =0,236, ЛГ2=0,618]. Сюда переходит опять точка xi, так что х^ должна принять значение 0,472, однако при этом оказывается х^—лг1<е. Приходится либо прекращать поиск, либо уменьшать е. Последнее представляется более предпочтительным в данном случае, поскольку разность Xi—^«1=0,09 близка к е=0,1. В итоге производится еще один шаг, состоящий в измерении h^, после чего процесс заканчивается (/t4</ii). Остаточный интервал неопределенности [хз, xj имеет длину L4=0,236 и располагается так, как показано на рис. 10.6, б. Из-за довольно большого е остаются неиспользованными два эксперимента. Каждый из рассмотренных методов поиска х* имеет свои преимущества и недостатки. В методе дихотомии устранение неопределенности происходит медленнее, но ослаблена чувствительность к выбранной величине е. В методе золотого сечения неопределенность устраняется, вообще говоря, быстрее (это становится заметно после второго шага), но из-за неудачного выбора е поиск завершается преждевременно. В обоих случаях есть возможность использовать дополнительную информацию, содержащуюся в измерениях h. Так, в методе дихотомии можно было бы сравнить ftj и ftj, что позволило бы сузить остаточный интервал Lj. В методе золотого сечения устойчивость точки Xi указывает иа ее близость к х* и т. д. Исследованные методы решения простейшей задачи поиска представляют практический интерес и, как будет показано ниже, могут входить составной частью в более обш,ие схемы организации эксперимента. § 10.4. Особенности многомерной оптимизации. Этапы решения задач Изучая задачи со многими переменными (случай векторного аргумента X), необходимо иметь в виду обш,ие замечания, сделанные в начале этой главы. Вместе с тем нужно уточнить введенные понятия и связанные с ними способы поиска экстремума. Если по-прежнему считать, что значение г в какой-либо точке X={Xi,. . . , Хп) определяется с помош,ью экспери- 269
мента, то объективно существующее, но неизвестно? исследователю соотношение z=f{X) может рассматриваться как уравнение некоторой гиперповерхности в i?„+i, называемой обычно поверхностью отклика (с нее «снимаются» значения Z при том или ином X). Множество точек X, удовлетво- ряющих заданным ограничениям g^i(Х)^6ь i=l, т, являг ется областью эксперимента. Методы формирования стратегий поиска X*, z* в расг сматриваемом случае отличаются от того, что обсуждалось в § 10.2. Это вызвано рядом причин, связанных как с конкретными свойствами задач, так и с характером экспериментирования. Например, с увеличением п становится все труднее сохранять предположение об унимодальности целевой функции. Хотя во многих случаях это делается, само понятие унимодальности требует уточнения. Далее, возни- ннкают осложнения с выбором меры эффективности поиска. Оценка остаточной неопределенности в единицах длины, площади, объема становится либо неоднозначной, либо перестает соответствовать смыслу задачи. Важную роль играет и то обстоятельство, что при п>1 нарушается один из главных выводов о возможности эффективного использования любых двух экспериментов в интересах частичного устранения имеющейся неопределенности (см. § 10.1). Постановка экспериментов преследует две цели — найти лучшее (по смыслу задачи) значение z и получить информацию о том, в какой точке провести очередное испытание. В случае л=1 эти два момента тесно связаны между собой, но в более общих случаях (л>1) они четко разделены, поэтому приходится различать эксперименты по их назначению. Характерной чертой любой стратегии поиска X*, z* является разумное сочетание экспериментов двух видов — пробных, несущих информацию о свойствах поверхности отклика в окрестности некоторой точки X, и опорного, проводимого в самой точке X. Получаемая информация используется для выбора направления перехода к новым X, и подобные переходы составляют процесс оптимизации, завершающийся отысканием X*. Таким образом, в начале поиска приходится исследовать часть области эксперимента, выбранную либо случайно, либо на основе тех представлений о функции z=f{X), которые имеет исследователь. После проведения подготовительных операций организуются переходы от одной 270
опорной точки к другой. Наконец, при достижении окрестности X* оценивается достоверность полученного результата, что особенно важно в случаях, когда f{X) имеет несколько локальных экстремумов. Указанные действия составляют основу трех этапов решения задач — начального, связанного с постановкой пробных экспериментов в окрестности той опорной точки, которую удалось найти; промежуточного, состоящего в обработке собранной информации и выборе новой опорной точки; заключительного, требующего специального исследования окрестно- Рис. 10.7 стей подозрительных на экстремум точек X* (?). В чередовании названных этапов отражена идея пошагового устранения исходной неопределенности. Каждый из существующих методов поиска X*, г* имеет особенности, проявляющиеся исключительно в способах использования промежуточных данных, получаемых в пробных экспериментах. Следовательно, имеет смысл изучать начальный и заключительный этапы решения отдельно, вне связи с какой-либо стратегией. Большое значение имеет вопрос выбора исходной опорной точки Хо- Пусть в области эксперимента Э даны точка /, которую с достаточным основанием можно назвать центром, и точка 2, расположенная на периферии (рис. 10.7, а). Каждую из них можно принять за Хо, однако опасность растянуть процесс решения задачи оказывается большей для точки 2. Это связано с возможностью появления X* на «противоположной стороне» области Э, т. е. с возможным увеличением числа переходов к X*. Следовательно, выбирая Хо, желательно использовать понятие центра области. Примером центра служит средняя точка Хс, заданная координатами j;/c=0,5(A;y„,ln+j;ymax). ГДе Д^/тш, -«^/тач — соответственно наименьшее и наибольшее допустимые значения Xj{j=l,n), рис. 10.7,6. Другой пример — центр 271
тяжести Xr области Э, рассматриваемой как однородное тело. Достоинствами приведенных определений центра являются их наглядность, сравнительная простота необходимых расчетов и т. д. К недостаткам относится чувствительность к поворотам координатой системы и даже опасность выхода за пределы Э (для областей кольцеобразной формы). Существуют и другие понятия центра, часто применяемые на практике, причем не только на первом шаге поиска X*, Z*, но н на следующих шагах, если, конечно, имеющаяся или появляющаяся у исследователя информация подтверждает целесообразность этого. Будем теперь считать, что точка Хо с координатами х^, •■., Хпо так или иначе выбрана, и в ней опытным путем определено значение го=/(л-1о, х^о,- ■ ■ , -»^по)- Этот единственный пока эксперимент не дает никаких сведений о характере поверхности отклика в окрестности Хо (а также о направлении дальнейшего «движения»). Чтобы получить нужную информацию, приходится строить более или менее приближенную модель рассматриваемой поверхности. В качестве основы здесь может быть принята формула Тейлора А.= |^[(^).А..+ ...+(4;).А^.]'х х/(«, х.) + Н,. (10.9) позволяющая оценить приращение Az, которое будет получено при переходе из Хо в какую-то другую точку X. Для вычисления частных производных, входящих в (10.9), используются данные пробных экспериментов, проводимых «вблизи» Хо- Исследователи обычно ограничиваются линей- и ным приближением Агд = 2^ \~§—)у ^-"v» "^"^^ позволяет сократить объем работы и в то же время получить приемлемый результат. Здесь достаточно вычислить только первые производные, т. е. провести пробные эксперименты в точках (Д^ю г Б,д;20с • • > -^по)» (-^loi -^гогБ, А^зос • • > -^по))- • • > (д^ю,. . . , а;„_1,о, Jf„o + е). находящихся на расстоянии е от Xq. Величина е в данном случае выполняет ту же роль, что и ранее (см. § 10.1; 10.2). Получаемые значения z= =Zje(j=l, п) входят в оценочныс формулы (df/dxj)x„^ ^ (zjE—го)/е, /=1, п, приводящие, в свою очередь, к отысканию Агл при различных вариациях Axj, Знак и величина 272
А^л определяют направление следующего шага (этим завершается начальный этап поиска X*, z*). Рассмотрим теперь заключительный этап. Здесь тоже проводятся локальные исследования, ио в окрестности точки X* (?), подозрительной на экстремум, что необходимо по'разным причинам. Во-первых, найденная точка X* может оказаться ложной вследствие погрешностей вычислений, а также незнания каких-то особенностей функции z=f{X). Во-вторых, величины х1, х1 Хп, определяющие X*, Z*, иногда оказываются неприемлемыми с точки зрения затрат на практическую реализацию полученного решения, и возникает задача оценки размеров проигрыша, связанного с отказом от X* (подобные ситуации часто наблюдаются на ранних стадиях исследования операций). В-третьих;, экстремум Z может оказаться слабым относительным максимумом или минимумом, и существует множество точек X, в которых Z принимает то же значение, что и в Х*(?). Как и ранее, модель участка поверхности z=f{X) строится в соответствии с (10.9), однако ограничиться анализом только линейной части Az не удается (первые производные должны обращаться в нуль в точке X*). Это приводит к трудностям вычислений, росту объемов работы и, как правило, снижению точности расчетов. Если нет особых причин для сохранения слагаемых высших порядков, то следует попытаться сначала оценить допустимость так называемой квадратичной аппроксимации f{X), выраженной формулой п п п ' ' ' ' (10.10) куда входят п-\-п(п-\-\)12 слагаемых. Для определения коэффициентов при них нужно провести многочисленные эксперименты и расчеты, поэтому естественно пытаться упростить выражение (10.10), оставив в нем слагаемые, не содержащие смешанных производных, т. е. рассмотреть равенство Формула (10.11) определяет аппроксимацию, не учитывающую связей между переменными. Она включает только 2п слагаемых, что дает заметный выигрыш в количестве под- 18 Дегтярев Ю. И. 273
считываемых коэффициентов, однако существует опасность того, что значения вторых смешанных производных, которыми пренебрегли при переходе от (10.10) к (10.11), окажутся довольно большими, и это приведет к искажению результатов. Чтобы оценить приемлемость формулы (10.11), нужно решить систему я уравнений вида 5(Дгкв)''|Э(Дд:у)=0 (/=1,п) и получить значения приращений Дхх, Дха,. . . , Дх„, указывающие некоторую точку X** (рис. 10.8). Чем больше приближается X** к X*, тем больше основа- / Модель \Пв5ерх1 »откт tHocmtt НИИ считать аппроксимацию (10.11) 'omwm-^ удачной. При Дx^ < 8 (у=1, п) \ точки X** и X* становятся прак- М тически неразличимыми и форму- К лами (10.11) может быть принята. X* Если же Дх^>-8 для всех или части Рис. 10.8 номеров/, то вопрос о приемлемости (10.11) решается применительно к конкретным условиям задачи. Предположим, что произошло худшее и пришлось отказаться от (10.11). Возвращаяськ (10.10), необходимо рассчитать дополнительно п{п+1)/2 коэффициентов — производных функций /(X), найти новую точку X**, дать заключение о ее пригодности и т. п. Иногда при допустимых Дх^ значения г в точках X** и X* заметно отличаются друг от друга, поэтому желательно проверить точки, близкие к X*, сравнивая данные эксперимента с данными, вытекающими из формул (10.11) или (10.10). Пусть необходимый анализ соотношения (10.10) проведен и дал положительный результат (в противном случае пришлось бы заняться слагаемыми третьего и выше порядков). Это означает формальную замену части реальной (но неизвестной) поверхности отклика ее моделью, построенной в соответствии с формулой (10.10), после чего точкой экстремума становится X**. Теперь нужно выяснить, является ли Т'очка X**, заменившая Х*(?), действительно точкой экстремума. Если это так, то любые отклонения значений х/(/=1, п) от соответствующих xj" должны приводить лишь к неблагоприятным изменениям величины г. Тем самым исследуются достаточные условия экстремума, требующие чтобы функция г, заданная своим разложением, была отрицательно (положи- 274
тельно) определена в, некоторой окрестности точки Х*,*:. Если это требование не выполнено, то, необходимо искать новую точку Х*(?) и, следовательаоу новую X**. Проведенный анализ, затронувший лишь начальный и заключительный этапы поиска Х^, г*, показывает, насколько сложен процесс оптимизации решений в условиях неопределенности. Конкретные стратегии, базирующиес|1 на рассматриваемых принципах, изучаются ниже. § 10.5. Способы формирования стратегий в общем случае Чтобы изучать те или иные стратегии поиска X*, г*, необходимо ввести ряд определений. Рассматривая систему равенств Xi = х^Щ, Х2=х^(1), . . . , x„=x„ (t), можно говорить о кривой (или траектории), заданной этими равенствами в пространстве R„ и соединяющей какие-то точки Х^, Хд Им (как и любым другим точкам траектории) соответствуют значения г, которые могут быть найдены экспериментально. Поскольку разным i отвечают разные Xj{t), зависимость z=f{Xi, х^,. . . , Хп), отнесенная к произвольно выбранной траектории, переходит в z=z{t). Таким образом, параметр t оказывается скалярным аргументом и появляется возможность использовать некоторые понятия, введенные в § 10.1, 10.2. Если из условия ti <;^2 следует г(^1)<;2'(^2),то траектория называется строго возрастающей. Функция z=f{X) называется унимодальной, если для любой точки X £Э найдется строго возрастающая траектория, идущая в X*. В случаях, когда эта траектория прямолинейна, f(X) является строго унимодальной функцией. Наконец, функция f{X) называется линейно унимодальной, если она унимодальна (см. § 10.1) на произвольной прямой, содержащейся в области Э. В дальнейшем будет использовано и понятие поверхности уровня как множества точек X, удовлетворяющих равенству г=/(X)=const (при п=2 эта поверхность вырождается в линию). Идеи, лежащие в основе тех или иных стратегий поиска X*, г*, весьма разнообразны. Часто они формируются под влиянием известных методов оптимизации (см. гл. 4), иногда обладают определенным своеобразием, но независимо от этого выражают общее стремление преодолеть ту неопределенность, которая присутствует в задаче. 275
Метод наискорейшего спуска. Рассматривая предлагаемый метод, необходимо иметь в виду, что г представляет собой скалярную функцию векторного аргумента Х= ={xi, Xi,. . . , Хп). Ее приближения (или модели), используемые на разных этапах поиска X*, г* и основанные на оценках частных производных первого и высших порядков, позволяют хотя бы формально определять вектор градиента ^f = [-k^ ■£;' ■■■'£) ^ ^'^^^'^ ^^^- ^'' ^ »^- правлении вектора V/ означает возможность получить максимальное (по модулю) приращение z (см. гл. 4). Учитывая, что вектор Vf всегда перпендикулярен поверхности уровня в точке, где он рассматривается, можно представить процесс переходов в следующем виде. Из очередной опорной точки, в которой с помощью пробных экспериментов найдены составляющие V/, делается шаг в направлении ?/. Величина шага определяет новую опорную точку, применительно к которой вся процедура повторяется. В результате образуется ломаная траектория «движения» к точке X* (рис. 10.9, а), воспроизводящая более или менее точно непрерывную «чисто градиентную» траекторию. Главным здесь является вопрос о выборе длины шага. Рассматривая уравнение луча, исходящего из точки Х^ {k=0, 1, 2,. . .) в направлении вектора Vf{Xh) (оно имеет вид Х = ==Xf,+aVf(Xh) iinHXj=Xjh+a{df/dXj)xi^, а>0,/=1, л),и под- п ставляя его в формулу Дгд = 2 {dfldXj)x^{Xj — Xj^ (линей- п пая часть приращения г), получаем Дгд = а S {df/dx,)x.. Легко видеть, что с ростом а, т, е. при «движении» вдоль Т/(Хй),'появляются положительные Az (пусть на достаточно малом шаге, в пределах допустимости линейной оценки Агд). Значит, перемещение вдоль луча имеет смысл до тех пор, пока Z «улучшается» (возрастает или убывает в зави- Рис. 10.9 276
симости от требований задачи). Отсюда следует рекомендация продолжить луч до пересечения с границей области Э (точка Х^), организовать на образовавшемся отрезке [Х^, Xj.] поиск экстремальной точки X любым доступным методом (см. § 10.2) и считать найденную X новой опорной точкой (рис. 10.9, а). Тем самым определяется нужная длина шага. Таким образом, процесс решения задачи сводится здесь к повторениям однотипных простейших операций поиска. Изучаемый метод применим в случаях, когда /(X) унимодальна. Метод Гаусса-Зайделя. В основе метода лежит идея покоординатного поиска (см. гл. 4). Пусть из п переменных Хи- . . , х„ выбрана какая-то одна х^ (1 ^s^n), а значения остальных фиксированы. Тем самым определяется прямая, параллельная одной из координатных осей (оси Xg). Производится поиск вдоль этой прямой (на том ее отрезке, который лежит в пределах области Э), в результате чего становится известной точка экстремума Х^. После этого номер S меняется на р (l^p^n, рфз), )^^ назначается опорной точкой и применительно к ней процедура повторяется. Так продолжается до тех пор, пока не будет найдена X* (?) (рис. 10.9, б). Полезно заметить, что одну и ту же переменную х^ (или Хр) можно проверять более одного раза. К достоинствам изучаемого метода относятся простота и отсутствие локальных исследований окрестностей опорных точек. Недостатком является возможность преждевременной остановки процесса поиска из-за возникновения так называемых гребней. Предположим, что первый шаг привел к отысканию точ. ки Xg. Может случиться, что попытка сделать следующий шаг будет неудачной — какая бы переменная ни выбиралась в качестве свободной на втором шаге, улучшить значение Z не удается, хотя достоверно известно Х^^Х*. Множество точек, из которых невозможно продолжить процедуру Гаусса — Зайделя, называется гребнем. Гребень — не только частная специфическая особенность той или иной функции /(X). Он может возникнуть, например, при повороте координатных осей, его появлению способствует малая разрешающая способность экспериментов, выраженная в задании довольно большого е > О, и т. д. Идея покоординатного поиска, как будет показано ниже, используется частично и в других методах. 277
Метод конфигураций. Пусть Xio=(a;io, -«^го х^^) — точка, из которой начййается поиск JJ^*, г*; а Ajif/> е—• выбранные заранее величины приращений, соответствующих лг/ (/=1, л), Предлагаемая последовательность действий предусматривает поочередные изменения координат J^io с целью получения лучших (по смыслу задачи) значений г. Вначале выбирается переменная Xi и при известном Алг^ оценивается г=г^1 в точке Xti= (xii^-{~ts.xi, Хщ х„^).'^ Результат сравнивается с величиной z=2io, найденной пред-' варительно в точке Х^. Если zJi > ^ю, то совершаете^ переход из Хю в Хц. после чего Xii обозначается как Хц- Если же 2i+i^ 2io, то ATi исследуется при отрицательных Ajfj. Определяется z=zu в точке Xii={xiu—Ajfi, х^о,..,', д;„о). Если Z£i> Zio, то совершается переход из Хю в Хи, обозначаемую как Xii. Если же Zi"i^ гщ, то попытка найти лучшее значение z за счет варьирования xt оказывается неудачной и тогда нужно начинать исследование х^. Здесь роль исходной точки будут выполнять либо Хц, либо Хю, в зависимости от результатов предшествующего шага, связанного с АГ). С целью унификации обозначений удобно всегда использовать символ Хц, даже если речь идет о Хю, т. е. ((•'^1о~Г^-'^1> -^го' •••> Хц^), Хц ]> ZjqJ (•'^10 ^•'^li X^f,, . . ., Jf„o)> ^11 -^ ^10' (XiQ, Jfjo -^no)» 2^ii> 2^11 ^ 2iQ. Оценивается значение 2=2^2 в точке Х^, которая определяется либо координатами (хщ+Ад;, дгао+Ад^аь -»^зо.. . ., Х„й), либо (Хю—Ajfi, Хзо+Аха, ^30,- . • , -»f„o), Либо (Хю, АГао+Ахз, Хзо л;„о)- Оно сравнивается со значением z в Хц. Если г^2> Zu, то совершается переход из Xii в Xit, после чего точка Xt^ обозначается кйк Xia- Если же ^12 ^ •2'п. то АГа получает отрицательное приращение. Рассматривается точка Xj^, заданная аналогично ХА, но со второй координатой х^—-Аха. Величина z^^ сравнивается с Zii. Если Zi~2> Zu, то совершается переход из Хц в Xfa, обозначаемую через Xia. Если же zfj^Zu, то Хи сохраняется в качестве исходной для последующих операций с Хз. Таким образом, результатом исследования Хг оказывается точка ^12 = ' \xt,, 1 Xi2, \Хи, ^12 ^ ^11 i 2l2 i> ^11> 2l2> ^12 ^ ^ll- 278
Предложенная процедура повторяется для Xg, Xi,. ... , х„, что позволяет,получить точки Xig, Хх^,. . . , Xi„. Совокупность точек Хю, Xi„ определяет первую конфигурацию. Ее отыскание завершает первый цикл поиска X*, г*. Чтобы начать второй цикл, необходимо указать новую исходную точку Хао- ЕЙ могла бы стать точка Xi„, однако для ускорения процесса часто применяется следующий прием. Точки Хю и Xi„ соединяются отрезком, и на его продолжении выбирается Хао, причем расстояние между Xi„ и Хао зависит от конкретных условий задачи. После определения Хао все перечисленные выше операции повторяются. В результате отыскивается точка Хг„, образующая с Хао вторую конфигурацию. Затем строится точка Хзо, являющаяся исходной для третьего цикла поиска, и т. д. Ясно, что переход от Х^о к Xh+i, о (k — номер цикла) возможен тогда, когда ХмФ Xk„- Если оказалось Xft„=: =Xfto и, следовательно, Xk+i, o=Xfto, то допустимы два предположения — либо Х^о находится на гребне, либо она представляет собой X* (?). В этих условиях рекомендуется уменьшить \xj, / = 1, л (не нарушая требований i.Xj^ ^е), что позволит «сузить» гребень (в случаях, когда остановка произошла из-за него) и продвинуться дальше в решении задачи. Если подобная операция не приводит к успеху, то поиск можно считать законченным, после чего остается исследовать окрестность точки X* (?) (см. § 10.4). Достоинство рассмотренного метода — в простоте локальных исследований поверхности отклика. Недостатки —• в громоздкости схемы переходов и неполноте информации, получаемой из экспериментов (анализируются только координатные направления). Ниже дан пример применения метода конфигураций. Пример 10.1. Найти значения переменных Xi и Хг, доставляющие минимум функции z=5x?+6xiXa+5x|-j-8xi-|-24xa+32 при выбранных Е=0,05 и Ax/=0,15 (/=1, 2). Решение. Областью эксперимента здесь является вся плоскость Xi, Ха- Исходной точкой можно считать A'id=(0, 0). Для нее Zxi,= 32. Сначала оцениваем z в точке Хи=(0,15; 0). Проведя несложные вычисления, получаем zi\=33,3>Zio, что неприемлемо (рассматривается задача на минимум г). Обращаемся к точке ХГ1=(—0,15; 0). Для нее zri=30,9<Zio, поэтому Xii=Xn, Zii=30,9. Учитывая полученный результат, выбираем Xi"a=(—0,15; 0,15). Здесь Zit=34,5>Zii (точку Xi^ следует отбросить). Величина zra=27,6, вычисленная в точке Xi'^=(—0,15; —0,15), оказывается допустимой, ""'' 279
X -2,7 -2J^ -IS -0,9 Хза •0,J %го У 0,9 0,6 O.J 0 -OJ поскольку- она меньше Zjj, т. е. Х^2=Хй и 2i2=27,6. Очевидно, Xi2 представляет собой в данном случае Xi„ (п=2), и ее получением завершается первый цикл поиска X*, г*. Рассмотрим отрезок, соединяющий Ху) с Xij. На ею продолжении Находится точка X^q. Координаты точек Лjo, Xi^, Х^^ связаны равенствами (1-1-а)х/(12)=ху,20)+а-^/оо). где а — отношение, в котором Xi2 делит отрезок [Х^, Х^о]. Выбирая, например, 0=2, находим Х2о=(—0,45, —0,45) и 220=20,8. Второй цикл решения начинается с проверки точки ^21=(—0,3; —0,45), в которой Рис. 10.10 Z2'i=21,l>Z2o. Затем проверяется Хи = (—0,6; —0,45), где Z2'i=22,8>Z2o:, поэтому X2i=X2o (совершить переход из Х2(^не удалось). Обращаемся к Х^2=(—0,45; —0,3) и получаем zl2=23,5>Z2o. Наконец, в точке Х22=(—0,45; —0,6) появляется удовлетворительное значение Z2'^=20,4<Z2o. Таким образом, X22=''^22. и второй цикл завершен. Точка Хзо строится при том же а=2, т. е. Хзо=(—0,45; —0,9) и Z3o= 14,2. Третья и последующие конфигурации определяются так же, как первые две. В результате формируется траектория «движения» к X*, показанная на рис. 10.10 (последний, восьмой цикл рассчитан при ДХу=0,1). Точка (1; —2,95) принимается за Х*(?). Исследование ее окрестности подтверждает правильность найденного решения. Рассмотренные в этой главе методы могут быть полезны для практики тогда, когда эксперименты позволяют получать точные значения z, что не всегда выполняется. Часто приходится сталкиваться с возмущениями (например, ошибками эксперимента), нарушающими предполагаемую последовательность решения задачи и вносящими коррективы в разрабатываемую модель. Глава П. МОДЕЛИ СО СЛУЧАЙНЫМИ ПАРАМЕТРАМИ Неопределенности, встречающиеся в тех или иных моделях операций, весьма разнообразны. Отсутствие сведений о целевой функции и связанные с этим последствия, обсуждавшиеся в гл. 10, не исчерпывают всей проблемы неполноты моделей. Практика показывает, что предположения, заменяющие собой точную информацию об изучаемом объекте, могут относиться (и формально, и по существу) к любым элементам исследуемых задач — функциям цели как таковым, их отдельным свойствам, ограничениям, погрешностям вычислений и т. п. 280
Своеобразные ситуации возникают в тех случаях, когда какие-то параметры изучаемой модели имеют вероятностную природу. Классическим примером здесь является задача линейного программирования со случайными коэф- п фициентами Cj выражения z = 2 ^/^/- Ее можно решать обычными способами (см. гл. 2), заменяя Cj математическим ожиданием m{Cj) (метод средних оценок), однако этот путь при своей внешней привлекательности приводит к результатам, полезность которых должна проявиться в многократно повторяемых решениях. Аналогичная картина наблюдается и при анализе оптимизационных задач других классов со случайностями, поэтому все разрабатываемые для них методы объединены обш,им названием «стохастическое программирование» (от греческого stochastikos — умеюш,ий верно угадывать). Основные трудности стохастического программирования связаны с тем, что не всегда удается ограничиться понятиями, используемыми в детерминированных моделях, хотя именно такая попытка делается в упоминавшемся методе средних оценок. Приходится разрабатывать специальные приемы поиска решений, предполагаюш,ие сознательное введение элемента случайности в действия исследователя с целью компенсировать исходную неопределенность. С этой точки зрения практический интерес представляют методы стохастической аппроксимации и методы случайного поиска, рассматриваемые ниже. § 11.1. Ошибки эксперимента. Информационный аспект проблемы Обратимся к изучению схем поиска X*, z*, содержаш,их элемент случайности. Для простоты сначала рассмотрим задачи, в которых целевая функция имеет скалярный аргумент (см. § 10.1). Предположим, что эксперименты, проводимые для оценки значений целевой функции z—f{x), содержат ошибки 6j.. Эти ошибки являются случайными и носят аддитивный характер, так что измеренная величина z есть сумма истинного, но неизвестного исследователю значения z^ и указанной бг, т. е. Z—z„+6z. Чтобы учесть присутствие ошибки б^., необходимо располагать теми или иными сведениями о ней, причем полнота этих сведений может меняться в широких пределах, начи- 281
ная от законов совместного распределения ошибок в разных экспериментах и кончая моментами (математическим ожиданием и дисперсией) величины б^ при конкретном х. [, Пусть на интервале [О, 1] выбрана точка х, и требуется получить оценку z„^f{x) в условиях, когда известно лишь математическое ожидание т{8^). Подобная задача возникает при попытке реализовать какую-либо из детерминированных процедур поиска х* путем многократного повторения экспериментов в ;е и использования получаемых z для вычисления среднего г. Зная т(8г), легко находим z^ = =z—т{Ьг). Чем выше требования к точности оценки г„, тем больше затраты средств и времени на получение нужного результата. Вопрос о том, можно ли избежать указанных затрат (или как-то уменьшить их) решается на основе следующих рассуждений. Если в данной точке х проведены Л'^ экспериментов и определены г'**, г'^* г'^, образуюш,ие стати- N стику, то допустимо считать z^ = тг ^1 2'''*- Если бы число «'= 1 экспериментов составило Л'^—1, то оценка z имела бы вид yv-i ^N-i = дттгт ^1 '^'"- сравнивая эти формулы, приходим «•=1 Л^—1- , 1 ,v> к соотношению г^у = —лГ''^л'-i + irr'^ > которое показывает, что величина г'^', являюш,аяся носителем «новой» информации, полученной в последнем по порядку эксперименте, входит в выражение z^ с весовым коэффициентом \IN, убываюш,им с ростом Л'^; величина гд,_1, вычисленная с использованием «старой» информации, содержаш,ейся в г'^*, г'-* 2^л'~^*, входит в гд-с весовым коэффициентом (Л'^—\)IN (он становится практически равным единице при Л'^^З-ьЮ); наибольшей информационной эффективности можно добиться, проводя в каждой точке х только один эксперимент, что означало бы отказ от попыток применить детерминированные процедуры поиска х*, z* в рассматриваемых условиях. При решении оптимизационных задач исследователь обычно не интересуется более или менее точным «восстановлением» вида функции z=f{x). Он стремится сформулировать правила выбора очередных х на основании результатов предшествующих экспериментов, с тем чтобы в конце 282
концов приблизиться к ;с*. Присутствие ошибок б^ приводит к йеобходимостй свкзать выбор каждого нового значения х с предыдущими значениями х и соответствующими z{x). В итоге в этом Новом х будет учтена вся полезная информация, содержащаяся в предшествующих г, и вся ложная информация, обусловленная присутствием б^, однако эта последняя должна разрушаться по мере переходов от Xf^ к Xh+i (/г=1, 2,. . .), если зависимость между разными х выбрана надлежащим образом. Пусть xn+i^'^hixn, Zn) или Xn-^-,=Wn{Xk, г^к+Ьгп)- Очевидно, характер преобразования (алгоритмического отображения) Wh должен влиять на сходимость последовательности значений д:^ (/г=1, 2, . . .) к некоторому пределу х или д:*. Если, например, W^ таково, что Xn+i = '^ih(Xk< 2и*) + ^2ь(бгь), то, зная свойства б^^^, можно удачным выбором Wah уменьшать вероятность отклонений Xft+i от х с ростом k. Таким образом, выбор преобразований Wi^^, W^u (с одновременным уточнением понятия сходимости х^ ^ х при /г->оо) равносилен выбору стратегий поиска л:*, г* в рассматриваемом случае. Особенностью этих стратегий является то, что в каждой точке х проводится только один эксперимент, а фильтрация ошибок происходит за счет умелого сочетания длины шага и свойств случайных величин бг),. Предлагаемая идея лежит в основе методов стохастической аппроксимации. Обратимся к определениям сходимости последовательностей случайных величин. В дальнейшем эти величины обозначаются, как обычно, большими буквами X, R и т. п., а их возможные значения—соответствующими малыми буквами (см. §6.1, 6.2). Последовательность {Х^} сходится по вероятности к некоторому неслучайному пределу х, если для произвольного ^1 > О вероятность события |Xh—л:1^й стремится к нулю при fe-^oo, т. е. lim p{\X„-x\^ii}=^0. Последовательность {Х^} сходится в среди е- квадратическом к неслучайному пределу х, если математическое ожидание квадрата модуля разности Хи—-х стремится к нулю при fe-^oo, т. е. lim т(\Х^~х\^) = 0. 283
Последовательность {Х^}, сходящаяся в среднеквадра- тическом, сходится и по вероятности (обратное положение места не имеет). Пусть Xh+i = Wi^(Xk, z„^) + W^hi^zh)- Из-за случайности 6zfe величина Wih^zk) будет также случайной и может рассматриваться как случайная составляющая Xh+i. Регулярной составляющей Xh+i оказывается Wift(Xfi, г„й). Обозначая для краткости Wi^ через Y^, а Wah — через i?ft, получаем X)i+i=Yf^-\-R^. Это равенство используется в последующем анализе как исходное. Потребуем, чтобы последовательность {Х^} сходилась в среднеквадратическом к х. Формально это означает lim m([Yi^-{- Rjt—л:]^) = 0. Математическое ожидание суммы В квадратных скобках есть (К^—д;)^+2(Кь—л:)т(^?ь) + +m(R\) или (Y^-xr+2(Yn-x)m(Rj,)+mHRj,) + D(Rn) где D (Rk) — дисперсия R^- Для упрощения формул положим m(i?h)=0, и тогда исследуемое условие сходимости принимает вид lim {(Yn—л:)^ + ЩRlг)} = О- Здесь под знаком предела стоит сумма двух существенно положительных величин, и достаточно рассмотреть совместно равенства lim (Y^—ху = 0, lim D (Rfi) = 0. Прежде всего заметим, что алгоритмическое fe ->■ со отображение (преобразование) К^^ необходимо построить так, чтобы одинаково хорошо управлять процессом поиска х в случае, когда точка х^ находится вблизи х (есть опасность «перескочить» через л: при переходе к л:ь+1), и в случае, когда точка Х), находится настолько далеко от х, что нет оснований надеяться достичь х за один шаг. Для первого случая условие lim (F^—л:)^ = О окажет- ft -> 00 ся выполненным, если потребовать, например IF^—^xl^a^.^ где а ft — элемент последовательности неотрицательных действительных чисел, обладающей свойством lim а^ = 0. ft-> 00 Для второго случая этого требования недостаточно, поскольку оно не гарантирует уменьшения расстояний до х при переходах от х^ и л:^+1. Здесь было бы приемлемо неравенство iFf,—ii^Uh—х\—Yft. утверждающее, что регулярная составляющая X^+i отличается от х меньше, чем л:^ 284
(при Ya^O)- Опасность остановки процесса по прошествии некоторого конечного числа шагов исключается введением дополнительного требования 2 Vs = °°- Таким образом, условия сходимости регулярной составляющей процесса приближения к х могут быть даны в обобщенном виде \y,-x\^(l+h)\4-x\-yk> Р,>0, 2Pfe<~, со 2 Vfe= °°- Отсюда следует важный вывод о необходимости знания некоторых свойств функции z„=f(x), без чего формальное оперирование величинами i^h=^ih(A:s, ^ик) становится невозможным. В дальнейшем анализ процедур стохастической аппроксимации позволит конкретизировать вывод. Обратимся теперь к требованию Иш D (7?^) = 0. Оно бу- ft ->■ 00 дет удовлетворено лишь тогда, когда удастся осуществить надлежащий выбор преобразования Wihi^zh), выполняющего роль «фильтра» случайных ошибок (помех) б^. Общим 00 здесь является условие 2 ^(^к) < °°. вводимое в предпо- ложении независимости величин б^^, /г=1, 2,. . . . Таким образом, процесс поиска решений сводится к следующему. По мере проведения экспериментов, в каждом из которых значение г=г„+8^ измеряется лишь один раз, регулярная составляющая К>, величины Xh+i все меньше отличается от некоторого х, а случайная составляющая R^ постепенно исключается сведением ее дисперсии к нулю. Методы, основанные на этих правилах, применяются в различных задачах исследования операций. § 11.2. Методы стохастической аппроксимации. Условия сходимости Возникновение прикладных методов стохастической аппроксимации связано с именами Роббинса и Монро, предложивших схему поиска корня функции в условиях помех. Хотя задача такого рода не является непосредственно оптимизационной, она хорошо иллюстрирует основные положения, сформулированные выше. 285
Т Zu'tif} Процедура роббинса—Монро. Пусть априори известие?, qro г„<0 при х<.х*; г„>0 при х>х*); 2^=0 при х=^х* (рис. 11.1). Ошибки, искажающие результаты определения Z при тех или иных х, отвечают услобиям: 1) математичег Ское ожидание б^^ равно О для любого k; 2) дисперсия бг^ конечна и постоянна при различных k\ 3) величины бг^ {k=\, 2,. . . ) независимы и обладают свойством аддитивности. Предлагается формула переходов^ Xft+i=J*;ft—cik^kt ''Д^ ■^ft — значение zi в точке Xf^, найденное эксперименг, тально, Oft — корректирующий коэффициент. Требуется дать оценку схо-: Рис. 11.1 димости процесса, реализуемого в соответствии с предлагаемой формулой. Поскольку 2ft=z„^+6zft, можно представить Xft+i в виде разности {Xh—anZ,M,)—ak^tk< откуда следует Y,^=Xu—a^z^k, i?ft=—аф^к- Обращаясь к условиям сходимости (см. § 11.1), рассмотрим две группы соотношений, связанных с /?ь и П. Анализ случайной составляющей основывается на пред- полагаемых свойствах величин б^ и равенстве Ru=—^,^6 так что /н (/? ft) =—aftm (6,0=0, D(/?ft)=a|D(6,ft), где D (Szft) — дисперсия ошибки, не зависящая от k. Очевидно, требование lim D {R^ = О переходит в данном случае в k -*■ ел lim а| = 0 и может быть выполнено при аи=с1вк~Р, где Оо— некоторая константа, р ^- показатель степени, принимаю- 00 щий значения от 0,5 и выше. Для р>0,5 имеем 2 0(/?(г)<°°. и проблема фильтрации ошибок решается достаточно просто. Анализ регулярной составляющей проводится в предположении, что некоторые свойства функции z^=f (х) известны. Модуль разности Y)^—х=Хи—а^^и^^—х можно представить как {ak\z„i,\ — \x^—x\, \Xf,—x\<a„\z„;,\, и условие lim (Yfi—xy=0 выполнимо, если как-то оценивается поведение г„^. Пусть, например, для очередногох^ указана нижняя граница значений ^„^1 в виде \Zak\>9h- Это значит, что lY^— 286
—x\<.\Xk—x\—fltftPs (cm. верхнюю строку формулы (11.1))^. Слйгаемое — аф^^ может рассматриваться как поправ1^а — yii (см. § 11.1), если только последовательность {а^ри} обладает свойством 2 ^kPk — °°- Точно так же, допустив \z^ii\^A\Xfi—xl+B, где А и В — некоторьге константы, получаем IF;,,—хКа^ВЧ-(а^^Л—l)\Xk—х\ (см. нижнюю строку формулы 11.1). Начиная с того или иного k, разность ач^А— 1 станет отрицательной (с каждым шагом коэффициент а^ уменьшается), и тогда последнее неравенство сведется к \Yk—xKa^fi. Очевидно, lim 0^6='О и К^ схо- -. • ' ft -»- со ДИТСЯ К X. Таким образом, процедура Роббинса — Монро обеспечивает выполнение сформулированных условий сходимости процесса поиска х, хотя и предъявляет определенные требования к уровню информированности исследователя о свойствах функции г„=/(х). Сказанное выше обобш,ается известной теоремой Дворецкого. пусть {«ft}, {Pft}> {Vft} — последовательности неотрицательных действительных чисел, обладающие свойствами 00 00 lim а ft=0, 2 Pft < °°> 2 Yft = °°"' ^ — действительное чис- Л^оо fe=l *=1 ло, а Fft— преобразование, удовлетворяющие условию |К^— —х|^тах{а^,, (H-ph)Uft—х\—у^} для всех действительных Xk (/г=1, 2. . . .); Xk+i^Vk-'i-Rit, где R^ — такие случайные величины, что m{Rh)=0; в этих предположениях схема Роббинса — Монро обеспечивает сходимость исследуемого процесса в среднеквадра- тическом {и по вероятности} к х. Рассмотрим теперь другой метод стохастической аппроксимации, предназначенный специально для поиска экстремума f{x). Процедура Кифера — Вольфовица. Допустим, что функция z^=f{x) унимодальна (см. § 10.1) и имеет экстремум (максимум) в точке х*. Ошибки, искажающие результаты экспериментов, отвечают введенным выше условиям 1—3. Предлагается формула переходов Xh+i=Xk-\-{ahlC}^x x[z{x^+c^)—z{xj^—cu)], где г{х,,+с^,), г(хл—Сй) —значения Z в точках Xji+Cft и х^—с^ соответственно; а^, с^ — действительные числа. Требуется провести анализ сходимости предлагаемой процедуры. 287
Геометрическая интерпретация рассматриваемых уЙЛо- вий дана на рис. 11.2. Отношение [z(xh+Ch)—г(хи—Сп)У /(2Сй) определяет приближенно тангенс угла 9^ наклона кривой г„=/(д:) в точке д:^. Идея метода заключается а последовательных оценках в^, с целью выбора направления перемещений (для этого на каждом шаге проводятся два эксперимента). Здесь г(д:^±Сь)=2„(д:^±Сь)+бг(л:^±.9^^) , поэтому Анализ случайной составляющей проводится так же, как и ранее. Из выражения R^ и условий 1—3 следует miR^)=0, D(i?,)=2(a,/c,)^D(6,), где 0(бг)—дисперсия ошибки, не зависящая от k. Требование lim D(R^) = 0 удовлетворяется. г»'ПхГ к- если lim (a^/Ct)^=0 или а/^/с^^а^к'Р/с^, ft-»-» «о/^о = const, р ^ 0,5. При р>0,5 имеем 2 D{R^)<oo. В случае необходимо- к=1 сти можно требовать lim а^ = О, lim с^ = О, не нарушая к-* со ft-> со рассматриваемых соотношений. Для анализа регулярной составляющей обозначим разность z„(xk+Ck)—zAxk—Ck) через (—Аг„й), и тогда 7^=- =Х)^—а>,Аг„^/с>,. Следовательно, \Ук-х\ = \x,-x\—^\Az..J;\x,-x\>^\Az. Ск 'akV I £1 Hfth 2^\^z,^\-\x,-x\■,\x,-x\<^\^z,,\. (11.2) Равенства (11.2) по своей структуре не отличаются от (11.1) поэтому замечания, сделанные ранее применительно к (11.1) и касающиеся выполнения условия lim (Yf^—л:) = О ft -> со ' можно отнести к (11.2). Так, положив 1Аг„й|>р^, со (%/с^) р^ = Yft^ 2 Yft==^ (в верхней строке (11.2) и |Аг„^|< ft= I 288
<:A\X)i—x\+B, Л<оо, В<оо (в нижней строке (11.2)), приходим к выводу о достаточности рассматриваемых неравенств для обеспечения сходимости К^, к х. Естественно поставить вопрос: «в каком отношении находятся X и л:*?» Очевидно, ответ может быть один — если сведения, которые нужны для доказательств сходимости, относятся действительно к х*, то х^^х*. Следовательно, начинать поиск решений рассматриваемыми методами имеет смысл тогда, когда о функции }{х) уже что-то известно. § 11.3. Анализ точности решений. Влияние исходных данных Обратим внимание на следующее важное обстоятельство. Теоретически достичь точки л:* можно лишь за бесконечно большое число шагов, причем различными путями (условия сходимости процесса являются слабыми и допускают широкий выбор последовательностей корректирующих коэффициентов). В то же время любая практическая ситуация характеризуется тем, что а) исследователь может провести лишь конечное количество экспериментов (ограничены средства, время, материальные ресурсы); б) для поиска X* обычно используются технические устройства, обладающие ограниченной чувствительностью к изменениям х (начиная с некоторого номера k процесс почти останавливается); в) часто неоднозначность выбора а^, или ajc^^ нежелательна из-за трудностей с составлением программ для ЭВМ, разработкой инструкций и т. д. В подобной обстановке получить точные д:*, г* невозможно, и приходится оценивать погрешности найденных решений. Чтобы оценить точность какого-либо результата, необходимо выбрать соответствующий критерий. Обычно выбор согласуется с характером и содержанием той оптимизационной задачи, которая представляет интерес и изучается исследователем. Вместе с тем существуют критерии достаточно универсальные, применяемые в разных задачах. Рассмотрим разность л:*—Xh+i=Aft+i (здесь и в дальнейшем будем полагать х=х*). Пусть x^+i— последняя точка, определяемая в ходе поиска х* {k>l). В этих условиях величина Ajj+t представляет собой погрешность полученного результата, носящую случайный характер. Ее систематическая составляющая есть х*—У\, а случайной составляющей становится — R;^. 10 Дегтярев Ю. И. 28У
Если выбирать различные последовательности {а^} или {a^/Ch}, т. е. менять скорость сходимости процесса, то можно заметить следующее. Чем меньше эта скорость, тем меньше ожидаемая величина \х*—Yf^\, но больше Rf^ (расширяется возможность приблизить Yfi к X* с одновременным возрастанием опасности случайных «выбросов» точки Xf^+i. Наоборот, увеличение скорости сходимости способствует более интенсивному подавлению помехи б^, но затрудняет приближение F^ к х*. Таким образом, закономерности поведения составляю- ш,их Ah+i в рассмотренной ситуации противоположны. Меняя характер сходимости процесса, можно лишь менять соотношение между указанными составляющими, стремясь сделать это соотношение наиболее приемлемым. Этим нужно руководствоваться при выборе критерия оценки получаемых результатов. Одним из наиболее распространенных является критерий вида Kj^=(x*—Y^)'+a^R^), где a^R„)=DiR^). Для краткости его часто называют «сумма квадратов случайной и систематической ошибок». Требование минимизации Kh равносильно требованию найти разумное сочетание величин X*—Y,^, D(Ri;) и определить тем самым оптимальную последовательность корректирующих коэффициентов. Теперь можно сформулировать задачу: для известного числа экспериментов Л^, находящихся в распоряжении исследователя, и известных условий сходимости методов стохастической аппроксимации выбрать параметры принятой схемы так, чтобы исключить опасность появления слишком больших значений Kh- Поставленную задачу можно решить тогда, когда есть какая-то информация о свойствах функции z^=f{x) (см. § 11.1). Дать эту информацию могут, в частности, те или иные гипотезы, принимаемые и используемые исследователем. С указанной точки зрения ниже рассматриваются процедуры Роббинса — Монро и Кифера — Вольфовица. § 11.4. Стохастическая аппроксимация при оптимальных характеристиках процесса. Роль гипотез Определение оптимальных последовательностей корректирующих коэффициентов ставит перед исследователем самостоятельные задачи, поскольку соответствующие результаты во многом зависят от предполагаемых свойств функции г„=/(л:) и особенностей применяемой схемы поиска л:*. 290
процедура Робби нса — Монро. Пусть известно, что ги принадлежит классу линейных функций, т. е. г„=Лл;+В. Следовательно, истинное значение корня есть х*=—В/А. Поскольку Yji=x^—af^Zgfi и fy^{Rk)=ala^{8^), выражение критерия принимает вид /Cft={ah—l/A)^{Ax)^-\-B)^+ala^{bi) (индекс к в обозначении 6^ здесь опущен, чтобы не загромождать последующие формулы). Стремясь достичь min/C^, будем выбирать а^ из условия dK/daf,=2{af,—l/A){Ax^+B)^+2akaH8,)=0. Тогда 1 "ft opt - л {14- а? фг)/{Ах^ + Bf}' ^ft min = д {1 ^ „2 (6,)/1ах^ + В)Ц • ^^^-^^ Анализ формул (П.З) позволяет сделать следующие выводы: каким бы ни был уровень помех при данном значении k, знание класса функций, к которому принадлежит г„=/(л;), оказывается недостаточным для вычисления значений Kkmia< нужно, по крайней мере, знать величину А и быть уверенным в том, что отношение а^(82)/(Ахи+В)^ меняется должным образом с изменениями к (см. требования сходимости, §11.2); наилучший результат поиска (точное решение задачи) достигается при ст(6г)=0 и aj,opt = l'M=const; здесь/Cftmin= =0; наихудший результат поиска получается при 0(62)^-00; здесь первое же значение а^ „pt обращается в нуль, и поиска как такового не будет; Kkmin оценивается как квадрат расстояния между х* и исходной точкой Хи при любой конечной дисперсии (0<;б^<;оо) вопрос о величинах Oft opt «и ^ftmin должен решаться лишь на основе каких-то дополнительных сведений о величине В. Чтобы конкретизировать последний вывод, рассмотрим пример. Очевидно, точное знание В сняло бы задачу поиска в целом,так как приданном А легко вычисляется х*=—В/А. Для начала будем считать значение А известным и отличным от нуля, величину 0(8^) — равной единице и B^j^^B^ <Bmax (Втт, ^В„ах заданы). Нужно найти корректирующий коэффициент для точки X]i={Bmi^ + В„^^)/{2А), полученной на очередном шаге (рис. 11.3, а). Без потери общности можно положить k=l и рассматривать Xf^ как исходную точку поиска. Тогда Axi-{-B=B—В, где В=(Вшт + 5„ах)/2 И а,,,^^{А11 + 1/(В-В^Ц-^ 10* 291
На рис. 11.3, б показан график зависимости a^^opt от -^i роль которого должна возрастать с уменьшением неопределенности в оценке возможных В. Обратимся к выражению критерия K/i, имеющему здесь вид Ki={ai—1/А)^{В—ВУ+а1. Очевидно, при любом постоянном Ui значение Ki растет с увеличением модуля разности В—В тем быстрее, чем больше коэффициент (ai—1/Л). Следовательно, нужно выбирать Ui как можно ближе к 1/Л, ослабляя тем самым влияние неопределенности выбора В S) iXl'H ■т I '^к not на /Ci. В рассматриваемом примере предпочтительным значением ai оказывается а1=Л~Ч1+4/(Лп,ах—-^тш)^]"'- С его помощью вычисляется х,, после чего рассматриваемые действия повторяются с той лишь разницей, что при оценке значений аг придется учитывать требование сходимости процесса, т. е. полагать аг < ai. Сделанные замечания связаны с конкретными условиями примера. Получение новых данных может многое изменить, поэтому соотношения (11.3) должны анализироваться в каждом случае с учетом той информации, которой располагает исследователь. Процедура Кифера — Вольфовица. Пусть известен вид функции f{x) и объективно существует экстремальная точка X*, которую предстоит найти. Обозначим через (о^ разность г^{Хи-\-с,^)—z^{xu—с^), так что X*—Y^=x*—х^—a^^tajcu. Критерий эффективности поиска остается прежним, т.е. Кп—{х*—x^Y— -2a,o),ax*-Xft)/Cft+(aft/c,)4o)| + 20^(6,)]. Чтобы определить оптимальные в смысле минимума К последовательности {а^), {с,^), рассмотрим систему уравнений дК^да^=0; dKh/dCk=0, которая в данном случае 292
ивлеет вид а^ ((о| + 2а^)/с|—(Ой (,х*—х^) [с^^ 0; (Oft (X*—х^)1с^—щ^ (X*—Xft) + a^^^Jc^ — (11.4) Суммируя строки системы (11.4), получаем а^ю^ау'сJci^— —м^^(л;*—Xj) = О, откуда следует либо 0^(0^/^^—(л:*— —л;ь)=0, либо щ — 0. Первое условие невыполнимо по той причине, что его подстановка в верхнее уравнение (11.4) приводит либо к X*—Xfe=0, либо к 0^=0, а это противоречит смыслу задачи. Остается ю^ =0, в связи с чем возникают два предположения: 1) существует единственное значение Сь = =^ftopt. удовлетворяющее рассматриваемому равенству; 2) свойства /(л:) таковы, что не позволяют осуществить выбор Cft opt с использованием условия col = 0. В первом случае с помощью (11.4) отыскивается c^opt и тогда адор4 = = о)ь(х*—Xfe)Cftop/(o)|-t-o2). Во втором случае приходится выбирать С;, opt из каких-то дополнительных соображений, а для оценки a^opt использовать только верхнюю строку (11.4), что, однако, не меняет результата. Таким образом, coЛl+^a>Ю = '^*"""" col l+2aVco^ Выводы, которые следуют из анализа формул (11.5), повторяют сказанное выше, а именно: знание лишь класса функций, которому принадлежит /(х), оказывается недостаточным для определения оптимальной последовательности {а^/с^}; точность получаемых решений тем выше, чем меньше o2(6z), и наоборот; в предельных случаях (а==0 и o=cxd) оказывается /Cftmin=0> «а opt=(^*—^ь)Саор/«й и Kumi^^ = {х*—Xft)^ aftopt=0 соответственно; при любой конечной дисперсии 0<;o'^<;cxd ответ на вопрос об оптимальных а^/с,^, Ки можно получиъ лишь на основе дополнительных исследований свойств f{x). Рассмотренные формулы, относящиеся к процедурам стохастической аппроксимации, были даны в предположении m(/?fc)=0. Отказ от этого предположения осложняет формальный анализ прикладных проблем и в ряде случаев делает проблематичным использование результатов теории. Конкретные расчеты, которые приходится проводить в ходе решения задач, отражены в примере. 293
пример 11.1. Найти точку экстремума функции Za=f{x), если известно, что f(x)=ax^-\-bx-]-c; а=3/4; —10<:6<5, а результаты экспериментов содержат случайные погрешности с характеристиками /«(б^)™ =0; D (бг)=0,5. Решение. Поскольку на величины х не наложены ограничения, можно определять х*, используя условие df/dx—2ax-\-b—0, т. е. исследовать задачу об отыскании корня функции г„=Лл:+В, причем А=1,5 и Bg[—10, 5]. Имеет смысл применить процедуру Роббинса — Монро 6 оценкой точности результатов по критерию Kf- (см. §§ 11.3; 11.4). Пусть в качестве исходной взята точка л:о=0, и в ней получено случайное значение го=—4. Чтобы вычислить л;1=л:о—uqZ, нужно выбрать а^ из возможных 1-1 1 1 (Ахо + В) Г= 3[1+1/(4В2)]- График зависимости а„ от В приведен на рис. 11,4 а (он играет вспомогательную роль вследствие неоднозначности В). Обращаясь к равенству о о apt а opt Ко=(ао—1/А)ЦАхо+В^+с&а^=(аа—2/3}^В^+а1/4, замечаем, что наименьшее влияние В на Ко достигается при aoWlM, следовательно 0^=0,65 (рис. 11.4, а) и л:1=2,6. Пусть эксперимент, проведенный в точке Xi=2,&, дал значение Zi= 1. Анализируются формулы '1 ai = {Ахг + В)^ JM[ ^1= ai-X (Ач+ВГ + аУ ai- 4 (3,9+В)2 3 ]"' (3,9+В)2- ai после чего ситуация с выбором оптимального корректирующего коэффициента % повторяется. Нужно приблизить % к \1 А, ослабив зависимость Ki от В. Учитывая требование ai<ao, полагаем ai=0,6, и тогда Х^—-Х\—fltjZj=z. Пусть в точке х^ получено z^=—0,5 (случайное значение). Из анализа формул ^2 -Т['+4(3+В)Ч =^^ -^ (3 -BY+i следует 02=0,55 (а2<%) и х^=^Х2—02^2=2,28. Если продолжить поиск X* по рассмотренным правилам, получая г^при условии а^ (бг)=0,5, то можно прийти к заключению о целесообразности пересмотра гипотезы —10<В<5, Истинное значение В вряд 294
ли близко к —10 или 5. Скорее всего оно находится в интервале t—5, Ij (на это указывают оценки а), и имеет смысл перейти к новой гипотезе, например, —5<:В<3. Пусть в качестве очередного х^ оставлено д:з=2,28, а 2з=—0,55. Это значит, что аз =—j= j ^ и вспомогательный график становится иным (рис. 11.4,6). Здесь можно взять аз=0,5 и найти л;4=2,55. Очевидно, стандартные переходы с уменьшающимися % должны повторяться до тех пор, пока не закончатся все Л^ экспериментов. Последнее из появившихся значений Kk определит погрешность результата (в данном примере после 10 шагов оказывается х*=—2,4; ^Cmln=0,06). Полезно заметить, что выбранная последовательность корректирующих коэффициентов а^ не является строго оптимальной. Величина, на которую уменьшался коэффициент aft+i по сравнению с а^, сохранялась постоянной, равной приблизительно 1/(10Л), Это правило удобно использовать тогда, когда исходная гипотеза об ожидаемых В остается неизменной. В противном случае более перспективной считается такая последовательность {а^}, в которой величины а^ остаются постоянными до очередной переоценки гипотезы, после чего назначается новое (уменьшенное) значение aj^ и т. д. Случайность параметров той или иной модели может быть обусловлена не только ошибками эксперимента, возникающими под влиянием «внешней среды». Часто неопределенность обстановки, в которой осуществляется поиск решений, требует специальных мер по сбору необходимой информации, и не всегда эти меры носят детерминированный характер. § 11.5. Методы случайного поиска Сознательное введение элемента случайности в действия исследователя вызывается как внешними помехами, так и недостаточным знанием особенностей целевой функции (поверхности отклика). Это приобретает решающее значение тогда, когда f{X) является полимодальной функцией со многими локальными экстремумами, и использование только детерминированных методов (например, градиентных) не приводит к получению X*, г*. Таким образом, не следует однозначно связывать проблемы случайного поиска с ошибками эксперимента. Случайный поиск можно осуществить и тогда, когда ошибки есть, и тогда, когда их нет. Общая схема решения задач сводится здесь к многократному последовательному повторению трех основных операций. Это — сбор данных о поверхности отклика в окре- 296
стности очередной опорной точки Х^ {k=l, 2,. . . .), переход в новую опорную точку и корректирование сведений об особенностях f(X) (самообучение поисковой системы). Характерная черта рассматриваемой схемы — предоставление исследователю права вводить случайности в процесс поиска X*, Z*. В качестве примера можно привести так называемый слепой поиск, идея и содержание которого заключаются в следующем. Существуют некоторые представления о том, где в области эксперимента находится точка X*. В простейшем варианте эти представления формулируются как «X* распределена по закону равной вероятности». В обычном порядке (см. § 10.4) назначается Хо (это дает и г»), а затем в соответствии с представлениями об X* имитируется случайный выбор Xi (здесь можно использовать механизм статистических испытаний, см. § 6.9). В найденной точке Xi оценивается значение zt и сравнивается с Zo- Если оказалось, что 2i «лучше», чем Zo, то совершается переход в Xi (в противном случае приходится повторять операцию выбора Xi). Применительно к Xi все происходит аналогично, в результате чего появляется Х^ и т. д. Рассматриваемый алгоритм определяется, таким образом, соотношениями X ^1 ^f-h Ч-i «лучше» 2^; " \ Х^, 2^ «лучше» 2^_1. Его эффективность будет тем выше, чем полнее учитываются изменения, возникающие в результате экспериментов. Другой пример случайного поиска связан с попытками использовать какой-либо детерминированный метод в сочетании со случайными начальными условиями. Пусть каким- то образом организован переход из Хо в ближайшую точку Х° локального экстремума целевой функции (например, по траектории наискорейшего спуска). По достижении X" процесс останавливается. Чтобы его продолжить, проводится случайный выбор новой исходной точки подобно тому, как это делалось при слепом поиске. Затем опять следует этап упорядоченных переходов в точку локального экстремума и т. д. В итоге возникает разрывная траектория, приближающаяся к точке X*. Общие идеи, лежащие в основе случайного поиска, применяются и в более сложных методах решения оптимизационных задач. Метод парных проб. Рассмотрим исходную точку Х„ и единичный вектор г, связанный с ней (рис. П.5, а). 296
Будем считать направление г случайным, распределенным, например, по.закону равной вероятности. Пусть Хю и Хго — точки, определяемые соотношениями Xio=Xo+ar, Х2о=Хо—аг, где а — положительный параметр (расстояние от Хо до Хю и Х^о)- Предлагается следующий алгоритм поиска экстремума: оцениваются значения 2io=/(Xio); 220=/(X20) и вводится функция Г 1 /№о)>/(^2о); sgn{/(Xi„)-/(Xg}={ о /(Xi„)=/(X^„); 1-1 /(^1о)</(^2о); отыскивается точка Xi=Xo+a„,sgn{/(Xio)—/(Х20)}, где Ощ > О выбираемая величина шага; й'г Рис. II.5 совершается переход из Хо в Xi, после чего пересматривается гипотеза о характере распределения вектора г, который должен быть теперь связан с Х^; новое (апостериорное) распределение г должно, вообще говоря, отличаться от равновероятного (принятого для Хо); в соответствии с новым распределением выбирается (случайным образом) направление г в точке Xf, строятся точки Xii=Xi+ar; X2i=Xi—ar, и все рассмотренные операции повторяются; в результате удается найти одну из возможных реализаций траектории случайного поиска, показанную условно на рис. П.5, б. Метод парных проб допускает различные модификации, многие из которых оказываются статистическими аналогами известных детерминированных методов. Например, можно требовать, чтобы направление г всегда совпадало с одним из координатных направлений, номер / которого есть случайная дискретная величина, распределенная в интервале [1, п] (аналог метода Гаусса — Зайделя). Точно так же, получая статистические оценки вектора градиента в той или иной точке Xfe и отождествляя их с г, легко построить аналог метода наискорейшего спуска (здесь реализуется идея так называемого стохастического квазиградиента). 297
Подобные соображения могут лечь в основу синтеза обобщенных стохастических процедур поиска X*, г*, объединяющих отдельные классы существующих методов и алгоритмов. Именно с этой точки зрения необходимо развитие теории случайного поиска, предлагающей средства анализа и оптимизации сложных многопараметрических систем. Глава 12. НЕФОРМАЛЬНЫЕ МЕТОДЫ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ Исследование операций, как правило, основывается на предпосылках, позволяющих представить изучаемые процессы и явления в упрощенном виде. Это дает возможность сосредоточить внимание на главном, отвлечься от второстепенных деталей и получить приемлемые по точности решения, рассчитанные на определенные периоды времени. Такой подход хорошо зарекомендовал себя на практике и привел к разработке ряда моделей, рассмотренных, в частности, в предыдущих главах. Их характерными признаками являлись относительная простота моделируемых объектов, однозначность решений и знание областей применимости результатов. Между тем в отдельных случаях бывает трудно, а иногда просто невозможно построить компактную модель, отражающую достаточно полно организацию и особенности поведения реальных систем. Причинами этого могут быть и сложность исследуемых структур, и малая изученность связей между элементами той или иной системы. В итоге чрезмерное упрощение реальности с целью «приспособить» к ней известные математические модели может исказить суть поставленных задач и в конце концов привести к неверным решениям. В подобных ситуациях на помощь исследователю приходит не только вычислительная техника, но и интуиция, накопленный опыт, умение сформулировать идею будущего алгоритма. Усложненные методы заменяютя более удобными программами вычислений, выбираемыми на основе «здравого смысла», т. е. имеющими лишь подсознательное («внутреннее») обоснование, не поддающееся формальному анализу. Получаемые при этом решения иногда оказываются эффективнее решений, вытекающих из строгих, достаточно сложных, но в чем-то идеализированных моделей. Становится необходимой разработка таких приемов исследования, которые приспособлены в каждом конкретном случае к изучаемой задаче, мало подвержены влиянию ее сложности 298
или неполноты исходных данных, но вместе с тем обладают известной гибкостью, обеспечивающей возможность широкого применения на практике (прежде всего в сочетании с ЭВМ). Этим требованиям удовлетворяют так называемые эвристические методы поиска решений, формируемые человеком в процессе его исследовательской деятельности (см. гл. 1). § 12.1. Эвристические решения. Специфика подхода к изучаемым проблемам Характерной особенностью эвристического подхода к изучению многих прикладных проблем является отказ от попыток построить специальные доказательства существования искомых решений, их единственности, общности и и т. п. Главная причина этого заключена в объективных трудностях, с которыми сталкивается исследователь, а не в стремлении облегчить свою работу. Не случайно поэтому разработка эвристических методов требует поиска взаимосвязанных компонент будущего решения, сбора недостающей информации, многократного корректирования результатов. Важно подчеркнуть, что по мере расширения знаний многие эвристические методы формализуются, приобретают научную строгость и переходят в класс точных методов. Многочисленные примеры этого можно найти в истории развития науки (выработанные практикой способы идентификации веществ и методы современной химии, эмпирика в задачах перебора вариантов и комбинаторный анализ, интуитивные приемы смешивания стратегий в играх и теоретико-игровой подход к проблеме оптимального поведения). Вместе с тем вряд ли следует ожидать в будущем полного вытеснения эвристик «чистой математикой». Это практически исключено хотя бы потому, что совершенствование технических, экономических, социальных систем выдвигает новые, более сложные проблемы теоретического и прикладного характера, к решению которых нужно приступать еще до того, как сформируется формальный аппарат исследований. Возникающее противоречие между потребностями общественного развития и возможностями «математического обеспечения» запросов практики приводит к возрастанию роли эвристических методов. Существуют и другие трудности, препятствующие иногда выбору подходящей модели изучаемого явления, а также 299
средств ее анализа. Речь идет об объективной «технической» неразрешимости ряда задач комбинаторного характера даже тогда, когда есть уверенность в существовании решений (см. § 4.7), или задач, связанных с логикой поведения в каких-то ситуациях (см. § 9.2). Все это непосредственно влияет на деятельность сложных систем, и, возможно, объясняет специфику применяемых методов управления. Признавая важность эвристических приемов исследования прикладных проблем, полезно попытаться раскрыть механизмы синтеза результатов и оценки их приемлемости. Наблюдения показывают, что в большинстве случаев начальный этап решения выбранной задачи состоит в поиске образа изучаемого объекта со всеми характерными его признаками (структурными, функциональными, логическими). Затем происходит содержательная обработка накопленной таким путем и упорядоченной информации, иду- ш,ая зачастую по непознанным до конца законам (программам), отражаюш,им возможности исследователя. В итоге появляется новая информация — предлагаемый алгоритм численного решения задачи (или уже готовое решение), его обоснование в виде доводов «за» и «против», рекомендуемые варианты использования, сопутствуюш,ие ориентировочные оценки и т. п. Конечно, рассматриваемая схема формирования эвристик весьма приближенно описывает реальные процессы принятия решений в различных сферах деятельности, начиная с разработки конкретных алгоритмов и кончая выбором стратегий в сложных операциях. Полезность этой схемы определяется тем, что она указывает на необходимость анализа информационных аспектов таких явлений, как восприятие, распознавание, абстрагирование, интерпретация. Кроме того, она позволяет сформулировать два обш,их требования, которые должны быть выполнены в любом случае: 1) выявить основные, существенные признаки и свойства изучаемого объекта, а также представить (закодировать) их в образах, позволяющих осмыслить, т. е. обработать на содержательном уровне, имеющиеся данные; 2) облечь в определенную форму результаты проведенных преобразований информации и реализовать их в соответствующих действиях. Сказанное выше дает основу для построения гипотез, объясняющих различия между строгими и эвристическими алгоритмами. Эти гипотезы затрагивают и организац^по вычислений в широком смысле слова, и характер получае- 300
Mbix результатов, что особенно важно для исследователя операций. Будем исходить из известного определения алгоритма как процесса последовательного построения величин, идущего в дискретном времени таким образом, что в начальный момент задается исходная конечная система величин, а в каждый последующий момент получается по определенному закону (программе) новая система величин [1]. В этом определении отражены свойства, которыми должен обладать точный алгоритм, а именно — единство поставленной цели, направленность процесса приближения к конечному результату, строгая определенность и неизменность закона (программы) преобразований каждой предыдущей системы величин в последующую, единственность (однозначность) промежуточных результатов, относительная простота (элементарность) шагов, составляющих рассматриваемый процесс. Можно утверждать, что различия между строгими алгоритмами и эвристическими процедурами заключаются в частичном или полном отсутствии у последних указанных выше особенностей. Так, в ходе формирования некоторого результата эвристическим путем может образоваться не одна, а несколько систем величин, получаемых не по одному, а по нескольким законам. Источником многозначности промежуточных результатов является поисковый характер эвристического процесса, допускающего изменение первоначальных целевых установок, переоценку того, что сделано и т. д. Это объясняется тем, что используемые человеком правила и законы берут начало в повседневном опыте, обобщении эмпирических данных, подмеченных аналогиях. Следует подчеркнуть одно важное обстоятельство. Выше речь шла о самом процессе эвристического «конструирования», а не о его конечном продукте, и термин «эвристический алгоритм» нужно понимать именно в этом смысле. Наглядным примером может служить поиск решений какой- либо сложной задачи в режиме диалога с ЭВМ, обладающей развитым математическим обеспечением, которое подкрепляется знаниями и интуицией исследователя. Что же касается распространенного на практике толкования указанного термина, то оно обычно подразумевает уже полученный алгоритм как итог эвристической деятельности. Таким образом, существенное различие эвристического и научно обоснованного подхода к той или иной проблеме заключается в степени определенности предлагаемых путей 301
исследования. Если искомое решение существует, то строгий метод всегда найдет его, а эвристический, вообще говоря, лишь приблизится к нему, но во многих случаях это приближение не может быть ничем заменено. Чтобы конкретизировать сделанные замечания, рассмотрим ситуации, возникающие в производственной системе, обслуживаемой транспортным роботом. Несмотря на простоту исходных условий, разработать точные (строгие) методы решения изучаемой задачи не удается. § 12.2. Модель управления транспортным роботом. Организация производственного процесса В предыдущих главах (см. § 4.6, 6.4) было замечено, что многие вопросы организации производства могут исследоваться в рамках различных вариантов задачи о мультипроцессоре. Это облегчает построение вычислительных схем, делает удобной интерпретацию получаемых результатов, хотя и не освобождает от необходимости многочисленных расчетов. В последнее время многое делается для повышения уровня автоматизации производственных процессов, и одно из главных мест в этой проблеме отводится роботам. Среди разнообразных функций, возлагаемых на роботы, простейшей (по содержанию) является транспортная. Выполняя ее, робот превращается в транспортное средство, работающее по определенной программе и связанное с обслуживаемой им системой не только физически, но и информационно. Одно из последствий роботизации производства выражено в необходимости изменений в планировании, которое должно учитывать новые технические возможности, вытекающие из самого факта присутствия робота в системе. Именно с этой точки зрения рассматривается здесь вопрос об управлении операциями транспортировки, согласуемыми с заданным ритмом производства. Можно по-разному формулировать задачу составления календарных планов для мультипроцессора, взаимодействующего с транспортным роботом, который перемещается от одной линии к другой, несет необходимые технологические принадлежности (например, заготовки будущих деталей, инструмент, приспособления, вспомогательные материалы) и создает тем самым предпосылки для начала запланированных работ. Во-первых, есть все основания требовать оптимизации плана при известном законе движения робота, выбираемом заранее. Во-вторых, можно считать 302
Скпад Рис. 12.1 1-я линия 2-я линия L-я линия \ план заданным в результате каких-то предварительных исследований, и применительно к нему составлять оптимальную программу транспортного обеспечения мультипроцессорной системы. В-третьих, допустимо анализировать поставленные вопросы р комплексе, сводя их решение к поискам наилучших вариантов организации всего технологического цикла [21]. Нетрудно видеть, что первые два подхода к задаче содержат традиционные компоненты — целевую установку и ограничивающие условия. Третий подход приводит, вообще говоря, к многокрите- риальности со всеми вытекающими отсюда последствиями (см. гл. 1). Можно ожидать, что наиболее эффективным окажется эвристический путь решения рассматриваемых задач. На это указывают и трудности формального анализа календарных планов, и отсутствие простых зависимостей между параметрами технологических процессов с участием роботов, и имеющиеся представления о сложности задач дискретной оптимизации (см. § 4.7). В качестве примера можно привести одну из моделей программного управления транспортным роботом, обслужи^ вающим некоторую производственную систему, представ- ленную в виде мультипроцессора. Обслуживание заключается в том, что робот доставляет очередную «заготовку» или «полуфабрикат» с центрального склада на ту или иную технологическую линию, затем возвращается назад, и цикл повторяется снова применительно к той же или другой линии (рис. 12.1). Пусть оптимальный календарный план П* загрузки мультипроцессора сЛГ работами составлен заранее и не учитывает присутствия робота (см. § 4.6). Попытка реализовать этот план сталкивается с трудностями, так как ни одна работа не может начаться до тех пор, пока со склада не поступит соответствующая «заготовка». Следовательно, система оказывается зависимой от возможностей транспортного обеспечения. Ее главный показатель — минимальное полное время занятости [Т^., см. рис. 4.4, 4.5) — становится функцией таких технических характеристик робота, как инерционность (или продолжительность т цикла обслуживания) и грузоподъемность (или способность нести несколь- 303
ко I «заготовок»), причем вид этой функции и способы ее задания вряд ли могут быть легко определены. Ясно только, что ухудшение указанных характеристик должно приводить к росту Т^, т. е. снижать быстродействие системы. Точно такой же эффект имел бы место при уменьшении числа каналов L мультипроцессора, поэтому можно оценивать потери от неудачного выбора параметров обслуживании, оперируя либо единицами Т^, либо единицами L. Таким образом, возникает задача — найти программу перемещений робота, обеспечивающую минимум непроизводительных потерь времени ДГ,, при заданном плане П* и известных т, I,. Целевую функцию А Т^ нельзя выразить здесь аналитически, ее значения для тех или иных т, Ъ, вычисляются путем перебора вариантов программного управления роботом, и это неизбежно связано с эвристиками. Пусть 1=1, т. е. робот в течение одного цикла обслуживания занят обеспечением только одной работы из тех, которые могли бы начаться в данный момент. Пусть далее х не зависит ни от номера линии, куда направляется очередная «заготовка», ни от номера работы, которую предстоит выполнить. В этих условиях удается сравнительно легко построить эвристические алгоритмы, позволяющие получить приемлемые решения поставленной задачи. В частности, имеет смысл придерживаться принципа «в системе не должно быть отстающих работ». Он требует такой последовательности перемещений робота, которая обеспечила бы как можно более равномерное выполнение операций на всех линиях. Важно подчеркнуть, что никаких доказательств здесь не приводится, принцип формулируется интуитивно, на основе опыта исследования тех или иных вариантов задачи о мультипроцессоре, где идея равномерной загрузки линий находит более строгое подтверждение (см. §4.6, 6.4). С помощью мап1инного эксперимента удается показать, что алгоритм, удовлетворяющий названным выше условиям, успешно работает, если утг,г<т, где х^,; — продолжительность у-й (по порядку) операции на /-Й линии (1<:/<:L). В противном случае (некоторые Xyi меньше х) потери времени, вызванные инерционностью робота, настолько возрастают, что производительность L-канального мультипроцессора падает до уровня производигельности одного канала. Другими словами, L—1 линий начинают работать вхолостую, их присутвие в системе становится бесполезным. Очевидно, речь идет о трудностях, которые просто не учитывались ранее (см. § 4.6,!, поэтому получаемые выводы отнюдь не свидетельствуют об опас1юсти роботизации производства, а лишь подтверждают необходндшсть специальных исследований, выявляющих степень влияния разрабатываемых и внедряемых робототехнических систем на конкретные технологические процессы. Подобные исследования помогут оценить перспективность тех или иных разработок, возможность их унификации, способность адаптироваться к меняющейся производственной обстановке и т. д. Из проведенного анализа следуют некоторые выводы. Во-первых, есть всеосноваяия предполагать, что трудности 304
развития теории оптимального планирования роботизированных производств окажутся весьма серьезными. Во-вторых, следует, по-видимому, сосредоточить усилия на разработке эвристических алгоритмов решения рассматриваемых задач и анализа эффективности получаемых результатов статистическими методами (см. § 6.9). Эвристический подход используется и для изучения ряда научно-технических проблем, специфика которых исключает применение точных аналитических методов. К числу таких проблем относятся, в частности, проблемы организации деловых игр и прогнозирования с присущими им неопределенностями. § 12.3. Деловые игры. Истоки, содержание, порядок подготовки Разнообразие форм эвристической деятельности проявляется в так называемых деловых играх как средстве имитации действий оперирующей стороны, стремящейся к достижению поставленной цели. Истоки, методология, сфера применения деловых игр тесно связаны с проблемами экономического характера, среди которых важнейшее место занимает подготовка управленческих решений. Основными составляющими любой деловой игры являются ее участники (представители оперирующих сторон), правила их поведения, определяющие круг допустимых решений, компромиссов, мер ответственности, и информация о текущих и возможных состояниях моделируемой операции, наличных ресурсах, организационных (структурных) особенностях систем, в интересах которых проводится игра. Информационный аспект приобретает здесь первостепенное значение, поскольку речь идет о попытках воспроизвести те или иные процессы на смысловом уровне и оценить (желательно количественно) последствия соответствующих решений. Этим деловая игра отличается от натурного эксперимента, неизбежно связанного с осуществлением изучаемого процесса в реальном времени. В игре становится возможным, с одной стороны, многократно создавать различные ситуации независимо от момента их возникновения на практике и, с другой стороны, варьировать решения получаемых задач с целью поиска наилучших результатов, приобретения опыта управления, контроля профессионального уровня и т. п. Естественно, все это должно происходить в строгом соответствии с теми кригериями оценки дея- ■2 Дегтярев Ю. И. 305
тельности оперирующих сторон, которые приняты в исследуемой операции. Несмотря на широкие возможности использования дёЛо- вых игр, наиболее распространены учебные игры и игры, проводимые в исследовательских целях. Повторяемость ситуаций, интенсивный обмен информацией между участниками, аргументация принимаемых решений, работа в условиях неопределенности, развитие принципов коллегиальности и другие подобные атрибуты игрового процесса позволяют не только приобретать знания, навыки, опыт, но и совершенствовать принципы хозяйствования, разрабатывать организационные структуры, уточнять системы планово-экономических показателей. Таким образом, каждую деловую игру можно рассматривать как специально организуемый сложный процесс, реализующий одновременно идеи имитационного моделирования, системного подхода к изучаемым явлениям, эвристического конструирования алгоритмов, проблемного обучения, стимулирования творческой активности работников сферы управления. Разработка деловой игры распадается на ряд стандартных этапов, поэтому можно утверждать, что существует достаточно общая схема подготовки игр различного назначения. Она во многом повторяет выработанные практикой приемы проектирования сложных систем. В результате происходит следующее: возникает замысел будущей игры, и для его реализации создается коллектив разработчиков, состоящий из специалистов, способных детально и разносторонне рассмотреть объект моделирования, сформулировать задачи, наметить пути их решения; определяются (по возможности полно) объект моделирования и круг исследуемых проблем, оцениваются их сложность и перспективы получения практических рекомендаций; уточняются назначение и цели подготавливаемой игры, масштабы ее использования в будущем, предполагаемая продолжительность разработки; выявляются составы участников игры, взаимоотношения между ними, выполняемые ими функции, а также характер принимаемых решений; определяются активные средства (ресурсы), которыми располагают участники, и общие ограничения, налагаемые на способы использования этих средств (стратегии); выделяются действующие факторы проводимой операции 306
и представляющие их параметры, проводится их классификация, устанавливаются связи между ними, анализируются способы их учета в модели; формулируются правила игры, определяющие поведение ее участников, порядок «ходов», формы и размеры «штрафов» (платежей), возможные компромиссы и т. п., а также процедурные моменты (например, график ведения игры, контроль результатов); разрабатываются и утверждаются способы представления данных о состояниях проводимой игры (документы, протоколы, изображения на экранах, числовые таблицы и т. п.), формируется вся учетная документация; уточняются перечни формальных моделей и методов, которые могут быть использованы участниками в ходе подготовки решений (например, модели сетевого планирования, численные методы оптимизации); подготавливаются информационные массивы, содержащие необходимые сведения о моделируемых объектах, решаемых задачах, наличных ресурсах, контролируемых и неконтролируемых факторах, поставленных требованиях и т. п.; осуществляется подготовка к обработке информационных массивов на ЭВМ, а также к использованию имеющихся пакетов стандартных программ, реализующих известные методы прикладной математики; проводятся испытания и отладки разработанной игры с внесением необходимых изменений и дополнений, утверждается ее «рабочий» вариант. Таким образом, каждой игре предшествует большая подготовительная работа. Приведенная схема подготовки игр может уточняться, дополняться новыми деталями применительно к конкретной обстановке. Важно отметить возрастающую роль ЭВМ в проведении деловых игр, поскольку объемы информации, используемой участниками для обоснования своих действий, оказываются, как правило, большими. Процесс игры включает в себя выполнение участниками предложенных им заданий и оценку получаемых результатов. Задания готовятся организаторами игры (распорядительным центром) в соответствии с теми идеями и возможностями, которые определены подготовительными мероприятиями. Специальная система датчиков обеспечивает получение таких сведений, которые сходны с реальной информацией, предназначаемой оперирующей стороне (ее подразделениям). В роли датчиков могут выступать и вычислитель- 307
ные машины, и небольшие коллективы специалистов, и справочная литература, и комплекты служебных материалов. Масштабы и продолжительность деловых игр варьируются в широких пределах. Имеюш,ийся производственный опыт подтверждает целесообразность участия в игре 50— 70 человек в течение нескольких часов [6], но известны случаи крупномасштабных игр с несколькими сотнями (и даже тысячами) участников и временем проведения, исчисляемым сутками н неделями. Независимо от этого полезность планируемой игры должна своевременно обосновываться, а ценность ее результатов окупать произведенные затраты. Сильная зависимость исхода планируемых операций от уровня информированности их организаторов и исследователей делает необходимыми специальные изыскания, направленные на устранение (хотя бы частичное) дефицита сведений. Одним из приемлемых средств оказывается разработка прогнозов, получившая широкое распространение на практике. Некоторые вопросы прогнозирования рассматриваются ниже. § 12.4. Элементы прогностики. Информационное обеспечение исследований Математические модели операций, используемые в различных исследованиях, связаны так или иначе с оценками того, что должно произойти в будуш,ем. Например, анализ требований, предъявляемых к какой-либо новой системе, представляет собой попытку заглянуть в будуш,ее этой системы. Точно так же, результаты решения задач планирования определяют программу действий на ближайшую или отдаленную перспективу в сфере производства, науки, военного дела. В ряде случаев суш,ествование и работа самой модели ставятся в зависимость от того, насколько точно предсказаны условия функционирования изучаемой системы, дей- ствуюш,ие факторы исследуемой операции, допустимые значения выбираемых параметров. Это объясняется стремлением хотя бы частично устранить неопределенности, возникающие на ранних стадиях исследований, в ходе формирования и отбора моделей. Главная цель здесь состоит в том, чтобы добиться как можно более медленного морального старения принимаемых решений. Все это говорит о необходимости прогнозов, н вопрос заключается в 308
том, какими методами и в отношении каких объектов или явлений осуществляется прогнозирование. Прогнозом (от греческого prognosis — предвидение, предсказание) называется научно обоснованная информация о будущем науки и техники или вообще любое конкретное суждение об ожидаемых состояниях какого-либо объекта или явления окружающей действительности. Прогнозирование — это разработка прогнозов или, в более обобщенном виде, специальное исследование перспектив развития изучаемых объектов или явлений. Прогностика — это теория и практика прогнозирования (в широком понимании) или наука о законах и способах разработки прогнозов. Прогнозы научно-технического развития затрагивают 1) науку как систему знаний; 2) науку как организацию; 3) конкретные виды техники и отрасли промышленности; 4) предвидимые критические ситуации. Разработка общей проблемы предсказания должна основываться на изучении реальных закономерностей, вскрытых историками естествознания, науковедами, экономистами. С этой точки зрения представляют интерес данные, относящиеся к росту населения Земли, росту производительности труда в сельском хозяйстве, росту скоростей транспортных средств за последние 200 лет: Годы 1800 1850 1900 1980 Население Земли, млрд. чел 1 1,25 1,7 4,2 Производительность труда (число людей, обеспечиваемых одним работником) 3 4 6 10—25 Скорость перемещения, км/ч (вид транспорта) . . 25 „ ^0 (же- 100(авиа- до 60 000 (конный) лезнодо- ционный) (космиче- рожный) ский) Анализ этих данных позволяет не только следить за изменениями количественных показателей, определяющих прогресс в различных областях жизни, но и строить прогнозы, касающиеся таких важных вопросов, как масштабы расширения производства, трудовые ресурсы, необходимый уровень автоматизации и т. п. Кроме того, весьма ценные результаты удается получить при формальном исследовании приведенных закономерностей. Оказывается, многие из них хорошо аппроксимируются зависимостью у = =a/(l+fte~"), где а, Ь, с — некоторые положительные величины, выбираемые в соответствии с имеющейся информацией об изучаемых явлениях. 309
График рассматриваемой функции у=у(х) представлен на рис. 12.2 и называется логистической кривой. Ее характерной особенностью является существование конечного предела, к которому стремятся значения г/ при x-^cxd. В этом факте отражены перспективы замедления темпов роста той или иной характеристики, что хорошо согласуется с общими представлениями о физической невозможности или экономической нецелесообразности безграничного наращивания скоростей, производственных мощностей, населенности территорий. Подобные выводы облегчают поиск приемлемых оценок будущего, хотя и не исчерпывают всей проблемы прогнозирования. Дело в том, что процесс развития в природе включает в себя и периоды медленной эволюции, и скачкообразные переходы от одних состояний к другим, вызываемые открытиями новых физических принципов, реализацией оригинальных технических идей, осуществлением крупных проектов. Это обстоятельство должно учитываться при проведении исследований, для чего используются различного рода приемы, позволяющие как-то выделить ожидаемые скачки на общем фоне изменений, интересующих исследователя. Например, если речь идет о больших промежутках времени, на которые почти наверное приходится много скачков, то изучаемые закономерности развития технических или экономических систем могут достаточно точно аппроксимироваться ступенчатыми функциями. Для простоты часто проводится «сглаживание» этих функций, в результате чего опять появляются непрерывные зависимости (эволюционная модель), содержащие довольно приближенный прогноз. Он улавливает общие тенденции и представляет эффект каждого скачка в интегрированном виде, не выделяя его специально. Таким образом, «величина» того или иного скачка может оцениваться по разным критериям — экономическим, организационным и даже связанным с психологической перестройкой человека или коллектива. Соответствующие количественные характеристики часто оказываются не такими, как предполагалось, поэтому их желательно рассматривать в динамике, что не всегда легко сделать. Важную 310
роль играет умение своевременно распознавать приближающийся скачок и снизить тем самым риск принятия ошибочных решений, замедляющих реализацию открыба- ющихся возможностей. Необходимо подчеркнуть, что каких-либо формальных правил для этого нет, и способность распознавать относится к высшим формам эвристической деятельности. Исследователь, разрабатывающий прогнозы, располагает, как правило, обширной, но весьма общей информацией, накопленной в различных областях знаний. Проблема заключается в том, чтобы конкретизировать имеющиеся сведения и отразить в них перспективы развития вполне определенной отрасли науки, техники, производства. § 12.5. Методология прогнозирования Неопределенности, свойственные всякому предсказанию, обусловлены не только особенностями используе\1ой первичной информации, но и способами ее обработки, т. е. методологией прогнозирования. Как и следовало ожидать, поиск приемлемых решений осуществляется здесь эвристическим путем, что непосредственно влияет на методы составления прогнозов. Известны три группы методов, предназначаемых для практического применения. К первой группе относятся методы экстраполяции, связанные с анализом тенденций развития науки, техники и форм организации исследований. Данные об истории возникновения различных отраслей знания, сделанных открытиях, возникших проблемах и т. п. изучаются, сопоставляются, переводятся на язык цифр, после чего выявленные закономерности отображаются в будущее. Выводы, получаемые при этом, служат основой составляемого прогноза, связанного, как правило, с предполагаемой эволюцией исследуемых объектов. Ко второй группе относятся методы экспертных оценок, использующие способность человека отражать с опережением окружающую действительность в своем сознании. Необходимая для прогнозирования информация содержится в мнениях квалифицированных экспертов по тем или иным вопросам. Мнения формируются независимо друг от друга, собираются специалистами и подвергаются статистической обработке. В результате вырисовывается осредненная картина будущего, а также возможные ее 311
варианты, допускающие, в частности, появление скачков, что особенно ценно для исследователей. К третьей группе относятся методы логического моделирования, предполагающие построение логических моделей, в которых проводятся аналогии между различными по своей природе явлениями, анализируются взаимосвязи отдельных наук, обобщаются данные научно-технического и экономического развития. Это позволяет предсказывать нестандартные ситуации в той или иной области деятельности, находить лучшие (по сравнению с имеющимися) решения, учитывать реальные перспективы совершенствования систем управления и т. п. Из перечисленных методов в практике исследования операций наиболее часто применяют метод независимых экспертных оценок или, как его иногда называют, метод Делфи (от названия древнегреческого города Дельфы, известного своим оракулом). Опрос экспертов проводится посредством анкет при строгом соблюдении следующих правил; а) исключаются контакты между экспертами и обсуждение возможных ответов (условие независимости мнений); б) сохраняются в тайне имена опрашиваемых (условие стабильности оценок). Нарушение этих правил может привести к искажениям получаемых сведений, их дублированию, влиянию на них привходящих обстоятельств (например, должности того или иного эксперта, его известности, авторитета и т. д.). После обработки получаемые результаты можно представить либо в виде гистограмм (если речь идет о предсказании каких-то числовых характеристик систем), либо в виде ожидаемых границ значений параметров, либо просто в описательном виде (в случае прогнозов общего характера). Полезно заметить, что допустимо поэтапное (повторное) прогнозирование с целью уточнения предварительных сведений, выявления дополнительных связей между исследуемыми событиями и т. п. Это способствует повышению надежности конечных результатов за счет более полного использования имеющейся информации. Прогнозирование научно-технического прогресса расширяет сферу исследования операций, позволяет создавать высококачественные системы различного предназначения и служит одним из средств совершенствования управления народным хозяйством. Необходимые предпосылки для этого уже имеются. Так, введена примерная классификация периодов времени, на которые целесообразно рассчитывать прогнозы: 2,5—4,5 г. (краткосрочный прогноз), 5—И лет 3i2
((среднесрочный), до 20 лет (долгосрочный прогноз). Директивные документы обязывают все ведомства систематически проводить работу прогностического характера, привлекая для этого и действующие АСУ, и вычислительную технику предприятий, что позволяет непрерывно определять перспективы развития на ближайшие 10—15 лет. Конечно, методология прогнозирования сталкивается с проблемами, среди которых наиболее важными являются оценки точности прогнозов и сравнительные характеристики существующих методов предсказания. Есть предположение, что точность прогноза убывает пропорционально квадрату времени, однако в общем виде это не доказано. Трудность заключается не только в значительном разнообразии ситуаций, которые могут возникнуть в будущем, но и в их неповторяемости. Лишь элементарные события (отказы оборудования, появление очередей, несчастные случаи) могут рассматриваться с позиций теории потоков (см. § 6.8). Более сложные события (осуществление народнохозяйственных или военных операций, реализация крупных технических проектов) подвержены влиянию многочисленных обстоятельств и даже при повторениях отличаются от своих аналогов в прошлом. Все это сказывается на конечных результатах исследований и затрудняет сравнительный анализ методов прогнозирования, выбор которых для практических нужд проводится зачастую по таким признакам, как внешняя простота, удобство использования в данных условиях и т. д. [35]. В настоящее время необходимость в прогнозах ощущается на разных уровнях управления. Она обусловлена и особенностями происходящей научно-технической революции, и конкретными задачами долгосрочного планирования. Несмотря на ограниченную точность предсказаний и сравнительно небольшой выбор методов исследований, составляемые прогнозы несут в себе полезную информацию и, что особенно важно, способствуют формированию новых научных идей, появлению творческих замыслов, рационализации хозяйственной работы. ЗАКЛЮЧЕНИЕ Исследование операций как наука располагает разнообразными средствами моделирования целенаправленной деятельности и современной методологией поиска наилучших 313
решений. Существующие и развиваемые подходы к анаЛизу прикладных проблем проникают в новые области автоматизированного управления, перестраиваемой технологии, робототехники, охраны окружающей среды. Получаемые результаты не только позволяют рационально расходовать Ограниченные экономические ресурсы, но и развивают наши представления о возможностях изучаемой теории, закономерностях научно-технического развития, путях Повышения эффективности общественного производства.
список ЛИТЕРАТУРЫ 1. Александров Е, А. Основы теории эвристических решений.— М.: Сов. радио, 1975. 2. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управление,— М.; Наука, 1979. 3. Вентцель Е. С. Исследование операций. Задачи, принципы, методология.— М.: Наука, 1980. 4. Гермейер Ю. Б. Введение в теорию исследования операций.— М.: Наука, 1971. 5. Гермейер Ю. Б. Игры с непротивоположными интересами.— М.: Наука, 1976. 6. Гидрович С. Р., Сыроежин И. М, Игровое моделирование экономических процессов (деловые игры).— М.: Экономика, 1976. 7. Гилл Ф., Мюррей У., Райт М. Практическая оптимизация. Пер. с англ. В. Ю. Лебедева / Под ред. А. А. Петрова.— М.; Мир, 1985. 8. Давыдов Э. Г. Методы и модели теории антагонистических игр.—М.; МГУ, 1978. 9. Дегтярев Ю. И. Методы оптимизации.— М.; Сов. радио, 1980. 10. Дюбин Г. Н., Суздаль В. Г, Введение в прикладную теорию игр / Под ред. Н. Н. Воробьева.— М.: Наука, 1981. И. Ермольев Ю. М. Методы стохастического программирования.— М.: Наука, 1976. 12. Зайченко Ю. П. Исследование операций.— Киев: Вища школа, 1979. 13. Ивченко Г. И., Каштанов В. А., Коваленко И. Н. Теория массового обслуживания.— М.; Высшая школа, 1982. 14. Карманов В. Г. Математическое программирование.— М.: Наука, 1975. 15. Коваленко И. Н,, Филиппова А. А. Теория вероятностей и математическая статистика.— М.; Высшая школа, 1982. 16. Колмогоров А. Н. Основные понятия теории вероятностей.— М.; Наука, 1974. 17. Конвей Р., Максвелл В., Миллер Л. Теория расписаний. Пер. с англ. В. А. Кокотушкина / Под ред. Г. П. Башарина.— М.: Наука, 1975. 18. Михалевич В. С, Кукса А. И. Методы последовательной оптимизации.— М.; Наука, 1983. 19. Моисеев Н. Н., Иванилов Ю. П., Столярова Е. М. Методы оптимизации.— М.; Наука, 1978. 20. Морз Ф., Кимбелл Д. Методы исследования операций. Пер. с англ. И. А. Полетаева, К. Н. Трофимова / Под ред. А. Ф. Горохова. — М.: Сов. радио, 1956. 21. Морозов В. П., Дымарский Я- С. Элементы теории управления ГАП (математическое обеспечение).— Л.; Машиностроение, 1984. 22. Немировский А. С, Юдин Д. Б. Сложность задач и эффективность методов оптимизации.— М.; Наука, 1979. 23. Hum И. В. Линейное программирование.—М.; МГУ, 1978. 24. Основы кибернетики, Ч, 1. Математические основы киберне- 315
тики/л. И. Галушкин, Ю. И. Дегтярев, Б. Н. Калинин и др./ Под ред. К- А. Пупкова.— М.: Высшая школа, 1974. 25. Основы кибернетики. Ч. 2. Теория кибернетических систем / Ю. И. Дегтярев, Б. Н. Калинин, В. Н. Марков и др./ Под ред. К- А. Пупкова.— М.: Высшая школа, 1976. 26. Поспелов Д. А. Логико-лингвистические модели в системах управления.— М.: Энергия, 1981. 27. Рейнгольд Э., Нивергельт Ю., Део Н. Комбинаторные алгоритмы. Теория и практика. Пер. с англ. Е. П. Липатова I Под ред. В. Б. Алексеева.— М.: Мир, 1980. 28. Современное состояние теории исследования операций / Под ред. Н. Н. Моисеева.— М.: Наука, 1979. 29. Танаев В. С, Гордон В. С, Шафранский Я. М. Теория расписаний. Одностадийные системы.— М.: Наука, 1984. 30. Четвериков В. Н., Воробьев Г. Н., Казаков Г. И. и др. Автоматизированные системы управления предприятиями / Под ред. В. Н. Четверикова.— М.: Высшая школа, 1979. 31. Ширяев А. Н. Вероятность.— М.: Наука, 1980. 32. Исследование операций. 1. Методологические основы и математические методы. 2. Модели и применения. Пер. с англ. под ред. И. М. Макарова, И. М. Бескровного /Под ред. Дж. Моудера, С. Элмаг- раби.— М..: Мир, 1981. 33. Федоров В. В. Численные методы максмина.— М.: Наука, 1979. 34. Яглом А. М., ^глом И. М. Вероятность и информация.— М.: Наука, 1973. 35. Янч Э. Прогнозирование научно-технического прогресса.— М.: Прогресс, 1970. 36. Таха X. Введение в исследование операций. В 2-х кн. Пер. с англ. В. Я■ Алтаева, В. Т. Вавилова, В. С. Данилина и др.— М.: Мир, 1985.
ОГЛАВЛЕНИЕ Предисловие 3 Введение 4 Раздел первый Общая методология исследования операций. Совершенствование организационно-технических систем Глава 1. Понятия, принципы и средства исследования операций 7 § 1.1. Основные определения. Иллюстративные примеры . . 7 § 1.2. Машинное моделирование операций. Возможности вычислительной техники 13 § 1.3. Проблема информированности исследователя. Выбор решений по многим критериям 16 § 1.4. Математический аппарат исследований. Обш,ие сведения 20 § 1.5. Анализ поведения систем. Формализованный подход 26 § 1.6. Прикладные аспекты исследования операций 31 Раздел второй Детерминированные модели операций. Оптимальное планирование при ограниченных ресурсах Глава 2. Линейное и целочисленное программирование . , , . , 36 §2.1. Постановка и классификация задач математического программирования. Модель перевозок 36 § 2.2. Линейное программирование. Общие свойства задачи 39 §2.3. Симплекс метод. Этапы поиска решений . .' 42 §2.4. Симплекс алгоритм. Процесс приближения к оптимуму 46 §2.5. Модель раскроя материалов. Выбор наилучшего варианта 49 §2.6. Двойственность в линейном программировании. Проблема зацикливания , 51 §2.7. Целочисленные решения. Метод Гомори 53 §2.8. Модель планирования с учетом транспортных ограничений . . . . , 58 Глава 3. Методы нелинейного программирования ,.,... 61 §3.1. Классические условия экстремума. Метод множителей Лагранжа 62 §3.2. Проблема обобщения метода множителей. Теорема Куна — Таккера 66 §3.3. Квадратичное программирование. Метод Вольфа .... 71 §3.4. Модель производства новей продукции. Фактор дефицита сырья 75 § 3.5. Динамическое программирование как метод оптимизации. Общая характеристика 78 § 3.6. Задачи с сепарабельной целевой функцией. Формальный анализ ....................... 82 317
§3.7. Способы представления данных. Модель капиталовложений -86 § 3.8. Проблема многомерности в динамическом программировании , '89 Глава 4. Прямые вычисления в задачах оптимизации . . , . . 92 §4.1. Алгоритмические отображения. Сходимость вычислительных процессов 93 § 4.2. Методы возможных направлений. Правила переходов 95 §4.3. Методы штрафных функций. Особенности учета ограничений 99 § 4.4. Метод ветвей и границ. Модель технологического контроля 102 § 4.5. Комбинаторные алгоритмы. Элементы теории расписа- * НИИ 106 § 4.6. Модель мультипроцессорной системы. Упорядочение работ 112 §4.7. О вычислительной сложности экстремальных задач 119 Глава 5. Сетевое планирование многоэтапных операций . . , 122 §5.1. Сетевой график комплекса работ. Основные характеристики 123 §5.2. Формальные оценки параметров плана. Оптимизационные задачи , 129 § 5.3. Модель научных разработок. Рациональное расходование ресурсов ..... 134 § 5.4. Выбор начальных норм времени. Выполнимость планируемых мероприятий 140 § 5.5. Организация работ неопределенной длительности , , . 142 Раздел третий Вероятностные модели операций. Принятие решений с учетом случайных факторов Глава 6. Анализ случаных явлений .,...,,..,,.. 146 §6.1. Частота и вероятность события. Аксиоматика Колмогорова 147 §6.2. Распределения вероятностей. Числовые характеристики случайных величин 151 §6.3. Модель формирования рабочей группы. Учет неопределенностей 157 § 6.4. Неравенство Чебышева. Статистический аналог задачи о мультипроцессоре 160 §6.5. Функции случайного аргумента. Распределения максимумов и модулей 165 § 6.6. Модель согласования сроков. Минимизация непроизводительных затрат 170 §6.7. Предельные теоремы. Некоторые правила вычисления моментов 173 §6.8. Метод статистических испытаний , 179 Глава 7. Теория массового обслуживания 183 §7.1. Случайные процессы. Потоки событий 185 § 7,2. Одноканальная система с отказами. Простейшая модель обслуживания . , 189 318
§7.3. Многоканальная система с отказами. Пропускная спо- собиость ....... 192 § 7.4. Одиоканальиая система с очередью. Время ожидания обслуживании 196 § 7.5. Миогокаиальная система с очередью. Эффект взаимодействия каналов 200 § 7.6. Формула Литтла 203 Раздел четвертый Игровые модели операций. Рациональное поведение в конфликтных ситуациях Глава 8. Выбор стратегий в антагонистических играх 205 § 8.1. Определение игры. Разновидности игровых моделей 206 §8.2. Антагонистическая игра в нормальной форме. Принцип гарантированного результата 211 §8.3. Проблема равновесия в игре. Чистые и смешанные стратегии 213 § 8.4. Теорема о минимаксе. Устойчивость получаемых решений 218 § 8.5. Способы поиска оптимальных стратегий. Общие подходы 221 §8.6. Решения игр 2x2, 2хп, тХ2. Графоаналитический метод 224 §8.7. Решения игр тХп. Эквивалентные задачи линейного программирования 230 § 8.8. Разрешимость игровых задач. Практическое исполь- вание выводов теории 234 § 8.9. Модель комплектации вычислительного центра . , . 237 Глава 9. Методы исследования кооперативных игр 239 §9,1. Бнматричная игра. Ситуации равновесия и поведение участников 240 §9.2. "Модель экологического конфликта. Варианты исхода игры 242 § 9.3. Проблемы и формы кооперирования. Понятие характеристической функции 247 §9.4. Дележи в кооперативных играх. Принципы формирования решений 251 § 9.5. Модель финансирования строительства 255 Раздел пятый Неполные модели операций. Способы действий в условиях ограниченной информированности Глава 10. Экстремальные задачи с неопределенной структурой 259 § 10.1, Роль эксперимента в исследованиях. Критерий оценки получаемых результатов 260 § 10.2. Активные стратегии поискч экстремума. Сравнительная эффективность методов 263 § 10.3. Модель геодезической разведки. Оптимальная последовательность действий 268 § 10.4. Особенности многомерной оптимизации. Этапы решения задач 269 § 10,5, Способы формирования стратегий в общем случае 275 319
Глава И. Модели со случайными параметрами .,,.,.. 280 §11.2. Ошибки эксперимента. Информационный аспект проблемы 281 §11.2. Методы стохастической аппроксимации. Условия сходимости 285 § 11.3. Анализ точности решений. Влияние исходных данных 289 § 11.4. Стохастическая аппроксимация при оптимальных характеристиках процесса. Роль гипотез 290 § 11.5. Методы случайного поиска , , 295 Глава 12. Неформальные методы исследования операций . . . 298 § 12.1 Эвристические решения. Специфика подхода к изучаемым проблемам 299 § 12.2. Модель управления транспортным роботом. Организация производственного процесса 302 § 12.3. Деловые игры. Истоки, содержание, порядок подготовки ............. 305 § 12.4. Элементы прогностики. Информационное обеспечение исследований 308 § 12.5. Методология прогнозирования ...,.,...., 311 Заключение , 314 Список литературы .,,.., 315 УЧЕБНОЕ ИЗДАНИЕ Юрий Иванович Дегтярев ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Заведующая редакцией Н. И. Хрусталева. Редактор И. Ё. Якушина. Мл. редактор Е. В. Растегаева. Художник В. Н. Хомяков. Художественный редактор В. И. Мешалкин. Технический редактор Л. А. Гри- горчук. Корректор Г, А, Чечеткина И Б № 4820 Изд. № СТД—451. Сдано в набор 09.04.86. Подп. в печать 22.09.86. Т-17538. Формат 84Х108'/з2. Бум. тип. № 1. Гарнитура литературная. Печать высокая. Объем 16,8 усл. печ. л. 16.8 усл. кр.-отт. 17,97 уч. изд. л. Тираж 20 000 экз. Заказ № 712. Цеиа i pyg. Издательство «Высшая школа». I0I430. Москва. ГСП-4, Неглинная ул., д. 29/14 Отпечатано с матриц ордена Октябрьской Революции и ордена Трудового Красного Знамени МПО «Первая Образцовая типография нменн А. А. Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной тор говли. 113054. Москва, Валовая, 28 во Владимирской типографии Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли, 600000, г. Владимир. Октябрьский проспект, д. 7