Text
                    УДК 65.0.12.122
Вентцель Е. С. Исследование операций. М., «Советское
радио», 1972, 552 стр., т 31 000 экз., ц. 1 р. 96 к.
Излагаются основы исследования операций — науки, зани-
мающейся количественным обоснованием решений во всех областях
целенаправленной человеческой деятельности.
В книге рассматриваются основные понятия и методологичес-
кие принципы исследования операций, математические методы оп-
тимизации (линейное, динамическое программирование, теория игр
и статистических решений), а также методы математического моде-
лирования операций. Большое внимание уделяется прикладной
теории марковских случайных процессов (с приложениями в облас-
ти теории массового обслуживания, теории надежности) и матема-
тическому описанию процессов, протекающих в сложных, много^
элементных системах (метод динамики средних). Рассматриваются
методы статистического моделирования операций на ЭЦВМ и осно-
вы метода сетевого планирования. Книга содержит ряд новых ма-
териалов, разработанных автором в последние годы и нигде ранее
не публиковавшихся.
Изложение ведется на сравнительно элементарном уровне, впол-
не доступном читателю, знакомому с обычным вузовским курсом
математики и с элементами теории вероятностей. Излагаемые мето-
ды иллюстрируются большим количеством примеров из разных
областей практики.
Книга рассчитана на широкий круг читателей — инженеров,
экономистов, научных работников и хозяйственных руководителей,
интересующихся применением математики к обоснованию опти-
мальных решений
Рис. 266, табл 119, библ. 29 найм.
3—3—14
93—72

ОГЛАВЛЕНИЕ Предисловие....................................................... 6 Введение ......................................................... 7 1. Основные понятия исследования операций....................11 1. Операция. Эффективность операции .........................11 2. Математическая модель операции-...........................14 3. Общая постановка задачи исследования операций. Детермини- рованный случай..............................................16 4. Общая постановка задачи исследования операций Оптимиза- ция решения в условиях неопределенности......................18 5. Оценка операции по нескольким показателям.................23 2. Линейное программирование ...............................28 1. Задачи линейного программирования.........................28 2. Основная задача линейного программирования................39 3. Геометрическая интерпретация основной задачи линейного про- граммирования .............................................. 45 4. Задача линейного программирования с ограничениями-нера- венствами. Переход от нее к ОЗЛП и обратно...................55 5. Симплекс-метод решения задачи линейного программирования 59 6. Табличный алгоритм замены базисных переменных.............63 7. Отыскание опорного решения основной задачи линейного про- граммирования ...............................................71 8. Отыскание оптимального решения основной задачи линейного программирования ........................................... 77 9. Транспортная задача линейного программирования ... 83 10. Нахождение опорного плана................................87 11. Улучшение плана перевозок. Цикл пересчета . 91 12. Решение транспортной задачи методом потенциалов..........99 13. Транспортная задача с неправильным балансом.............110 14. Решение транспортной задачи по критерию времени.........115 3. Динамическое программирование . ... . ........ 120 1. Задачи динамического программирования...................120 2. Задача о наборе высоты и скорости летательным аппаратом . . 124 3. Общая постановка задачи динамического программирования. Интерпретация управления в фазовом пространстве.............132 4. Задачи распределения ресурсов............................142 5. Пример решения задачи распределения ресурсов.............146 6. Другие задачи распределения ресурсов.....................154 7 Распределение ресурсов со вложением доходов в производство 157 8 Решение задачи динамического программирования с учетом предыстории процесса........................................163 9. Задачи динамического программирования, несвязанные со вре- менем ......................................................172 3
10 Задачи динамического программирования с мультипликативным критерием • • ......................... 11 Бесконечношаговои процесс динамического программирования 177 4. Моделирование операций по схеме марковских случайных про- цессов ...................................................... 1 Марковский случайный процесс с дискретными состояниями 181 2 Случайные процессы с дискретным и непрерывным временем Марковская цепь ................................185 3 Марковский процесс с дискретными состояниями и непрерывным временем Уравнения Колмогорова для вероятностей состоя- .. 104 нии ........................................ 4 . Поток событий Простейший поток и его свойства .........200 5 Потоки Пальма Потоки Эрланга ......................206 6 Пуассоновские потоки событий и непрерывные марковские цепи 212 7 Предельные вероятности состояний . ..............217 8 Процесс «гибели и размножения» ......................222 9 Циклический процесс 22? 10 Приближенное сведение не-марковских процессов к марковс- ким Метод псевдосостояннй ......................232 5. Теория массового обслуживания ............. 238 1 Задачи теории массового обслуживания 238 2 Классификация систем массового обслуживания и их основ- ные характеристики 240 3 Одноканальная СМО с отказами ..........................242 4 Многоканальная СМО с отказами..........................245 5 Одноканальная СМО с ожиданием...........................248 6 Многоканальная СМО с ожиданием . 257 7 СМО с ограниченным временем ожидания ...................264 8 Замкнутые системы массового обслуживания ...............268 9 Системы массового обслуживания со «взаимопомощью» между каналами 275 10 Система массового обслуживания с ошибками..............281 11 . Системы массового обслуживания с не-пуассоновскими пото- ками событий 285 6. Метод динамики средних....................................291 1 Идея метода Область применимости .........................291 2 Учет зависимости интенсивностей потоков событий от численнос- тей состояний Принцип квазирегулярности .....................300 3 Учет пополнения численностей состояний ...................309 4 Метод динамики средних для системы, состоящей из неоднород- ных элементов 314 5 Предельное поведение средних численностей состояний . . . 320 6 . Уравнения динамики боя (модель А) . ..................329 7 Учет пополнения сил, упреждающего удара, темпа мобилиза- ции и прочих факторов в уравнениях динамики боя . . . . 333 8 Модель Б Случай отсутствия переноса огня..................336 9 МодельВ Учет деятельности разведки и системы управления боем 338 10 Учет восстановления единиц в ходе боевых действий . ... 343 11 Уравнения динамики боя для неоднородных единиц Функции распределения огня . .............................347 12 Уравнения смешанного типа ......................350 13 Некоторые уточнения метода динамики средних .............357
7. Методы учета надежности технических устройств . . . 366 1 Проблема оценки надежности ............366 2 Надежность элемента Плотность распределения времени без- отказной работы Среднее время безотказной работы .... 367 3 Экспоненциальный закон надежности Интенсивность отказов 372 4 Определение надежности системы по надежности ее элементов. Надежность нерезервированной системы ....................378 5 Надежность резервированной системы («горячий резерв»)..382 6 Надежность резервированной системы («холодный» и «облег- ченный» резерв) . 386 7 Надежность системы с восстановлением.................393 8 Учет зависимости отказов при оценке надежности технических устройств 400 8. Моделирование операций методом статистических испытаний . . 409 1 Метод статистических испытаний (Монте-Карло) .... 409 2 . Единичный жребий ............................413 3 Розыгрыш значения нормально распределенной случайной ве- личины ..................................................420 4 Получение случайного числа R от 0 до 1 ...............424 5 Примеры моделирования случайных процессов методом Монте- Карло 426 6 Определение характеристик стационарного случайного процес- са методом Монте-Карло по одной реализации 433 7 . Оценка точности характеристик полученных методом Монте- Карло Необходимое число реализаций ......................440 9. Игровые методы обоснования решений....................446 1 Задачи теории игр и статистических решений............446 2 . Предмет теории игр Основные понятия ................447 3 Платежная матрица 450 4 Нижняя и верхняя цена игры Принцип минимакса .... 454 5 Решение игры в смешанных стратегиях 461 6 Упрощение игр 464 7 Игра 2X2 466 8 . Игры 2Хп и тХ2.................................... 472 9 Решение игр т X п.....................................480 10 Решение конечных игр методом итераций ................489 11 . Физическая смесь стретегий 493 12 . Элементы теории статистических решений 496 13 Критерий, основанный на известных вероятностях условий. Критерии Вальда, Гурвица, Сэвиджа .......................500 14 Планирование эксперимента в условиях неопределенности . 509 10. Метод сетевого планирования ............. 516 1 Задача планирования комплекса работ ................. 516 2 . Сетевой график комплекса работ. Временной сетевой график . . 519 3 Формальная запись (алгоритм) задачи сетевого планирования 526 4 Оптимизация плана комплекса работ ....................529 5 Сетевое планирование при случайных временах выполнения работ Применение ЭЦВМ ........................539 Пр иложение (таблицы) ........543 Литература 545 Предметны йуказатель ........547 5
ПРЕДИСЛОВИЕ Настоящая книга написана на базе лекций по исследованию опе- раций, читанных автором в течение ряда лет в высших учебных заве- дениях, а также на основе опыта научно-исследовательских работ в раз- ных областях. Задачей автора было дать по возможности простое и понятное изло- жение идей и методов исследования операций, не пользуясь громозд- ким математическим аппаратом. В отношении математической подго- товки от читателя требуется только знакомство с обычным втузовским курсом высшей математики, а также владение элементами теории веро- ятностей. В целях наглядности изложение сопровождается многими примерами. Книга рассчитана на широкий круг читателей — глав- ным образом, инженеров и научных работников, интересующихся зада- чами обоснования решений в различных областях практики. Автор приносит глубокую благодарность И. Я. Динеру, Л. А. Ов- чарову и А. Д. Вентцелю, сотрудничество с которыми помогло ему в разработке материалов, изложенных в книге. Книга содержит ряд новых материалов, разработанных автором в последние годы и нигде ранее не публиковавшихся. Москва, 1970 Е. Вентцель
ВВЕДЕНИЕ За последние годы наука уделяет все большее внимание вопросам организации и управления; это обусловлено целым рядом причин. Быстрое развитие и усложнение техники; увеличение масштабов и сто- имостей проводимых мероприятий; широкое внедрение автоматизации в сферу управления — все это приводит к необходимости научного анализа сложных целенаправленных процессов под углом зрения их структуры и организации. От науки требуются рекомендации по наи- лучшему (оптимальному) управлению такими процессами. Эти потребности практики вызвали к жизни специальные научные методы, которые принято объединять под названием «Исследование операций». Под этим подразумевается применение математических, количественных методов для обоснования решений во всех областях целенаправленной человеческой деятельности. Необходимость принятия решений так же стара, как само челове- чество. Испокон веку люди, приступая к осуществлению своих меро- приятий, раздумывали над их возможными последствиями и принима- ли решения, выбирая тем или другим образом зависящие от них пара- метры — способы организации мероприятий. Но до поры, до времени решения могли приниматься без специального математического анали- за, просто на основе опыта и здравого смысла. Такой способ принятия решений не утратил своего значения и в наше время. Возьмем пример: человек вышел утром из дому, чтобы ехать на работу. По ходу дела ему приходится принять целый ряд решений: брать ли с собой зонтик? В каком месте перейти улицу? Каким видом транспорта воспользоваться? И так далее. Разумеется, все эти решения человек принимает без специальных расчетов, просто опираясь на имеющийся у него опыт и на здравый смысл. Для обоснования таких решений никакая наука не нужна, да вряд ли понадобится и в дальнейшем. Однако возьмем другой пример. Допустим, организуется работа городского транспорта. В нашем распоряжении имеется какое-то ко- личество транспортных средств. Необходимо принять ряд решений, например: какое количество и каких транспортных средств направить по тому или другому маршруту? Как изменять частоту следования ма- шин в зависимости от времени суток? Где разместить остановки? И так далее. Эти решения являются гораздо более ответственными, чем реше- ния предыдущего примера. В силу сложности явления последствия каждого из них не столь ясны; для того, чтобы представить себе эти 7
последствия, нужно провести расчеты. А главное, от этих решений гораздо больше зависит. В первом примере неправильный выбор реше- ния затронет интересы одного человека; во втором — может отразиться на деловой жизни целого города. Конечно, и во втором примере при выборе решения можно дей- ствовать интуитивно, опираясь на опыт и здравый смысл. Но решения окажутся гораздо более разумными, если они будут подкреплены количественными, математическими расчетами. Эти предварительные расчеты помогут избежать длительного и дорогостоящего поиска пра- вильного решения «наощупь». Наиболее сложно обстоит дело с принятием решений, когда речь идет о мероприятиях, опыта в проведении которых еще не существует и, следовательно, здравому смыслу не на что опереться, а интуиция может обмануть. Пусть, например, составляется перспективный план развития системы вооружения на несколько лет вперед. Образцы воо- ружения, о которых может идти речь, еще не существуют, никакого опыта их боевого применения нет. При планировании приходится опи- раться на большое количество данных, относящихся не столько к прош- лому опыту, сколько к предвидимому будущему. Выбранное решение должно по возможности гарантировать нас от ошибок, связанных с не- точным прогнозированием, и быть достаточно эффективным для широ- кого круга условий. Для обоснования такого решения приводится в действие сложная система математических расчетов, да иначе и быть не должно: ведь неправильное решение, если оно будет принято, мо- жет привести к самым тяжелым последствиям. Вообще, чем сложнее организуемое мероприятие, чем больше вкла- дывается в него материальных средств, чем шире спектр его возможных последствий, тем менее допустимы так называемые «волевые» решения, не опирающиеся на научный расчет, и тем большее значение получает совокупность научных методов, позволяющих заранее оценить послед- ствия каждого решения, заранее отбросить недопустимые варианты и рекомендовать те, которые представляются наиболее удачными. Такими математическими расчетами, облегчающими людям при- нятие правильных решений, и занимается наука «Исследование опе- раций». Это — сравнительно молодая наука. Ее возникновение обыч- но относят к годам второй мировой войны, когда в вооруженных силах США и Англии были сформированы специальные научные группы для подготовки решений по способам организации и обеспечения боевых действий [11. Справедливость требует отметить, что подобными иссле- дованиями (правда, не под таким названием) занимались и до войны, в частности, в нашей стране, где были широко развиты математичес- кие методы оценки эффективности стрельбы, представляющие собой, в современном понимании, часть исследования операций. Зародившись в области преимущественно военных задач, исследо- вание операций с течением времени вышло из этой узкой сферы. В нас- тоящее время исследование операций — одна из самых быстро разви- вающихся наук, завоевывающая все более обширные области приме- нения: промышленность, сельское хозяйство, торговля, транспорт, здравоохранение и т. д. Задачи исследования операций, к какой бы §
области они ни относились, имеют общие черты, и при их решении применяются сходные методологические приемы. Например, методика количественного исследования, выработанная для анализа процессов образования очередей в системах массового обслуживания (парик- махерских, ремонтных мастерских и т. д.), может, почти без изменений, быть перенесена на некоторые задачи электронной вычислительной техники, а также задачи, связанные с организацией системы противо- воздушной обороны (ПВО). Чтобы ближе познакомиться со спецификой задач исследования операций и их характерными особенностями, приведем несколько при- меров таких задач. Пример I. Завод выпускает определенного вида изделия. Для обеспечения высокого качества этих изделий организуется система выборочного контроля. Требуется рациональным образом организо- вать этот контроль, т. е. выбрать: — размер контрольной партии; — последовательность контрольных операций; — правила браковки изделий и т. д. так, чтобы обеспечить заданный уровень качества при мини- мальных расходах. Пример 2. Для реализации определенной массы сезонных товаров создается сеть временных торговых точек. Требуется выбрать пара- метры этой сети: — число точек; — их размещение; — количество персонала; — продажные цены товаров и т. д. так, чтобы обеспечить максимальную экономическую эффектив- ность распродажи. Пример 3. Организуется воздушный налет группы самолетов- бомбардировщиков на промышленный район противника. В нашем распоряжении — определенное количество самолетов с известными летно-тактическими данными и вооружением. Требуется выбрать параметры налета: — высоту полета; — эшелонирование самолетов в строю; — точки прицеливания отдельных самолетов и групп; — способ выполнения бомбометания (залпом, серией) и т. д. так, чтобы в результате налета максимально снизить про- мышленный потенциал района. Пример 4. Организуется снабжение сырьем группы промышлен- ных предприятий. Возможные поставщики сырья размещены в различ- ных географических пунктах страны и связаны с группой предприятий различными путями сообщения (с разными тарифами). Требуется ра- циональным образом разместить заказы на сырье, так, чтобы потреб- ности группы предприятий были удовлетворены в заданные сроки и при минимальных затратах на перевозки. 9
Пример 5. Сложное техническое устройство время от времени может отказывать (выходить из строя). Для того, чтобы ликвидировать аварию, необходимо локализовать неисправность (обнаружить ее при- чину). Требуется разработать систему тестов, позволяющую с опреде- ленной, достаточно большой вероятностью локализовать неисправность за минимальное время. Пример 6. Организуется медицинское обследование группы на- селения с целью выявления некоторых заболеваний. На обследование выделены определенные материальные средства, оборудование и меди- цинский персонал. Требуется разработать план обследования: — количество пунктов; — их размещение; — последовательность осмотров; — вид и количество анализов и т. д. с тем, чтобы к заданному сроку выявить максимальный процент заболевших. Число примеров можно было бы легко умножить, но и этих доста- точно, чтобы составить представление об отличительных особенностях задач исследования операций. Несмотря на то, что примеры относятся к самым разным областям практики, в них легко просматриваются сходные черты. В каждом из них идет речь о каком-то меропри- ятии (или системе мероприятий), преследующем определенную цель. Заданы некоторые условия, характеризующие обстановку мероприятия, изменять которые мы не вправе (например, отпущенные средства). В рамках этой системы условий, требуется принять какое- то решение с тем, чтобы мероприятие в некотором смысле было наиболее выгодным (или наименее убыточным). В соответствии с этими общими чертами вырабатываются и общие приемы решения подобных задач, в совокупности составляющие методо- логическую основу исследования операций. Для решения практических задач исследование операций распо- лагает целым арсеналом математических средств. К ним относятся: тео- рия вероятностей с ее новейшими разделами (теория случайных про- цессов, теория информации, теория массового обслуживания); мате- матические методы оптимизации, начиная от простейших способов на- хождения экстремумов (максимумов и минимумов), знакомых каждому инженеру, и кончая современными методами, такими, как линейное программирование, динамическое программирование, принцип мак- симума Л. С. Понтрягина и многие другие. Из них в данной книге, адресованной широкому кругу читателей, освещаются далеко не все, а только простейшие и наиболее распространенные. Для понимания текста читатель должен владеть только основами математического анализа и элементами теории вероятностей. В книге содержится много численных примеров, иллюстрирующих излагаемые методы. При выборе условий этих примеров автор исходил из методических соображений, так что этими материалами ни в коем случае нельзя пользоваться как справочными.
1 ОСНОВНЫЕ ПОНЯТИЯ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ 1. ОПЕРАЦИЯ. ЭФФЕКТИВНОСТЬ ОПЕРАЦИИ Под операцией мы будем понимать любое мероприятие (или систему действий), объединенное единым замыслом и направленное к достижению определенной цели. Примеры операций. 1. Система мероприятий, направленная к повышению надежнос- ти технического устройства. 2. Отражение воздушного налета средствами ПВО. 3. Размещение заказов на производство оборудования. 4. Разведывательный поиск группы самолетов в тылу противника. 5. Запуск группы искусственных спутников Земли для установле- ния системы телевизионной связи. 6. Система перевозок, обеспечивающая снабжение ряда пунктов определенного вида товарами. Операция всегда является управляемым мероприятием, т. е. от нас зависит выбрать тем или другим способом какие-то пара- метры, характеризующие способ ее организации. «Организация» здесь понимается в широком смысле слова, включая и выбор технических средств, применяемых в операции. Например, организуя отражение воздушного налета средствами ПВО, мы можем, в зависимости от об- становки, выбирать тип и свойства применяемых технических средств (ракет, установок) или же, при заданных технических средствах, ре- шать только задачу рациональной организации самой процедуры отра- жения начета (распределение целей между установками, количество ракет, направляемых на каждую цель и т. д.). Всякий определенный выбор зависящих от нас параметров мы бу- дем называть решением. Решения могут быть удачными и неудачными, разумными и нера- зумными. Оптимальными называются решения, которые, по тем или иным соображениям, предпочтительнее других. Основная задача исследования операций—предварительное коли- чественное обоснование оптимальных решений. Заметим, что само принятие решения выходит за рамки исследования операций и относится к компетенции ответственного ли- ца (или группы лиц), которым предоставлено право окончательного вы- бора. При этом выборе ответственные за него лица могут учитывать, 11
наряду с рекомендациями, вытекающими из математического расчета, еще ряд соображений (количественного и качественного характера), которые не были учтены расчетом. Таким образом, исследование операций не ставит себе задачей полную автоматизацию принятия решений, полное исключение из это- го процесса размышляющего, оценивающего, критикующего челове- ческого сознания. В конечном итоге, решение всегда принимается че- ловеком (или группой лиц); задача исследования операций — подго- товить количественные данные и рекомендации, облегчающие челове- ку принятие решения*). Наряду с основной задачей — обоснованием оптимальных реше- ний — к области исследования операций относятся и другие задачи, такие как — сравнительная оценка различных вариантов организации опе- рации; — оценка влияния на результат операции различных параметров (элементов решения и заданных условий); — исследование так называемых «узких мест», то есть элементов управляемой системы, нарушение работы которых особенно сильно сказывается на успехе операции, и т. д. Эти «вспомогательные» задачи исследования операций приобре- тают особую важность, когда мы рассматриваем данную операцию не изолированно, а как составной элемент целой системы операций. Так называемый «системный» подход к задачам исследования операций требует учета взаимной зависимости и обусловленности целого ком- плекса мероприятий. Разумеется, в принципе всегда можно объеди- нить систему операций в одну сложную операцию более «высокого по- рядка», но на практике это не всегда удобно (и не всегда желательно), и в ряде случаев целесообразно выделять в качестве «операций» от- дельные элементы системы, а окончательное решение принимать с уче- том роли и места данной операции в системе. Итак, рассмотрим отдельную операцию 0. Размышляя над ор- ганизацией операции, мы стремимся сделать ее наиболее эффективной. Под эффективностью операции разумеется степень ее при- способленности к выполнению стоящей перед ней задачи. Чем лучше организована операция, тем она эффективнее. Чтобы судить об эффективности операции и сравнивать между со- бой по эффективности различно организованные операции, нужно иметь некоторый численный критерий оценки или пока- затель эффективности (в некоторых руководствах пока- затель эффективности называют «целевой функцией»). Будем в дальнейшем обозначать показатель эффективности буквой W. *1 Даже в тех случаях, когда принятие решения, казалось бы, полностью авто- матизировано (например, в процессе автоматического управления предприя- тием или космическим кораблем), роль человека не устраняется, ибо, в конеч- ном счете, от него зависит выбор алгоритма, по которому осуществляется уп- равление. 12
Конкретный вид показателя эффективности W, которым следует пользоваться при численной оценке эффективности, зависит от спе- цифики рассматриваемой операции, ее целевой направленности, а так- же от задачи исследования, которая может быть поставлена в той или другой форме. Многие операции выполняются в условиях, содержащих элемент случайности (например, операции, связанные с колебаниями спроса и предложения, с движением народонаселения, заболеваемостью, смертностью, а также все военные операции). В этих случаях исход операции, даже организованной строго определенным образом, не мо- жет быть точно предсказан, остается случайным. Если это так, то в ка- честве показателя эффективности W выбирается не просто характерис- тика исхода операции, а ее среднее значение (математическое ожида- ние). Например, если задача операции — получение максимальной прибыли, то в качестве показателя эффективности берется средняя прибыль. В других случаях, когда задачей операции является осуществление вполне определенного события, в качестве показателя эффективности берут вероятность этого события (например, ве- роятность того, что в результате воздушного налета данная группа целей будет поражена). Правильный выбор показателя эффективности — необходимое условие полезности исследования, применяемого для обоснования ре- шения. Рассмотрим ряд примеров, в каждом из которых показатель эф- фективности W выбран в соответствии с целевой направленностью опе- рации. Пример 1. Рассматривается работа промышленного предприятия под углом зрения его рентабельности, причем проводится ряд мер с целью повышения этой рентабельности. Показатель эффективности — прибыль (или средняя прибыль), приносимая предприятием за хозяйственный год. Пример 2. Группа истребителей поднимается в воздух для перехвата оди- ночного самолета противника. Цель операции — сбить самолет. Показатель эф- фективности — вероятность поражения (сбития) самолета. Пример 3. Ремонтная мастерская занимается обслуживанием машин; ее рентабельность определяется количеством машин, обслуженных в течение дня. Показатель эффективности — среднее число машин, обслуженных за день («сред- нее» потому, что фактическое число случайно). Пример 4. Группа радиолокационных станций в определенном районе ве- дет наблюдение за воздушным пространством. Задача группы — обнаружить любой самолет, если он появится в районе. Показатель эффективности — ве- роятность обнаружения любого самолета, появившегося в районе. Пример 5. Предпринимается ряд мер по повышению надежности электрон- ной цифровой вычислительной машины (ЭЦВМ). Цель операции — уменьшить частоту появления неисправностей («сбоев») ЭЦВМ, или, что равносильно, уве- личить средний промежуток времени между сбоями («наработку на отказ»). По- казатель эффективности — среднее время безотказной работы ЭЦВМ (или сред- нее относительное время исправной работы). Пример 6. Проводится борьба за экономию средств при производстве опре- деленного вида товаров. Показатель эффективности — количество (или среднее количество) сэкономленных средств. Во всех рассмотренных примерах показатель эффективности, ка- ков бы он ни был, требовалось обратить в максимум («чем больше, тем 13
лучше»). Вообще, это не обязательно: в исследовании операций часто пользуются показателями, которые требуется обратить не в максимум, а в минимум («чем меньше, тем лучше»). Напримёр, в примере 4 можно было бы в качестве показателя эффективности веять «вероятность тоге, что появившийся самолет не будет обнаружен» — этот показатель же- лательно сделать как можно меньше. В примере 5 за показатель эф- фективности можно было бы принять «среднее число сбоев за сутких, которое желательно минимизировать. Если оценивается какая-то система, обеспечивающая наведение снаряда на цель, то в качестве по- казателя эффективности можно выбрать среднее значение «промаха» снаряда (расстояния от траектории до центра цели), которое желательно сделать как можно меньше. Наряд средств, выделяемых на выполнен ие какой-либо задачи, тоже желательно сделать минимальным, равно как и стоимость предпринимаемой системы мероприятий. Таким образом, во многих задачах исследования операций разумное решение должно обеспечивать не максимум, а минимум некоторого показателя. Очевидно, что случай, когда показатель эффективности W надо обратить в минимум, легко сводится к задаче максимизации (для этого достаточно, например, изменить знак величины №). Поэтому в даль- нейшем, рассматривая в общем виде задачу исследования операций, мы будем для простоты говорить только о случае, когда W требуется об- ратить в максимум. Что касается практических конкретных за- дач, то мы будем пользоваться как показателями эффективности, кото- рые требуется максимизировать, так и теми, которые требуется мини- мизировать. 2. МАТЕМАТИЧЕСКАЯ МОДЕЛЬ ОПЕРАЦИИ Для применения количественных методов исследования в любой области всегда требуется построить ту или другую математическую модель явления. Не составляет исключения и исследование опе- раций. При построении математической модели явление (в нашем слу- чае — операция) каким-то образом упрощается, схематизируется; из бесчисленного множества факторов, влияющих на явление, выделяется сравнительно небольшое количество важнейших, и полученная схема описывается с помощью того или другого математического аппарата. В результате усмнавливаются количественные связи между условиями операции, параметрами решения и исходом операции — показателем эффективности (или показателями, если их в данной задаче несколько). Чем удачнее подобрана математическая модель, тем лучше она отражает характерные черты явления, тем успешнее будет исследова- ние и полезнее — вытекающие из него рекомендации. Общих способов построения математических моделей не сущест- вует. В каждом конкретном случае модель строится, исходя из целевой направленности операции и задачи научного исследования, с учетом требуемой точности решения, а также точности, с какой могут быть известны исходные данные. Требования к модели противоречивы. С одной стороны, она долж- на быть достаточно полной, т. е. в ней должны быть учтены все важ- м
\ ные факторы, от кбторых существенно зависит исход операции. С дру- гой стороны, модельдолжна быть достаточно простой для того, чтобы можно было установить обозримые (желательно — аналитические) зависимости между вхддящими в нее параметрами. Модель не должна быть «засорена» множеством мелких, второстепенных факторов — их учет усложняет математический анализ и делает результаты исследо- вания трудно обозримыми. Одним словом, искусство составлять математические модели есть именно искусство, и опыт в этом деле приобретается постепенно. Две опасности гсегда подстерегают составителя модели: первая — утонуть в подробностях («из-за деревьев не увидеть леса»); вторая слишком огрубить явление («выплеснуть из ванны вместе с водой и ре- бенка»), В сложных случаях, когда построение модели вызывает наи- большее сомнение, полезным оказывается своеобразный «спор моделей», когда одно и то же явление исследуется на нескольких моделях. Если научные выводы и рекомендации от модели к модели меняются мало, это — серьезный аргумент в пользу объективности исследования. Характерным для сложных задач исследования операций являет- ся также повторное обращение к модели: после того, как первый цикл исследований выполнен, возвращаются снова к модели и вносят в нее необходимые коррективы. Построение математической модели — наиболее важная и ответ- ственная часть исследования, требующая глубоких знаний не только и не столько в математике, сколько в существе моделируемых явлений. Однако, раз созданная удачная модель может найти применение и далеко за пределами того круга явлений, для которого она перво- начально создавалась. Так, например, математические модели массо- вого обслуживания нашли широкое применение в целом ряде облас- тей, далеких, с первого взгляда, от массового обслуживания (надеж- ность технических устройств, организация автоматизированного про- изводства, задачи ПВО и др.). Математические модели, первоначаль- но предназначенные для описания динамики развития биологических популяций, находят широкое применение при описании боевых дейст- вий и наоборот — боевые модели с успехом применяются в биологии. Математические модели, применяемые в настоящее время в зада- чах исследования операций, можно грубо подразделить на два класса: аналитические и статистические. Для первых характерно установление формульных, аналитиче- ских зависимостей между параметрами задачи, записанных в любом виде: алгебраические уравнения, обыкновенные дифференциальные Уравнения, уравнения с частными производными и т. д. Чтобы такое аналитическое описание операции было возможно, как правило, нужно принять те или иные допущения или упрощения. С помощью аналити- ческих моделей удается с удовлетворительной точностью описать только сравнительно простые операции, где число взаимодействующих элементов не слишком велико. В операциях же большого масштаба, сложных, в которых переплетается действие огромного количества факторов, в том числе и случайных, на первый план выходит метод статистического моделирования. Он состоит в том, что процесс развития 15
операции как бы «копируется» на вычислительной/машине, со всеми сопровождающими его случайностями. Всякий паз, когда в ход опе- рации вмешивается какой-либо случайный фактор, его влияние учи- тывается посредством «розыгрыша», напомина19щего бросание жребия. В результате многократного повторения такой процедуры удается по- лучить интересующие нас характеристики /схода операции с любой степенью точности*). / Статистические модели имеют перед аналитическими то преиму- щество, что они позволяют учесть большее число факторов и не требуют грубых упрощений и допущений. Зато результаты статистического моделирования труднее поддаются анализу и осмыслению. Более гру- бые аналитические модели описывают явление лишь приближенно, зато результаты более наглядны и отчетливее отражают присущие яв- лению основные закономерности. Наилучшие результаты получаются при совместном применении аналитических и статистических моделей: простая аналитическая модель позволяет вчерне разобраться в основ- ных закономерностях явления, наметить главные его контуры, а лю- бое дальнейшее уточнение может быть получено статистическим моде- лированием. 3. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ.ДЕТЕРМИНИРОВАННЫЙ СЛУЧАЙ Рассмотрим задачу исследования операций в общей постановке, безотносительно к виду и цели операции. Пусть имеется некоторая операция 0, т. е. управляемое меро- приятие, на исход которого мы можем в какой-то мере влиять, выбирая тем или другим способом зависящие от нас параметры. Эффективность операции характеризуется каким-то численным критерием или пока- зателем W, который требуется обратить в максимум (случай, когда его требуется обратить в минимум, сводится к предыдущему и отдельно не рассматривается). Предположим, что тем или иным способом математическая модель операции построена; она позволяет вычислить показатель эффектив- ности W при любом принятом решении, для любой совокупности условий, в которых выполняется операция. Рассмотрим сначала наиболее простой случай: все факторы, от которых зависит успех операции, делятся на две группы: — заданные, заранее известные факторы (условия проведения опе- рации) ах, а2, ..., на которые мы влиять не можем; — зависящие от нас факторы (элементы решения) хъ х2, ..., которые мы, в известных пределах, можем выбирать цо своему усмотрению. Этот случай, в котором факторы, влияющие на исход операции, либо заранее известны, либо зависят от нас, мы будем называть д е- терминированным. *) Подробно о статистическом моделировании см. гл. 8. 16
Заметим, что под «заданными условиями» операции cq, а2, ... мо- гут пониматься не только обычные числа, но и функции, в частности— ограничения, наложенные на элементы решения. Равным об- разом, элементы решения хъ х2, ... также могут быть не только числа- ми, но и функциями. Показатель эффективности W зависит от обеих групп факторов: как от заданных условий, так и от элементов решения. Запишем эту зависимость в виде общей символической формулы: W = W (dj, a2, ...; х1( x2,...). (3.1) Так как математическая модель построена, будем считать, что за- висимость (3.1) нам известна, и для любых аь a2, ...; хъ х2, ... мы мо- жем найти W. Тогда задачу исследования операций можно математически сфор- мулировать так: При заданных условиях , а2, ... найти такие элементы решения х1г х2, ..., которые обращают показатель W в максимум. Перед нами — типично математическая задача, относящаяся к классу так называемых вариационных задач. Методы решения таких задач подробно разработаны в математике. Простейшие из этих методов («задачи на максимум и минимум») хорошо известны каждому инженеру. Для нахождения максимума или минимума (коро- че, экстремума) функции нужно продифференцировать ее по аргу- менту (или аргументам, если их несколько), приравнять производные нулю и решить полученную систему уравнений. Однако, этот простой метод в задачах исследования операций имеет ограниченное применение. Причин этому несколько. 1. Когда аргументов Xj, х2, ... много (а это типично для задач ис- следования операций), совместное решение системы уравнений, полу- ченных дифференцированием основной зависимости, зачастую оказы- вается не проще, а сложнее, чем непосредственный поиск экстремума. 2. В случае, когда на элементы решения xlt х2, ... наложены огра- ничения (т. е., область их изменения ограничена), часто экстремум на- блюдается не в точке, где производные обращаются в нуль, а на границе области возможных решений. Возникает специфическая для исследования операций математическая задача «поиска экстре- мума при наличии ограничений», не укладывающаяся в схему класси- ческих вариационных методов. 3. Наконец, производных, о которых идет речь, может вовсе не существовать, например, если аргументы хъ х2, ... изменяются не не- прерывно, а дискретно, или же сама функция W имеет особенности. Общих математических методов нахождения экстремумов функций любого вида при наличии произвольных ограничений не существует. Однако для случаев, когда функция и ограничения обладают опреде- ленными свойствами, современная математика предлагает ряд спе- циальных методов. Например, если показатель эффективности W зави- сит от элементов решения хъ х2, ... линейной ограничения, на- ложенные на хь х2, ..., также имеют вид линейных равенств (или неравенств), максимум функции W находится с помощью специального 17
аппарата, так называемого линейного программирова- ния (см. гл. 2). Если эти функции обладают другими свойствами (на- пример, выпуклы или квадратичны), применяется аппарат «выпуклого» или «квадратичного» программирования [2], болееюложный по сравне- нию с линейным программированием, но все же дозволяющий в прием- лемые сроки найти решение. Если операция ^'естественным образом расчленяется на ряд «шагов» или «этапов» (найример, хозяйственных Лет), а показатель эффективности W выражается в виде суммы показа- телей wir достигнутых за отдельные этапы, для нахождения решения, обеспечивающего максимальную эффективность, может быть применен метод динамического программирования (см. гл. 3). Если операция описывается обыкновенными дифференциальными уравнениями, а управление, меняющееся со временем, представляет собой некоторую функцию х(0, то для нахождения оптимального уп- равления может оказаться полезным специально разработанный метод Л. С. Понтрягина [3]. Таким образом, в рассматриваемом детерминированном случае задача отыскания оптимального решения сводится к математической задаче отыскания экстремума функции W; эта задача может быть весь- ма сложной (особенно при многих аргументах), но, в конце концов, является вычислительной задачей, которую, особенно при наличии быстродействующих ЭЦВМ, удается так или иначе решить до конца. Трудности, возникающие при этом, являются расчетными, а не прин- ципиальными. 4. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ИССЛЕДОВАНИЯ ОПЕРАЦИЙ. ОПТИМИЗАЦИЯ РЕШЕНИЯ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ В предыдущем параграфе мы рассмотрели самый простой, пол- ностью детерминированный случай, когда все условия операции Я], а2> известны, и любой выбор решения х2, ... приводит к впол- не определенному значению показателя эффективности IE. К сожалению, этот простейший случай не так уж часто встре- чается на практике. Гораздо более типичен случай, когда не все условия, в которых будет проводиться операция, известны зара- нее, а некоторые из них содержат элемент неопределенности. Напри- мер, успех операции может зависеть от метеорологических условий, которые заранее неизвестны, или от колебаний спроса и предложения, заранее трудно предвидимых, связанных с капризами моды, или же от поведения разумного противника, действия которого заранее неиз- вестны. В подобных случаях эффективность операции зависит уже не от двух, а от трех категорий факторов: — условия выполнения операции alt а2.которые известны за- ранее и изменены быть не могут; — неизвестные условия или факторы Ylt Y2, ... ; — элементы решения хи х2, ..., которые нам предстоит выбрать. 18
Пусть эффективность операции характеризуется некоторым пока- зателем W, зависящим от всех трех групп факторов. Это мы запишем в виде общей формулы: W = W (alf а2,...; Yu Га, ...; х1г х2,...). (4.1) Если бы условия Yi, Ys, ... были известны, мы могли бы заранее подсчитать показатель W и выбрать такое решение х1г х2, ..., при кото- ром он максимизируется. Беда в том, что параметры Yi,Y2, ... нам не- известны, а значит, неизвестен и зависящий от них показатель эффек- тивности W при любом решении. Тем не менее задача выбора решения по-прежнему стоит перед нами. Ее можно сформулировать так: При заданных условиях а1; а2, с учетом неизвестных факторов Ki, Ys, ... найти такие элементы решения хъ х2, ..., которые по воз- можности обращали бы в максимум показатель эффективности И7. Это — уже другая, не чисто математическая задача (недаром в ее формулировке сделана оговорка «по возможности»). Наличие неизвест- ных факторов Ylt У2, ... переводит нашу задачу в другую категорию’ она превращается в задачу о выборе решения в условиях неопределен- ности. Давайте будем честны: неопределенность есть неопределенность. Если условия выполнения операции неизвестны, мы не имеем возмож- ности так же успешно организовать ее, как мы это сделали бы, если бы располагали большей информацией. Поэтому любое решение, приня- тое в условиях неопределенности, хуже решения, принятого во впол ie определенной ситуации. Наше дело — сообщить своему решению в наи- большей возможной мере черты разумности. Решение, принятое в ус- ловиях неопределенности, но на основе математических расчетов, бу- дет все же лучше решения, выбранного наобум. Недаром один из вид- ных зарубежных специалистов — Т. Л. Саати в книге «Математичес- кие методы исследования операций» [4] дает своему предмету следую- щее ироническое определение: «Исследование операций представляет собой искусство давать плохие ответы на те практические вопросы, на которые даются еще худшие ответы другими методами». Задачи о выборе решения в условиях неопределенности встречают- ся нам в жизни на каждом шагу. Пусть, например, мы собрались ехать в отпуск, взяв с собой чемодан ограниченного объема, причем вес че- модана не должен превышать того, при котором мы можем носить его без посторонней помощи (условия аь а2, ...). Погода в районах путе- шествия заранее неизвестна (условия Yr, У2, ...). Спрашивается, ка- кие предметы одежды (хг, х2, ...) следует взять с собой? Эту задачу мы, разумеется, решаем без всякого математического аппарата, хотя, по-видимому, не без опоры на какие-то численные дан- ные (хотя бы на вероятности морозной или дождливой погоды в райо- нах путешествия в данное время года). Однако, если нужно принять более серьезное и ответственное решение (например, о характеристи- ках проектируемой плотины в районе возможных паводков, или о вы- боре типа посадочного устройства для посадки на планету с неизвест- 19
ними свойствами поверхности, или о выборе образца вооружения для борьбы с противником, характеристики которого заранее неизвестны), то выбору решения в обязательном порядке должныбыть предпосланы математические расчеты, облегчающие этот выбор и сообщающие ему, в доступной мере, черты разумности. Применяемые при этом методы существенно зависят от того, ка- кова природа неизвестных факторов Ylt Y2, и какими ориентиро- вочными сведениями о них мы располагаем. Наиболее простым и благоприятным для расчетов является слу- чай, когда неизвестные факторы Ylt У2, ... представляют собой слу- чайные величины (или же случайные функции), о которых имеются статистические данные, характеризующие их распределение. Пусть, например, мы рассматриваем работу железнодорожной сортировочной станции, стремясь оптимизировать процесс обслужива- ния прибывающих на эту станцию грузовых поездов. Заранее неизвест- ны ни точные моменты прибытия поездов, ни количество вагонов в каж- дом поезде, ни адреса, по которым направляются вагоны. Все эти ха- рактеристики представляют собой случайные величины, закон распределения каждой из которых (и их совокупности) может быть определен по имеющимся данным обычными методами математи- ческой статистики. Аналогично, в каждой военной операции присутствуют случай- ные факторы, связанные с рассеиванием снарядов, со случайностью моментов обнаружения целей и т. п. В принципе все эти факторы могут быть изучены методами теории вероятностей, и для них могут быть по- лучены законы распределения (или, по крайней мере, числовые харак- теристики). В случае, когда неизвестные факторы, фигурирующие в опера- ции — Ylt Y2, ... — являются обычными случайными величинами (или случайными функциями), распределение которых, хотя бы ориен- тировочно, известно, для оптимизации решения может быть применен один из двух приемов: — искусственное сведение к детерминированной схеме; — «оптимизация в среднем». Остановимся более подробно на каждом из этих приемов. Первый прием сводится к тому, что неопределенная, вероятност- ная картина явления приближенно заменяется детерминированной. Для этого все участвующие в задаче случайные факторы Ylt У2, ... приближенно заменяются не случайными (как правило, их математи- ческими ожиданиями). Этот прием применяется по преимуществу в грубых, ориентиро- вочных расчетах, когда диапазон случайных изменений величин Yb Y2, ••• сравнительно мал, т. е. они без большой натяжки могут рас- сматриваться как не случайные. Заметим, что тот же прием замены случайных величин их математическими ожиданиями может успешно применяться и в случаях, когда величины Ylt Y2, ... обладают боль- шим разбросом, но показатель эффективности W зависит от них ли- нейно (или почти линейно). 20
Второй прием («оптимизация в среднем»), более сложный, при- меняется, когда случайность величин У1( У2, ... весьма существенна и замена каждой из них ее математическим ожиданием может привес- ти к большим ошибкам. Рассмотрим этот случай более подробно. Пусть показатель эф- фективности W существенно зависит от случайных факторов (будем для простоты считать их случайными величинами) Ylt Y2, ...; допус- тим, что нам известно распределение этих факторов, скажем, плот- ность распределения f(ylt у2, ...). Предположим, что операция выпол- няется много раз, причем условия Ylt Y2, ... меняются от раза к разу случайным образом. Какое решение xlt х2, ... следует выбрать? Очевидно, то, при котором операция в среднем будет наиболее эффективна, т. е. математическое ожидание показателя эффектив- ности W будет максимально. Таким образом, нужно выбирать такое решение хь х2, ... , при котором обращается в максимум математиче- ское ожидание показателя эффективности: Г = УИ[Г] = -Я •; У1, Уч, - ; Х2, х2 у2, ...)dy1dy2... (4.2) Такую оптимизацию мы будем называть «оптимизацией в сред- нем». А как же с элементом неопределенности? Конечно, в какой-то ме- ре он сохраняется. Успешность каждой отдельной операции, осущест- вляемой при случайных, заранее неизвестных значениях Ylt Y2....... может сильно отличаться от ожидаемой средней, как в большую, так, к сожалению, и в меньшую сторону. При многократном осуществлении операции эти различия, в среднем, сглаживаются; однако, нередко данный способ оптимизации решения, за неимением лучшего, приме- няется и тогда, когда операция осуществляется всего несколько раз или даже один раз. Тогда надо считаться с возможностью неприят- ных неожиданностей в каждом отдельном случае. Утешением нам мо- жет служить мысль о том, что «оптимизация в среднем» все же лучше, чем выбор решения без всяких обоснований. Применяя этот прием к многочисленным (хотя бы и различным) операциям, все же мы в сред- нем выигрываем больше, чем если бы совсем не пользовались расчетом. • Для того, чтобы составить себе представление о том, чем мы рис- куем в каждом отдельном случае, желательно, кроме математическо- го ожидания показателя эффективности, оценивать также и его дис- персию (или среднее квадратическое отклонение). Наиболее трудным для исследования является тот случай неопре- деленности, когда неизвестные факторы Ylt Y2, ... не могут быть изу- чены и описаны с помощью статистических методов: их законы распре- деления или не могут быть получены (соответствующие статистические Данные отсутствуют), или, что еще хуже, таких законов распределения вовсе не существует. Это бывает, когда явление, о котором идет речь, не обладает свойством статистической устойчивости. Например, мы 21
знаем, что на Марсе возможно наличие органической/Жизни, и некото- рые ученые даже считают его весьма вероятным, несовершенно невоз- можно подсчитать эту вероятность на основе какйх-либо статистичес- ких данных. Другой пример: предположим, что эффективность проек- тируемого вооружения сильно зависит от того, будет ли предполагае- мый противник к моменту начала боевых действий располагать сред- ствами защиты, и если да, то какими именно? Очевидно, нет никакой возможности подсчитать вероятности этих гипотез — самое большее, их можно назначить произвольно, что сильно повредит объективности исследования. В подобных случаях, вместо произвольного и субъективного на- значения вероятностей с дальнейшей «оптимизацией в среднем», ре- комендуется рассмотреть весь диапазон возможных условий Уъ У2, ... и составить представление о том, какова эффективность операции в этом диапазоне и как на нее влияют неизвестные условия. При этом задача исследования операций приобретает новые методологические особен- ности. Действительно, рассмотрим случай, когда эффективность опера- ции W зависит, помимо заданных условий аъ а2, ... и элементов реше- ния Xj, х2, ..., еще и от ряда неизвестных факторов Уъ У2, ... нестати- стической природы, о которых никаких определенных сведений нет, а можно делать только предположения. Попробуем все же решить за- дачу. Зафиксируем мысленно параметры Уъ У2, ... , придадим им вполне определенные значения Ух = ylt У2 — у2, ..., и переведем тем самым в категорию заданных условий аг, а2, .... Для этих усло- вий мы в принципе можем решить задачу исследования операций и найти соответствующее оптимальное решение хъ х2, ... Его элементы, кроме заданных условий аъ а2, ..., очевидно, будут зависеть еще и от того, какие частные значения мы придали условиям Ух, У2, ...: x1 = Xi(a1, а2,...; ylt у2,...); х2 = х2(аъ а2,...; уи у2,...). Такое решение, оптимальное для данной совокупности условий Уг> У(и только для нее), называется локально-оптимальным. Это решение, как правило, уже не оптимально для других значений Уъ У2, ... Совокупность локально-оптимальных решений для всего диа- пазона условий Уъ У2, ... дает нам представление о том, как мы дол- жны были бы поступать, если бы неизвестные условия Ylt У2, ... были нам в точности известны. Поэтому локально-оптимальное реше- ние, на получение которого зачастую тратится много усилий, имеет в случае неопределенности сугубо ограниченную ценность. Совершен- но очевидно, что в данном случае следует предпочесть не решение, строго оптимальное для каких-то определенных условий, а ком- промиссное решение, которое, не будучи, может быть, стро- го оптимальным ни для каких условий, оказывается приемлемым в целом диапазоне условий. В настоящее время полноценной- математической «теории компро- мисса» еще не существует, хотя в теории решений и имеются некоторые попытки в этом направлении (см., например, § 13 гл. 9 настоящей кни- 22
ги). Обычно окончательный выбор компромиссного решения осуществ- ляется человеком, который, опираясь на расчеты, может оценить и со- поставить сильные и слабые стороны каждого варианта решения в раз- ных условиях и на основе этого сделать окончательный выбор. При этом необязательно (хотя иногда и любопытно) знать точный локаль- ный оптимум для каждой совокупности условий уъ у2, ... Таким об- разом, классические вариационные и новейшие оптимизационные ме- тоды математики отступают в данном случае на задний план. В последнюю очередь рассмотрим своеобразный случай, возни- кающий в так называемых конфликтных ситуациях, когда неизвестные параметры У1( У2, ... зависят не от объективных обстоятельств, а от активно противодействующего нам против- ника. Такие ситуации характерны для боевых действий, отчасти для спортивных соревнований, в капиталистическом обществе — для конкурентной борьбы и т. д. При выборе решений в подобных случаях может оказаться по- лезным математический аппарат так называемой теории игр — математической теории конфликтных ситуаций (см. гл. 10). Модели конфликтных ситуаций, изучаемые в теории игр, основаны на пред- положении, что мы имеем дело с разумным и дальновидным противни- ком, всегда выбирающим свое поведение наихудшим для нас (и наилуч- шим для себя) способом. Такая идеализация конфликтной ситуации в некоторых случаях может подсказать нам наименее рискованное, «перестраховочное» решение, которое необязательно принимать, но во всяком случае полезно иметь в виду. Наконец, сделаем одно общее замечание. При обосновании реше- ния в условиях неопределенности, что бы мы ни делали, элемент не- определенности остается. Поэтому неразумно предъявлять к точности таких решений слишком высокие требования. Вместо того, чтобы пос- ле скрупулезных расчетов однозначно указать одно-единственное, в точности оптимальное (в каком-то смысле) решение, всегда лучше вы- делить область приемлемых решений, которые оказываются несущественно хуже других, какой бы точкой зрения мы ни пользо- вались. В пределах этой области могут произвести свой окончатель- ный выбор ответственные за него лица. 5. ОЦЕНКА ОПЕРАЦИИ ПО НЕСКОЛЬКИМ ПОКАЗАТЕЛЯМ Выше мы рассмотрели задачу исследования операций, где требо- валось так выбрать решение, чтобы максимизировать (или минимизиро- вать) один-единственный показатель эффективности W. На практике часто встречается случай, когда эффективность операции приходится оценивать не по одному, а сразу по нескольким показателям: W'i, и^2, ..., Wh; одни из этих показателей желательно сделать больше, Другие — меньше. Как правило, эффективность больших по объему, сложных опе- раций не может быть исчерпывающим образом охарактеризована с по- мощью одного показателя; на помощь ему приходится привлекать и дру- гие, дополнительные. 23
Например, при оценке деятельности промышленного предприя- тия приходится учитывать целый ряд показателей, как то: — прибыль, — полный объем продукции («вал»), — себестоимость и т. д. При анализе боевой операции, помимо основного показателя, ха- рактеризующего ее эффективность (например, математическое ожида- ние причиненного противнику ущерба), приходится учитывать и ряд дополнительных, как то: — собственные потери, — время выполнения операции, — расход боеприпасов и т. д. Такая множественность показателей эффективности, из которых некоторые желательно максимизировать, а другие — минимизировать, характерна для любой сколько-ни- будь сложной задачи исследования операций. Возникает вопрос: как же быть? •УД аг?» т,» *Xg х159 Прежде всего надо подчеркнуть, что выдвинутые требования, вообще •Хю *т,} > 7 говоря, несовместимы. Решение, об- ращающее в максимум один какой- то показатель как правило, не обращает ни в максимум, ни в мини- мум другие показатели W ъ, .... Поэтому широко распространенная формулировка «достижение макси- мального эффекта при минимальных Рис. 1.1 затратах» для научного исследования не подходит. Корректной является любая из формулировок «достижение максимального эффек- та при заданных затратах» или же «достижение заданного эффекта при минимальных затратах». В общем случае не существует решения, которое обращало бы в максимум один показатель W'j и одновременно в максимум (или минимум) другой показатель 1^2; тем более, такого решения не существует для нескольких показателей. Однако, количественный анализ эффективности может оказаться весьма полезным и в случае нескольких показателей эффективности. Прежде всего, он позволяет заранее отбросить явно нера- циональные варианты решений, уступающие лучшим вариан- там по всем показателям. Проиллюстрируем сказанное на примере. Пусть анализируется боевая операция О, оцениваемая по двум показателям: W — вероятность выполнения боевой задачи («эффективность»); S — стоимость израсходованных средств. Очевидно, первый показатель желательно обратить в максимум, а второй — в минимум. Предположим для простоты, что предлагается 24
на выбор конечное число — 20 различных вариантов решения; обоз- начим их Х1г Х2..... X20. Для каждого из них известны значения обоих показателей W и 3. Изобразим для наглядности каждый вариант решения в виде точ- ки на плоскости с координатами W и 3 (рис. 1.1)*>. Рассматривая рисунок, мы видим, что некоторые варианты реше- ния «неконкурентоспособны» и заранее должны быть отброшены. Дей- ствительно, те варианты, которые имеют над другими вариантами с той же стоимостью X преимущество по эффективности W, должны лежать на правой границе области возможных вариантов. Те же ва- рианты, которые при равной эффективности обладают меньшей стои- мостью, должны лежать на нижней границе области возмож- ных вариантов. Какие же варианты следует предпочесть при оценке эффективнос- ти по двум показателям? Очевидно, те, которые лежат одновременно ина правой, и на нижней границе области (см. пунк- тирную линию на рис. 1.1). Действительно, для каждого из вариантов, не лежащих на этом участке границы, всегда найдется другой вариант, не уступающий ему по эффективности, но зато более дешевый или, наоборот, не уступающий ему по дешевизне, но зато более эффектив- ный. Таким образом, из 20 предварительно выдвинутых вариантов большинство выпадает из соревнования, и нам остается только проана- лизировать оставшиеся четыре варианта: Xi6, ЛД, X19, Х20. Из них Хм — наиболее эффективный, но зато сравнительно дорогой; Х20 — самый дешевый, но зато не столь эффективный. Дело принимающего решение — разобраться в том, какой ценой мы согласны оплатить из- вестное повышение эффективности или, наоборот, какой долей эффек- тивности мы согласны пожертвовать, чтобы не нести слишком больших материальных потерь. Аналогичный предварительный просмотр вариантов (хотя и без такой наглядной геометрической интерпретации) может быть произ- веден и в случае многих показателей: Wlt W2, ..., Wh. Такая процедура предварительной отбраковки неконкуренто- способных вариантов решения должна всегда предшествовать решению задачи исследования операций с несколькими показателями. Это, хотя и не снимает необходимости компромисса, но существенно умень- шает множество решений, в пределах которого осуществляется выбор. Ввиду того, что комплексная оценка операции сразу по нескольким показателям затруднительна и требует размышлений, на практике часто пытаются искусственно объединить несколько показателей в один обобщенный показатель (или критерий). Нередко в качестве обобщенного (составного) критерия берут дробь; в числителе те показатели ..., Wm, которые желательно увеличить, а в нателе, — те, которые желательно уменьшить: t, IFt., Wm —-------- В книге рисунки пронумерованы по главам, а формулы и таблицы — по пара- графам такого ставят знаме- (5.1) 25
Например, если речь идет о боевой операции, в числителе ставят такие величины, как «вероятность выполнения боевой задачи» или «потери противника»; в знаменателе — «собственные потери», «расход боеприпасов», «время выполнения операции» и т. п. Общим недостатком «составных критериев» типа (5.1) является, то, что недостаток эффективности по одному показателю всегда можно скомпенсировать за счет другого (например, малую вероятность вы- полнения боевой задачи — за счет малого расхода боеприпасов, и т. п.). Критерии подобного рода напоминают в шутку предложенный Львом Толстым «критерий оценки человека» в виде дроби, где числитель — истинные достоинства человека, а знаменатель — его мнение о себе. Несостоятельность такого критерия очевидна: если принять его всерьез, то человек, почти без достоинств, но зато совсем без самомнения, будет иметь бесконечно большую ценность! Часто «составные критерии» предлагаются не в виде дроби, а в виде «взвешенной суммы» отдельных показателей эффективности: U— аг ...-f-ah №'h, (5.2) где alt а2, ..., ak — положительные или отрицательные коэффициенты. Положительные ставятся при тех показателях, которые желательно максимизировать; отрицательные—при тех, которые желательно ми- нимизировать. Абсолютные значения коэффициентов («веса») соот- ветствуют степени важности показателей. Нетрудно убедиться, что составной критерий вида (5.2) по сущест- ву ничем не отличается от критерия вида (5.1) и обладает теми же не- достатками (возможность взаимной компенсации разнородных показа- телей). Поэтому некритическое пользование любого вида «составными» критериями чревато опасностями и может привести к неправильным рекомендациям. Однако, в некоторых случаях, когда «веса» не выби- раются произвольно, а подбираются так, чтобы составной критерий наилучшим образом выполнял свою функцию, удается получить с его помощью некоторые результаты ограниченной ценности. В некоторых случаях задачу с несколькими показателями удается свести к задаче с одним-единственным показателем, если выделить толь- ко один (главный) показатель эффективности W2 и стремиться его об- ратить в максимум, а на остальные, вспомогательные показатели W2 Wa, ... наложить только некоторые ограничения вида: !F2>w2;---; Wm^wm; W„l+i ^Wm+r,...; Wk^wk. Эти ограничения, разумеется, войдут в комплекс заданных усло- вий аь а2, Например, при оптимизации плана работы промышленного пред- приятия можно потребовать, чтобы прибыль была максимальна, план по ассортименту — выполнен, а себестоимость продукции — не выше заданной. При планировании бомбардировочного налета можно потре- бовать, чтобы нанесенный противнику ущерб был максимален, но при этом собственные потери и стоимость операции не выходили за из- вестные пределы. 26
При такой постановке задачи все показатели эффективности, кроме одного, главного, переводятся в разряд заданных условий операции. Варианты решения, не укладывающиеся в заданные границы, сразу же отбрасываются, как неконкурентоспособные. По- лученные рекомендации, очевидно, будут зависеть от того, как выбра- ны ограничения для вспомогательных показателей. Чтобы определить, насколько это влияет на окончательные рекомендации по выбору реше- ния, полезно проварьировать ограничения в разумных пределах. Наконец, возможен еще один путь построения компромиссного решения, который можно назвать «методом последовательных усту- пок». Предположим, что показатели эффективности расположены в по- рядке убывающей важности: сначала основной Wi, затем другие, вспо- могательные: W2, ••• Для простоты будем считать, что каждый из них нужно обратить в максимум (если это не так, достаточно изме- нить знак показателя). Процедура построения компромиссного реше- ния сводится к следующему. Сначала ищется решение, обращающее в максимум главный показатель эффективности IFX. Затем назначает- ся, исходя из практических соображений и точности, с какой известны исходные данные (а часто она бывает небольшой), некоторая «уступка» Д Wlt которую мы согласны допустить для того, чтобы обратить в мак- симум второй показатель W2. Налагаем на показатель W'j ограничение, чтобы он был не меньше, чем — Д где W\* — максимально возможное значение IF1( и при этом ограничении ищем решение, об- ращающее в максимум W2. Далее снова назначается «уступка» в пока- зателе IV'a, ценой которой можно максимизировать W9, и т. д. Такой способ построения компромиссного решения хорош тем, что здесь сразу видно, ценой какой «уступки» в одном показателе при- обретается выигрыш в другом. Заметим, что свобода выбора решения, приобретаемая ценой даже незначительных «уступок», может оказаться существенной, так как в районе максимума обычно эффективность решения меняется очень слабо. Так или иначе, при любом способе формализации, задача коли- чественного обоснования решения по нескольким показателям остает- ся не до конца определенной, и окончательный выбор решения опреде- ляется волевым актом «командира» (так мы условно будем называть ответственное за выбор лицо). Дело исследователя — предоставить в распоряжение командира достаточное количество данных, позволяю. Щих ему всесторонне оценить преимущества и недостатки каждого ва- рианта решения и, опираясь на них, сделать окончательный выбор.
2 ЛИНЕЙНОЕ ПРОГРАММИРОВАНИЕ 1. ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Во многих областях практики возникают своеобразные задачи оптимизации решений, для которых характерны следующие черты: — показатель эффективности W представляет собой линейную функцию от элементов решения хъ х2, ... ; — ограничительные условия, налагаемые на возможные решения, имеют вид линейных равенств или неравенств. Такие задачи принято называть задачами линейного программиро- вания*^ . Приведем несколько примеров задач линейного программирова- ния из разных областей практики. 1. Задача о пищевом рационе. Имеется четыре вида продуктов питания: Пх, П2, П3, П4. Известна стоимость единицы каждого продукта: 6*1, 6*2, С3, СА. Из этих продуктов необходимо составить пищевой рацион, кото- рый должен содержать: —белков не менее Ьг единиц, — углеводов не менее 62 единиц, — жиров не менее bs единиц. (1.1) Единица продукта П] содержит ап единиц белков, п12 единиц углеводов, а13 единиц жиров и т. д. Содержание элементов в единице каждого продукта задано таблицей (табл. 1.1). Требуется так составить пищевой рацион, чтобы обеспечить за- данные условия (1.1) при минимальной стоимости рациона. Запишем сформулированные словесно условия задачи в виде мате- матических формул. Обозначим Xj, х2, х3, х4 количества продуктов П1Я П2, П3, П4, входящих в рацион. *) Слово «программирование» заимствовано из зарубежной литературы и в данном случае означает не что иное, как «планирование» 28
Таблица I.) Элемент белки углеводы жиры £ >3 Ct 0 СХ Е Пх <3ц <312 °13 П2 °21 а22 а23 Пз °31 °32 а33 П4 °43 <342 а43 Очевидно, общая стоимость рациона будет L = ел + с2х2 + CgXa + с4х4 или короче 4 ь = 2 сгхг. /=1 (1-2) Запишем математически условия (1.1). В одной единице продукта Ilj содержится ап единиц белка, значит, в хг единицах — аиху, в х2 единицах продукта П2 содержится а21х2 единиц белка и т. д. Общее ко- личество белков, содержащееся в рационе, не должно быть меньше Ьг\ отсюда получаем первое условие-неравенство: ап %! + а21 х2 + а31 х3 4- а41 х4 > Ьг. (1.3) Записывая аналогичные условия для углеводов и жиров, получим, включая (1.3), три условия-неравенства: аи Ч- a2i х2 + #31 х3 п41 Хц blt а12 Х1 + а22 Х2 + а32 Х3 4“ а42 Х4 ^2- а13 Х1 4* а23 Х2 4" а33 Х3 4" й43 Х4 2^ ^3' (1.4) Эти условия представляют собой ограничения, наклады- ваемые на решение. Возникает следующая задача: Выбрать такие неотрицательные значения переменных х1( х2, х8, xit удовлетворяющие линейным неравенствам (1.4), при которых ли- нейная функция этих переменных В — Cixi 4“ с2х2 4- caxa 4- с^х^ обращалась бы в минимум. Поставленная задача представляет собой типичную задачу ли- нейного программирования. Не останавливаясь покуда на способах ее решения (об этом речь будет идти в дальнейшем), поставим еще не- сколько подобных задач. 29
2. Задача о загрузке станков. Ткацкая фабрика располагает станками типа 1 и Л/2 станками типа 2. Станки могут производить четы- ре вида тканей: ^i, Т2> тз', 7\, Каждый тип станка может производить любой из видов тканей, но в неодинаковом количестве. Станок типа 1 производит в месяц ап метров ткани Т1г а12 метров ткани Т2, а13 метров ткани Т3, а14 метров ткани Tt. Соответствующие числа для станка типа 2 будут а21, о22, агз, а24- Таким образом, производительности станков при произ- водстве каждого вида ткани заданы табл. 1.2. Таблица .2 1ип стайка Вид ткани т. г< 1 а11 ац «13 аы 2 а21 а22 «23 «24 Каждый метр ткани 7\ приносит фабрике доход съ ткани Т2 — доход с2, ткани Т3 — доход с3 и ткани Tt —доход с4. Фабрике пред- писан план, согласно которому она обязана произвести за месяц: не менее метров ткани Ти не менее Ь2 метров ткани Тг, не менее Ь3 метров ткани Т3 и не менее 64 метров ткани Tit т. е. пла- новое задание выражается числами Ьъ Ь2, Ь3, Ь4. Требуется так распределить загрузку станков производством тка- ней различного вида, чтобы план был выполнен и при этом месячная прибыль была максимальна. Запишем условия задачи математически. Обозначим хп—число станков типа 1, занятых производством ткани Т1г х12 — число станков типа 1, занятых производством ткани Т2, и вообще xtj — число станков типа I, занятых производством ткани Тs. Первый индекс соответствует типу станка, второй — виду ткани (i = 1, 2, / = 1, 2, 3, 4). Таким образом возникают восемь переменных — элементов реше- ния; (1.5) Х111 Х12> Х13> хи> X2lt Х22> X23i Х24> которые мы должны выбрать так, чтобы месячная прибыль была мак- симальна. Запишем формулу для вычисления этой прибыли. Каждый метр ткани Т\ приносит прибыль с4; хп метров ткани 7\ принесут при- быль CjXuj всего ткань 7\ принесет прибыли + х21) и т. д. Общая прибыль будет равна: L —Cj (хи -|- Х21) 4* ^2 (-*-12 + X2i) *Т^З (*13 4" *2з) ^4 (Х14 4“ *24)- (1 Требуется выбрать такие неотрицательные значения переменных (1.5), чтобы линейная функция от них (1.6) обращалась в максимум. При этом должны выполняться следующие ограничительные условия: 30
(1.7) 1) Ресурсы по станкам не должны быть превышены, т. е. сумма количеств станков каждого типа, занятых производством всех тканей, не должна превышать наличного запаса станков: *11 + *12 + *13 + *14 "С 1» *21 + *22 + *23 “Г *24 2' 2) Задания по ассортименту должны быть выполнены (или пере- выполнены). С учетом данных табл. 1.2 эти условия запишутся в виде неравенств: а11 *11 + а21 *21 ^1» °12 *12 + а22 *22 ^2» (18) Я13 *13 а2й *23 ^3» ®14 *14 ^24 *24 ^4’ Таким образом, сформулирована задача: Выбрать такие неотрицательные значения переменных хп, х12, ..., ..., *24» удовлетворяющие линейным неравенствам (1,7) и (1.8), при которых линейная функция этих переменных (1.6) обращалась бы в максимум. 3. Задача о распределении ресурсов. Имеются какие-то ресурсы (сырье, рабочая сила, оборудование): /?1, /?2> ••• > в количествах соответственно bi, b2, ..., Ьт единиц. С помощью Этих ресурсов могут производиться товары: Для производства одной единицы товара Т} необходимо atj еди- ниц ресурса Rt (t — 1,2, ... , т\ j = 1,2, ... , п). Каждая единица ресурса Rt стоит dt рублей (/ = 1,2...т). Каждая единица това- ра Т) может быть реализована по цене с> (/ = 1, 2, ..., п). По каждому виду товара количество произведенных единиц огра- ничивается спросом: известно, что рынок не может поглотить более, чем kj единиц товара Т} (j = 1,2, ..., п). Спрашивается: какое количество единиц какого товара надо про- извести для того, чтобы реализовать максимальную прибыль? Запишем условия задачи. Обозначим количества товаров Tlt Т2...... Тп, которые мы запланируем к произ- водству. Условия спроса налагают на эти величины ограничения: *i < ki, х2 < k2; ...; хп < kn. (1.9) 31
Ресурсов Должно хватить, отсюда возникают ограничения: а11 Х1 4“ й12 Х2 4* ••• + а1п Хп ^=5 а21 хг 4- ам х2 + ... + а2п хп < Ь2, ат1 *1 4- &т2 -^2 4-...4-^тп %п ^тп* I Эти же условия можно короче записать в виде: Gjj Xj SJZ blt (=1 п f ат1х1<Ьт. =i Выразим прибыль L в зависимости от элементов решения Х1, х2,..., хп. Х1) Себестоимость s> единицы товара Tj равна Sy = Gjj di 4- a2j d2 4- • • • 4- ami или, короче, tn s}^Yaudi (j=l, 2,..., n} (1.11) z=i Вычислив по этой формуле себестоимость единицы каждого то- вара, получим ряд значений: St, s2,..., sn. Чистая прибыль qjt получаемая от реализации одной единицы Товара Tj, равна разнице между ее продажной ценой С; и себестои- мостью s,: qi=c~si (/ = !. 2.......«)• (М2) По этой формуле получаем чистые прибыли на единицу для всех товаров: 71, 7г...qn- Общая чистая прибыль от реализации всех товаров будет L =q± Xj 4- 7г хг 4- ••• 4- 7« хт или, короче, п L=TqjXj. (1.13 32
Задача сводится к следующему: Выбрать такие неотрицательные значения переменных хг, х2, хп, которые удовлетворяют линейным неравенствам (1.9), (1.10) и об- ращают в максимум линейную функцию этих переменных (1.13). 4. Задача о перевозках. Имеются т складов: Ci, С2,..., Ст и п пунктов потребления: Ц1» П2,..., Пп (см. рис. 2.1). Речь идет о составлении плана перевозок со складов Сь С2, Ст в пункты П1( П2, Пп некоторого товара. На складах Ct, С2, ..., Ст имеются запасы товара в количествах ^2> ••• > единиц. Пункты потребления Пь П2, ..., Пп подали заявки соответст- венно на t>i, b2,..., Ьп единиц товара. Заявки выполнимы, т. е. сумма всех заявок не превос- ходит суммы всех имеющихся запасов: . п т Т' Ь) J at. i=i i=i Склады Сх.....Ст связаны с пунктами потребления Пъ ..., Пя какой-то сетью дорог с определенными тарифами на перевозки. Стоимость перевозки одной единицы товара со склада С, в пункт П] равна си (i =1, 2, ..., т; j = 1, 2, ..., п). 2 Зак 573 33
Требуется составить план перевозок, т. е. указать, с какого скла- да в какие пункты и какое количество товара нужно направлять так, чтобы заявки были выполнены, а общие расходы на все перевозки были минимальными. Обозначим хц — количество единиц товара, направляемое со склада С4 в пункт П,- (если с этого склада в этот пункт товары не направляются, х(7==0). Решение (план перевозок) состоит из тп чисел : *11> *12» ••• » *1п> *21» *22, ••• » *2п» хт1> хт2> •••» хтп> образующих прямоугольную таблицу (матрицу). Сокращенно будем обозначать ее (xj;). Требуется выбрать такие неотрицательные зна- чения переменных xtj (1=1,2,..., tn; j = l, 2... п), чтобы были выполнены следующие условия: 1. Емкость складов не должна быть превышена, т. е. общее коли- чество товара, взятое с каждого склада, не должно превышать имею- щихся на нем запасов: хп + *ia + ••• + х1п аЪ 1 Х21 +Х22 + ••• + %2п аъ', % ml ”1“ ••• 4~^тп > < или, короче, п /=1 п *2> @2> (1-14) т J xmJ @1 1=1 2. Заявки, поданные пунктами потребления, должны быть вы- полнены: *11 + *21 + ••• + *ml — ^1» *12 + *22 + ••• +*т2 — ^2» *м + *2п + ••• + хтп — 94
или, короче, т F ха=ьи f=l т X/2 = Ь2, /=1 (1.15) т Х{п = Ьп. Z=I Общая стоимость перевозок L будет равна L =сп Хц -{- с12 х12 4* ••• + cin xin 4" 4- С21 *21 4~ ^22 %22 ”1“ ••• 4“ ^2п %2п 4“ 4--- 4-cmi % ml 4“ Ctn2 % m2 + ••• 4- ^mn %тп* или, гораздо короче, т п ь = 2 ^ci]Xti. (1.16) Z—1 /=1 Требуется так выбрать план перевозок (хц) (i = 1,2, m; j — 1, 2, ..., и), чтобы стоимость L этих перевозок обратить в минимум. Снова возникает задача, аналогичная рассмотренным ранее: вы- брать неотрицательны^ значения переменных (х^) так, чтобы при вы- полнении условий (1.14), (1.15) линейная функция этих переменных (1.16) достигала минимума. Некоторая особенность этой задачи, по сравнению с ранее рас- смотренными, состоит в том, что не все ограничения, наложенные на переменные, являются линейными неравенствами; а именно, условия (1.15) записаны в виде линейных равенств. В дальнейшем мы будем встречаться с задачами линейного про- граммирования, в которых ограничительные условия имеют как вид линейных неравенств, так и равенств, и научимся с легкостью пере- ходить от одних к другим и обратно. Заметим, что при некоторой постановке задачи о перевозках все условия-ограничения задачи становятся равенствами. А именно, если сумма всех заявок равна сумме всех запасов п т S Ь) = S ai> i=l <=1 то неизбежно с каждого склада будет вывезено все, что на нем имеет- ся, и неравенства (1.14), так же как (1.15), превратятся в равенства. Такая задача о перевозках называется транспортной задачей, и ею мы будем специально заниматься в дальнейшем (см. § 9—14 дан- ной главы). 5. Задача о производстве сложного оборудования. Планируется производство сложного оборудования, каждый комплект которого со- стоит из п элементов: Эь Э4,..., Эп. 2* 35
Заказы на производство этих элементов могут быть размещены на т разных предприятиях: Пь П2,..., Пт. В течение заданного времени Т на предприятии Пг можно изго- товить ai} элементов типа Эу (t = l, ..., tn; j = 1, ..., п). Сдаче подлежат только полные комплекты оборудова- ния, состоящие из набора всех элементов Э1( Э2, ..., Эп. Требуется распределить заказы по предприятиям так, чтобы чис- ло полных комплектов оборудования, изготовленных за время Т, было максимально. Планируя производство оборудования, мы должны для каждого предприятия П{ указать, какую часть имеющегося в его рас- поряжении времени оно должно отдать на производство элементов Э,- (i = 1..т\ j ~ 1....п). Обозначим xtj долю времени Т, которую предприятие Пг будет уделять производству элемента Э, (если этот элемент на данном пред- приятии вообще не производится, х^ = 0). При планировании мы должны соблюдать следующие ограничи- тельные условия: количество времени, которое каждое предприятие затрачивает на производство всех элементов, не должно превышать общего ^запаса времени Т (а «доля» — единицы): Х11 + *12 +••• + *1п + 1, *21 + *22 + ••• + *2n 1 > *т1 + *тг + ••• + %mn 1 ' ИЛИ 2 *u^i> /=1 п 2 *2/ 1» /=1 (1.17) 2 Хт} < 1 • f=l Определим количество полных комплектов оборудования, кото- рое за время Т поставят все предприятия вместе. Общее количество элементов Эу, которое произведут все предприя- тия вместе, будет равно — aij Хц + a2j х2) amj xmj или зв m Nj = 2 ai} xt} 0 = 1.......«)• (1.18)
Таким образом, при заданном плане распределения заказов, т. е. при заданных т\ / = 1,..., п) будет произведено: —экземпляров элемента —Nt экземпляров элемента Э2 —iVn экземпляров элемента Эп. Сколько же полных комплектов оборудования можно собрать из этих элементов? Очевидно столько, каково минимальное из всех чисел Nlt N2, ..., iVn. Действительно, если, например, элементов типа произведено 100 шт., а элементов типа Э2 — всего 10 шт., то мы никак не сможем собрать из этих элементов более 10 полных ком- плектов. Обозначим Z — количество полных комплектов оборудования, которое можно собрать при данном плане размещения заказов (х,?). Имеем: Z = minNj, (1.19) I где знаком min обозначается минимальное из чисел, / стоящих под этим знаком, для всех возможных /. С учетом (1.18) , условие (1.19) можно переписать в виде Z = min 2 auXi}. (1.20) I z=i Таким образом, мы приходим к следующей математической поста- новке задачи: Найти такие неотрицательные значения переменных xi}, чтобы выполнялись неравенства (1.17) и при этом обращалась в максимум функция этих переменных т Z = min J auxi}. i i=i Отличие этой задачи от всех ранее рассмотренных состоит в том, что здесь максимизируемая функция Z не является линей- ной функциейот переменных хц и, таким образом, задача, соб- ственно, не является задачей линейного программирования. Однако ее легко свести к задаче линейного программирования следующими рассуждениями. Так как величина Z является минимальной из всех величин т Nj = У atj Хн, то можно написать ряд неравенств 37
т Т апхц^г-, /=1 т Г ai2xi2>Z; z=i (1.21) т У ain KiTl >: Z. Ав- lit III Z=1 Величину Z можно рассмотреть как новую неотрица- тельнуюпеременнуюи решить следующую задачу. Найти такие неотрицательные значения переменных х1л, х12, хтп и Z, чтобы они удовлетворяли линейным неравенствам (1.17) и (1.21) и при этом величина Z обращалась в максимум. Так как величина Z есть линейная функция новых пере- менных Хц, х12, ..., хтп, Z: Z — 0 • Xtl 0 • Х12 -{- ... 4" 0 ' хтп + 1'2, то задача сведена к обычной задаче линейного программирования, пу- тем введения «лишней» переменной Z, которая в первоначальной по- становке задачи не фигурировала. Задачи такого типа, где требуется обратить в максимум мини- мальное значение какой-то величины (или, наоборот, в минимум — мак- симальное), довольно часто встречаются на практике и называются «за- дачами на минимакс». С такими задачами мы еще встретимся в гл. 10. Итак, мы рассмотрели целый ряд задач исследования операций из самых разных областей практики; эти задачи характеризуются не- которыми общими чертами. В каждой из них элементы реше- ния представляют собой ряд неотрицательных переменных xlt х2, .... Требуется так выбрать значения этих переменных, чтобы 1) выполнялись некоторые ограничения, имеющие вид линейных неравенств или равенств относительно переменных х1( х2, ...; 2) некоторая линейная функция L тех же переменных обращалась в максимум (минимум). Математический аппарат линейного программирования, к изло- жению которого мы и приступаем, предназначен специально для реше- ния таких задач. Может возникнуть вопрос: а нужен ли такой специальный аппа- рат? Нельзя ли, как это принято в математике, просто продифферен- цировать L по аргументам х2, ..., приравнять производные нулю и решить полученную систему уравнений? Нет, оказывается, сделать этого нельзя! Так как функция L ли- не й н а, производные от нее по всем аргументам постоянны и ни- где в нуль не обращаются. Максимум (или минимум) функции L, если он существует, достигается всегда где-то на границе обла- сти возможных значений хи х2.т. е. там, где начинают действовать ограничения. Математический аппарат линейного программирования и позволяет нам последовательно, в кратчайшие сроки, обследовать 38
границы области возможных решений и найти на этих границах то решение, которое является оптимальным, т. е. такую совокупность значений х1г х2, ..., при которой линейная функция L обращается в максимум или в минимум. 2. ОСНОВНАЯ ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Выше мы рассмотрели различные практические задачи, сводящие- ся к схеме линейного программирования. В одних из этих задач ли- нейные ограничения имели вид неравенства, в других — равенств, в третьих — тех и других. Здесь мы рассмотрим задачу линейного программирования с огра- ничениями-равенствами — так называемую основную задачу линей- ного программирования (ОЗЛП). В дальнейшем мы покажем, как от задачи с ограничениями-не- равенствами можно перейти к ОЗЛП, и обратно. Основная задача линейного программирования ставится следую- щим образом. Имеется ряд переменных х2,, хп. Требуется найти такие неотрицательные значения этих пере- менных, которые удовлетворяли бы системе линейных уравнений! а11 Х1 + а12 хг + ••• + а1п хп = Ьъ а21 Х1 + а22 Х2 + ... + а2п Хп = ^2» • • ••• • ••••••»• ami xi + ат2 х2 + ... + атп хп = Ь и, кроме того, обращали бы в минимум линейную функцию L = Cj xt -j-c2 х2 сп хп. (2.2) Очевидно, случай, когда линейную функцию нужно обратить не в минимум, а в максимум, легко сводится к предыдущему, если изме- нить знак функции и рассмотреть вместо нее функцию L'= ~Ь = —с1х2—с2х2—...—спхп. (2.3) Условимся называть допустимым решением ОЗЛП любую совокупность переменных лу О, х2 0,..., хп 0, удовлетворяющую уравнениям (2.1). Оптимальным решением будем называть то из допустимых решений, при котором линейная функция (2.2) обращается в мини- мум. Основная задача линейного программирования необязательно должна иметь решение. Может оказаться, что уравнения (2.1) противо- (2.1)
речат друг другу; может оказаться, что они имеют решение, но не в об- ласти неотрицательных значений хъ х2, ..., хп. Тогда ОЗЛП не имеет допустимых решений. Наконец, может оказаться, что допустимые решения ОЗЛП существуют, но среди них нет оптимального: функция L в области допустимых решений неограничена снизу. С примерами таких особенностей ОЗЛП мы познакомимся в даль- нейшем. Рассмотрим, прежде всего, вопрос о существовании допусти- мых решений ОЗЛП. При решении этого вопроса мы можем исключить из рассмотрения линейную функцию L, которую требуется минимизировать — наличие допустимых решений определяется только уравнениями (2.1). Итак, пусть имеется система уравнений (2.1). Существуют ли не- отрицательные значения хи х2, ..., хп, удовлетворяющие этой систе- ме? Этот вопрос рассматривается в специальном разделе математики— линейной алгебре. Приведем вкратце некоторые положения линейной алгебры, не останавливаясь на доказательствах соответствующих теорем*) . Матрицей системы линейных уравнений аИ Х1 + й12 Х2 + ••• + а1п ХП ~ #21 xi4- #22 х2 а2п хп = Ь2, G-ml ^-1 -Г ^т2 Х2 + ••• + ^тп хп ~ называется таблица, составленная из коэффициентов при Xi, х2, ..., хп: #п а12 ... #in #21 й22 ••• #2п ^m2 ••• @тп Расширенной матрицей системы линейных уравне- ний называется та же матрица, дополненная столбцом свободных чле- нов: #и а12 ... #in Ьг а21 а22 ••• а2п '^2 ^ml &т2 ••• Рангом матрицы называется наибольший порядок от- личного от нуля определителя, который можно получить, вычеркивая из матрицы какие-то строки и какие-то столбцы. В линейной алгебре доказывается, что для совместности системы линейных уравнений (2.1) необходимо и достаточно, чтобы ранг мат- рицы системы был равен рангу ее расширенной матрицы. *) Элементарное изложение линейной алгебры см., например, в работе [5]. 40
Пример I. Дана система трех уравнений с четырьмя неизвестными: -(-Яг—хз~\~х4---1; *1 —х2 = 2; х 1 — 2х з 3. Определить, является ли эта система совместной? Решение. Матрица системы; 2 1—11 1—1 0 0. 1 0—2 0 Расширенная матрица; 2 1—11—1 1—1 00 2 . 1 0—20 3 Определим ранг первой матрицы. Он не может быть больше, чем 3 (так как число строк равно 3). Составим какой-нибудь определитель, вычеркивая из мат- рицы какой-нибудь столбец, например, последний. Получим 2 1 1 —1 1 0 Д = —1 0 —2 Вычисляя этот определитель по известному правилу, получим: Д = 2.(—1).(—2)+1-0.(—1)+1.1-0— —(—1)-(—1)-1— 2.0-0 — (—2). 1-1 =4 —1+2=5. Этот определитель не равен нулю, значит, ранг матрицы системы равен 3. Очевидно, ранг расширенной матрицы тоже равен 3, так как из элементов расши- ренной матрицы можно составить тот же определитель. Из равенства рангов мат- риц следует, что система уравнений совместна. Пример 2. Исследовать на совместность систему двух уравнений с тремя неизвестными xt, х2, xs: 2xj— x2+ х3=—4, 4xx — 2x2 + 2х3 = 1. Решение. Расширенная матрица системы: II 2 —1 1 —4 || II 4 —2 2 1 || ’ (левая ее часть — матрица системы). Найдем ранг матрицы системы, составляя все возможные определители второго порядка: 2 4 Д1 = = —44.4 = 0; 2 4 1 2 = 4—4=0; ЛН-2 2 | = ~2 + 2=0- 44
Итак, все возможные определители второго порядка, составленные из элементов матрицы системы равны нулю; значит, ранг этой матрицы систе- мы гс = 1 <2. Найдем ранг расширенной матрицы. Определитель I 2 _4 I Д4 = =2+16=18=^0. 4 II Отсюда ранг расширенной матрицы гр = 2, он не равен рангу матрицы си- стемы: /-р + гс, следовательно, система уравнений несовместна. Пример 3. Исследовать на совместность систему трех уравнений с четырьмя неизвестными: *1 + *г4* хз—2, xi—х2 + *з + х4=— 3xj—х2 + Зх3 + х4= 0 Решение Расширенная матрица системы (вместе с матрицей систе- мы): 1 11-1 2 1-11 1 -1 . 3—13 1 о Найдем ранг матрицы системы. Возьмем определитель третьего порядка, составленный из ее элементов, например: Л1 = 1 1 1 -1 3 —1 Известно, что если какая-либо строка определителя является линейной комбинацией двух других его строк, то определитель равен нулю. В нашем слу- чае третья строка является линейной комбинацией двух первых: чтобы ее полу- чить, достаточно сложить первую строку с удвоенной второй Поэтому Д] = 0. Нетрудно убедиться, что тем же свойством обладает и любой определитель третьего порядка, составленный из элементов матрицы системы Следовательно, ранг матрицы системы гс < 3. Так как имеется неравный нулю определитель второго порядка, например, I 1 Д2-| j 1 —1 то ранг матрицы системы равен гс — 2. С помощью таких же рассуждений убедимся, что и ранг расширенной мат- рицы равен двум: гр = 2. Следовательно, система уравнений совместна Заметим, что три уравнения данного примера не являются неза- висимыми: третье можно получить из двух первых, если умножить второе на два и прибавить к первому. Значит, третье уравнение есть простое следствие двух первых. Независимых уравнений в системе только два: это и отражено тем фактом, что ранг матрицы системы гс = 2. Итак, если система уравнений-ограничений ОЗЛП совместна, то матрица системы и ее расширенная матрица имеют один и тот же ранг. Этот общий ранг г называется рангом с и с т е м ы; он предста* 43
вляет собой не что иное, как число линейно незави- симых уравнений среди наложенных ограничений. Очевидно, ранг системы г не может быть больше числа уравне- ний т: г^т. Очевидно, также, что ранг системы не может быть больше общего числа переменных п: г < п. Действительно, ранг матрицы системы определяется как наиболь- ший порядок определителя, составленного из элементов матрицы; так как число ее строк равно т, то г т; так как число ее столбцов равно п, то г Структура задачи линейного программирования существенно за- висит от ранга системы ограничений (2.1). Рассмотрим, прежде всего, случай, когда г=п, т. е когда число линейно независимых уравнений, входящих в систему (2.1), равно чис- лу переменных п. Отбросим «лишние» уравнения, являющиеся линей- ными комбинациями других. Система уравнений-ограничений ОЗЛП принимает вид: а11 Х1 4~й12 *2 + ••• + аи Ч + ••• + а1пХп = ^1» а21 *14~а22 хг + ••• + а2г Х1 + •” + а2п хп ~ &2» (2 4) ап1 Х1~Ьап2 *2 + ••• + ani Xi + ••• + апп Хп =^п- Так как г = п, то определитель, составленный из коэффициентов, °11 °12 аи ••• ain ^21 а22 ••• ^2г ••• <Чп &пЛ ••• &пп не равен нулю. Из алгебры известно, что в этом случае система (2.4) имеет единственное решение. Чтобы найти величину xt, достаточно в определителе А -заменить i-й столбец — столбцом свободных членов и разделить на А. Итак, при г — п система уравнений-ограничений ОЗЛП имеет единственное решение: хъ х2...хп. Если в этом решении хотя бы одна из величин х1( х2, ..., хп отри- цательна, это значит, что полученное решение недопустимо и, значит, ОЗЛП не имеет решения. Если все величины хъ х2, ..., хп неотрицательны, то найденное решение является допустимым. Оно же, очевидно, является- и оптимальным (потому что других нет). Очевидно, этот тривиальный случай не может нас интересовать. Поэтому в дальнейшем мы будем рассматривать только случай, когда 43
г < и, т. е., когда число независимых уравнений, которым должны удовлетворять переменные хг, х2, ..., хп, м е н ь ш е числа самих пере- менных. Тогда, если система совместна, у нее существует бесчисленное множество решений. При этом п—г переменным мы можем придавать произвольные значения (так называемые свободные пере- менные), а остальные г переменных выразятся через них (эти г переменных мы будем называть базисными). Пример 4 Рассматривается система двух уравнений с четырьмя неизвест- ными: 2X1— х2+ xs— х4=1, 1 —= J Ранг этой системы равен г = 2 (уравнения линейно независимы). Выберем в качестве свободных переменных, например, х3 и х4, а в качестве базисных — *2 и х2. Выразим базисные переменные через свободные. Имеем из уравне- ний (2.5): 2Х| — х2 = 1 — х3 -|- х4, —х4 + х2 = 2 + 2х3 — хл Складывая эти уравнения, получим хх = 3 + х3. Умножая второе уравнение на 2 и складывая с первым, получим х2 = 5 + Зх3 — х4. Таким образом, базисные переменные хъ х2 выражены через свободные х3, xt Свободным переменным х3, х4 можно придавать любые значения; при этом мы будем всегда получать совокупность значений xlt х2, х3, xt, удовлетворяющую системе уравнений (2.5) Например, полагая х3 = xt =» 0, получим х4 — 3, х4= 5; эти значения удовлетворяют системе (2.5). Полагая х3 = 1, xt = 2, получим х, 4. х2 = 6; эти значения также удовлетворяют уравнениям (2.5). Вообще, если ранг системы уравнений ОЗЛП (т. е. число линейно независимых уравнений, входящих в систему ограничений) равен г, то всегда можно выразить какие-то г базисных переменных через п—г остальных (свободных) и, придавая свободным переменным лю- бые значения, получить бесчисленное множество решений системы. В дальнейшем для простоты, записывая уравнения ОЗЛП, мы будем считать их линейно независимыми; при этом ранг системы г бу- дет равен числу уравнений т. Итак, если число уравнений ОЗЛП г~т меньше, чем число пе- ременных п, то система линейных уравнений имеет бесчисленное мно- жество решений, т. е. совокупностей значений xlt х2, хп, удовлет- воряющих уравнениям-ограничениям (2.1). Если среди этих ре- шений нет ни одного, для которого все Xi, х2, ...,хп неотрицательны, то это значит, что ОЗЛП не имеет допустимого реше- ния. Если же существуют какие-то решения системы (2.1), для которых всегъ х2, ..., хп неотрицательны (короче, «неотрицательные решения»), то каждое из них допустимо. Возникает задача — найти среди допусти- мых решений оптимальное, т. е. такое решение Xi, х2, ... , хп, 44
для которого линейная функция L =cxxx-f-c2x2 + ...-|-cnxn обращается в минимум. Для того чтобы отчетливее представить себе особенности решения ОЗЛП и различные случаи, которые могут при этом встретиться, удобно воспользоваться геометрической интерпретацией. 3. ГЕОМЕТРИЧЕСКАЯ ИНТЕРПРЕТАЦИЯ ОСНОВНОЙ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Рассмотрим случай, когда число переменных п на два больше, чем число независимых уравнений т, которым они должны удовлетворять: п—т = 2. Тогда, как мы уже знаем, можно две из п переменных, скажем» хх и х2, выбрать в качестве свободных, а остальные т сделать базис- ными и выразить их через свободные. Предположим, что это сделано. Получим т = п—2 уравнений вида: Х3 = «31 Х1 4“ «32 х2 4~ Рз» ^=«41^1+а42^ + р4. /ОП ^n=«nl^l + «n2^+Pn- Дадим задаче линейного программирования геометрическую ин- терпретацию. По осям Oxj и 0х2 будет откладывать значения свобод- ных переменных хх, х2 (рис. 2.2). Так как переменные хх, х2 должны быть неотрицательными, до- пустимые значения свободных переменных лежат только выше оси 0хх и правее оси 0х2; отметим это штриховкой, обозначающей «допусти- мую сторону» каждой координатной оси. 45
Остальные переменные xs, xit ..., хп также должны быть не- отрицательными, т. е. должны выполняться условия: х8 — a8i Xi -f- ос82 х2 4* 03 Xt ~СС^ Х^ СХ42 Х2 4* 04 О, (3.2) = *i4-an2x2 + 0n>O. Посмотрим, как изобразить эти условия геометрически. Возьмем одно из них, например, первое: х8 = а81 хх + а82 х2 4- 08 > 0. Рис. 2.3 Положим величину х8 равной своему крайнему значению — нулю. Получим уравнение asl х1 4“ а32 Х2 4* 03 = 0. Это — уравнение прямой. На этой прямой х3 = 0 (см. рис. 2.2); по одну сторону от нее х3 > 0, по другую х8 < 0 (по какую — это за- висит от коэффициентов уравнения). Отметим штриховкой ту сторону прямой х8 = 0, по которую х8 > 0. Аналогичным образом построим и все остальные ограничивающие прямые: х4 = 0, ..., хп = 0 и отметим у каждой из них штриховкой «допустимую сторону», где соответствующая переменная больше нуля (рис. 2.3). Таким образом, мы получили п прямых: две оси координат (х2 = 0, хх = 0) и п—2 прямых (х8 = 0, ...,хп = 0). Каждая из них определяет «допустимую полуплоскость», лежащую по одну ее сторону. Часть плоскости хх 0х2, принадлежащая одновременно всем этим полуплоскостям, образует область допустимых ре- шений (ОДР). На рис. 2.3 область допустимых решений отмечена редкой штриховкой. Нетрудно убедиться, что область допустимых решений всегда представляет собой выпуклый многоугольник. Как известно, вы- пуклой фигурой (рис. 2.4) называется фигура, обладающая следующим 46
свойством: если две точки А и В принадлежат этой фигуре, то и весь отрезок АВ также принадлежит ей. Докажем, что ОДР всегда является выпуклой фигурой. Предпо- ложим противное: точки А и В принадлежат ОДР, а какая-то точка С между ними не принадлежит (см. рис. 2.4). Тогда между точкой А, принадлежащей ОДР, и точкой С, не принадлежащей ей, непременно должна проходить какая-то из прямых xk = 0 : по одну сторону этой прямой точки удовлетворяют условию хк 0, по другую — не удов- летворяют. Пусть эта прямая пересекает отрезок АВ в какой-то точ- ке D. Тогда точки А и В, лежащие по разные стороны от прямой, не могут одновременно принадлежать ОДР (для нее все xh неотри- цательны), что противоречит условию. Рис. 2.4 На рис. 2.3 показан такой пример, когда ОДР существует, т. е. система уравнений ОЗЛП имеет неотрицательные решения. Могут быть и случаи, когда неотрицательных решений системы не существует. Пример такого случая показан на рис. 2.5. Действи- тельно, не существует области, лежащей по одну и ту же (заштрихо- ванную) сторону от всех прямых: хх = 0, х2 = 0, х8 = 0, х4=0, х& =0; т. е. условия неотрицательности переменных противоречат друг другу и допустимых решений ОЗЛП не существует. Пример 1 Задача линейного программирования с семью переменными хх, хг, х3, х4, х5) х„ х, имеет т = 5 уравнений-ограничений: х4—Х2 + Х3— 4; 2xj— xz—хз— х$ — —5; *1+^8—*6= —4, x2~\~xe — ! 2хх—2х2—хв4*2х7= 7 | (3.3) Требуется дать ее геометрическую интерпретацию и построить ОДР, если она существует. 47
Решение. Выберем в качестве свободных переменных, например, х, и хг и выразим через них остальные (базисные) переменные: х3, xit х8, х3, х-, Из пер- вого уравнения имеем: х3 = —х, + х2 + 4 (3.4) Из третьего: х8 = х, + х2 + 4. Из четвертого: х„ — —х3 + 5. (3.5) Подставляя (3.4) во второе уравнение (3.3) и (3.5) — в последнее и раз- решая относительно х4, х7, имеем: х8== Зх| —- 2х2+ 1; х?=—хх+ %х2 + 6. Геометрическая интерпретация задачи представлена на рис. 2.6 (прямые хх — 0, х2 = 0—оси координат; остальные ограничивающие прямые х3 = 0, х4=0, х8 = 0, хв — 0 и х7 = 0; короткой штриховкой помечены допустимые полу- плоскости). Как видно из расположения прямых и отмеченных полуплоскостей, допус- тимые решения для расй&отреиной задачи существуют; они заполняют ОДР, ко- торая на рис. 2.6 показана редкой штриховкой. Рис. 2.6 Таким образом, мы рассмотрели вопрос о существовании области допустимых решений ОЗЛП и (для случая т ~ п — 2) дали ему гео- метрическую интерпретацию. Теперь возникает вопрос о нахождении из числа допустимых оптимального решения, т. е. такого, которое обращает в ми- нимум линейную функцию L = c1xl4-c2xii4-...+cnxn. (3.6) 48
Дадим и этой задаче геометрическую интерпретацию, причем сно- ва для случая, когда т—п — 2 (т. е. число свободных переменных равно 2, а число базисных т). Предположим, что свободными переменными опять являются хъ х2, а базисными ха, х4, хп, выраженные через свободные фор- мулами (3.2). Подставим выражения (3.2) в формулу (3.6), приведем подобные члены и выразим линейную функцию L всех п переменных как линейную функцию только двух свободных переменных: хг и х2. Получим: £-“Yo-H1*1 + Y2*2. (3.7) где у0 — свободный член, которого в первоначальном виде у функции L не было; теперь, при переходе к переменным х1г х2, он мог поя- виться. Очевидно, линейная функция (3.7) достигает минимума при тех же значениях хх, х2, что и функция b'=Yi *i+Y2 х2 без свободного члена (линейная форма). Действительно, L! —L—у0, где у0 не зависит от хх и х2, и, очевидно, минимумы той и другой функ- ций, отличающиеся на у0, достигаются при одних и тех же значениях хъ х2. Найдем эти значения, пользуясь геометрической интерпретацией. Придадим L' некоторое постоянное значение С: L = ух хх у2 х2 ~ С; • получим уравнение прямой на плоскости хх0х2 (рис. 2.7). Угловой коэф- фициент этой прямой равен — ух/у2, а отрезок, отсекаемый ею на оси 0х2 (начальная ордината), равен С/у2. Очевидно, если мы заменим постоянную С на некоторую другую Сх, угловой коэффициент пря- мой не изменится; изменится только начальная ордината, и прямая переместится параллельно самой себе в новое положение U — С, (см. рис. 2.7). Таким образом, различным значениям U соответствуют разные прямые на плоскости, но все они параллельны между собой. Очевнд- 49
но, вместо всех этих прямых достаточно изобразить на плоскости одну основную прямую, например, L' = 0, а затем можно мысленно перемещать ее параллельно самой себе. При перемещении этой прямой в одну сторону L, будет возрастать, в другую — убывать. Построим основную прямую L' — 0 на плоскости х10х2 (рис. 2.8). Мы знаем, что ее угловой коэффициент равен — Т1/у2; чтобы построить прямую, проходящую через начало координат с угловым коэффициен- том — T1/V2» отложим по оси абсцисс отрезок у2, а по оси ординат от- резок —71, и через точку А с такими координатами проведем прямую. Это и будет основная прямая L’ — 0. Теперь остается только выяснить, в какую сторону (параллельно самой себе)надо двигать эту прямую, чтобы величина L' убывала. В случае, показанном на рис. 2.8 (оба коэффициента и у2 положи- тельны) направление убывания L' — вниз и налево (это показано стрелками, направленными от основной прямой в сторону убывания L'). При других знаках коэффициентов ух, у2 направление убывания меняется. Случаи различных направлений убывания показаны на рис. 2.9, 2.10 и 2.11. Таким образом, и направление основной прямой L' = 0, и на- правление убывания линейной формы L' определяются величинами и знаками коэффициентов yi, у2 при свободных переменных хи х2 в выражении L'. Дадим теперь геометрическую интерпретацию нахождения о п- тимального решения ОЗЛП среди допустимых. Пусть имеется область допустимых решений ОДР (рис. 2.12) и ос- новная прямая L' = 0; известно (указано стрелками) направление убывания линейной формы L'. При перемещении основной прямой в направлении, указанном стрелками, линейная форма L' будет убывать. Очевидно, наименьше- го значения она достигнет, когда прямая будет проходить через край- нюю точку ОДР, наиболее удаленную от начала координат в направ- лении стрелок (в нашем случае, точку А). Координаты этой точки хг*, х2* и определяют оптимальное решение ОЗЛП. Зная оптимальные зна- чения свободных переменных хг*, х2*, можно найти, подставляя их в уравнения (3.2), и оптимальные значения базисных переменных: 60
х3* — а31 Xi* аз2 х2* 4- Р3, х4* = а41 4- а42 х2* 4- р4, хп*=ап1 х^+ап2х^ + ^п, а также оптимальное (минимальное) значение линейной функции L: ^nin==Yo + Yl*l* + Y2*2*- (3-8) Таким образом, если число независимых уравнений-ограни- чений, которым должны удов- летворять переменные хъ х2, ..., хп, на два меньше, чем число переменных п (т. е. в ОЗЛП фи- гурируют две свободные пере- менные и любое число базис- ных), решение ОЗЛП может быть получено простым геомет- рическим построением. Пример 2. В условиях приме- ра 1 найти оптимальное решение ОЗЛП, обращающее в минимум линейную функцию семи неизвест- ных: L = x1 —х24-2х3—xt —Зх5Ц-х9 —2х, (3.9) Уравнения-ограничения —те же, что и в примере 1. Решение. В примере 1 уравнения-ограничения (3.3) были разрешены от- носительно базисных переменных х3, х4, хБ, хв, х7, которые были выражены через свободные х4 и х2: х3----*1+ *8 4-4; х4 = 3xj — 2х2 4~ 1; хъ~ Х1Ч~ х2~Ь4; хв — —х24~5, xi == —*14- % хг 4-6. (3.10) Подставляя эти выражения в (3.9) и приводя подобные члены, имеем: L— — 5xt—2х2 — 12. (3.11) Воспроизведем область допустимых решений, ранее построенную на рис. 2.6 (см рис. 2.13). Отбрасывая свободный член в (3.11), имеем: В ——5х4—2х2. Строим основную прямую L' — 0. Для этого откладываем отрезки у2 =—2 по оси абсцисс и —= 5 по оси ординат, проводим через точку В с координа- тами (—2, 5) прямую L' = 0 и отмечаем стрелками направление убывания L'. Перемещая основную прямую параллельно самой себе в сторону убывания L', наименьшее значение I/ мы получим в точке А (наиболее удаленной от нача- 51
ла координат в направлении стрелок). Координаты этой точки xt*, х2 и дают оптимальное решение ОЗЛП В точке А пересекаются две ограничивающие пря- мые: х, = 0 их, =0. Приравнивая нулю выражения для хе и х7, получим два уравнения: —х2-|-5=0, ) —Xj + /4*2-Ь 6=0. J Решая их совместно, найдем хх* = 8,5; х2* = 5. Подставляя эти значения в (3 11), найдем оптимальные значения базисных переменных: х3* = 0,5, х4*=16,5; х5*=17,5. Что касается хв и х7, го их оптимальные значения равны нулю: хв* = 0; х7* =0. Подставляя найденные оптимальные значения хх* И х2* в линейную функ- цию (3.11), найдем минимальное значение (оптимум) линейной функции L: L<= —5.8,5—2-5—12= —64,5. Таким образом, мы научились решать ОЗЛП в частном случае т = п — 2 при помощи геометрического построения. Несмотря на то, что это построение относится к частному случаю, из него вытекают некоторые общие соображения, относящиеся вообще к свойствам решения ОЗЛП. Отметим подмеченные нами закономерности для случая п—т = 2. 1. Решение ОЗЛП, если оно существует, не может лежать в н у т- р и области допустимых решений, а только на ее г р а н и ц е. 2. Решение ОЗЛП может быть и не единственным (см. рис. 2.14). Действительно, если основная прямая параллельна той стороне много- угольника допустимых решений, где достигается минимум L', то он 52
достигается не в одной точке, а на всей этой стороне. В этом случае ОЗЛП имеет бесчисленное множество оптимальных решений. 3. ОЗЛП может не иметь решения даже в случае, когда сущест- вует ОДР (рис. 2.15). Это бывает тогда, когда в направлении стрелок ОДР неограничена, т. е. в области допустимых решений линейная функция L неограничена снизу. Перемещая основную прямую в на- правлении стрелок, мы будем получать все меньшие и меньшие значе- ния L', а значит, и L. 4. Решение ОЗЛП, минимизирующее функцию L (оптимальное решение), всегда достигается в одной из вершин многоугольника до- пустимых решений (если оно достигается на целой стороне, то оно же Рис. 2.14 Рис. 215 достигается и в каждой из вершин, через которые проходит эта сторо- * на). Решение, лежащее в одной из вершин ОДР, называется опор- ным решением, а сама вершина — опорной точкой. 5. Для того, чтобы найти оптимальное решение, в принципе до- статочно перебрать все вершины ОДР (опорные точки) и выбрать из них ту, где функция L достигает минимума. 6. Если число свободных переменных в ОЗЛП равно 2, а число базисных — т и решение ОЗЛП существует, то оно всегда дости- гается в точке, где по крайней мере две из переменных х1( х2, ..., хп обращаются в нуль. Действительно, в любой опорной точке пересе- каются по крайней мере две из ограничивающих прямых; могут же в ней пересекаться и более двух (см. рис. 2.16). Случай, когда в оптимальном решении обращаются в нуль не две, а больше переменных, называется вырожденным. На рис. 2.16 показан вырожденный случай, когда в точке А, соответствующей оп- тимальному решению, обращаются в нуль три переменные: х8, х5 и хв. Рассмотрев подробно геометрическую интерпретацию для случая т ~ п — 2, обратимся к случаю, когда число переменных превышает на 3 число независимых уравнений-ограничений: т = п — 3. 53
В этом случае свободных переменных оказывается уже не две, а три (пусть это будут хъ х2, х3), а остальные т = п — 3 базисных переменных могут быть выражены через свободные: = (Z41 Xi ®42 ^2 4~ ®43 Х3 4* ХЬ ~ а51 Х1 4* а52 Х2 + а53 Х3 4* Psi И 1 21 Хп ~ ап1 Х1 4" ап2 Х2 4~ апЗ х3 4* Рп- Требуется найти такие неотрицательные значения xlt х2, хп, которые, удовлетворяя уравнениям (3.12), одновременно обращали бы в минимум линейную функцию этих переменных: Рис. 2.16 Рис. 2.17 Геометрическую интерпретацию этой задачи придется строить уже не на плоскости, а в пространстве (рис. 2.17). Каждое условие xk =0 для одной из базисных переменных xk (k = 4.....п) геометрически изобразится уже не прямой, а плоскостью. По одну сторону от этой плоскости xk > 0, по другую xh <z 0. Координатные плоскости х20х3, Xj0x3 и XjOx-j изображают условия Xj = 0, х2= 0, х3 = 0 соот- ветственно. Область допустимых решений (если она существует) пред- ставляет собой выпуклый многогранник, ограниченный этими пло- скостями, т. е. часть пространства, для которой выполнены все условия: xx^s0, х2^0, х3^0,..., хп^0. Роль «основной прямой» в этом случае будет играть «основная плоскость», уравнение которой L' = 0, где L'=L—уо; L = у0 4- Yi хг 4- у2 х2 4- у3 х3. При перемещении этой плоскости параллельно самой себе в одну сторону L’ будет убывать, в другую — возрастать. Точка А, в которой достигается оптимальное решение (если оно существует), представляет 54
собой ту вершину ОДР, которая находится дальше всего от начала координат, считая по направлению убывания L'. Может оказаться, как и при п — т =2, что ОЗЛП имеет бесчисленное множество реше- ний, либо заполняющих целое ребро, либо — целую грань многогран- ника допустимых решений. Оптимальное решение Xj*, х2*, х3* (если оно существует) совпадает с одной из о п о р н ы х т о ч е к, т. е. вершин многогранника, в которой по крайней мере три переменных хъ х2...... хп обращаются в нуль. Пользоваться геометрической интерпретацией для непосредст- венного отыскания решения даже при п — т = 3 затруднительно; при п — т = k> 3 это вообще выведет нас за рамки трехмерного пространства и геометрическая интерпретация потеряет наглядность. Однако соответствующая терминология может оказаться удобной: мож- но говорить об области допустимых решений, как о некотором «сверх- многограннике» в пространстве k измерений, ограниченном т «гипер- плоскостями»; об оптимальном решении — как об одной из «вершин» этого многогранника, о каждой «вершине» — как об «опорной точке» и т. д. Такой геометрической терминологией можно, по желанию, поль- зоваться или не пользоваться. Нам геометрическая интерпретация по- надобилась для того, чтобы обосновать следующие свойства решения ОЗЛП при любых значениях числа переменных п и числа уравне- ний т < п: 1. Оптимальное решение, если оно существует, лежит не внутри, а на границе области допустимых решений, в одной из опор- ных точек, в каждой из которых по крайней мере k из перемен- ных обращаются в нуль. 2. Для того, чтобы найти оптимальное решение, нужно, переходя от одной опорной точки к другой, двигаться в направлении уменьшения линейной функции L, которую требуется минимизировать. На этих принципах и будут основаны методы решения ОЗЛП, ко- торые мы изложим в дальнейшем. 4. ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ С ОГРАНИЧЕНИЯМИ-НЕРАВЕНСТВАМИ. ПЕРЕХОД ОТ НЕЕ К ОЗЛП И ОБРАТНО На практике ограничения в задаче линейного программирования часто задаются не уравнениями, а неравенствами. Покажем, как можно перейти от задачи с ограничениями-неравен- ствами к основной задаче линейного программирования. Пусть имеется задача линейного программирования с п перемен- ными х1( х2.хп, в которой ограничения, наложенные на перемен- ные, имеют вид линейных неравенств. В некоторых из них знак нера- венства может быть а других (второй вид сводится к первому простой переменой знака обеих частей). Поэтому зададим все ограни- чения-неравенства в стандартной форме: И
au xi fli2 xz 4~ •••4~ain xn 4~ 0; a2i X1 +a22 *2 + ••• 4“ aZn Xn + ^2 O', (4 j) aml X1 + ^m2 ^2 4- ••• 4* ^тн xn + bm>®-) Будем считать, что все эти неравенства линейно независимы (т. е. никакое из них нельзя представить в виде линейной комбинации дру- гих). Требуется найти такую совокупность неотрицательных значений х1г х2...хп, которая удовлетворяла бы неравенствам (4.1), и, кроме того, обращала бы в минимум линейную функцию: L = Су Ху -[* Сг х2 4*... 4-сп хп. (4.2) От поставленной таким образом задачи легко перейти к основной задаче линейного программирования. Действительно, введем обозна- чения: У1 — ап xi 4- ai2 хг 4* ••• 4* ain хп 4* У2 — а21 Х1 4~а22 Х2 4- ••• 4- а2п Хп 4- Ь2г (4 3) Ут = ^пг1 Х1 4- &т2 х2 4* ••• 4" ®тп хп 4* Ьт> где Уу, Уъ, ..., ут — некоторые новые переменные, которые мы будем называть «добавочными». Согласно условиям (4.1), эти добавочные пе- ременные так же, как и Ху, х2, ..., хп, должны быть неотрицательными. Таким образом, перед нами возникает задача линейного програм- мирования в следующей постановке: найти такие неотрицательные зна- чения п 4- т переменных Ху, х2, ..., хп; ylt у2, ут, чтобы они удов- летворяли системе уравнений (4.3) и одновременно обращали в мини- мум линейную функцию этих переменных: L = Су Ху 4- с2 х2 4-... 4~сп хп- Как видно, перед нами в чистом виде основная задача линейного программирования (ОЗЛП). Уравнения (4.3) заданы в форме, уже разрешенной относительно базисных переменных ylt у2, ..., ут, кото- рые выражены через свободные переменные хъ х2, ..., хп. Общее коли- чество переменных равно п 4* tn, из них п «первоначальных» и т «до- бавочных». Функция L выражена только через «первоначальные» пе- ременные (коэффициенты при «добавочных» переменных в ней равны нулю). Таким образом, задача линейного программирования с ограни- чениями-неравенствами сведена нами к основной задаче линейного программирования, но с большим числом переменных, чем первона- чально было в задаче. Пример 1 Имеется задача линейного программирования с ограничениями- неравенствами: иайти неотрицательные значения переменных Ху, х2, х3, xt, хъ, удовлетворяющие условиям ав
2Xj X2—1~ 3Xg 6, Xg---------3x2 < ----- 1, Хъ — 2x4 + Xj > —1, x5 — xj < 0 (4.4) и обращающие в минимум линейную функцию L — Xj — 2х2 — Зхд. (4.5) Требуется привести эту задачу к виду ОЗЛП. Решение. Приводим неравенства (4.4) к стандартной форме: —+ —ЗхзЧ"6 > О, ЗХ2 Хд 1 О, xt —2х4+ х5+ 1 > О, Xj— х5 > 0. Вводим дополнительные переменные: У а — —2xj + х2—Зх3 + 6, #2= Зх2— х3 —1, Уз — xi—2х4 + х6+1, У»= xi— х5. Задача сводится к тому, чтобы найти неотрицательные значения перемен- ных *1, х2, х8, х4, х5; у, у2, у3, yit удовлетворяющие уравнениям (4.6) и обращающие в минимум линейную фуик" цию (4.5). Мы показали, как от задачи линейного программирования с ог- раничениями-неравенствами можно перейти к задаче с ограничениями- равенствами (ОЗЛП). Всегда возможен и обратный переход — от ОЗЛП к задаче с ограничениями-неравенствами. Если в первом случае мы увеличивали число переменных, то во втором случае будем его умень- шать, устраняя базисные переменные и оставляя только свободные. Пример 2. Имеется задача линейного программирования с ограничениями- равенствами (ОЗЛП): xt+ х2= 1, х2 —2хд=—3, хз— Xf+ х5 = I и минимизируемой функцией L= --Xj---Xg + Xg. (4.7) (4.8) Требуется записать ее как задачу линейного программирования с ограниче- ниями-неравенствами. Решение. Так как т = 3, п — 5, п — т = 2, то выберем какие-то две из переменных в качестве свободных. Заметим, что переменные xlt х2 в качестве сво- бодных выбирать нельзя, так как они связаны первым из уравнений (4 7): зна- чение одной из них полностью определяется значением другой, а свободные пере- менные должны быть независимыми По такой же причине нельзя в качестве 57
свободных выбрать переменные х2, х3 (их связывает второе уравнение (4.7)). Выберем в качестве свободных переменные х, и х4 и выразим через них все остальные: хг — —Xi-j-1, х3 = —l/zXi -|-2, хБ = /2xi4~X4— У (4.9) Так как х2 > 0, х3 > 0, х5 > 0, условия (4 9) могут быть заменены нера- венствами: —Xi 4- — Уг^1 + (4.10) 4~ х$ — 1 > 0. , Перейдем в выражении линейной функции L к свободным переменным хг,х4. Подставляя в L вместо х, и х- их выражения (4.9). получим: L~ —Xi 4-Xi — 14* Уг-Х14~*4 — 1 = '/2*1 — 2, =1/2Х1+*4- (4.11) Таким образом, задача сведена к задаче линейного программирования с ог- раничениями-неравенствами. Ее геометрическая интерпретация показана на рис. 2.18. Основная прямая L' = 0 параллельна той стороне ОДР, где L' до- стигает минимума. Следовательно, все точки участка АВ дают оптимальное решение. Беря в качестве решения, например, координаты точки А, получим: Х1* = 0; х4*=1; х2*=1; х3* = 2; х5*=0. При таких значениях переменных линейная функция L достигает миниму- ма, равного Bmin= —2= -=1. 58
Таким образом, мы можем по произволу переходить от ОЗЛП к задаче линейного программирования с ограничениями-неравенствами и обратно. Если в числе ограничений задачи есть как уравнения, так и неравенства, рекомендуется произвести унификацию и перейти в какой-либо единообразной форме, например ОЗЛП. Пример 3. Рассматривается задача линейного программирования с пере- менными Xj, х2, xs, xt и ограничениями вида xi + хг — хз+xi> Х1--х2~}~х3 < 1> X2~\~X3~]~xt 5. Минимизируется функция б = хг—2х2+х3—Зх4. (4.12) (4.13) Требуется привести задачу к ОЗЛП. Решение. Введением добавочных переменных^, у2 приведем условия (4.12) к виду ОЗЛП: xi Ч- хг —хз —xt~^< Х1—хг + хз+(/1 = 1, ж2 + хз + х4 — У 2 — 5. Минимизируемая функция остается в виде (4.13). 5. СИМПЛЕКС-МЕТОД РЕШЕНИЯ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Геометрическая интерпретация, которой мы пользовались при решении задач линейного программирования, перестает быть при- годной для этой цели при числе свободных переменных п — т> 3, а затруднительна уже при п-—т = 3. Для нахождения решения зада- чи линейного программирования в общем случае (при произвольном числе свободных переменных) применяются не геометрические, а вы- числительные методы. Из них наиболее универсальным является так называемый симплекс-метод. Идея симплекс-метода относительно проста. Пусть в задаче ли- нейного программирования имеется п переменных и т независимых линейных ограничений, заданных в форме уравнений. Мы знаем, что оптимальное решение (если оно существует) достигается в одной из опорных точек (вершин ОДР), где по крайней мере k — n—т из пе- ременных равны нулю. Выберем какие-то k переменных в качестве свободных и выразим через них остальные т базисных переменных. Пусть, например, в качестве свободных выбраны первые k = п — т переменных х1( х2, ..., хк, а остальные т выражены через них: *Й+1Г —ай+1,1 Х1 + Дн-1.2 Х2+-” + ай4-1.АХ*+Р*4-1 > ХА4-2—afe4-2,l Xl + аАН-2,2 Х2 "I-•" "Ь ай-|-2, й Хй + Рй+2 > (5-1) Хп — ап, I *1 + ап, 2 Х2 + ••• + ап. A Xfe4~Pn' 59
Попробуем, что будет, если положить все свободные переменные хъ х2, Xk равными нулю: _(хх = 0, х2 = 0,..., = При этом мы получим: Х*4-1 == Рн-1, *64-2 = Рн-2, Хп=Р/, Это решение может быть допустимым или недопустимым. Оно допустимо, если все свободные члены pfe_|_x, Зь+г, •••> Рп неотрица- тельны. Предположим, что это условие выполнено. Тогда мы получи- ли опорное решение. Но является ли оно оптимальным? Мо- жет быть да, а может быть и нет. Чтобы проверить это, выразим мини- мизируемую линейную функцию L через свободные переменные ХХ, Х29 '•*» Xk‘ L = Yo + Yi xi 4* У2Х2 4* ••• + Yfe xk- (5»2)- Очевидно, что при хх —х2 = .... =хк = 0 L — у0. Посмотрим, не мо- жем ли мы улучшить решение, т. е. уменьшить функцию ^увели- чивая какие-нибудь из переменных хъ х2, .... хк (уменьшать их мы не можем, так как все они равны нулю, а отрицательные значения пе- ременных недопустимы). Если все коэффициенты ух, у2.....ук в фор- муле (5.2) положительны, то, увеличивая какие-то из перемен- ных хх, х2, хк сверх нуля, мы не можем уменьшить L; следо- вательно, найденное нами опорное решение является оптималь- н ы м. Если же среди коэффициентов ух, у2, ..., ук в формуле (5.2) есть отрицательные, то, увеличивая некоторые из переменных хХ( х2, хк, а именно — те, коэффициенты при которых отрицательны, мы можем улучшить решение, т. е. уменьшить L. Пусть, например, коэффициент ух в формуле (5.2) отрицателен. Значит, есть смысл увеличить хх, т. е. перейти от данного опорного решения к другому, где переменная хх не равна нулю, а вместо нее рав- на нулю какая-то другая. Увеличение хх «полезно» для линейной функ- ции L, делает ее меньше. Однако увеличивать хх надо осторожно, так чтобы не стали отрицательными другие переменные xft+1, хк+2...хп, выраженные через свободные переменные, в частности, через хх фор- мулами (5.1). Посмотрим, опасно ли для переменных хк+1, хк+2, ..., хп увели- чение хх, т. е. может ли оно сделать их отрицательными? Да, опасно, если коэффициент при хх в соответствующем уравнении отрицателен. Если среди уравнений (5.1) нет уравнения с отрицательным коэффи- циентом при хх, то величину хх можно увеличивать беспредельно, а, значит, линейная функция L не ограничена снизу и оптимального ре- шения ОЗЛП не существует. Допустим, что это не так и что среди уравнений (5.1) есть такие, в которых коэффициент при хх отрицателен. Для переменных, стоящих в левых частях этих уравнений, увеличение хх опасно — оно может сделать их отрицательными. во
Возьмем одну из таких переменных xt и посмотрим, до какой степени можно все же увеличить х1( пока переменная х; не станет от- рицательной? Выпишем Ле уравнение из системы (5.1): xi ~ аи xi 4* агг х2 + ••• + aik xk + Pi* Здесь свободный член 0, а коэффициент аг1 отрицателен. Легко понять, что если мы оставим х2 = ... = xk = 0, то хх мы можем увеличивать только до значения, равного — Рг/ац, а при дальнейшем увеличении Xj переменная х, станет отрицательной. Выберем ту из переменных х^, ..... хп, которая раньше всех обратится в нуль при увеличении т. е. ту, для которой вели- чина — Р/ад меньше всего. Пусть такая «наиболее угрожаемая» пе- ременная будет хг. Тогда имеет смысл «переразрешить» систему урав- нений (5.1) относительно других базисных переменных, выведя из чис- ла свободных переменных хх и переведя вместо нее в группу свободных переменных хг. Действительно, мы хотим перейти от опорного решения, задаваемого равенствами хх =х2 =... =хк —0, к опорному решению, в котором уже хг =И= 0, а х2 = ... = хк = хт = 0. Первое опорное ре- шение мы получили, положив равными нулю все прежние свободные переменные хх, х2, ..., xfe; второе мы получим, если обратим в нуль все новые свободные переменные х2, .... хк, хт. Базисными переменными при ЭТОМ будут Хх, Xfe_|_x, ..., хг_!, Хг+х, ..., хп. Предположим, что уравнения типа (5.1) для нового набора базис- ных и свободных переменных составлены. Тогда можно выразить че- рез новые свободные переменные и линейную функцию L. Если все коэффициенты при переменных в этой формуле положительны, то мы нашли оптимальное решение: оно получится, если все свободные пере- менные положить равными нулю. Если среди коэффициентов при пере- менных есть отрицательные, то процедура улучшения решения про- должается: система вновь переразрешается относительно других ба- зисных переменных, и так далее, пока не будет найдено оптимальное решение, обращающее функцию L в минимум. Проследим описанную процедуру постепенного улучшения реше- ния ОЗЛП на конкретном примере. Пример Имеется задача линейнего программирования с ограничениями- неравенствами: —5хх—x2-|-2xj < 2, — ххх3-|-х4 < 5, —3xj+5x4 < 7. (5.3) Требуется минимизировать линейную функцию L = 5xj — 2х3. Решение. Приводя неравенства к стандартному виду (>0) и вводя добавоч- ные переменные у1г у2, у3, переходим к условиям-равенствам: £71=5хх -|— х2 —2х3Ц- 2, У2~х1 —хз — -|-5, {/з = 3хх—5х. + 7. (5.4) 61
ЧисЛо переменный п — 7 на 4 Превышает число уравнений /й=ьЗ. Значит, четыре переменных могут быть выбраны в качестве свободных Попробуем выбрать в качестве свободных переменных хх, х2, х3, xt и поло- жить их равными нулю. При этом мы сразу получим опорное решение: хг = х2 = = х8 = х4 = 0; у4 = 2; у2 = 5; у8 = 7. При этих значениях переменных L = 0. Посмотрим, является ли это решение оптимальным? Нет! Потому что в вы- ражении линейной функции L коэффициент при х3 отрицателен. Значит, увели- чивая х3, можно уменьшить L. Попробуем увеличивать х3. Проследим по уравнениям (5.4), опасно ли это для других переменных? Да, опасно для yt и у2 — в оба эти уравнения перемен- ная х3 входит с отрицательным коэффициентом, значит, при увеличении х3 соот- ветствующие переменные у± и у2 могут стать отрицательными. Посмотрим, какая из этих переменных у± или у2 является наиболее «угро- жаемой», какая раньше обратится в нуль при увеличении х3. Очевидно, ух-. она станет равной нулю при х8 = 1, а величина у2—только при х3 = 5. Поэтому выбираем переменную у4 и вводим ее в число свободных вместо х3. Чтобы «переразрешить» систему (5.4) относительно х3, у2, у3, поступим следую- щим образом. Разрешим первое уравнение (5.4) относительно новой базисной пе- ременной х3: x3 = -/3Xi-{-1/2x2—l/2 bi 4"1- Это выражение подставим вместо х3 во второе уравнение; получим У2— ~3/2X1—1/2X2 + 1/2 yi—Xt+4. Что касается третьего уравнения, то оно, как не содержащее х3, не изме- нится. Итак, мы привели систему (5.4) к виду: хз — -/а Ху 4- J/2 х2— Vz Ух 4- Ь У2= —в/2Х1—1/2Х2+1/2У1—Х^ + 4, Уз — Зх4—5х44-7 со свободными переменными xlt х2, ylt х4 и базисными х3, у2, у3. Выразим линейную функцию L через новые свободные переменные: Т == 5х4——5х4х2 4“ У1 2, или L=—х24-(/т^2. (5.5) (5.6) Положим теперь свободные переменные равными нулю. Линейная функция L станет равной —2. Это уже лучше, чем прежнее значение L = 0. Но является ли это решение оптимальным? Все еще нет, так как коэффициент при х2 в выра- жении (5.6) отрицателен. Итак, будем увеличивать х2. Посмотрим, для какой из переменных, стоящих в левых частях системы (5.5), это может быть «опасно». Только для у2 (в первое уравнение х2 входит с положительным коэффициентом, а в третье совсем нс входит). Итак, обменяем местами переменные х2 и у2 — первую выведем из числа свободных, а вторую — введем. Для этого разрешим второе уравнение (5.5) от- носительно х2 и подставим это х2 в первое уравнение. Получим еще один вид си- стемы (5.4): —У2—*4 4-5; х2 = —Зхт—2(/24-?/i—2х4-|-8; Уз = 3х4—5х44-7. Выразим L через новые свободные переменные: или L — 3xj4-2y2 —ух + 2х.—84-^1 —2, L = 3xj 4- 2(/2 + 2х4 —10. (5.7) (5-8) 62
Полагая х1=у1 = у2 = х4 = 0, получим L = — 10. Является ли это решение оптимальным? На этот раз — да, так как коэффи- циенты при всех свободных переменных в выражении (5.8) неотрицательны. Итак, оптимальное решение ОЗЛП найдено: Х!*=0, х2* = 8; х3* = 5; х4* = 0; ^* = 0; г/2* = 0; ув*=7. При таких значениях переменных линейная функция L принимает мини- мальное значение: Lmin = Ю. Заметим, что в рассмотренном примере нам не пришлось искать опорного решения: оно сразу же получилось, когда мы положили сво- бодные переменные равными нулю. Это объясняется тем, что в урав- нениях (5.4) все свободные члены были неотрицательны и, значит, пер- вое же попавшееся решение оказалось опорным. Если это окажется не так, можно будет прийти к опорному решению с помощью такой же процедуры обмена местами некоторых базисных и свободных пере- менных, переразрешая уравнения до тех пор, пока свободные члены не станут неотрицательными. Как это делается, мы увидим в дальней- шем (см. § 7). 6. табличАый алгоритм замены БАЗИСНЫХ ПЕРЕМЕННЫХ Процедура «переразрешения» системы уравнений-ограничений ОЗЛП относительно новых базисных переменных может быть сущест- венно упрощена, если ее формализовать и свести к заполнению стан- дартных таблиц по определенной системе правил (короче, алго- ритму). Этот алгоритм мы продемонстрируем на конкретном приме- ре (в его справедливости для любого общего случая читатель сможет убедиться самостоятельно). Рассмотрим систему пяти уравнений-ограничений: У1 — а11 Х1 #12 Хг + #13 Х3 + #14 Х4 ^1> Уз = #21 Х1 + #22 Х2 + #23 Х3 + #24 Л'4 + ^2> Уз ~ #31 Х1 + #32 Х2 #33 Х3 + #34 Xi + ^3 ’ Уз = #41 Х1 + #42 Х2 + #43 Х3 + #44 Х4 + ^4> Уз ~ #51 Х1 #52 Х2 + #53 Х3 + #54 Х3 ^5 с четырьмя свободными переменными: хъ х2, х3, х4. Пусть нам требует- ся вывести из числа свободных какую-нибудь переменную, например х2, и перевести ее в базисные, а взамен ее ввести в число свободных какую-то базисную переменную, скажем г/3; короче, мы хотим обме- нять местами переменные х2 и г/3. Эту замену мы будем символически обозначать хг Уз- 63
Посмотрим, какие действия надо для этого осуществить. Вообще, можно было бы для каждой новой системы уравнений проводить переразрешение заново, т. е. для замены х2 <-->• z/3 мы взяли бы в третьем уравнении (6.1) член а^х* содержащий х2, (назовем его «разрешающим членом»; разумеется, предполагаем с32 =£ 0), перенесли бы его в левую часть, а у3 — в правую; решили бы уравнение относи- тельно х2 и подставили бы выражение для х2 во все остальные уравне- ния. Процедура достаточно громоздкая, требующая напряженного внимания; при ее выполнении легко ошибиться (особенно при большом числе уравнений). Но так как здесь каждый раз нужно проделывать одни и те же операции, то их достаточно выполнить один раз в общем виде и вывести правила преобразования, которые затем можно при- менять автоматически. Эти правила, осуществляющие «переразреше- ние» системы, удобно реализовать в виде табличного алгоритма. Чтобы этот алгоритм был проще и легче запоминался, целесооб- разно предварительно несколько преобразовать систему уравнений (6.1), представив их правые части как разности между свобод- ными членами и суммой остальных: У1 = — (— Яц хх — а12 х2 — а13 х3—я14 х4), Z/2 = Ь2 ( *4 «22 ^2 «23 Х3 О24 Х1)> Уз = Ь3—( —а31 Хц — а 2 х2 — а33 х3 — a3i х4), У4 = Ь4 ( «41 Хх я42 х2, «43 Х3 «44 Xi)' Уь — bb ( g5i х4 а52 х2 я53 х3 яй4 х4). Обозначая —«и=ан; — (6.1) получим: —а51=а54- Ух — bi—(«и Х14- а12 х2 -ф а13 х3 4- а14 х4), • (6.2) У2 ~ Ь2 («21 Х1 + «22 Х2 + «23 Х3 + «24 Xi)> Xi)> Уз — Ь3 («31 Х1 + «32 Х2 + «33 Хз+«34 Уь= bi — <«41 *1 + «42 *2 + «43 Х3 + «44 Xi)> Уъ = Ь3 — («51 Х1 + «52 Х2 + «53 Х3 + «54 xi). Форму записи уравнений (6.2) мы будем называть станда р т- н о й. Очевидно, вместо того, чтобы полностью записывать уравнения (6.2), можно ограничиться заполнением стандартной та б л и- ц ы, где указаны только свободные члены и коэффициенты при пере- менных. Первый столбец таблицы мы отведем под свободные члены, второй, третий, четвертый и пятый — под коэффициенты при пере- менных хъ х2, х3, х4 в стандартной форме (6.2). Стандартная таблиц^ для системы (6.2) приведена в табл. 6.1. Теперь представим себе, что мы хотим произвести замену х2 «-» y3f т. е. перевести переменную х2 в число базисных, а переменную у3 —< в число свободных. Выделим в стандартной таблице разрешаю-1 щ и й э л е м е н т а32 (обведем его кружком); выделим также жирны' 64
Таблица 6.1 Свободный член X, л?2 л?3 У: Ь, «12 «13 «14 У2 Ь2 «21 «22 «23 «24 Уз Ъ3 «з. «32 азз «34 У4 ь4 «4! «42 , «43 «44 у5 «5! «52 «53 «54 ми линиями строку и столбец, в которых стоит разрешающий элемент. Эту строку и этот столбец мы будем называть разрешающей строкой иразрешающим столбцом (см. табл. 6.2). • Таблица 6.2 Уз** Свободный член X, х2 Х3 х4 У> «и «12 «13 «14 Уг Ь2 «21 «22 «23 «24 Уз Ь3 «31 («зг) «33 «34 Ул ь4 «4, «42 «43 «44 Уз &5 «51 «52 «53 «54 Выполняя операцию <-> у3, мы хотим в разрешающей строке поместить переменную у3, а в разрешающем столбце — переменную х2 (это отмечено в таблице рядом со строкой и столбцом). Найдем коэффициенты, которые нужно будет поставить в таблице после обмена х2 у3. Начнем с преобразования разрешающей стро- ки. Решая третье уравнение (6.2) относительно х2, получим: х2 = ^—Уз + ^Хз + ^xJ. (6.3) а32 X а32 ^32 #82 &32 / Таким образом, преобразованные элементы разрешающей строки найдены. Составим правило преобразования остальных строк. Для 3 Зак. 573 85
этого подставим в первое уравнение (6.2) вместо его выражение (6.3). После приведения подобных членов получим Нетрудно убедиться, что совершенно аналогичным образом пре- образовываются все остальные строки. В результате мы получим преоб- разованную таблицу (см. табл. 6.3), в которой операция х2 ♦-» у3 уже совершена. Таблица 6.3 Свободный член Уз *3 *4 У1 , “12 ^3 *1 “32 “12 “31 “11 ' “32 “12 “32 “12 “33 “13 “32 “12 “34 “14 “32 Уз “22 Ь3 Ь2 “32 “22 “31 “21 “32 “2 2 “32 “22 “33 “23 “32 “22 “34 “24 " “32 х2 Ьз “32 “31 “32 1 “32 “33 “32 ° 34 “32 У4 ! “42 Уз Уц .. “32 “42 “31 “41 “32 “42 “32 “42 “33 “43 “32 “42 “34 “44 “32 Уь , “52 Уз 65 “32 “52 “31 “52 “32 “52 “33 “52 “34 аб1 а32 аБЗ " а32 “54 “32 Рассмотрев табл. 6.3, мы можем так сформулировать алгоритм преобразования коэффициентов стандартной таблицы. 1. Разрешающий элемент заменяется на обратную ему величину. 2. Все остальные элементы разрешающей строки делятся на раз- решающий элемент. 3. Все элементы разрешающего столбца (кроме самого разрешаю- щего элемента) меняют знак и делятся на разрешающий элемент. 4. Каждый из остальных элементов подвергается следующему преобразованию: к нему прибавляется произведение элемента, стояв- шего в прежней разрешающей строке на том же месте по’ порядку (т. е. в том же столбце), на элемент, стоящий в новом разрешающем столбце на соот- ветствующем месте (т. е. в той же строке, что и наш элемент). 66
Последнее правило может в первом чтении показаться не совсем понятным; покажем, как оно применяется, хотя бы на примере элемен- та, стоящего в первой строке и втором столбце табл. 6.3. Новый элемент равен прежнему (аи) плюс произведение прежнего элемента раз- решающей строки а31, стоящего в том же столбце, что а11( и ново- го элемента разрешающего столбца! — —), стоящего в той же стро- ке, что и преобразуемый элемент. Нетрудно убедиться, что сформулированные правила преобразо- вания стандартной таблицы справедливы для любого числа уравне- ний и свободных переменных и для любой замены Xj«-» yt. Преобразование стандартной таблицы при замене xj «-» yt удобно производить, выполняя все вспомогательные расчеты тут же, в табли- це, для чего выделяется нижняя часть каждой ячейки.. Алгоритм преобразования х, yt стандартной таблицы сводит- ся при этом к следующим операциям. 1. Выделить в таблице разрешающий элемент atj. Вычислить его обратную величину X = 1/аг; и записать в нижней части той же ячей- ки (в правом нижнем углу). 2. Все элементы разрешающей строки (кроме самого агу) умно- жить на X; результат записать в нижней части той же ячейки. 3. Все элементы разрешающего столбца (кроме самого агу) умно- жить на —X; результат записать в нижней части той же ячейки. 4. Подчеркнуть (или выделить иным способом) в разрешающей строке все верхние числа (прежние элементы), за исключением самого разрешающего элемента ячейки, а в разрешающем столбце — все нижние числа (новые элементы), за исключением самого разрешающего элемента. 5. Для каждого из элементов, не принадлежащих ни к разрешаю- щей строке, ни к разрешающему столбцу, записать в нижнюю часть ячейки произведение выделенных чисел, стоящих в том же столбце и в той же строке, что и данный элемент. 6. Переписать таблицу, заменив: — Xj на yt и обратно, — элементы разрешающей строки и столбца — числами, стоящи- ми в нижних частях тех же ячеек, — каждый из остальных элементов — суммой чисел, стоящих в верхней и нижней части той же ячейки. Пример 1. В системе уравнений У1 = Xj— Х2-|-2Хз—6, Уз — 2х% Х3 1, у4 = — *1 — *з+2 (6.4) произвести замену х} у2, т. е вывести из числа свободных переменных Xj и вза- мен ее ввести у2 3* 67
У2 Таблица 6. ь Свободный член х3 У1 -5 -1 1 -2 У2 1 1 О Уз -1 О -2 I у4 2 1 О 1 Решение. Записываем уравнения (6.3) в форме стандартной таблицы (см. табл. 6.4), оставляя в нижней части каждой ячейки достаточно свободного места. Выделяем кружком разрешающий элемент — 2 и жирными линиями —раз- решающие строку и столбец. Вычисляем к = — 1/2. Вспомогательные записи будем вести в правом нижнем углу ячейки (см. табл. 6.5). Заполним, согласно пунктам 1, 2 и 3 алгоритма, нижиие части ячеек разре- шающих строки и столбца. Выделим, окружив их рамкой, верхние числа разрешающей строки и ниж- ние числа разрешающего столбца (кроме самой разрешающей ячейки). Далее мы уже можем заполнить все остальные нижние части ячеек, пере- множая соответствующие им выделенные числа, стоящие в разрешающей строке и разрешающем столбце на тех же местах, что данная ячейка (см. табл. 6.6). Заканчиваем преобразование, для чего переписываем табл 6.6, заменяя х, на у2, элементы разрешающей строки и столбца — нижними числами тех же ячеек, а остальные элементы — суммой верхних и нижних чисел (см. табл. 6.7) Таким образом, мы научились с помощью табличного алгоритма совершать в уравнениях-ограничениях любую замену X;yt. Вспомним, что в задаче линейного программирования, кроме урав- нений-ограничений, существует еще и линейная функция = с0 + С1 Х1 + С2 Х2 + ••• + cj Xj + ••• ~Tcn Хп> которую нужно минимизировать. Если эта функция выражена через прежние свободные переменные xlt х2, ..., хп, то, очевидно, после за- мены Xj <-> yt ее нужно выразить через новые свободные переменные хъ х2, ..., х;+1, yit xj+1, ..., хп. Нетрудно убедиться, что для этого может быть применен тот же алгоритм, что и для преобразования лю- бой строки стандартной таблицы. Действительно, приводя L к стан- дартной форме ~со—(Yi xi + Уг Х2~Ь ••• + Уп хп)> где Yj = —ct; у2 = —с2; ...; уп = —сп, мы получим еще одну стро- ку (добавочную) стандартной таблицы, которая отличается от осталь- 68
t Таблица 6,5 Свободный член т, х2 *з У1 -5 -1 -1 2 1 -2 У2 1 -1 2 2 1 1 2 О О Уз -1 О I О -2 1 У4 2 1 1 2 О 1 габлица 6.6 '2 Свободный член т, тг т3 У| 2 -1 х 2 1 1 2 -2 0 У2 1 2 ® 1 2 1 1 ' 2 _oj 0 Уз -1 О О 1 о -2 0 1 0 У4 2 । 2 1 х 2 О , 2 1 0 Таблица 6.7 Свободный член Уг •^3 У1 _ц 2 1 2 1 2 -2 *1 2 2 __1_ 2 0 Уз -1 0 -2 1 у4 5 2 1 2 1 2 1 69
У2 Таблица 6.8 Свободный член X, J?2 Х3 L 1 1 -2 1 Ух -1 -1 1 -1 Уг -3 ЛТ\ <2/ О 1 Уз О О -3 2 ных только тем, что в ней никогда не выбирается разрешающий эле- мент. Пример 2. Сделать замену хг «->• у2 в системе уравнений У1= хг— х2+ хя — 1, | Уг = 1/2*1 — *з — 3, | (6.5) Уз = Зх2 — 2хя ) и в линейной функции б “ —+ 2х2 —хя 4-1. Решение. Заполняем стандартную таблицу, в верхней строке которой по- мещаем линейную функцию L (см. табл. 6.8). Таблица 6.9 32 Свободный член Д?1 3?2 д?з L 1 -6 1 2 -2 о 1 2 У1 -1 6 -1 -2 1 О -1 -2 У2 -3 6 \2J~2 О О ij -2 Уз О о О О -3 О 2 О 70
Для выполнения замены х, **р, в той же таблице делаем дополнительные расчеты (см. табл 6.9) Заменой х, ** таблица приводится к виду (табл. 6 10) Таблица В. 10 Свободный член У1 Х2 Д?3 L -5 2 -2 3 У) 5 -2 1 -з 6 -2 О -2 y3 О О -3 2 С помощью табличного алгоритма обмена переменных в уравне- ниях ОЗЛП можно решить любую задачу линейного программирова- ния или же убедиться, что она не имеет решения. Нахождение решения каждой задачи линейного программирова- ния распадается на два этапа: I) отыскание опорного решения; 2) отыскание оптимального решения, минимизирующего линей- ную функцию L. В процессе первого этапа попутно выясняется, имеет ли вообще данная задача допустимые (неотрицательные) решения; если да, то находится опорное решение, для которого все свободные переменные равны нулю, а все базисные — неотрицательны. В процессе второго этапа попутно выясняется, ограничена ли снизу минимизируемая функция L; если нет, то оптимального решения не существует. Если да, то оно находится после того или другого чис- ла замен Xj *-» yt. Оба этапа решения ОЗЛП удобно выполнять с помощью описан- ного алгоритма преобразования стандартных таблиц. 7. ОТЫСКАНИЕ ОПОРНОГО РЕШЕНИЯ ОСНОВНОЙ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Пусть имеется ОЗЛП с ограничениями-равенствами, записанными в стандартной форме: У1 = — (ап х, + а12 хг 4-... + а1п хп), У2— ^2-(a21 Xl + a ll X2 4* ••• 4~ Xn)> (7 1) Ут ~ Ьщ <®>nl Х1 Ь ^rn2 x2 4” ••• 4* 71
разрешенными относительно базисных переменных уъ ...... ут, ко- торые выражены через свободные переменные хъ х2........хп. В каждой вершине ОДР (опорном решении) по крайней мере п переменных долж- ны обращаться в нуль. Попробуем получить опорное решение, полагая в формулах (7.1) все свободные переменные равными нулю. Имеем: х1 = х2 = ...=хп = 0; , ь ь (7-2) У1 = ЬХ-, у2 — Ь2\ ...; ут = Ьт. Если все свободные члены blt b2, Ьт в уравнениях (7.1) неот- рицательны, это значит, что опорное решение уже получено; этот случай нас не интересует. Рассмотрим случай, когда среди сво- бодных членов blt b2, ..., Ьт есть отрицательные. Это значит, что реше- ние (7.2) не является опорным — оно вообще не допустимо, и опорное решение еще предстоит найти. Для этого мы будем шаг за шагом обме- нивать местами базисные и свободные переменные в уравнениях (7.1) до тех пор, пока не придем к опорному решению или не убедимся, что его не существует. Последнее бывает в случае, когда система уравне- ний (7.1) несовместима с неравенствами *1>0, х2>0,.... хп>0, у1>0,..., ут>0, (7.3) т. е. у нее нет неотрицательных решений. Очевидно, нужно так обменивать местами базисные и свободные переменные, чтобы эта процедура приближала нас к границе ОДР, а не удаляла от нее, т. е. чтобы число отрицательных свободных членов с каждым шагом убывало, или, если число отрицательных сво- бодных членов остается прежним, то, по крайней мере, убывали их абсолютные величины. Существует ряд способов выбора разрешающего элемента для при- ближения к опорному решению. Остановимся (без строгого доказатель- ства) на одном из них. Пусть имеется одно из уравнений (7.1) с отрицательным свободным членом. Ищем в этой строке отрицательный элемент аг;-. Если такого элемента нет (все элементы а<;- > 0), это признак того, что система уравнений (7.1) несовместима с неравенствами (7.3). Действительно, при отсутствии отрицательных элементов в строке вся правая часть соответствующего уравнения может быть только отрицательной, а это противоречит условиям неотрицательности переменных. Предположим, что отрицательный элемент есть. Тогда выбираем столбец, в котором он находится, в качестве разрешающего. Теперь надо выбрать в этом столбце сам разрешающий элемент. Рассмотрим все элементы данного столбца, имеющие одинаковый знак со свободным членом. Из них выбирем в качестве разрешающего тот, для которого отношение к нему свободного члена минимально. Таким образом, выбирается разрешающий столбец, разрешающий элемент в нем и, значит, разрешающая строка. Убедимся на примере, как совершается приближение к опорному решению при таком правиле выбора разрешающего элемента. Попут- но мы убедимся в разумности этого правила. 72
Пример 1. Найти (если оно существует) опорное решение задачи линейно- го программирования с ограничениями-равенствами: У1 = 1 — (— хг—2x2-j-x3), 1/2 = —5 — (—2xj-|- х2—х3), Уз — 2—(xi+ Vi— 1—(— х2 + хз)> (7.4) (здесь не приводится линейная форма, которую нужно минимизировать, потому что опорное решение ищется безотносительно к виду этой формы). Решение. Записываем условия (7.4) в виде стандартной таблицы (см. табл. 7.1). Таблица. 7.1 Свободный член X, Х2 Х3 У1 1 -1 -2 1 У2 -5 ^2 1 -1 Уз 2 1 1 О у4 1 О -1 1 В табл 7.1 имеется отрицательный свободный член —5 в строке у2 столбца хх. Согласно правилу, выбираем любой отрицательный элемент этой строки, на- пример —2 (в табл. 7.1 он подчеркнут). Этим мы выбрали разрешающий столбец хх. В качестве «кандидатов» на роль разрешающего элемента рассмотрим все те элементы этого столбца, которые одинаковы по знаку со своим свободным чле- ном; это будут —2 и 1 (нуль в качестве разрешающего элемента фигурировать не может). Вычисляем для каждого из «кандидатов» отношение к нему свободного члена: (-5)/(-2) = »/2; 2/1=2. Наименьшее из этих отношений 2; значит, элемент 1 выбираем в качестве разрешающего и меняем местами хх у2 (см. табл. 7.2). После выполнения действий приходим к табл. 7.3. В табл. 7.3 по-прежнему один отрицательный свободный член, но по абсо- лютной величине он уже меньше, чем в табл. 7.1 — значит, мы приближаемся к ОДР. Попробуем избавиться и от этого члена. В строке у2 имеется только один отрицательный элемент —1 (подчеркнут). Значит, разрешающим столбцом может быть только столбец х3. Вычисляем для всех элементов этого столбца, имеющих одинаковый знак со своим свободным членом, отношение свободного члена к эле- менту: 3/l=»3j (-!)/( —1)=1; 1/1=1. 73
Таблица 7.2 Уз~*~” Свободный член X 1 X Ig У1 1 2 -1 1 -2 । 1 0 У2 -5 4 -2 2 1 2 -1 0 Уз ’ 2 2 1 1 О О у4 1 О О О -1 О 1 0 Таблица 7.3 Свободный член Уз а?2 х3 У1 3 1 -1 -1 У2 -1 2 3 ч X, 2 1 1 О У4 1 О -1 1 Отношение достигает минимума, равного 1, для двух элементов; возьмем и качестве разрешающего первый из них (—1), стоящий в строке у3 и столбце хв, в сделаем замену х3 у2 (см. табл 7.4 и 7.5). В табл 7.5 все свободные члены неотрицательны, и опорное решение най- дено: = 0; й = 2; х3 = 1; х± = 2; у± = 0. Пример 2. Найти (если оно существует) опорное решение системы */i— —4—(—xt-f-2x3), 4*2 = —3 — (хх—х2+хз), 4*з= ~ Ю—(2*i—х2+аз), 4,4==-2-=(«-хх+х2). (7.5) 74
Таблица 7. Ч У2 — Свободный член Уз а?2 а?з У1 3 -1 1 2 -1 3 1 1 У2 -1 1 2 -2 3 -3 (н) -1 а?! 2 0 1 о 1 0 О О у4 1 -1 О 2 -1 3 1 1 Таблица 7.5 Свободный член Уз z2 У2 У1 2 3 2 1 X- о 1 -2 -3 -1 X] 2 1 1 О У4 О 2 2 t Таблица 7. В Свободный член а?1 Х2 ' % У1 -4 -1 2 0 У2 -3 1 -1 1 Уз -10 2 -1 1 у4 -2 (ч) 1 0 П
Уь— таблица 7. 7 Свободный член Т, Х2 J?3 У1 -4 2 -1 -1 2 -1 0 0 У2 -з -2 1 -1 1 1 0 Уз -10 -4 2 2 -1 2 1 0 у4 -2 -1 1 0 2 -1 0 Решение. Записываем систему уравнений (7.5) в виде стандартной табли- цы (см. табл. 7.6). Выбираем строку с отрицательным свободным членом, например, первую. В ней есть отрицательный элемент (—1). Выбираем столбец хг в качестве разре- шающего. Вычисляем отношения: (—4)/( —1) = 4; (-2)/(-1) = 2. Последнее отношение минимально; значит, в качестве разрешающего берем элемент ( —1) в строке р4 и производим замену х, ys (см. табл. 7.7 и 7.8). Обратим внимание на строку у3 в табл. 7 8. В ней свободный член отрица- телен, но нет ни одного отрицательного элемента (кроме самого свободного члена). Соответствующее уравнение имеет вид: (/з = —14 — &у} 4-x2-f-x3). Может ли при каких бы то ни было неотрицательных значениях у}, х2> х3 . величина у3 быть неотрицательной? Очевидно, нет: при у2=х2 = х3 == 0 полу- чим у3 = —14, а увеличение у4, х2, х3 сверх нуля сделает у3 еще меньше Следо- Таблица 78 Свободный член Ул х2 ХЛ У> -2 -1 1 0 У-2 -5 1 0 1 Уз -14 2 1 1 X. 2 -1 -1 0 76
вательно, система (7.5) несовместима с неравенствами, вытекающими из неотри- цательности переменных, и задача линейного программирования с условиями- ограничениями (7.5) допустимых решений не имеет. О том же свидетельствует и строка у2 табл. 7.8, где тоже нет ни одного отрицательного элемента (кроме самого свободного члена) Таким образом, мы видим, что нет необходимости специально исследовать систему условий ОЗЛП на совместность в области неот- рицательных решений: этот вопрос выясняется автоматически, в про- цессе нахождения опорного решения. 8. ОТЫСКАНИЕ ОПТИМАЛЬНОГО РЕШЕНИЯ ОСНОВНОЙ ЗАДАЧИ ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ В предыдущем параграфе мы научились отыскивать опорное ре- шение системы уравнений ОЗЛП; при поисках этого опорного реше- ния мы вовсе не занимались минимизируемой функцией L. Теперь мы займемся оптимизацией решения, т. е. отысканием такого опорного решения, которое обращает в минимум линейную функцию: L = с0— (?1 Х1 + у2 х2 +... + у„ х„). В § 5 мы уже продемонстрировали принципиальную сторону ме- тодики оптимизации решения. Здесь мы на примерах покажем, как эта оптимизация может быть проведена с помощью табличного алго- ритма замены х/ «-> yt. Пример 1. Найти решение задачи линейного программирования с уравне- ниями J/1 —2— ( Xj-|-X2—2х8), У2=1— ( Xi—X2+ х8), (/3=5 — ( х24* хз), t/4 = 2 — (2х1— х2), обращающее в минимум линейную функцию L —0—(—Xi -}~2х2-}-Хз). (8*2) Решение. Все свободные члены в (8.1) неотрицательны, значит, опорное ре- шение налицо: Х4 = х2=х3 = 0; {/1=2; у2 = 1; (/3 = 5; (/, = 2. Является ли оно оптимальным? Нет, так как коэффициенты при х2 и х3 в (8.2) положительны, значит, увеличивая эти переменные, мы уменьшаем L. Запишем (8.1) и (8.2) в виде стандартной таблицы (табл. 8.1). Так как коэффициенты в первой строке при х2 и хз положительны, любую из этих переменных можно вывести из числа свободных. Пусть это будет х3. Ка- кой из элементов столбца х3 взять разрешающим? Этот элемент должен быть п о- ложительным. Значит, у нас есть выбор: 1 в строке у2 или 1 в строке у3. Выберем тот их них, для которого отношение к нему свободного члена минималь- но (обоснование см. в § 5). Отношения равны 1/1 = 1; 5/1=5. Минимальное из них 1. Значит, в ка- честве разрешающего нужно взять элемент 1 в столбце х3, строке у2. Произ- ведем замену х3 у2 (см. табл. 8.2, 8.3). 77
Таблица 8.1 1 Свободный член *4 гг Г3 L о -1 2 1 2 1 1 -2 уг 1 1 -1 (Т) Уз 5 О 1 1 У4 2 2 -1 О Таблица 8.2 У2— Свободный член Х2 лг3 L О -1 -1 -I 2 1 1 1— 1 -1 У! 2 2 1 2 1 -2 -2 । 1 2 У2 1 Jj 1 1 __Z1J -1 (Т) ч-/ 1 Уз 5 ! -1 О -1 1 1 1 , 1 -1 & 1 2 1 0 2 о -1 О О 1 0 Таблица 8.3 ! Свободный член X, Х2 у2 -1 -2 3 -1 У1 4 3 -1 2 ! 1 1 -1 1 Уз 4 -1 -1 . У4 2 2 -1 О 78
Таблица 8. f Уз— Свободный член *1 х2 У2 L -1 -6 "2 з 2 3 3 2* 1 3 2 У1 4 2 3 , 2 -1 1 2 2 _> 2 х3 1 2 ’ 1 2 -1 1 2 1 1 2 Уз и -1 1 . (А) 1 2 1 , 2 2 2 У< 2 2 КЗ 1 ю|— -1 1 2 О 1 Ю|— В верхней строке табл. 8.3 есть положительный коэффициент при х2, зна- чит, х2 надо вывести из свободных переменных. Выбираем в качестве разрешаю- щего тот положительный элемент столбца х2, для которого отношение к нему свободного члена минимально. Но в столбце х2 единственный положительный элемент 2, его и выбираем в качестве разрешающего (см. табл. 8.4 и 8.5). Оказывается, процедура еще не закончена: в первой строке табл. 8.5 имеет- ся положительный элемент в столбце у2, значит, переменную у2 нужно вывести из числа свободных. В качестве разрешающего берем тот из положительных эле- ментов столбца у2, для которого отношение к нему свободного члена минимально. Сравнивая отношения 6:3/2 = 4, 3 :1/2 = 6, выбираем в качестве разрешающего элемент 3/2 в строке уг и столбце у2 и продол- жаем процедуру оптимизации (см. табл. 8.6 и 8.7). В первой строке табл. 8.7 нет ни одного положительного элемента; значит, оптимальное решение достигнуто; оно будет: *1 = (/з = ?/1 = 0; ?/2=4; х8=1; «2=4; у4=6. • При этих значениях переменных линейная функция L достигает своего минималь- ного значения, равного 7-ш1п= —9. Возникает вопрос: а что если в столбце, содержащем положитель- ный элемент строки L, не найдется ни одного положительного элемен- та, чтобы сделать его разрешающим? Легко убедиться, что в этом слу- чае функция L не ограничена снизу и ОЗЛП не имеет оптимального решения. Действительно, в этом случае увеличение переменной, соответст- вующей данному столбцу, уменьшает линейную функцию L и не мо- жет сделать ни одной из базисных переменных отрицательной, значит, ничто не препятствует неограниченному уменьшению функции L. Итак, сформулируем правила нахождения оптимального решения ОЗЛП симплекс-методом. 1. Если все свободные члены (не считая строки L) в симплекс- таблице неотрицательны, а в строке L (не считая свободного члена) нет ни одного положительного элемента, то оптимальное ре- шение достигнуто. 7»
Таблица 8.5 Свободный член X, Уз Уз L -7 2 2 3 2 1 2 У, 6 5 2 2 2 /ЗЛ хз 3 2 2 2 2 2 2 х2 2 _2 2 2 2 2 2 у< 4 3 2 2 2 2 *2 таблица 8.5 У> — Свободный член Уз Уз L -7 -2 2 2 _ 5. 6 1 ю|со ! ~6 ^-1 2 ! 3 У, 6 4 i 5 3 1 2_ 1 3 /з' <2^ ) 2 3 *3 3 -2 2 2 5. ~ 6 2 2 1 6 2 2 1 3 х2 2 2 2 ~2 5 6 2 2 1 6 1 2 1 г 1 3 У4. 4 2 3 2 5 £ 2 2 1 6 2 2 ГТ 1 5 Таблица в. 7 Свободный член Уз У< L -9 _4. 3 5. 3 3 у2 4 5. 3 2 3 2 3 х3 1 2 ~з 1 3 1 3 х2 4 2 3 2 3 2 3 У< 6 7 3 2 3 2 3 80
Таблица 8.8 Свободный член Х2 Х3 Т4 L о -2 1 О О У. О -1 О О О У2 2 О 1 -1 О Уз 1 О О -1 -1 Таблица 8.9 Свободный член Х2 Х3 г4 L О 0 -2 1 1 [-1 О О О О У1 oj -1 | -1 со у 1 о| 0 О у2 2 0 О 1 'F -1 0 О О Уз 1 0 О 0 А» -1 0 -1 О л Таблица 8.10 Свободный член Х! У! хз Ж4 L О -1 -1 О О Х2 О -1 1 О О У2 2 1 -1 -1 О Уз 1 О О -1 -1 8!
2. Если в строке L есть положительный элемент, а в столбце, соответствующем ему, нет ни одного положительного элемента, то ли- нейная функция L не ограничена снизу, и оптимального ре- шения не существует. 3. Если в этом столбце есть положительные элементы, то следует произвести замену одной из свободных переменных на одну из баз ис- ных, причем в качестве разрешающего надо взять тот элемент этого столбца, для которого отношение к нему соответствующего свободного члена минимально. В заключение остановимся на так называемом «вырожденном» случае, когда один (или более) свободных членов в уравнениях-огра- ничениях получается равным нулю. Это означает, что в данном опор- ном решении обращаются в нуль не только свободные переменные, но и некоторые из базисных. Рассмотрим пример. Пример 2. Найти решение задачи линейного программирования с условия- ми t/i = Xi —-Ч> ] ,Q Уг — —х2-(-х3+2, I (8.3) !/з= *з+-ч+1, J обращающее в минимум линейную функцию L=2x1—х2. (8.4) Решение. Записываем (8.3) и (8.4) в виде стандартной таблицы (см. табл. 8.8). Согласно общему правилу, ищем в столбце х2 разрешающий элемент, для которого отношение к нему свободного члена неотрицательно и минимально. Сравнивая отношения 0:1 и 2:1, останавливаемся на разрешающем элементе 1 в строке ylt для которого это отношение равно нулю. Производим замену х2 «-» У) (см. табл. 8.9 и 8.10). При переходе от табл. 8.8 к табл. 8.10, естественно, не произошло умень- шения линейной функции L (она как была, так и осталась равной нулю), ио зато элементы верхней строки стали все неположительными, из чего видно, что опти- мальное решение достигнуто: минимум функции равен нулю и достигается при X] = У, = *3 = *4 = °; хг = 0; у2 = 2; у3 <= 1. Сделаем еще одно, последнее, замечание по поводу так называе- мого «зацикливания». Мы уже видели, что при наличии «вырождения» может оказаться, что замена одной из свободных переменных на ба- зисную и обратно приводит только к перестановке переменных, без уменьшения линейной функции L. В очень редких случаях может ока- заться, что последовательное применение правила выбора разрешаю- щего элемента приводит к тому, что после нескольких замен Xj «->yt мы вновь возвращаемся к тому же набору базисных и свободных пе- ременных, с которого начали. Это и называется «зацикливанием». Практически для того, чтобы избежать этого, достаточно бывает при повторении взять разрешающий элемент не так, как он был взят пер- вый раз (например, в другом столбце). При организации алгоритма линейного программирования на ЭЦВМ в программу должно быть введено соответствующее указание. 82
9. ТРАНСПОРТНАЯ ЗАДАЧА ЛИНЕЙНОГО ПРОГРАММИРОВАНИЯ Изложенный в предыдущих параграфах симплекс-метод решения задачи линейного программирования является универсальным и при- меним для решения любых таких задач. Однако существуют некоторые частные типы задач линейного программирования, которые, в силу не- которых особенностей своей структуры, допускают решение более простыми методами. К ним относится, в частности, так называемая транспортная задача. Классическая транспортная задача линейного программирова- ния формулируется следующим образом. Имеется т пунктов отправления: Аи А2,..., Агп, в которых со- средоточены запасы какого-то однородного товара (груза) в коли- честве соответственно а1г а2,..., ат единиц. Кроме того, имеется п пунктов назначения : В1, В2, ..., Вп, подавших заяки соответственно на b2, ..., Ьп единиц товара. Предполагается, что сумма всех заявок равна сумме всех запасов: т п ^at=^b3. (9.1) Z=l /=1 Известна стоимость ci3 перевозки единицы товара от каждого пункта отправления At до каждого пункта назначения В3. Таблица (матрица) стоимостей перевозки ci3j задана: С11 С12 ••• с1п С21 с22 ... с2п Ст1 ст2 ••• стп Требуется составить такой план перевозок, при котором все заяв- ки были бы выполнены, и при этом общая стоимость всех перевозок была минимальна. При такой постановке задачи показателем эффективности плана перевозок является стоимость; поэтому поставленную задачу точнее называют транспортной задачей по критерию стоимости. Дадим этой задаче математическую формулировку. Обозначим xi3 — количество груза, отправляемого из г-го пункта отправления Дг- в /-й пункт назначения В3 (г = 1, ..., т; / = 1.п). Неотрицатель- ные переменные хп, х12........................... хтп (число которых, очевидно, равно mXn) должны удовлетворять следующим условиям: 1. Суммарное количество груза, направляемое из каждого пунк- та отправления во все пункты назначения, должно быть равно запасу груза в данном пункте. Это даст нам т условий-равенств: 83
In —G2> “ CL mn nv или, короче, (9.2) п 2 xmi~ 2. Суммарное количество груза, доставляемое в каждый пункт назначения изо всех пунктов отправления, должно быть равно заяв- ке, поданной данным пунктом. Это даст п условий-равенств: *11 4* *21 4* ••• 4* Хт1 = (’и *12 4“ *22 4- ••• Ч~Хт2=^2> *1п4-*2п4* ••• Л~хтп~Ьп, или, короче, т 2*п=*1. 1 = 1 т V г — h *12 ~ «2, /О т 2 = ^п' 3. Суммарная стоимость всех перевозок, т. е. сумма величин х^/, умноженных на соответствующие стоимости с^, должна быть мини- мальной: L~cu xu с12 х12 4- ... 4- с1п х1п -}- 4~С21 *21 4- С22 *22 4- — 4- С2п*2п4* ••• 4* 4* С'т! Хт1 4- Cm2 Хт2 4“ ••• 4~ Стп Хтп — ПИП, или, гораздо : ороче, т п 2 2 *ii = min, (9.4) i=i /=1 tn а где знак двойной суммы 2 S означает, что суммирование произ- i=i ;=1 84
водится по всем комбинациям индексов (£ = 1.т; j = 1, п), т. е. по всем комбинациям пунктов отправления с пунктами назначения. Функция (9.4) линейна, ограничения - равенства (9.2), (9.3) так- же линейны. Перед нами — типичная задача линейного программи- рования с ограничениями-равенствами (ОЗЛП). Как и всякую другую задачу линейного программирования, ее можно было бы решить симплекс-методом, но данная задача имеет некоторые особенности, позволяющие решить ее более просто. Причи- ной является то, что все коэффициенты при переменных в уравнениях (9.2), (9.3) равны единице. Кроме того, имеет значение структура свя- зей между условиями. Нетрудно убедиться, что не все т -j- п уравне- ний нашей задачи являются независимыми. Действительно, склады- вая между собой все уравнения (9.2) и все уравнения (9.3), мы должны получить одно и то же, в силу условия (9.1). Таким образом, условия (9.2), (9.3) связаны одной линейной зависимостью, и фактически из этих уравнений только т п — 1, а не т + п являются линейно независимыми. Значит, ранг системы уравнений (9.2), (9.3) равен r = m-)-n— 1, а, следовательно, можно разрешить эти уравнения относительно т -\-п — 1 базисных переменных, выразив их через остальные, свобод- ные. Подсчитаем количество свободных переменных. Оно равно: k = mn—(т-^-п — 1) =тп—т—(п— 1) = = т’(п— 1) — (и— 1) — (т— 1) (п — 1). Мы знаем, что в задаче линейного программирования оптимальное решение достигается в одной из вершин ОДР, где по крайней мере k переменных обращаются в нуль. Значит, в нашем случае для опти- мального плана перевозок по крайней мере (т — 1)(п — 1) значений xi} должны быть равны нулю. Условимся о терминологии. Значения количества единиц гру- за, направляемых из пункта Дг в пункт В, мы будем называть пере- возками. Любую совокупность значений (хг?-) (г = 1, ..., т; j — 1.п) будем называть планом перевозок, или просто планом. План (xtj) будем называть допустимым, если он удовлетво- ряет условиям (9.2), (9.3) (так называемым «балансовым условиям»): все заявки удовлетворены, все запасы исчерпаны. Допустимый план будем называть опорным, если в нем от- личны от нуля не более г — т-(-п — 1 базисных перевозок х1}, а ос- тальные перевозки равны нулю. План (xtj) будем называть оптимальным, если он, среди всех допустимых планов, приводит к наименьшей стоимости всех пере- возок. Перейдем к изложению методов решения транспортной задачи (ТЗ). Эти методы не требуют манипуляций с симплекс-таблицами, 85
а сводятся к более простым операциям непосредственно с таблицей, где в определенном порядке записаны все условия ТЗ. Такую табли- цу мы будем называть транспортной таблицей. В транспортной таблице записываются — пункты отправления и назначения, — запасы, имеющиеся в пунктах отправления, — заявки, поданные пунктами назначения, — стоимости перевозок из каждого пункта отправления в каж- дый пункт назначения. Стоимости перевозок мы будем помещать в правом верхнем углу каждой ячейки, с тем чтобы в самой ячейке при составлении плана по- мещать перевозки х^. Образец транспортной таблицы дан в табл. 9.1. Таблица 9.1 Хпн пох В, Вг Вп Запасы «I Си С,2 с In а2 С2| С22 С2п а2 •J Ат {-'mt Ст2 Cion ат Заявки ^2 т п £,a=Z,bi i=i }=i ' Для краткости в дальнейшем будем обозначать пункты отправ- ления — ПО, пункты назначения — ПН. В правом верхнем углу каж- дой клетки проставлены стоимости перевозки единицы товара (груза) из ПО At в ПН Bj. В правом столбце помещены запасы товара в каждом ПО, в нижней строке — заявки, поданные каждым ПН. Для ТЗ сумма запасов равна сумме заявок; общее значение этой суммы записывается в правой нижней ячейке таблицы. Выше мы показали, что ранг системы уравнений-ограничений ТЗ равен г — т + п — I, где т — число строк, ап — число столбцов транспортной таблицы. Значит, в каждом опорном плане, включая оптимальный, будут отличны от нуля не более, чем п + т — I пере- возок. Ячейки (клетки) таблицы, в которых мы будем записывать эти отличные от нуля перевозки, условимся называть базисными, а остальные (пустые) свободными. 86
Таким образом, решение ТЗ свелось к следующему. Найти такие вначения положительных перевозок, которые, будучи проставлены в базисных клетках транспортной таблицы, удовлетворяли бы следую- щим условиям: — сумма перевозок в каждой строке таблицы должна быть равна запасу данного ПО; — сумма перевозок в каждом столбце должна быть равна заявке данного ПН; — общая стоимость перевозок — минимальная. В дальнейшем все действия по нахождению решения ТЗ будут сво- диться к преобразованию транспортной таблицы 9.1. При описании этих преобразований нам удобно будет пользовать- ся нумерацией клеток таблицы (подобной нумерации клеток шахмат- ной доски).' Клеткой (Д(, Bj) или, короче, клеткой (t, /) мы будем называть клетку, стоящую в /-й строке и /-м столбце транспортной таблицы. Например, самая верхняя левая клетка будет обозначаться (1, 1), стоящая под ней (2, 1) и т. д. 10. НАХОЖДЕНИЕ ОПОРНОГО ПЛАНА Решение транспортной задачи, как и всякой задачи линейного программирования, начинается с нахождения опорного решения, или, как мы будем говорить, опорного плана. В отличие от общего случая ОЗЛП с произвольными ограничениями и минимизируемой функцией, решение ТЗ всегда существует. Действительно, из чисто физических соображений ясно, что хоть какой-то допустимый план существовать должен. Среди допустимых планов непременно имеется оптимальный (может быть, не^один), потому что линейная функция L — стоимость перевозок заведомо неотрицательна (ограни- чена снизу нулем). В данном параграфе мы покажем, как построить опорный план. Для этого существуют различные способы, из которых мы остановимся на простейшем, так называемом «способе северо-за- падного угла». Пояснить его проще всего будет на конкретном при- мере. Пример 1. Условия ТЗ заданы транспортной таблицей (см. табл. 10.1). Требуется найти опорное решение ТЗ (построить опорный план). Решение. Перепишем табл. 10.1 и будем заполнять ее перевозка- ми постепенно, начиная с левой верхней ячейки (1,1) («северо-западно- го угла» таблицы). Будем рассуждать при этом следующим образом. Пункт By подал заявку на 18 единиц груза. Удовлетворим эту заявку за счет запаса 48, имеющегося в пункте Аъ и запишем перевозку 18 в клетке (1,1). После этого заявка пункта В] удовлетворена, а в пунк- те Ai осталось еще 30 единиц груза. Удовлетворим за счет них заявку пункта В2 (27 единиц), запишем 27 в клетке (1,2); оставшиеся 3 едини- цы пункта Ai назначим пункту В3. В составе заявки пункта В3 оста- лись неудовлетворенными 39 единиц. Из них 30 покроем за счет пункта 87
Таблица fO. i Xtih поХ в> В2 в3 в. в5 Запасы а. -4, 10 8 5 6 9 48 а2 6 7 8 6 5 30 А3 в 7 Ю в 7 27 Д4 7 5 4 6 8 20 Заявки Ь> 18 27 42 12 26 125 A2, чем его запас будет исчерпан, и еще 9 возьмем из пункта А3. Из оставшихся 18 единиц пункта Л3 12 выделим пункту В4; оставшиеся 6 единиц назначим пункту В6, что вместе со всеми 20 единицами пунк- та А4 покроет его заявку (см. табл. 10.2). На этом распределение запасов закончено: каждый пункт назна- чения получил груз согласно своей заявке. Это выражается в том, что сумма перевозок в каждой строке равна соответствующему запасу, а в столбце — заявке. Таким образом, нами сразу же составлен план перевозок, удов- летворяющий балансовым условиям. Полученное решение является не только допустимым, но и опорным решением транспортной задачи. Таблица 10.2 Хпн пох В\ в2 в3 в. в, Запасы 4] 10 18 8 27 5 3 в 9 48 а2 6 7 8 30 6 5 30 Аз 8 7 10 9 в 12 7 6 27 7 5 4 6 8 20 20 Заявки Ь 18 27 42 12 26 125 88
Клетки таблицы, в которых стоят ненулевые перевозки, являются базисными, их число удовлетворяет условию г = т-\-п—1=8. Ос- тальные клетки—свободные (пустые), в них стоят ненулевые перевоз- ки, их число равно (п — 1)(т — 1) = 12. Значит, наш план — опор- ный и поставленная задача построения опорного плана решена. Возникает вопрос: а является ли этот план оптимальным по стои- мости? Разумеется, нет! Ведь при его построении мы совсем не учи- тывали стоимостей перевозок с/?-. Естественно, план не получился оп- тимальным. Действительно, стоимость этого плана, которая найдется, если умножить каждую перевозку на соответствующую стоимость, равна 18-10+27-8+3-5+30-8 + 9-10 + 12-8 + 6-7 + 20-8 = 1039. Таблица 1О.З Хпн пох в. В2 В3 в4 в5 Запасы 10 а 27 5 21 6 9 48 Д2 6 18 7 8 12 6 5 30 43 8 7 10 9 8 12 7 6 27 7 5 4 6 8 20 20 Заявки Ь> 18 27 42 12 26 125 Попробуем улучшить этот план, перенеся, например, 18 единиц из клетки (1,1) в клетку (2,1) и, чтобы не нарушить баланса, перене- ся те же 18 единиц из клетки (2,3) в клетку (1,3). Получим новый план, приведенный в табл. 10.3. Нетрудно убедиться, что стоимость нового плана равна 27,8 + 21-5 + 18-6 + 12-8 + 9-10 + 12-8 +6-7 + 20-8 = 913,т. е. на 126 единиц меньше стоимости плана, приведенного в табл. 10.3. Таким образом, за счет циклической перестановки 18 единиц гру- за из одних клеток в другие нам удалось понизить стоимость плана. На этом способе уменьшения стоимости в дальнейшем и будет основан алгоритм оптимизации плана перевозок. Остановимся на одной особенности плана перевозок, которая мо- жет встретиться как при построении опорного плана, так и при его улучшении. Речь идет о так называемом «вырожденном» плане, в кото- ром некоторые из базисных перевозок оказываются равными нулю. Рассмотрим конкретный пример возникновения вырожденного плана. Пример 2. Дана транспортная таблица (без стоимостей перевозок, так как речь идет только о построении опорного плана)—см. табл. 10.4. 89
Таблица 10 4 \пн по\ з, в2 В3 в4 в, Запасы а, Л, 20 Д2 30 лз 25 Ад 20 Заявки Ь> 10 10 20 35 20 95 Таблица 10.5 \ПН по\ з. 32 3з Зд з5 Запасы ai А, 10 10 20 ^2 20 10 30 ^3 25 25 Ад 20 20 Заявки Й1 10 10 20 35 20 95 Таблица 10.6 Хпн поХ з. В2 Зз Вд в5 Запасы Я| 11 А, 10 10 £ 20 + ff а2 20-е 10+е 30 A3 25-е 2е 25+е а4 2О-2е 20-2е Заявки bJ 10 10 20 35 20 95 90
Составить опорный план перевозок. Решение. Применяя способ северо-западного угла, получим табл. 10.5. Опорный план составлен. Особенностью его является то, что в нем только шесть, а не восемь отличных от нуля перевозок. Значит, некоторые из базисных перевозок, которых должно быть т + п — 1 =8, оказались равными нулю. Нетрудно заметить, отчего это произошло: при распределении запасов по пунктам назначения в некоторых случаях остатки оказы- вались равными нулю и в соответствующую клетку не попадали. Такие случаи «вырождения» могут возникать не только при со- ставлении опорного плана, но и при его преобразовании, оптимизации. В дальнейшем нам удобно будет всегда иметь в транспортной таблице т + п — 1 базисных клеток, хотя в некоторых из них, может быть, будут стоять и нулевые значения перевозок. Для этого можно ничтожно мало изменить запасы или заявки, так чтобы общий баланс не нарушился, а лишние, «промежуточные» балансы уничтожились. Достаточно в нужных местах изменить запасы или заявки, например, на величину е, а после нахождения оптимального решения положить е = 0. Покажем, как перейти от вырожденного плана к невырожденному на примере табл. 10.5. Изменим слегка запасы в первой строке и поло- жим их равными 20 + 8. Кроме того, в третьей строке проставим за- пасы 25 + е. Чтобы «свести баланс», в четвертой строке ставим запасы 20 — 2е (см. табл. 10.6). Для этой таблицы строим опорный план спо- собом северо-западного угла. В табл. 10.6 уже содержится столько базисных переменных, сколь- ко требуется: т + п. — 1 = 8. В дальнейшем, после оптимизации пла- на, можно будет положить е = 0. 11. УЛУЧШЕНИЕ ПЛАНА ПЕРЕВОЗОК. ЦИКЛ ПЕРЕСЧЕТА В предыдущем параграфе мы уже бегло познакомились со спосо- бом улучшения плана, состоящим в том, что некоторые перевозки, без нарушения баланса, переносятся из клетки в клетку по некоторому замкнутому циклу. Здесь мы рассмотрим эти циклические перестанов- ки подробнее. Возьмем транспортную таблицу, состоящую, например, из т=5 строк и и = 6 столбцов (число строк и столбцов несущественно). Циклом в транспортной таблице мы будем называть несколько клеток, соединенных замкнутой ломаной линией, которая в каждой клетке совершает поворот на 90°. Например, в табл. 11.1 изображены два цикла: первый с четырь- мя вершинами (2,1), (2,3), (4,3), (4,1) и второй — с восемью вершина- ми (1,4), (1,6), (4,6), (4,4), (3,4), (3,5), (5,5), (5,4). Стрелками показано направление обхода цикла. 91
Таблица 11.1 Хпн поХ Bi в2 В3 в4 В5 В6 Запасы Ai Си С|2 с 13 см С|5 С|б О. а2 Qi с22 С23 С24 С25 *-"26 а2 ^з С31 С 32 С33 С34 С 35 С36 «3 А4 С4, С 42 С 43 С44 С45 С 46 а4 ^5 С51 С52 с 53 С 54 С55 С56 Заявки &2 &3 Ь4 ^6 т п Z'a.=Z'bl 1=1 1=1 ' Таблица 11.2 "хпн поХ в, в2 В3 В4 В5 В6 Запасы °| 41 с„ О 1 С13 С|4 С15 С|6 01 д2 С2| С22 с23 С 24 С25 С26 а2 Лз — С31 С32 С 33 4- С34 С35 х Оз —* + а4 С4, С42 С43 С44 С45 С46 а4 4s С51 С52 С53 С54 С55 С56 «5 + Заявки Ь) bi ь2 Ьз Ь4 Ь6 ГарГй) i=i j=i 1 92
Нетрудно убедиться, что каждый цикл имеет четное число вершин и, значит, четное число звеньев (стрелок). Условимся отмечать знаком «+» те вершины цикла, в которых пе- ревозки увеличиваются, а знаком «—» — те вершины, в которых они уменьшаются. Цикл с отмеченными вершинами будем называть «означенным». В табл 11.2 показано два означенных цикла: первый Щ с четырьмя вершинами (1,1), (1,2), (3,2) и (3,1) и второй Цг с восемью вершинами (3, 4), (3,6), (5, 6), (5,3), (2,3), (2,5), (4,5) и (4,4). Перенести («перебросить») какое-то количество единиц гру- за по означенному циклу — это значит увеличить перевозки, стоящие в положительных вершинах цикла, на это количество единиц, а пере- возки, стоящие в отрицательных вершинах — уменьшить на то же ко- личество. Очевидно, при переносе любого числа единиц по циклу рав- новесие между запасами и заявками не меняется: по-прежнему сумма перевозок в каждой строке равна запасам этой строки, а сумма пере- возок в каждом столбце — заявке этого столбца. Таким образом, при любом циклическом переносе, оставляющем перевозки неотрицатель- ными, допустимый план остается допустимым. Стоимость же плана при этом может меняться — увеличиваться или уменьшаться. Назовем ценой цикла увеличение стоимости перевозок при перемещении одной единицы груза по означенному циклу. Очевидно, цена цикла равна алгебраической сумме стоимостей, стоящих в вер- шинах цикла, причем стоимости, стоящие в положительных вершинах, берутся со знаком «+», а в отрицательных — со знаком «—». Напри- мер, для цикла Цх в табл. 11.2 цена равна: С11 С12 + С32 С31 > а для цикла Ц2 С34 С3в +С5в С53~ЬС23 С25 4* С45 С44’ Обозначим цену цикла Ц через у. При перемещении одной едини- цы груза по циклу Ц стоимость перевозок увеличивается на величину у; при перемещении по нему k единиц груза стоимость перевозок уве- личивается на ky. Очевидно, для улучшения плана имеет смысл перемещать пере- возки только по тем циклам, цена которых отрицательна. Каждый раз, когда нам удастся совершить такое перемещение, стоимость плана уменьшается на соответствующую величину ky. Так как перевозки не могут быть отрицательными, мы будем поль- зоваться только такими циклами, отрицательные вершины которых лежат в базисных клетках таблицы, где стоят положительные пере- возки*). Если циклов с отрицательной ценой в таблице больше не оста- лось, это означает, что дальнейшее улучшение плана невозможно, т. е. оптимальный план достигнут. *) В случае вырождения, как мы увидим далее, может оказаться полезным фик- тивный перенос по циклу, отрицательная вершина которого лежит в клетке с нулевой перевозкой. 93
Метод последовательного улучшения плана перевозок и состоит в том, что в таблице отыскиваются циклы с отрицательной ценой, по ним перемещаются перевозки, и план улучшается до тех пор, пока циклов с отрицательной ценой уже не останется. При улучшении плана циклическими переносами, как правило, пользуются приемом, заимствованным из симплекс-метода: при каж- дом шаге (цикле) заменяют одну свободную переменную на базисную, т. е. заполняют одну свободную клетку и взамен того освобождают одну из базисных клеток. При этом общее число базисных клеток остается неизменным и равным т 4- п — 1. Этот прием удобен тем, что для не- го легче находить подходящие циклы. Можно доказать, что для любой свободной клетки транспортной таблицы всегда существует цикл (и притом единственный), одна из вершин которого лежит в этой свободной клетке, а все остальные — в базисных клетках. Если цена такого цикла, с плюсом в свободной клетке, отрицательна, то план можно улучшить перемещением пере- возок по данному циклу. Количество единиц груза k, которое можно переместить, определяется минимальным значением перевозок, стоя- щих в отрицательных вершинах цикла (если переместить большее чис- ло единиц груза, возникнут отрицательные перевозки). Пример 1. Найти оптимальный план для транспортной задачи, приведен- ной в табл. 11.3. Таблица 11.3 \пн по\ в, В2 в3 в4 Запасы а, а, ю 7 6 8 31 Л2 5 6 5 4 4'8 Аз 8 7 6 7 38 Заявки Ь1 22 34 41 20 117 Решение. Составляем опорный план способом северо-западного угла (табл. 11.4). Стоимость этого плана равна: Щ = 22-10 4- 9-7 4- 25-6 4- 23-5 4- 18-6 4- 20-7 = 796. Число базисных переменных, как и полагается в невырожденном случае, равно г = т + п — 1 = 34*4 — 1 = 6. Попробуем улучшить план, заняв свободную клетку (2,4) с минимальной стоимостью 4. Цикл, соответствующий этой клетке, показан в табл. 11.4. Цена этого цикла равна у = 4 — 74-6 — 5 = —2. По этому циклу мы можем переместить максимум 20 единиц груза (чтобы не получить в клетке (3,4) отрицательной перевозки) Новый, улучшенный план показан в табл 11.5 94
Таблица if. б \пн пох в. в2 В3 в4 Запасы °. а. 10 22 7 9 6 8 31 а2 5 6 25 5 23Г- 4 48 Аз 8 7 6 18 b 7 —‘20 38 Заявки 61 22 34 41 20 117 Таблица ft. 5 \пн пох в, в2 В3 В4 Запасы а, А< 22 10 7 9 6 8 31 а2 5 6 5 4 20 — 25 3 48 А3 8 7 38 6 7 38 Заявки 22 34 41 20 117 Таблица 11.6 в. в2 В3 В4 Запасы А. ю 7 31 6 8 31 а2 5 22 6 3 5 3 4 20 48 4з 8 7 6 38 7 38 Заявки Ь> 22 34 41 20 117 95
Таблица 11.7 \пн по\ В2 в3 Запасы ai л ю 5 4 40 д2 6 4 5 23 Аз 7 3 8 20 Заявки bJ 20 20 43 83 Таблица 11.8 \пн по\ В\ В2 В3 Запасы а. А, 10 20 20 5 4 4 е 40 + е а2 6 4 б 23 23 ^з 7 3 6 120-е 20-е — Заявки 20 20 43 83 Таблица 11.9 \пн по\ в. В2 В3 Запасы °! А1 20 10 б е + 4 20 40 + £ а2 6 4 5 23 23 А3 7 3 20-е 6 20-е Заявки Ь> 20 20 43 83 96
Стоимость этого плана = 796 + 20-(—2) = 756. В нем по-прежнему шесть базисных клеток. Для дальнейшего улучшения плана обратим внимание на свободную клет- ку (2,1)со стоимостью 5. Цикл, соответствующий этой клетке, показан в табл. 11.5; цена его 7—6+5 — 10= —4 По этому циклу переместим 22 единицы груза, чем уменьшим стоимость перевозок до L3= 756 + 22 •(—4) = 668 (см. табл. 11.6). Попробуем дальше улучшить этот план, подсчитывая цены циклов, начи- нающихся положительной вершиной в свободной клетке. Просматриваем имею- щиеся свободные клетки табл. 11.6 и определяем цену цикла для каждой из них. Все эти цены (предоставляем читателю проверить это) или положительные, или нулевые, следовательно, никакое циклическое перенесение перевозок не может улучшить план перевозок. Таким образом, план, данный в табл. 11.6, является оптимальным. Примененный выше метод отыскания оптимального решения транспортной задачи называется распределительным; он состоит в непосредственном отыскании свободных клеток с отрица- тельной ценой цикла и в перенесении перевозок по этому циклу. Пример 2. Найти оптимальный план перевозок для ТЗ, условия которой приведены в табл. 11.7. Решение. Строим опорный план способом северо-западного угла; он полу- чается вырожденным. Чтобы избежать этого, нарушаем баланс запасов и заявок на е в первой и третьей строках, не нарушая общего баланса (сумма запасов равна сумме заявок). После этого строим опорный план также способом северо-запад- ного угла (табл. 11.8), в нем ровно столько базисных переменных, сколько нуж- но: пять. Улучшаем план перевозок переносом 20 — е единиц груза по циклу, показанному в табл. 11.8; получим новый, лучший план (см. табл. 11.9). План, приведенный в табл. 10.9, еще не оптимален, так как цикл с началом в свободной клетке (2,1) имеет отрицательную цену: у == 6 — 5 + 4 — 10 = —5. Перемещаем по этому циклу 20 единиц груза; получим табл. 11.10. Цена цикла, начинающегося в клетке (2,2) табл. 11.10, также отрицательна: 4 — 5+4 — 5 = —-2. Однако, по этому циклу можно перенести только пере- возку, равную 8. Тем не менее, сделаем это и получим новый план (см.табл. 11.11). В табл. 11.11 все циклы, соответствующие свободным клеткам, имеют не- отрицательную цену, поэтому план, приведенный в табл. 11.11, является опти- мальным. Полагая в нем 8 = 0, получим окончательный оптимальный план (табл 11.12) с минимальной стоимостью перевозок Lmln=40.4 + 20-6 + 3-5 + 20-3= 355. Заметим, что примененный здесь метод «ликвидации вырождения» путем е-изменения запасов не совсем удобен, так как требует допол- нительных действий с 8-измененными данными. Проще было бы при заполнении табл. 10.8 не изменять запасы, а «вообразить» их себе из- мененными и вместо 8 поставить в базисной клетке (3,3) просто нуль. Базисная клетка с нулевой перевозкой тем будет отличаться от сво- бодной, что в ней нуль проставлен, а в свободной — нет. Дальнейшие манипуляции с транспортной таблицей будут совершенно такими же, как если бы в базисных клетках стояли только положительные пере- возки, с той лишь разницей, что когда одна из отрицательных вершин цикла окажется в базисной клетке с нулевой перевозкой, нужно пере- носить по этому циклу нулевую перевозку (фиктивный перенос). Если в транспортной таблице немного (одна-две) базисных переменных об- ращаются в нуль, можно рекомендовать этот простой метод вместо 4 Зак. 573 97
Таблица 11. 1О пн ПО\ в, в2 В3 Запасы °. А, 10 £ 5 + 4 (40 40 + £ 6 20 4 5 23 а2 4- 3 А3 7 3 20-£ 6 20-е Заявки bj 20 20 43 83 Габлица 11.11 \ ПН по\ В. В2 в3 Запасы «1 А, 10 3 4 40 + £ 40 + £ а2 6 20 4 £ 5 3-£ 23 А3 7 3 20-е 6 20-£ Заявки 20 20 43 83 Таблица 11.1 Z \ПН по\ в, в2 В3 Запасы а. ' а. 10 5 4 40 40 А3 6 20 4 5 3 23 А3 7 3 20 6 20 Заявки 20 20 43 83 98
е-изменений запасов (заявок). Рекомендуем читателю самостоятельно решить пример 2 таким упрощенным способом. Следует иметь в виду, что при большом количестве базисных переменных, обращающихся в нуль, упрощенный метод становится менее удобным, так как легко запутаться с расстановкой по таблице нулевых базисных перевозок (т. е. ошибочно проставить базисные клетки там, где они находиться не могут). 12. РЕШЕНИЕ ТРАНСПОРТНОЙ ЗАДАЧИ МЕТОДОМ ПОТЕНЦИАЛОВ Распределительный метод решения ТЗ, с которым мы познакоми- лись в предыдущем параграфе, обладает одним недостатком: нужно отыскивать циклы для всех свободных клеток и находить их цены. От этой трудоемкой работы нас избавляет специальный метод решения ТЗ, который называется методом потенциалов. Этот метод позволяет автоматически выделять циклы с отрицательной ценой и оп- ределять их цены. Пусть имеется транспортная задача с балансовыми условиями 2 xtJ = at (i=l......m); ^хи = Ь} (/ = 1.........п), (12.1) /=i i=i причем т п 2 = 2 bj. 1 = 1 j-1 Стоимость перевозки единицы груза из At в Bj равна cfj; таблица стоимостей (сц) задана. Требуется найти план перевозок (xtj), который удовлетворял бы балансовым условиям(12.1), и при этом стоимость всех перевозок была минимальна: £=2 2 cf/xo = min. (12.2) t=i i=i Идея метода потенциалов для решения ТЗ сводится к следующе- му. Представим себе, что каждый из пунктов отправления А( вносит за перевозку единицы груза (все равно, куда) какую-то сумму аг; в свою очередь, каждый из пунктов назначения В; также вносит за перевозку единицы груза (куда угодно) сумму Ру; эти платежи передаются не- которому третьему лицу («перевозчику»). Обозначим (t = l, .... т; /=!,...,«) (12.3) и будем называть величину ctj «псевдостоимостью» перевозки единицы груза из Aj в Bj. 4* 99
Заметим, что платежи ctt, не обязательно должны быть Положи- тельными: не исключено, что «перевозчик» сам платит тому или дру- гому пункту какую-то премию за перевозку. Обозначим для краткости всю совокупность платежей а1( .... ат, Рь ..., через (аг, Р;). Не уточняя пока вопроса, из каких соображе- ний назначаются эти платежи, докажем прежде всего одно общее по- ложение или «теорему о платежах». Она состоит в следующем. Для заданной совокупности платежей (ait PJ суммарная псевдо- стоимость перевозок т п £=2 2 > = i /=i при любом допустимом плане перевозок (xi}) сохраняет одно и то же значение L — C — const. (12.4) В этой формуле величина С зависит только от совокупности пла- тежей (ah Pj), но н е зависит от того, каким именно допустимым планом (xtj) мы пользуемся. Докажем это положение. Имеем: т п т п А = 2 2 Сц Хц — 2 2 (а1 + РЛ хи — i=l /=1 Z=1 /=1 т п т п = 2 2 “г хи + 2 2 ?Чха- (12.5) 1=1 /=1 /=1 1=1 Преобразуем первую из двойных сумм в выражении (12.5). Выне- сем at из-под знака суммы по /: т п т п 2 2 хи = 2 «г 2 Хц- z=i / = 1 <=1 /=1 Но план (хг,) является допустимым, значит, для него выполняется балансовое условие: п 2 xii=^i> <=1 откуда т п т 2 агаг. (12.6) /=1 /=1 z=i Аналогичным образом преобразуем второе слагаемое в (12.5): т п пт 2 2 Pj Хц = 2 2 Р; Хц = i=l i=\ /=1 (= I пт п = 2 Р/ 2 XU= 2 Р;&;. (12.7) /=1 /=1 /=1 100
Подставляя (12.6) и (12.7) в (12.5), получим: т п >п п L— 2 cij xij = ai ai + (12.8) <=i /=i ;=i /=| В формуле (12.8) правая часть не зависит от плана перевозок (хгу), а зависит только от запасов (аг), заявок (bj) и платежей (af, Ру). Таким образом, мы доказали, что суммарная псевдостоимость лю- бого допустимого плана перевозок при заданных платежах (аг, Ру) о д- на и та же и от плана к плану не меняется. До сих пор мы никак не связывали платежи (аг, Ру) и псевдостои- мости сгу =а, + Ру с истинными стоимостями перевозок сгу. Теперь мы установим между ними связь. Предположим, что план (х,у) невырожденный (число базисных клеток в таблице перевозок равно т + п — 1). Для всех этих клеток х^ > 0. Определим платежи (аг, Ру) так, чтобы во всех базисных клет- ках псевдостоимости были равны стоимостям: О/ = аг + Ру = сгу при хгу> 0; что касается свободных клеток (где хц = 0), то в них соотношение между псевдостоимостями и стоимостями может быть какое угодно: си-, сц<си или cl}>ctJ при xl7=0. Оказывается соотношение между псевдостоимостями и стоимостя- ми в свободных клетках показывает, является ли план оптимальным, или же он может быть улучшен. Докажем следующую теорему. Теорема. Если для всех базисных клеток, плана (хгу>0) + = с2у = Сц, а для всех свободных клеток (х;у = 0) ai +Р/= Cii < cib то план является оптимальным и никакими способами улучшен быть не может. Доказательство. Обозначим (хгу)— план с соответствующей ему системой платежей (аг, Ру), обладающий указанным выше свойством (для всех базисных клеток псевдостоимости равны стоимостям, а для свободных — не превосходят их). Определим стоимость этого плана: т п 2 2 сах1}. (12.9) !=1 7=1 В сумме (12.9) отличны от нуля только слагаемые, соответству- щие базисным клеткам, в них стоимости равны псевдостоимостям. По- этому т п 1=2 2оуХо. (12.10) I — 1 / = 1 101
На основании ранее доказанного, эта сумма (при данной системе платежей) равна некоторой константе С (см. (12.4)): т п Ь= 2 (12.11) (=1 ,= 1 Теперь попробуем изменить план (xj7), заменив его каким-то другим планом (х/>). Обозначим стоимость нового плана т п £'=2 ЪсцХЧ, (12.12) Z= 1 /—1 где xi, — новые перевозки, отличные от нуля, вообще говоря, в дру- гих клетках, чем х;7. Некоторые из этих клеток совпадают с прежни- ми — базисными для плана (хо), а другие — со свободными для пла- на (xi}). В первых — стоимости ctj по-прежнему равны псевдостои- мостям, а во вторых — не меньше их: си си- Поэтому сумма (12.12) не может быть меньше, чем сумма (12.11) (она же 12.9): т п т п т п L' = 2 2 2 2 ~а/х'ц = 2 2 ~сцхц=С=Ь. (12.13) 1=1 /=1 /=1 , = 1 ;=1 /=1 Мы видим, что никаким изменением плана (хц) его стоимость не может быть уменьшена; значит, план (xi7) является оптимальным и теорема доказана. Нетрудно показать, что эта теорема справедлива также для вы- рожденного плана, в котором некоторые из базисных переменных рав- ны нулю. Действительно, то, что в базисных клетках перевозки строго положительны, для доказательства несущественно: достаточ- но, чтобы они были неотрицательными. Таким образом, доказано, что признаком оптимальности плана (хц) является выполнение двух условий: си = сц для всех базисных клеток; (12.14а) СИ^-СИ для всех свободных клеток. (12.146) План, обладающий таким свойством, называется потенциаль- ным, а соответствующие ему платежи (аг, (37) — потенциала- ми пунктов Аг, В} (i = l, т\ j=l, ..., п). Пользуясь этой терминологией, доказанную выше теорему можно сформулировать так: Всякий потенциальный план является оптимальным. Итак, для решения транспортной задачи нам нужно одно — по- строить потенциальный план. Оказывается, его можно построить мето- дом последовательных приближений, задаваясь сначала какой-то про- извольной системой платежей, удовлетворяющей условию (12.14 а). При этом в каждой базисной клетке получается сумма платежей, рав- 102 *
ная стоимости перевозок в данной клетке; затем, улучшая план, сле- дует одновременно менять систему платежей так, что они приближают- ся к потенциалам. При улучшении плана нам помогает следующее свойство плате- жей и псевдостоимостей: Какова бы ни была система платежей (аг, Р;), удовлетворяющая условию (12.14 a), для каждой свободной клетки цена цикла пере- счета равна разности между стоимостью сц и псевдостоимостью ci} в данной клетке; (12.15) Таблица 12.1 Хпн поХ В\ В2 В3 в4 В, В6 А» с„ с |2 С 1з С |4 С15 С16 С 21 С 22 С23 С24 С25 с 26 С31 С 32 С33 С34 С35 С зе — Д4 с4, С42 С43 С44 С45 ’-'46 а5 С51 С52 С53 С54 С 55 С56 Действительно, рассмотрим какую-то транспортную таблицу, например т = 5, п = 6 (табл. 12.1). Не будем проставлять в этой таблице ни запасов, ни заявок, ни перевозок (они не будут нам нужны), просто отметим (обведем жир- ной линией) базисные клетки. Возьмем любую свободную клетку, например (1.5), и построим соответствующий ей цикл пересчета, положительная вершина которого лежит в этой свободной клетке, а все остальные — в базисных. Опре- делим цену этого цикла. Она равна 715 =^15 4)5 4" 4)3 ^23 "Ь ^22 4.2- Но для всех базисных клеток стоимости равны псевдостоимостям, поэтому Yu = с1з — (а3 4 Рз) + (“з + РЛ) - (а2 + Ря) 44<*2 4- Р2) — -- (а| 4- Рг) = С15 (а1 4" Рз) = С13-С15> 103
т. е. цена цикла, начинающегося в свободной клетке (1, 5) равна раз- ности стоимости с15 и псевдостоимости с18 в этой клетке. Очевидно, то же будет справедливо и для любой свободной клетки. Таким образом, при пользовании методом потенциалов для реше- ния ТЗ отпадает наиболее трудоемкий элемент распределительного метода: поиски циклов с отрицательной ценой. Процедура построения потенциального (оптимального) плана состоит в следующем. В качестве первого приближения к оптимальному плану берется любой допустимый план (хотя бы построенный способом северо-за- падного угла). В этом плане т + п — 1 базисных клеток, где т — число строк, п — число столбцов транспортной таблицы. Для этого плана можно определить платежи (а{-, Р;), так, чтобы в каждой базис- ной клетке выполнялось условие: аг + Р;=сг7. (12.16) Уравнений (12.16) всего т + п — 1, а число неизвестных равно т + п. Следовательно, одну из этих неизвестных можно задать произвольно (например, равной нулю). После этого из т + п — 1 уравнений (12.16) можно найти остальные платежи ait (Зу, а по ним вычислить псевдостоимости: С,;=аг+ 0; для каждой свободной клетки. Если оказалось, что все эти псевдостои- мости не превосходят стоимостей ~сц<са, (12.17) то план потенциален и, значит, оптимален. Если же хотя бы в одной свободной клетке псевдостоимость больше стоимости си>си> то план не является оптимальным и может быть улучшен переносом перевозок по циклу, соответствующему данной свободной клетке. Цена этого цикла равна разности между стоимостью и псевдостоимостью в этой свободной клетке. Итак, мы приходим к следующему правилу (алгоритму) решения транспортной задачи методом потенциалов. 1. Взять любой опорный план перевозок, в котором отмечены т + п — 1 базисных клеток (остальные клетки — свободные). 2. Определить для этого плана платежи (аг, [Ц) исходя из усло- вия, чтобы в любой базисной клетке псевдостоимости были равны стои- мостям: аг + р; = сг7. (12.18) Один из платежей можно назначить произвольно, например, положить равным нулю. 1(Ц
3. Подсчитать псевдостоимости — аг + рг для всех свободных клеток. Если окажется, что все они не превышают стоимостей, то план оптимален. 4. Если бы хотя в одной свободной клетке псевдостоимость пре- вышает стоимость, следует приступить к улучшению плана путем пе- реброски перевозок по циклу, соответствующему любой свободной клетке с отрицательной ценой (для которой псевдостоимость больше стоимости). 5. После этого заново подсчитываются платежи и псевдостоимос- ти, и, если план все еще не оптимален, процедура улучшения продол- жается до тех пор, пока не будет найден оптимальный план. Таблица /2.2 \пн по\ 5, В2 В3 в4 в5 Запасы 01 А, 10 17 8 8 9 6 5 25 А-2 5 6 13 4 19 3 8 32 9 7 5 22 4 14 3 4 40 14 10 8 8 8 20 20 Заявни 17 21 41 14 24 117 Понятиям «платежей» и и «псевдостоимостей» можно дать нагляд- ную экономическую интерпретацию. Представим себе, что (аг, |jj7)—реальные платежи, которые пункты А( и Bj платят за перевозку единицы груза какому-то третьему лицу («перевозчику»). Не будем противопоставлять интересов А и В — пусть они действуют как единая экономическая система. Перевозка единицы груза из пункта At в пункт Bj объективно стоит с,у, а стороны А и В вместе платят за эту перевозку «перевозчику» сумму Сц = аг + Р;. Оптимальным будет такой план перевозок, при котором пункты Аг, Bj не переплачивают «перевозчику» ничего сверх объективной стои- мости перевозок, т. е. такой план, любое отступление от которого невыгодно для компании А, В — оно заставит их платить за перевоз- ки больше, чем если бы они возили грузы сами. Продемонстрируем применение метода потенциалов для решения ТЗ на конкретном примере. Пример 1. Решить методом потенциалов ТЗ, заданную в табл. 12.2, где проставлен первый опорный план, составленный по способу северо-западного угла. 105
Решение. Приписываем к табл 12 2 снизу добавочную строку для платежей Ру, справа — добавочный столбец для платежей а, (см табл. 12.3) Псевдостои- мости с;; = а; + Ру записываем в левом верхнем углу каждой клетки, а стои- мости — в правом верхнем углу. Один из платежей, например alt выбираем про- извольно, полагая, скажем, ах==0 Для каждой базисной клетки псевдостоимость ci} = at + Ру должна быть равна стоимости с;у. Полагая а1 = 0, находим из условия сц + Pi = 10; 0 + Pi = 10; Рг = 10, а из условия а1 + р2 = 0 + Р2 = 8; р2 = 8 Таблица 12.3 \пн по\ в2 в3 в4 в5 Запасы ai Платежи а1 ^1 10 17 10 8 8 8 + 6 9 5 6 4 5 25 0 а2 8 + 5 6 6 13 4 4 19 3 3 2 8 32 -2 9 9 7 7 5 5 22 4 4 14 3 3 4 40 -1 А4 14 14 12 10 10 8 9 8 8 8 20 20 4 Заявки Й1 17 21 41 14 24 117 Платежи h 10 8 6 5 4 Продолжая эту процедуру, находим: а2 + Р2 = а2+8=6, а2=— 2) —2 + Рз=4; Рз=6; а3-|-6 = 5; а3=—lj —-1+Р« = 4; р4 = 55 ^1+рБ=3; р6 = 4) а4-|-4 = 8; а4=4. Так как не все псевдостоимости в свободных клетках табл. 12.3 удовлет- воряют условию (12.17), план, приведенный в табл. 12.3, ие является оптималь- ным Попробуем улучшить его, переводя в базисные одну из свободных клеток, для которых ctj> Cij, например, клетку (2, 1) Строим соответствующий этой клетке цикл (показан в табл. 12.3). Цена этого цикла 5 — 8 = —3. Перенесем по этому циклу 13 единиц груза (больше нельзя, чтобы перевозки в клетке (2,2) не стали отрицательными), уменьшим стоимость плана на 13-3 = 39 и перейдем к табл. 12.4. Вычисляем для плана табл. 12.4 новые значения платежей, по-прежнему полагая сц = 0. Видим, что в табл. 12.4 все еще есть свободные клетки, для кото- рых 7гу>сгу, например (1, 4). Цикл для этой клетки показан в табл 12.4. Пере- нос четырех единиц по этому циклу приводит к плану, представленному (со свои- 106
Таблица 12.4 \по пн\ В, S2 S3 в4 S5 Запасы а. Платежи «1 А, 10 ю 4 8 8 21 9 9 8 6 7 5 25 0 + Аг 5 5 13 з 6 4 4 19 3 3 2 8 32 -5 Аз 6 8 4 7 в 5 22Ц 4 4 14 3 3 4 40 -4 А4 11 14 9 10 10 8 9 8 8 8 20 20 1 Заявим 61 17 21 41 14 24 117 Платежи Pi 10 8 9 8 7 Таблица <2.5 \пн по\ В| s2 S3 s4 S5 Запасы а1 Платежи “i А, 8 10 8 8 21 7 9 8 6 4 5 5 25 0 а2 5 5 17 5 6 4 4 15 3 3 2 8 32 -3 A3 6 9 6 7 5 5 26 4 4 10 3 3 4 40 -2 + а4 11 14 11 10 10 18 9 8 8 8 20 20 3 — Заявим 6J 17 21 41 14 24 117 Платежи Pi 8 8 7 6 5 Таблица I2.&t \|ПН по\ в. s2 83 s4 s5 Запасы Платежи «1 а, 8 10 8 В 21 7 9 6 6 4 5 5 25 О дг 5 5 17 5 6 4 4 15 3 3 2 8 32 -з A3 6 9 6 7 5 5 6 4 4 ю 3 3 24 40 -2 а4 9 14 9 Ю 8 9 20 7 9 6 9 20 1 Заявки Й1 17 21 41 14 24 1 17 Платежи Р, 8 8 7 6 5 107
Таблица 72t9 'Х<Г1Н по\ в, В2 Дз Запасы °! А, 6 4 2 20 а2 9 5 4 25 ^3 3 6 3 30 Заявки »> 20 25 30 75 Таблица 12.8 \ПН по\ В\ В2 В3 Запасы а. Платежи «1 А, 6 20 6 4 4 4 £ 3 2 20+г 0 д2 7 3 5 _ 5 4 + 4 25 + г 1 25—£ -"2г лз 6 , 3 4 6 3 3 ЗО-2г 0 ЗО-2г Заявки 20 25 30 75 Платежи 6 4 3 Таблица 12.9 \пн по\ Вг в2 Bs Запасы °! Платежи ai 4] 3 6 4 4 20+г 3 2 20+е 0 — + а2 4 3 6 + 5 4 4 25 + г 1 5-е 2О + 2г 4з 3 3 20 4 6 3 3 10-2г 30-2г 0 Заявки Ь1 20 25 30 75 Платежи 3 4 3 108
Таблица 10 '\ПН по\ в, в2 в3 Запасы а, Платежи «> а. 2 6 3 4 2 2 20+е 20+е 0 д2 4 3 5 5 25 4 4 £ 25 + е 2 4- Аз 3 _ 3 4 6 3 :+ 3 ЗО-2е 1 20 10-2е Заявки Ь> 20 25 30 75 Платежи Pi 2 3 2 Таблица 12.11 \пн ПО\ в, В2 в3 Запасы Платежи ai А] 2 6 4 4 2 2 20+е 20+е 0 а2 3 3 £ 5 5 25 3 4 25 + е 1 Аз 3 3 20-е 5 6 3 3 10—Е 30-2е 1 Заявки Ь> 20 25 30 75 Платежи > j 2 4 2 Таблица 12.12 \пн по\ в. в2 в3 Запасы ai Aj 6 4 2 20 20 а2 3 5 25 4 25 Аз 3 20 6 3 10 30 Заявки 20 25 30 75 109
ми платежами и псевдостоимостями) в табл. 12.5. Этот план все еще не оптималь- ный. Перенося по циклу, соответствующему свободной клетке (4, 3),/20 единиц груза, получаем новый план (табл 12.6) с новыми платежами и псевдостоимо- стями. В табл. 12.6 уже все псевдостоимости не превосходят соответствующих стои- мостей, значит, этот план оптимален Потенциалы пунктов найдены и рав- ны соответственно: cq =0; а2 = —3; а3 = —2; а4 = 1; ₽! = 8; ₽2 = 8; р3 = 7; р4 = 6; ₽5 = 5. При анализе этих значений нельзя забывать, что одно из них (в на- шем случае о^) назначено произвольно (а4 = 0), поэтому потенциалы (или равновесные платежи) пунктов достаточно условны. Важно, что их сумма для всех перевозок, отличных от нуля, равна сумме стоимос- тей, проставленных в соответствующих клетках. Если смотреть на эти платежи не с точки зрения каждого пункта в отдельности, а с точки зрения всей «компании» пунктов (Л, В), то безразлично, какой из пунктов платит больше, а какой — меньше. Следующий пример будет посвящен вырожденному случаю. Пример 2. Решить методом потенциалов ТЗ, условия которой даны в табл. 12.7. Решение. Применяя способ северо-западного угла, получаем вырожден- ный план. Вводя е-изменения запасов, получаем опорный план с пятью базисны- ми клетками. Подсчитывая платежи (табл. 12.8), видим, что план не оптимален. Улучшаем его циклическим переносом перевозок, и т. д. Процедура улучшения плана показана в табл. 12.8, 12.9, 12.10. 12.11; план, приведенный в последней таблице, оптимален. Полагая в нем е=0, получаем окончательный оптимальный план (табл. 12.12) со стоимостью Lmln = 20-2 + 25.5 = 20-3+10-3 = 255. Заметим, что эта стоимость такая же, как стоимость плана, показанного в табл. 12.10 при е= 0; это и естественно, так как табл. 12.11 получена из табл. 12.10 переносом по циклу фиктивных е-перевозок; этот перенос не меняет стоимости плана, а нужен только для того, чтобы убедиться, что план оп- тимален. 13. ТРАНСПОРТНАЯ ЗАДАЧА С НЕПРАВИЛЬНЫМ БАЛАНСОМ До сих пор мы рассматривали только такую задачу о перевозках, в которой сумма запасов равна сумме заявок: т п Ъ( = 2 Ь}. (13.1) <= 1 /= ! Это — классическая транспортная задача, иначе называемая «транспортной задачей с правильным балансом». Встречаются такие варианты ТЗ, где условие (13.1) нарушено. В этих услучаях говорят о ТЗ с неправильным балан- сом. Баланс ТЗ может нарушаться в двух направлениях: 119
1. Сумма запасов в пунктах отправления превышает сумму подан- ных заявок: т п 5 ai > S i=l 1=1 2. Сумма поданных заявок превышает наличные запасы: п т i bj> i at. /« 1 Z = 1 Условимся первый случай называть «ТЗ с избытком запасов», а второй — «ТЗ с избытком заявок». Рассмотрим последовательно эти два случая. /. ТЗ с избытком запасов В пунктах Л1( Аг....Ат имеются запасы груза аь а2, ..., ат; пункты Ви В2, Вп подали заявки Ьь Ь2, Ьп, причем т п 2 ai > X bj. Требуется найти такой план перевозок (хц), при котором все заявки будут выполнены, а общая стоимость перевозок минимальна; S J cMxu = min. Очевидно, При этой постановке задачи некоторые условия-равенст- ва ТЗ превращаются в условия-неравенства, а некоторые — остаются равенствами: п /=i т S xu~bj 1 (i = 1, .... tn), (/ = 1........n). (13.2) Мы умеем решать задачу линейного программирования, в какой бы форме — равенств или неравенств — ни были заданы ее условия. Поставленная задача может быть решена, например, обычным симп- лекс-методом. Однако, задачу можно решить проще, если искусствен- ным приемом свести ее к ранее рассмотренной ТЗ с правильным балансом. Для этого, сверх имеющихся п пунктов назначения Въ В2, .... Вп, введем еще один, фиктивный, пункт назначения Вф, которому припишем фиктивную заявку, равную избытку запасов над заявками: tn п Ь$ — Г at — S bj 1=1 /=1 (13.3) 111
и положим стоимости перевозок из всех ПО в фиктивный ПН/ Вф рав- ными нулю: Оф = ° (i = l, tn). Таким образом, отправление какого-то количества груза хгф из пункта At в пункт Вф попросту будет означать, что в пункте Аг- оста- лись неотправленными хгф единиц груза. Введением фиктивного ПН Вф с его заявкой Ьф мы сравняли ба- ланс ТЗ, и теперь ее можно решать как обычную ТЗ с правильным балансом. 2. ТЗ с избытком заявок В пунктах Аг, А3, .... Ат имеются запасы груза а1( ..., ат; пунк- п т ты Въ ..., Вп подали заявки Ьг, .... Ьп, причем S Ь< > S а;, т. е. /-1 /=1 имеющихся запасов недостаточно для удовлетворения всех заявок. Требуется составить такой план перевозок, при котором все запа- сы окажутся вывезенными, а стоимость перевозок — минимальной. Очевидно, эту задачу также можно свести к обычной ТЗ с правильным балансом, если ввести в рассмотрение фиктивный пункт отправления Аф с запасом аф, равным недостающему запасу: п tn Яф = Ъ bj — 2аг, /=1 /=1 и положить стоимости перевозок из ПО Аф в любой ПН равными нулю: сф;- = 0 (/=1, ..., п). При этом какая-то часть заявок хф; на каждом пункте останется неудовлетворенной; будем считать, что она как бы покрывается за счет фиктивного ПО Аф. Таким образом, мы свели ТЗ с избытком заявок к ТЗ с правиль- ным балансом. Заметим, что при этом мы вовсе не заботились о «спра- ведливости» удовлетворения заявок, не налагали никаких условий на то, какую долю своей заявки должен получить каждый ПН — нас ин- тересовали лишь расходы, которые нужно минимизировать. Если поставить задачу по-иному, например, потребовать, чтобы все ;ПН были удовлетворены в равной доле, задача снова сводится к ТЗ с правильным балансом. А именно, нужно поданные заявки «ис- т п править», умножив каждую из них на коэффициент k^a^b,, 1=1 7=1 после чего решать ТЗ с правильным балансом. Можно также поставить задачу о распределении грузов по пунктам назначения с учетом сравнительной важности каждого пункта. При этом доля заявки, которую получает каждый пункт, может быть не одинаковой, как в только что описанном способе, а различной. В этом случае задача также сводится к ТЗ с правильным балансом. 112
Таблица f3. t \пн по\ в, В2 в3 Запасы а\ л 5 7 6 50 д2 6 6 5 40 A3 8 4 б 20 Заявки *1 18 21 33 Таблица /3.2 \пн по\ в. В2 Вз Вф Запасы Платежи а( а, 5 5 18 7 7 21 6 6 11 - 1 0 + 50 0 а2 4 6 6 6 5 5 22 + 0 0 - 18 40 -1 Аз 4 8 6 4 5 5 0 0 20 20 -1 Заявки 18 21 33 38 110 Платежи 5 7 6 1 Таблица 63.3 \ПН по\ в, в2 В3 Вф Запасы Платежи «1 А, 5 5 18 7 21 7 5 6 0 0 11 50 0 А? 5 6 7 6 5 5 33 0 0 7 40 0 Аз 5 8 7 4 5 5 0 0 120 20 0 + — Заявки 18 21 33 38 110 Платежи 5 7 5 0
Таблиц^ /3. * пн по\ Bi в2 В3 вф Запасы ai Платежи а1 А, 5 5 18 7 1 7 5 6 0 0 31 50 0 — 4- Д2 5 6 7 6 5 5 33 0 0 7 ’ 40 0 — А3 2 8 4 4 20 2 5 -3 о 20 -3 Заявки 18 21 33 38 110 Платежи 5 7 5 0 Таблица /3.5 \ПН П0\ в. В2 в3 Вф Запасы а, Платежи а1 Л, 5 5 18 е 7 5 6 0 0 32 50 0 а2 5 6 в в 1 5 5 33 0 0 6 40 ' 0 А3 3 8 4 4 20 3 5 -2 0 20 -2 Заявки 1 18 21 33 38 110 Платежи _Л_1 5 ' 6 5 0 1 Пример. Решить ТЗ с избытком запасов, условия которой заданы в табл. 13.1. Решение. т п 2^ = 110} 26>=72> I = 1 / SB 1 114
разница между запасами и заявками равна 2 at— 2 bi~ 110—72 = 38. »= 1 |=i Введением фиктивного ПН5ф с заявкой Ьф = 38 сводим задачу к ТЗ с правильным балансом (см. табл. 13.2, 13.3, 13.4, 13.5). План, представленный в табл. 13.5, является оптимальным, так как во всех свободных клетках псевдостоимости не превосходят стоимостей. Согласно этому плану, из 50 единиц груза, имеющихся в пункте Alt не перевозятся 32, а осталь- ные 18 направляются в пункт Вх; из 40 единиц, имеющихся в пункте Д2> 6 не пе- ревозятся, 1 отправляется в пункт Вг и 33 — в пункт В3. Все 20 единиц, имею- щихся в пункте Л3, направляются в пункт В %. 14. РЕШЕНИЕ ТРАНСПОРТНОЙ ЗАДАЧИ ПО КРИТЕРИЮ ВРЕМЕНИ До сих пор критерием оптимальности решения ТЗ у нас была об- щая стоимость перевозок, и мы стремились эту стоимость минимизи- ровать. В большинстве случаев практики именно критерий стоимости яв- ляется главным, определяющим качество (эффективность) плана пере- возок. Однако в некоторых случаях иа первый план выдвигается не стоимость перевозок L, а время Т, в течение которого все перевозки бу- дут закончены. Так, например, бывает, когда речь идет о перевозках скоропортящихся продуктов или же о подвозе боеприпасов к месту боевых действий. Наилучшим планом перевозок (хц) будет считаться тот план, при котором время окончания всех перевозок минимально: T = min. (14.1) Такая транспортная задача, где оптимальным считается план с ми- нимальным временем Т, называется транспортной задачей по крите- рию времени. Задача ставится следующим образом. Имеется т пунктов отправ- ления Аъ ..., Ат с запасами ах.......ат -и п пунктов назначения В], ..., Вп с заявками Ь1г .... Ьп; сумма запасов равна сумме заявок: т п 2 «; = 2 bj. (14.2) /=i /=1 Заданы времена перевозок tiS из каждого ПО Аг в каждый ПН В у, предполагается, что они не зависят от количества перевозимого груза xtj, т. е. количество транспортных средств всегда достаточно для осуществления любого объема перевозок. Запасы а,, заявки bj и времена ttj приведены в табл. 14.1, построенной так же, как обычная транспортная таблица, с той разницей, что в правом верхнем углу каж- дой клетки вместо стоимостей стоят времена ti}. 115
Таблица №. 1 ХПИ по\ В, B2 • » • • • Bn Запасы «1 а, tn 112 • • * * . • tin а2 121 122 • • • • » t2n a2 е * * • • • • ♦ « • i • • ^т t ml *m2 • • « • » tmn Заявки 62 • • * • • b„ m n i=i j=i J Требуется выбрать перевозки (хц) таким образом, чтобы удовлет- ворялись балансовые условия п X хц=Щ 7=1 т 2 ха = Ь} t= 1 (* = 1.......т), (j= 1, .... п), (14.3) и, кроме того, обращалось в минимум время окончания всех пере- возок Т. Выразим время Т через времена ti} и перевозки xtj. Так как все перевозки заканчиваются в момент, когда кончается самая длительная из всех перевозок, то время Т есть максимальное из всех времен ttj, стоящих в ячейках, содержащих ненулевые перевозки. Запишем это в виде формулы: T = maxt<;, (14.4) > ° где знак Хц > 0 показывает, что берется максимальное не из всех ttj, а только из тех, для которых перевозки отличны от нуля. Мы хотим найти такой план перевозок для которого время Т обращается в минимум: 7 = max /j=min. (14.5) Поставленная задача не является задачей линей- ного программирования, так как величина Т — не ли- 116
нейная функция переменных xt). Эту задачу можно свести к решению задач линейного программирования, но не одной, а нескольких. Од- нако, мы не будем заниматься таким сведением, а продемонстрируем расчетный метод, позволяющий непосредственно найти оптимальное решение ТЗ по критерию времени преобразованием транспортной таб- лицы. Этот метод называется «методом запрещенных клеток». Проще всего будет пояснить его на примере. Пример. Условия ТЗ по критерию времени (запасы, заявки и времена перевозок) даны в табл. 14.2. Требуется найти план перевозок, укладывающийся в минимальное время, и указать это время. Решение. Начальный план перевозок можно было бы, как мы и де- лали раньше, составить способом северо-западного угла, но мы видим что при этом получится (за счет клетки (1,1)) очень большое время Т= 10. Попытаемся этого избежать, «запретив» себе ставить отличные от нуля перевозки в клетки (1,1) и (4,1), где стоят самые большие вре- мена в таблице (Zu = 10 и = 11). Перечеркнем в табл. 14.3 эти клет- ки и составим новый план перевозок так, чтобы в первую очередь за- нимать клетки с малыми временами. В плане (табл. 14.3) время окончания всех перевозок равно 8 — оно достигается в клетке (3, 2). Попробуем улучшить план, запретив себе Для дальнейшего использования все клетки, где время ti} 8, и перечеркнув эти клетки. Перенесем 14 единиц Груза по циклу, ука- занному в табл. 14.3; этим мы устраним перевозки со временем 8. По- лучится план, приведенный в табл. 14.4, со временем окончания Т = 7 (клетка (3, 3)). Чтобы еще улучшить этот план, нам нужно устранить перевозки из клетки (3, 3), запретив, кроме того, перенос в клетку (1, 5), со- держащую то же время. 7 из 13 единиц, стоящих в клетке (3, 3), устраняем переносом по циклу, показанному в табл. 14.4. Новый план приведен в табл. 14.5. Таблица гь.г \пн по\ В, В2 в3 в, В5 Запасы А-\ 10 8 5 6 7 25 а2 5 6 8 8 9 34 A3 4 8 7 8 5 42 А4 11 4 5 8 9 23 Заявки &1 21 37 40 11 15 124 П7
Таблица ff.3 \пн псХ. Bt в2 Вз в4 в8 Запасы 1, л Ч ioJ 5 25 6 7 25 д2 21 5 6 8 2 е И х х9 34 A3 + 4 8 14 7 13 5 15 42 А< 4 23 б X /8 X х9 23 Заявки 21 37 40 и 15 124 Таблица /4.4 \ПН поХ Bi В3 В4 В5 Запасы ai А, х^х X X8 5 25 6 х х7 25 а2 5 ’-г 6 14 6 2 е 11 \ X9 34 Аз 41 7 13 X /8 5 15 42 +*г — Ад X X 4 23 5 X /8 23 Заявки bi 21 37 40 11 15 124 Таблица fb 5 Хпн поХ В| В2 в3 в4 В, Запасы а, А| Х*х° X ,8 5 25 6 X х7 25 а2 5 6 21 6 2 6 11 X /9 34 Аз 4 21 X /8 7 6 5 15 42 а4 Х^\. 4 16 5 7 X ^8 X /9 23 Заявки &1 21 37 40 11 15 124 118
Попробуем избавиться от оставшихся 6 единиц в клетке (3,3) пу- тем их циклического переноса. Для этого испробуем все возможные переносы из этой клетки, начинающиеся горизонтально или верти- кально. Горизонтальный перенос в клетку (3,5) исключен, так как стол- бец 5 не содержит не запрещенных клеток. Горизонтальный перенос в клетку (3,1) также исключен, так как для этого пришлось бы умень- шить перевозки в клетке (2,1), что невозможно. Вертикальный перенос, как можно убедиться непосредственно, также не дает ни одного цикла, уменьшающего время перевозок. Из этого мы делаем заключение, что план перевозок, данный в табл. 14.5, оптимален, и минимальное время перевозок равно
3 ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ 1. ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Динамическое программирование (иначе, «динамическое планиро- вание») представляет собой особый математический метод оптимизации решений, специально приспособленный к многошаговым (или многоэтапным) операциям. Представим себе, что исследуемая операция О представляет собой процесс, развивающийся во времени и распадающийся на ряд «шагов» или «этапов». Некоторые операции расчленяются на шаги естественно: например, при планировании хозяйственной деятельности группы предприятий естественным шагом является хозяйственный год. В дру- гих операциях разделение на шаги приходится вводить искусственно; например, процесс вывода ракеты на космическую орбиту можно ус- ловно разбить на этапы, каждый из которых занимает какой-то вре- менной отрезок Д/. Процесс, о котором идет речь, является управляемым, т. е. на каждом шаге принимается какое-то решение, от которого зави- сит успех данного шага и операции в целом. Управление операцией складывается из ряда элементарных, «шаговых» управлений. Рассмотрим пример естественно-многошаговой операции О. Пусть планируется деятельность группы (системы) промышленных предприя- тий П1, П2, .... Пь на некоторый период времени Т, состоящий из m хозяйственных лет (рис. 3.1). В начале периода на развитие системы предприятий выделяются какие-то основные средства Ко, которые должны быть как-то распреде- лены между предприятиями. В процессе функционирования системы выделенные средства частично расходуются (амортизируются). Кроме того, каждое предприятие за год приносит некоторый доход, зависящий от вложенных средств. В начале каждого хозяйственного года имею- щиеся средства могут перераспределяться между предприятиями: каждому из них выделяется какая-то доля средств. Ставится вопрос: как нужно в начале каждого года распределять имеющиеся средства между предприятиями, чтобы суммарный доход от всей системы предприятий за весь период Т = т был максимальным? 1-й год Z-й год i-u год т-й год —I----1-----1----1----j----J----1-----1____1_ О 1 2 i-1 i m-i т=т t Рис. 3.1 120
Перед нами — типичная задаче динамического про граммирования. Рассматривается управляемый процесс — функционирование си стемы предприятий. Управление процессом состоит в распреде- лении (и перераспределении) средств. Шагом управления является выделение каких-то средств каждому из предприятий в начале хозяй- ственного года. Пусть в начале г-го года предприятиям Пь П2, ..., Пй выделяются соответственно средства: X-1) Х^ Х{к} Совокупность этих значений представляет собой не что иное, как управление на z-м шаге: [/(= (Х,(1>, Х}2>.X\k}). (1.1) Управление U операцией в целом представляет собой совокупность всех шаговых управлений: U=^U1,U2.....ит). (1-2) Управление может быть хорошим или плохим, эффективным или неэффективным. Эффективность управления U оценивается тем же показателем W, что и эффективность операции в целом. В нашем при- мере показатель эффективности (целевая функция) представляет собой суммарный доход от всей системы предприятий за т лет. Он зависит от управления операцией U, т. е. от всей совокупности шаговых управ- лений: Г = Г(1/) = Г([/1,С72..Um). - (1.3) Возникает вопрос: как выбрать шаговые управления Uy U2.Um для того, чтобы величина W обратилась в максимум? Поставленная задача называется задачей оптимизации управления, а управление, при котором показатель W дости- гает максимума, — оптимальным управлением. Будем обозначать оптимальное управление (в отличие от управления вообще U) буквой и. Оптимальное управление и многошаговым процессом состоит из совокупности оптимальных шаговых управлений: и = (и1, и2..ит). (1.4) Таким образом, перед нами стоит задача: определить оптимальное управление на каждом шаге U; (г = 1, 2, ..., т) и, значит, оптимальное управление всей операцией и. Заметим, что в нашем примере (управление финансированием си- стемы предприятий) показатель эффективности W представляет собой сумму доходов за все отдельные годы (шаги): т (1-5) /= । где Wj — доход от всей системы предприятий за г-й год. 1?1
Показатель, обладающий таким свойством, называется адди- тивным. Мы будем пока рассматривать только задачи с аддитив- ным показателем. Поставим задачу динамического программирования в общем виде. Пусть имеется операция О с аддитивным показателем эффективности (1.5), распадающаяся (естественно или искусственно) на т шагов. На каждом шаге применяется какое-то управление (7г. Требуется найти оптимальное управление « = («!, и2, ит), при котором показатель эффективности т w==SiWi обращается в максимум. Поставленную задачу можно решать по-разному: или искать сразу оптимальное управление и, или же строить его постепенно, шаг за ша- гом, на каждом этапе расчета оптимизируя только один шаг. Обычно второй способ оптимизации оказы- вается проще, чем первый, особенно при большом числе шагов. Такая идея постепенной, пошаговой оптимизации процесса и со- ставляет суть метода динамического программирования. С первого взгляда эта идея может показаться довольно тривиаль- ной. В самом деле, чего, казалось бы, проще: если трудно оптимизи- ровать операцию в целом, то разбить ее на ряд шагов; каждый такой шаг будет отдельной, маленькой операцией, оптимизировать которую уже нетрудно. Надо выбрать на каждом шаге такое управление, при котором эффективность этого шага максимальна. Не так ли? Оказывается, вовсе не так! Принцип динамического программи- рования отнюдь не предполагает, что каждый шаг оптимизируется отдельно, независимо от других; что, выбирая шаговое управление, можно забыть обо всех других шагах. Напротив, шаговое управление должно выбираться с учетом всех его последствий в будущем. Планирование должно быть дальновидным, с учетом перспективы. Что толку, если мы выберем на данном шаге управление, при котором эффективность этого шага максимальна, если в даль- нейшем это помешает нам получить хорошие результаты других шагов? Нет, выбирая управление на каждом шаге, надо делать это непремен- но «с оглядкой на будущее», иначе возможны серьезные ошибки. Рассмотрим пример: пусть планируется работа группы промыш- ленных предприятий, одни из которых заняты выпуском предметов по- требления, другие же производят для этого машины. Задачей является получение за т лет максимального объема выпуска предметов потреб- ления. Пусть планируются капиталовложения на первый год. Исходя из узких интересов данного шага (года), мы должны были бы все сред- ства вложить в производство предметов потребления, пустить имею- 1?2
щиеся машины на полную мощность и добиться к концу года макси- мального объема продукции. Но правильным ли будет такое решение с точки зрения операции в целом? Очевидно, нет. Имея в виду будущее, необходимо выделить какую-то долю средств и на производство машин. При этом объем продукции за первый год, естественно, снизится, зато будут созданы условия, позволяющие увеличивать ее производство в последующие годы. Таким образом, планируя многошаговую операцию, необходимо вы- бирать управление на каждом шаге с учетом его будущих последствий на еще предстоящих шагах. Однако из этого правила есть исключение. Среди всех шагов су- ществует один, который может планироваться попросту, без «оглядки на будущее». Какой это шаг? Очевидно, последний — после не- го других шагов нет. Этот шаг, единственный из всех, можно плани- ровать так, чтобы он как таковой принес наибольшую выгоду. Сплани- ровав оптимально этот последний шаг, можно к нему пристраивать предпоследний, к предпоследнему — пред-предпоследний и т. д. Поэтому процесс динамического программирования разворачи- вается от конца к началу: раньше всех планируется послед- ний, /п-й шаг. А как его спланировать, если мы не знаем, чем кончил- ся предпоследний? Очевидно, нужно сделать разные предположения о том, чем кончился пред- последний (т — 1)-й ш а г, и для каждого из них найти такое управление, при котором выигрыш (доход) на последнем шаге был бы максимален. Решив эту задачу, мы найдем условное опти- мальное управление на /n-м шаге, т. е. то управление, кото- рое надо применить, если (т — 1)-й шаг закончился определенным образом. Предположим, что эта процедура выполнена и для каждого исхода (т — 1)-го шага мы знаем условное оптимальное управление на т-м шаге и соответствующий ему условный оптимальный выигрыш. Теперь мы можем оптимизировать управление на предпоследнем, (т — 1)-м шаге. Сделаем все возможные предположения о том, чем кончился пред-предпоследний, (т — 2)-й шаг, и для каждого из этих предполо- жений найдем такое управление на (т — 1)-м шаге, чтобы выигрыш за последние два шага (из которых последний уже оптимизирован) был максимален. Далее оптимизируется управление на (т—2)-мшаге, и т. д. Одним словом, на каждом шагу ищется такое управление, которое обеспечивает оптимальное продолжение процес- с а относительно достигнутого в данный момент состояния. Этот прин- цип выбора управления называется принципом оптималь- ности. Само управление, обеспечивающее оптимальное продолже- ние процесса относительно заданного состояния, называется услов- ным оптимальным управлением на данном шаге. Теперь предположим, что условное оптимальное управление на каждом шаге нам известно: мы знаем, что делать дальше, в каком бы состоянии ни был процесс к началу каждого шага. Тогда мы можем найти уже не «условное», а просто оптимальное управление на каждом шаге. 123
Действительно, пусть нам известно начальное состояние процесса, обозначим его So. Теперь мы уже знаем, что делать на первом шаге: надо применить условное оптимальное управление, выработанное на- ми для первого шага, относящееся к состоянию <S0. В результате этого управления после первого шага система перейдет в другое состояние но для этого состояния мы снова знаем условное оптимальное уп- равление на втором шаге «2, и т. д. Таким образом мы найдем оптималь- ное управление процессом « = («х, и2, .... ит), приводящее к максимально возможному выигрышу Wmax. Таким образом, в процессе оптимизации управления методом ди- намического программирования многошаговой процесс «проходится» дважды: — первый раз — от конца к началу, в результате чего находятся условные оптимальные управления на каждом шаге и оптимальный выигрыш (тоже условный) на всех шагах, начиная с данного и до конца процесса; — второй раз — от начала к концу, в результате чего находятся (уже не условные) оптимальные шаговые управления на всех шагах операции. Эти общие правила станут более понятными на конкретном при- мере. 2. ЗАДАЧА О НАБОРЕ ВЫСОТЫ И СКОРОСТИ ЛЕТАТЕЛЬНЫМ АППАРАТОМ Одной из простейших задач, решаемых методом динамического программирования, является задача об оптимальном режиме набора высоты и скорости летательным аппаратом. С этой задачи мы и начнем изложение практических приемов динамического программирования, причем в целях методической ясности, условия задачи будут до край- ности упрощены. Пусть самолет (или другой летательный аппарат), находящийся на высоте Но и имеющий скорость Уо, должен быть поднят на заданную высоту Н,.„ а скорость его доведена до заданного значения (буквой со мы будем отмечать конец процесса). Известен расход горючего, потребный для подъема аппарата с любой высоты Н на любую другую Н' >Н при неизменной скорости V; известен также расход горючего, потребный для увеличения скорости от любого значения V до V > V при неизменной высоте Н. Требуется найти оптимальный режим набора высоты и скорости, при котором общий расход горючего будет минимальным. Решение будем строить следующим образом. Для простоты до- пустим, что весь процесс набора высоты и скорости разделен на ряд по- следовательных шагов (этапов) и за каждый шаг самолет увеличивает только высоту или только скорость. 124
Будем изображать состояние самолета Точкой S на плоскости VOH (рис. 3.2), где абсцисса — скорость самолета, а ордината — его высота. Очевидно, существует множество возможных управлений — мно- жество траекторий, по которым можно перевести точку S из So в Из всех этих траекторий нужно выбрать ту, на которой расход горю- чего будет минимальным. Будем решать задачу методом динамического программирования. Для этого разделим интервал скоростей Va> — Vo на и.! равных частей: V —V ДУ — ---2-, «1 а интервал высот На — Но — на п2 равных частей: 125
Число частей пх и п2 принципиального значения не имеет и может быть выбрано исходя из требований к точности решения задачи. Так как за каждый шаг мы можем менять только высоту или только скорость, то общее число т шагов будет: ОТ = + п2. Например, для случая, изображенного на рис. 3.3, 7^ = 8, n2 = 6, т = 14. Любая траектория, переводящая точку S из So в So, состоит из 14 шагов, или этапов. Чтобы оптимизировать управление процессом набора высоты и скорости (т. е. выбрать ту траекторию, на которой расход горючего минимален), надо знать расход на каждом шаге (горизонтальном или вертикальном участке траектории). Предположим, что эти расходы заданы (см. рис. 3.4). На каждом отрезке записан расход горючего в условных единицах. Любой траектории, переводящей S из So в <8Ю, соответствует впол- не определенный расход горючего, равный сумме чисел, написанных на отрезках. Например, траектория, помеченная стрелками на рис. 3.4, дает расход горючего: Г=12 + 11 + 10+8 + 11+8 + 10+10 + 13 + 15 + 20+9+ + 12 + 14 = 163. Нам нужно из всех траекторий выбрать ту, для которой расход горючего минимален. Можно было бы, конечно, перебрать все возмож- ные траектории, но их слишком много. Гораздо проще будет решить задачу методом динамического программирования. Процесс состоит из 14 шагов; будем оптимизировать каждый шаг, начиная с последнего. Конечное состояние самолета (точка S<0) нам задано; 14-й шаг непре- менно должен привести нас в эту точку. Посмотрим, откуда мы можем 126
переместиться в точку So за один шаг, т. е. каковы возможные состоя- ния самолета после предпоследнего, 13-го шага? Рассмотрим отдельно правый верхний угол нашей прямоугольной сетки (рис. 3.5) с конечной точкой So. В эту точку можно за один шаг переместиться из двух соседних точек: Bj и В2, причем из каждой — только одним способом, так что выбора условного управления на по- следнем шаге у нас нет — оно единственно. Если предпоследний шаг привел нас в точку В1( мы должны двигаться по горизонтали (набирать скорость) и тратить 17 единиц горючего; если в точку В2 — идти по вертикали (набирать высоту) и тратить 14 единиц. Запишем эти мини- мальные (в данном случае просто неизбежные) расходы в специальных кружках, которые поставим в точках Вь В2 (рис. 3.6). Запись «17» в кружке у Bj означает: «если мы пришли в Вь то минимальный расход ----17- Рис. 3.5 Рис. 3.6 горючего, переводящий нас в точку <SO, равен 17 единицам». Анало- гичный смысл имеет запись «14» в кружке у точки В2. Оптимальное управление, приводящее к этому расходу, помечено в каждом случае стрелкой, выходящей из кружка. Стрелка указывает то направление, по которому мы должны двигаться из данной точки, если в результате предыдущей нашей деятельности оказались в ней. Таким образом, условное оптимальное управление на последнем, 14-м шаге, найдено для любого (В2 или В2) исхода тринадцатого шага. Для каждого из этих исходов найден, кроме того, условный минималь- ный расход горючего, за счет которого можно переместиться из данной точки в So,. Перейдем к планированию предпоследнего, 13-го шага. Для этого рассмотрим все возможные результаты пред-предпоследнего, 12-го ша- га. После этого шага мы можем оказаться только в одной из точек Cj, С2, С3 (рис. 3.7). Из каждой такой точки мы должны найти опти- мальный путь в точку <SO и соответствующий этому пути минимальный расход горючего. Если мы оказались в точке то выбора нет: мы должны переме- щаться по горизонтали и тратить 15 4- 17 — 32 единицы горючего. Этот расход мы запишем в кружке при точке Си а оптимальное (в дан- ном случае единственное) управление из точки С] снова пометим стрелкой. Для точки С2 выбор есть: из нее можно идти в S(0 либо через В1( либо через В2. В первом случае мы израсходуем 13 + 17 = 30 единиц 127
горючего, во втором 17 + 14 = 31 единицу. Значит, оптимальный путь из С2 в начинается вертикальным участком (отметим это вер- тикальной стрелкой), а минимальный расход горючего равен 30 (это число мы запишем в кружке при точке С2). Наконец, для точки Са путь в Sa опять единственный: по верти- кали. Обходится он в 124-14 = 26 единиц; эту величину (26) мы и за- пишем в кружке при С3, а стрелкой пометим оптимальное управле- ние. ! Таким образом, переходя от точки к точке справа налево и сверху вниз (от конца процесса к его началу), можно для каждой узловой точки рис. 3.4 выбрать условное оптимальное управление на следую- щем шаге, т. е. направление, ведущее из данной точки в точку So с ми- нимальным расходом горючего, и записать в кружке у данной точки этот минимальный расход. Чтобы найти в узловой точке оптимальное управление, нужно просмотреть два возможных пути из этой точки: направо и вверх, и для каждого из них найти сумму расхода горючего на этом шаге и минимального расхода горючего на оптимальном про- должении пути, уже построенном для следующей точки, куда ведет данный путь. Из двух путей (вправо и вверх) выбирается тот, для ко- торого эта сумма меньше (если суммы равны, выбирается любой путь). В результате выполнения такой процедуры, из каждой узловой точки (см. рис. 3.8) проводится стрелка, указывающая условное опти- мальное управление, а в кружке записывается минимальная стоимость перехода из этой точки в Sa (условная минимальная стоимость). Рано или поздно процесс заканчивается, дойдя до исходной точки <S0. Из этой точки, как и из любой другой, идет стрелка, указывающая, куда надо из нее перемещаться, а в кружке записан минимальный рас- ход горючего. На этом этап условной оптимизации управления закан- чивается, и начинается завершающий этап безусловной оптимизации — построение оптимального управления на каждом шаге от первого до по- |?8
следи его. При этом мы строим оптимальную траекторию точки S, пе- ремещаясь по стрелкам из So в 5Ш. На рис. 3.8 показан окончательный результат такой процедуры — оптимальная траектория отмечена жирными кружками и дополнитель- ными стрелками. Число «139», стоящее у точки So> означает минималь- ный расход горючего 1Ут|П, меньше которого нельзя получить ни на какой траектории. Таким образом, поставленная задача решена, и оптимальное уп- равление процессом найдено. Оно состоит в следующем: — на первом шаге увеличивать только скорость, сохраняя неиз- менной высоту Но, и довести скорость до Уо 4- ДУ; Рис. 3.8 — на втором и третьем шагах увеличить высоту до Но + 2АЯ, сохраняя скорость неизменной; — на четвертом, пятом и шестом шагах снова набирать скорость, пока она не станет равной Уо + 4ДУ; — на седьмом и восьмом шагах набирать высоту и довести ее до Но + 4ДЯ; — на девятом, десятом, одиннадцатом и двенадцатом шагах снова набирать скорость и довести ее до заданного конечного значения Уи; — на последних двух шагах (тринадцатом и четырнадцатом) на- бирать высоту до заданного значения На. Нетрудно на ряде примеров убедиться, что найденное управле- ние действительно является оптимальным и на любой другой траекто- рии расход горючего будет больше (или, по крайней мере, не меньше). Рассмотренная здесь задача оптимального набора высоты и ско- рости является простейшим примером, на котором часто демонстрируют основную идею динамического программирования. Действительно, 5 Зак. 573 129
в нашей упрошенной постановке задачи на каждом шагу нам нужно выбирать только между двумя управлениями: «набирать высоту» и «на- бирать скорость». Именно в связи с таким элементарно простым набо- ром управлений задача очень легко решается до конца. Такая намеренно упрощенная постановка задачи не вполне соот- ветствует действительности. Фактически летательный аппарат может набирать (а зачастую и набирает) высоту и скорость одновременно. В этом случае для каждой точки на плоскости V0H точка S мо- жет двигаться под любым углом в пределах некоторого сектора (рис. 3.9), причем каждому направлению соответствует свой расход горючего на единицу длины пройденного пути (разумеется, не ре- ального пути, а условного — на плоскости VOH). Чтобы решить такую задачу динамического программирования, мы должны как-то установить «шаги» или «этапы» процесса. Нам здесь уже неудобно будет пользоваться тем разделением на этапы, которое мы выбрали для предыдущей задачи Удобнее будет разбить отрезок S05o на т частей, провести через точки деления ряд опорных прямых (0) — (0), (1) — (1)...(0 — (/), (т) — (т), перпендикулярных S0So, и предположить, что «шаг» состоит из перехода точки с одной из опорных прямых на другую (рис. 3.10). Если взять опорные прямые достаточно близкими, можно допустить, что каждый участок траекто- рии, от одной опорной прямой до следующей, — прямолинеен. Ра- зумеется, направление каждого такого участка не должно выходить за пределы «разрешенного сектора», определяемого «розой направле- ний» на рис. 3.10. Расход горючего на прямолинейном участке определяется точкой, где он начинается, направлением участка и его длиной. Схема решения такой задачи методом динамического программи- рования несколько сложнее, чем вышеописанная «ступенчатая» схе- ма, но в принципе отличается от нее только тем, что на каждом шаге приходится выбирать не между двумя направлениями, а между не- сколькими. 130
Начинается процесс с Последнего Шага (рис. 3.11). Прежде всего, определяются возможные положения точки на прямой (т— 1)—(т—1), из которых она может прийти в <SO за один шаг. Это, очевидно, все положения от А до В (так как выбранная нами роза направлений предполагает, что скорость и высота в процессе набора убывать не мо- гут). Зададимся на отрезке АВ рядом возможных положений точки S, для каждого из них построим прямолинейный участок пути к точке SM и подсчитаем на этом участке расход горючего. Движение по этому Роза направлении участку и будет (вынужденным) оптимальным управлением, в расход — (неизбежным) минимальным расходом. Таким образом, условная оп- тимизация последнего шага выполнена. Перейдем к предпоследнему шагу. Зададимся рядом точек на отрезке CD прямой (т—2)—(т — 2). 5* 131
Для каждой из этих точек выявим оптимальное управление, т. е. то направление дальнейшего следования, двигаясь по котором) мы истратим на двух последних шагах минимум горючего. Чтобы найти это направление, мы должны для каждого из возможных отрезков, соединяющих данную точку с прямой (т — 1) — (т — 1), подсчитать расход горючего и сложить его с (уже оптимизированным) расходом на последнем шаге. Из всех направлений в качестве опти- мального выбирается то, для которого этот суммарный расход мини- мален. Далее переходим к оптимизации (т — 2)-го шага, и т. д. На каж- дом этапе ищется такое направление движения из каждой точки, для которого расход горючего на ближайшем шаге плюс (уже оптимизи- рованный) расход горючего на всех оставшихся до конца шагах дости- гает минимума. Этот процесс условной оптимизации продолжается до тех пор, пока мы не дойдем до первого шага, начало которого S,, уже не надо варьировать — оно известно. Таким образом определяется минимальный расход горючего на всю операцию, начиная от точки So. Далее, двигаясь из каждой точки, начиная от <S0, по оптимальному пути, находим оптимальный режим набора высоты и скорости (отмечен на рис. 3.11 точками). Заметим, что описанная методика построения оптимальной тра- ектории точки S (оптимального управления) отнюдь не относится толь- ко к случаю набора высоты и скорости. По осям могут откладываться не высота и скорость, а любые другие величины, например: — декартовы (полярные) координаты движущейся точки; — вес и три составляющие скорости ракеты; — количества средств, вкладываемые в разные отрасли произ- водства и т. п. Равным образом, максимизируемый (минимизируемый) показа- тель эффективности W может быть любой природы, например: — расход материальных средств на систему мероприятий; — время перемещения из точки So в Str); — доход, приносимый группой предприятий, и т. д. Выбор системы координат, в которой решается задача, и способ членения операции на шаги могут быть самыми разными; их конкрет- ные формы диктуются, главным образом, соображениями удобства расчетной схемы, а иногда — наглядностью геометрической интер- претации. 3. ОБЩАЯ ПОСТАНОВКА ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ. ИНТЕРПРЕТАЦИЯ УПРАВЛЕНИЯ В ФАЗОВОМ ПРОСТРАНСТВЕ После того, как рассмотрены некоторые конкретные задачи дина- мического программирования, дадим общую постановку таких задач и сформулируем принципы их решения. При этом мы будем-пользо- ваться обобщенными, символическими, а не расчетными формулами; 132
каждая из них выражает, что от чего зависит, но не дает возможности что-либо вычислить. Тем не менее, написание таких об- щих формул очень полезно для уяснения сути метода. Рассматривается следующая общая задача. Имеется некоторая фи- зическая система 8, которая с течением времени меняет свое состоя- ние, т. е. в системе 8 происходит какой-то процесс. Мы можем управлять этим процессом, т. е. тем или другим способом влиять на состояние системы. Такую систему 5 мы будем называть управ- ляемой системой, а способ нашего воздействия на нее — уп- равлением U. Напомним, что буквой U обозначается не какая- то одна величина, а целая совокупность величин, векторов или функ- ций, характеризующих управление. Предположим, что с процессом связана какая-то наша заинтере- сованность, выражающаяся численно величиной W, которую мы будем называть «выигрышем». Мы хотим так управлять процессом, чтобы выигрыш был максимален*'. Очевидно, выигрыш зависит от управления: W = W(U). (3.1) Мы хотим найти такое управление (оптимальное) U=u, при котором выигрыш максимален: Wmax = max {W (U)}. (3.2) Запись max читается «максимум по U» и означает: «максимальное и из всех значений W(U) при всех возможных управлениях U». То из уп- равлений, при котором достигается этот максимум, и есть оптималь- ное управление и. Таким образом, поставлена общая задача оптимизации управле- ния физической системой. Однако она поставлена еще не полностью. Обычно в таких задачах должны быть учтены некоторые условия, на- кладываемые на начальное состояние системы So и конечное состояние <SW. В простейших случаях эти состояния могут быть полностью зада- ны (см., например, § 2). В других случаях они могут быть заданы не полностью, а только ограничены какими-то условиями, т. е. указаны область начальных состояний 80 и область конеч- ных состояний 8(о. Например, в задаче, подобной рассмотренной в предыдущем па- раграфе, может оказаться, что летательный аппарат надо привести не в точно заданное состояние 8О, а в какую-то область на плоскости УО// (скажем, достигнуть высоты, не меньше заданной, имея при этом •) Здесь и в дальнейшем для краткости будем говорить только о максимиза- ции W', подразумевается, что «максимум» в любом случае может быть заменен на «минимум» 133
скорость, заключенную в определенных пределах); начальная ско- рость Ео также может быть не в точности задана, а ее можно произ- вольно выбирать в некоторых границах. Тот факт, что начальное состояние системы 30 входит в область So, мы будем записывать с помощью принятого в математике «знака включения» G: So 6 S, Аналогично, для конечного состояния системы: So, С So. Таким образом, общая задача оптимального управления форму- лируется следующим образом: Из множества возможных управлений U найти такое оптималь- ное управление и, которое переводит физическую систему S из началь- ного состояния <S0 So в конечное состояние Зи £ So так, чтобы при этом выигрыш W обращался в максимум. Дадим процессу управления геометрическую интерпретацию. Для этого нам придется несколько расширить наши привычные гео- метрические представления и ввести понятие о так называемом фазо- вом пространстве (или пространстве состояний). Состояние S системы S, которой мы управляем, всегда можно описать с помощью того или другого количества численных парамет- ров. Такими параметрами могут быть, например: — координаты тела и его скорость; — количества средств, вложенных в отрасль производства; — численности группировок войск и т. д. Эти параметры мы будем называть фазовыми коорди- натами системы S, а состояние системы изображать точкой S с этими координатами в некотором условном фазовом прост- ранстве (пространстве состояний). Размерность этого пространст- ва зависит от числа фазовых координат. Если состояние системы ха- рактеризуется одним параметром то фазовое пространство будет , S ' ' — > ~0----~ у \»»»,»>,^ Область Возможных состояний системы (фазовое пространство) Рис. 3.12 одномерным и представляет собой участок оси абсцисс (рис. 3.12), а управление интерпретируется законом движения точки S из исход- ного состояния So £ St, в конечное состояние Зю £ Зю. Если состояние системы характеризуется двумя параметрами и |2 (например, ско- ростью и высотой, как в § 2, гл. 3), то фазовое пространство будет дву- 134
О Область Возможных состояний системы (фазовое пространс- ч тво) мерным (плоскость или ее часть), а процесс будет изображаться пере- мещением точки S из So € So в So С So по определенной траектории на фазовой плоскости |]0|2- Траектория эта и будет изображать управление (рис. 3.13). Если состояние системы S характеризуется тремя координатами 11, Вз (например, абсцисса, скорость и ускорение), то фазовым про- странством будет трехмерное пространство или его часть, а управля- емый процесс изобразится перемещением точки S по пространственной кривой (рис. 3.14). Если число параметров, характеризующих состояние системы, больше трех, то геометрическая интерпрета- ция теряет свою наглядность, но геометрическая термино- логия продолжает оставаться удобной. В общем случае, когда состояние системы S описывается п параметрами _ _ „ Рис. 3.13 Bi, Ва...Вп, мы будем говорить о точке S в n-мерном фазовом пространстве и о ее перемещении из области So в область So по такой траектории, для ко- торой выигрыш W максимален. Выбор фазовых координат |2, •••, определяющих состояние системы, и соответствующей геометрической интерпретации может быть тем или другим, в зависимости от удобства построения расчетной схе- мы. В некоторых случаях в качестве одной из фазовых координат, ха- рактеризующих состояние системы S, бывает удобно выбрать время t, протекшее с начала процесса; тогда этапы (шаги) будут наглядно видны в фазовом пространстве как перемещения точки S с одной из плоскостей (гиперплоскостей) t — const на другую (рис. 3.15). Предположим, что фаЗовые координаты |2, ..., определяющие состояние системы S, выбраны. Общая задача оптимизации управле- ния в геометрических терминах может быть сформулирована так: Найти такое управление и (оптимальное управление), под влия- нием которого точка S фазового пространства переместится из началь- ной области So в конечную область So так, что при этом выигрыш W обратится в максимум. Поставленную общую задачу можно решать различными спосо- бами — отнюдь не только методом динамического программирования. Характерным для динамического программирования является опреде- ленный методический прием, состоящий в следующем: процесс пере- мещения точки S из So в So разделяется на несколько шагов (этапов) (см. рис. 3.16), и затем проводится пошаговая оптимизация управления и выигрыша, 135
Рис. 3.15 130
Процедура построения оптимального управления методом ди- намического программирования распадается на две стадии: предвари- тельную и окончательную. На предварительной стадии определяется для каждого тага условное оптимальное управле- ние, зависящее от состояния S системы (достигнутого в результате предыдущих шагов), и условный оптимальный вы- игрыш на всех оставшихся шагах, начиная с данного, также за- висящий от состояния 5. На окончательной стадии определяется для каждого шага окон- чательное (безусловное) оптимальное управление. Предварительная (условная) оптимизация производится по шагам, в обратном порядке: от последнего шага к первому; окончательная (безусловная) оптимизация — также по шагам, но в естественном по- рядке: от первого шага к последнему. Из двух стадий оптимизации несравненно более важной и трудоем- кой является первая. После окончания первой стадии выполнение вто- рой трудности не представляет; остается только «прочесть» рекоменда- ции, уже заготовленные на первой стадии. В основе поэтапной процедуры лежит уже упоминавшийся прин- цип оптимальности, состоящий в следующем: Каково бы ни было состояние S системы в результате какого-то числа шагов, мы должны выбирать управление на ближайшем шаге, так, чтобы оно, в совокупности с оптимальным управлением на всех после- дующих шагах, приводило к максимальному выигрышу на всех оставших- ся шагах, включая данный. Запишем принципиальную структуру обеих стадий оптимизации с помощью общих символических формул. «Символическими» мы их называем потому, что в них будут фигурировать функции, аргументами которых будут не числа, а «состояния» и «управления», каждое из кото- рых в общем случае характеризуется не одним числом, а целой сово- купностью чисел или функцией. Введем некоторые обозначения. Условимся обозначать U7Z(S) (3.3) условный оптимальный выигрыш, получаемый на всех последующих ша- гах, начиная с i-го и до конца-, он достигается при оптимальном управ- лении на всех этих шагах и равен максимальному выигрышу, который можно получить на всех этих шагах вместе, если в их начале система находится в состоянии S. Коротко мы будем называть величину 1Уг(3) условным оптимальным выигрышем. Условимся также обозначать Uj(S) (3.4) условное оптимальное управление на t-м шаге, которое, совместно с оп- тимальным управлением на всех последующих шагах, обращает выи- грыш на всех оставшихся шагах, начиная с данного, в максимум. Ко- роче будем называть управление щ(8) условным оптималь- ным управлением. 137
Поставим задачу: определить функции U7;(S) и ut(S), т. е. услов- ный оптимальный выигрыш и условное оптимальное управление, для всех шагов (Z = 1,2, ..., т). Рассмотрим z-й шаг процесса управления. Пусть в результате i — 1 предыдущих шагов система пришла в состояние S, и мы выбираем какое-то управление Ut на i-м шаге. Если мы его применим, то, во- первых, получим на данном i-м шаге какой-то выигрыш wt; он зависит как от состояния системы S, так и от примененного управления Ut: wt=wt(S,Ut). (3.5) Кроме того, мы получим какой-то выигрыш на всех оставшихся шагах. Соответственно принципу оптимальности, будем считать, что он максимален. Чтобы найти этот выигрыш, мы должны знать состоя- ние системы перед следующим, (Z + 1)-м шагом. Под влиянием управ- ления Ut на /-м шаге система из состояния S (в котором она была пе- ред этим шагом) перейдет в какое-то новое состояние S'. Это новое состояние будет зависеть, опять-таки, от прежнего состояния S и при- мененного управления Ut: S'^JS,^). (3.6) Запишем выигрыш, который мы получим на всех шагах, начиная с i-го, если на i-м шаге будет применено любое (вообще говоря, не оптимальное) управление Ult а на всех последующих (от (z + 1)-го до т-го оптимальное управление. Этот выигрыш будет равен выигры- шу wt на данном, i-м шаге, плюс условный оптимальный выигрыш на всех последующих шагах, начиная с (Z + 1)-го, определяемый для но- вого состояния системы S'; обозначим такой «полуоптимальный» выи- грыш через $7(S, Ut): W((S, Ut)=wt(S, Ut) + Wl + l(S'), или, учитывая (3.6), r,.(S, U^w^S, Ut)+Wl+l(<ft(S, U,)). (3.7) Теперь, в соответствии с принципом оптимальности, мы должны выбрать такое управление Ut — ut, при котором величина (3.7) мак- симальна и достигает значения: (S) = тах k (S, Ut) + ,(Ф/ (S, [/,))}• (3.8) ut То управление ^• = «z (S), при котором этот максимум достигается, и есть условное опти- мальное управление на i-м шаге, а сама величина (3.8)— условный оптимальный выигрыш (на всех шагах, начиная с z-ro и до конца). В уравнении (3.8) функции w^S, Uи ср((5, Ut) известны. Неиз- вестными остаются функции U7;(S) и U^+1(S); из них первая выражает- ся через вторую. 138
Формула (3.8) представляет собой так называемое основное функциональное уравнение динамического программирования; она позволяет определить функцию IV'/S), если известна следующая за ней по порядку функция Й?г+1(Х). Что касается функции Wm(S) (условный оптимальный выигрыш на последнем шаге), то она может быть определена очень просто. Дей- ствительно, за последним шагом нет никакого другого, и нужно по- просту обратить в максимум выигрыш на последнем шаге: №m(S) = max КДЗ, Um)}. (3.9) Um Максимум в формуле (3.9) берется не по всем возможным управлениям Um на m-м шаге, а только по тем, которые приводят систему в заданную область конечных состояний Хо, т. е. по тем, для которых <pm(s,t/m)esw. Это всегда надо иметь в виду при пользовании формулой (3.9). То управление Um = um(S), при котором достигается максимум выигрыша (3.9), и есть условное оптимальное управление на послед- нем шаге. Теперь можно, одно за другим, построить всю цепочку условных оптимальных управлений. Действительно, зная U7m(X), можно, по общей формуле (3.8), полагая в ней i +1 = т, найти функцию й^т-ДХ) и соответствующее условное оптимальное управление u^S); за- тем U7m_2(X) и мт_2(Х) и так далее, вплоть до последнего от конца (первого ) шага, для которого будут найдены функции ^(Х) и Ui(X). Функция U7JX) есть условный оптимальный выигрыш за всю опера- цию, т. е. на всех шагах, начиная с первого и до последнего (если пер- вый шаг начинается с определенного состояния X системы X). Таким образом, предварительная оптимизация закончена — най- дены условный оптимальный выигрыш и условное оптимальное управ- ление для каждого шага. Теперь перейдем ко второй стадии оптимизации — нахождению безусловного (окончательного) оптимального управления u =(un и2, .... ит). Начнем в первого шага. Предположим, что исходное состояние Хо нам полностью известно. Подставим это состояние Хо в формулу для условного оптимального выигрыша W^S). Получим ^ = ^l(So). (ЗЛО) Оптимальное управление на первом шаге найдется одновременно с (3.10): «1 = «1(Х0). Далее, зная исходное состояние Хо и управление иъ можем найти состояние X* системы после первого шага: Si* = <h(Xe,«1). (З.П) И9
Зная это состояние S*, можно найти оптимальное управление на втором шаге u2 = u2(Si), затем S2 = <f2(Si, u2) и т- Д- Таким об- разом, идя по цепочке So—> «j (So) —> Si —> u2 (Sj) —>> Sm _ \^~um (Sm— i) —> Sm, (3.12) мы определим, одно за другим, все шаговые оптимальные управления и найдем состоящее из них оптимальное управление операцией в це- лом u=(ult и2, ..., ит), а также (если оно не было в точности задано заранее) конечное состоя- ние системы: sro=s;. (3.13)" Разумеется, это состояние будет принадлежать области Sm, пото- му что мы выбирали управление на последнем шаге именно так, чтобы это условие было соблюдено: Sm = <р (Sm— ], wm) f S(o- Предположим теперь, что исходное состояние системы известно нам не полностью, а только ограничено условием: So С So. Тогда нужно найти такое (оптимальное) начальное состояние So, при котором условный оптимальный выигрыш за все шаги мак- симален: = max {^(S)}. (3.14) s es, To начальное состояние So, для которого этот максимум дости- гается, и должно быть выбрано в качестве исходного. Далее оптималь- ное управление строится совершенно так же, как и раньше, по цепоч- ке: So —> U] (So)—> S]—> (Si)Sm_ j—> (Sm_ i)—>Sm, (3.15) что и дает оптимальное управление операцией в целом: «2> ит) и конечное состояние системы S0) — S*m, если оно заранее не было полностью определено. - — На этом процесс оптимизации заканчивается. В данном параграфе мы пользовались системой символических формул, которые, разумеется, непригодны для непосредственного вы- числения по ним: в этих формулах не указан не только конкретный вид функций U);(S, и,) и <p;(S, Uf), но даже и что такое аргументы S и Ui — числа, векторы, или же функции и т. п. Тем не менее, система 140
символических формул очень полезна для организации процедуры ди- намического программирования. При решении любой задачи динами- ческого программирования удобно придерживаться раз навсегда уста- новленного, стандартного порядка действий. Этот порядок можно установить, например, в такой форме. 1. Выбрать способ описания процесса, т. е. параметры, характе- ризующие состояние системы, фазовое пространство и способ членения операции на «шаги». 2. Записать выигрыш на i-м шаге в зависимости от состояния си- стемы S в начале этого шага и управления (7г: wt — wt (S, U;). 3. Записать для г-го шага функцию, выражающую изменение со- стояния системы от S к S' под влиянием управления Ut: S' — Vi (S, Ut). 4. Записать основное функциональное уравнение (3.8), выражаю- щее функцию U/,(S) через U7/+1(S): W\(S)=max {^(S, t/f)+^+i (<P. ($, ^))Ь (3-16) ui 5. Найти функцию U7m(S) (условный оптимальный выигрыш) для последнего шага: Wm(S) = max (wm(S, Um)} (3.17) (максимум берется только по тем управлениям, которые приводят си- стему в заданную область конечных состояний S<0) и соответствующее ей условное оптимальное управление на последнем шаге: um(S). 6. Зная IV'n/S) и пользуясь уравнением (3.16) при конкретном виде функций wt(S, U^, cp{(S, Ut), найти одну за другой функции Гт_, (S), U7m_2(S)....U7X(S) и соответствующие им условные оптимальные управления: Um— 1 (S), Um—2 (S), •••» Uj (S). 7. Если начальное состояние So задано, найти оптимальный выи- грыш Wmax — (So) и далее безусловные оптимальные управления (и, если надо, конечное состояние S*m) по цепочке: So —> Ui (So) —> Si —> и% (S,) —>... —> Sm_ i —> um (Sm— i) —> Sm- в. Если начальное состояние Sn не задано, а лишь ограничено условием So 6 So, in
найти оптимальное начальное состояние 56, при котором выигрыш, №1(5) достигает максимума r^^maxfr^S)} seSi и далее, по цепочке, безусловные оптимальные управления. В дальнейшем, решая различные задачи динамического програм- мирования, мы будем придерживаться этой последовательности дейст- вий. В заключение отметим следующее. В принципе процесс динами- ческого программирования может разворачиваться (хотя и не так ес- тественно) и в направлении, обратном тому, которое мы приняли: условные оптимальные управления могут отыскиваться в направлении от первого шага к последнему, а безусловные — от последнего к пер- вому. Например, в задаче о наборе высоты и скорости, которую мы рассматривали в предыдущем параграфе, ничто не мешает нам строить процесс не от правого верхнего угла к нижнему левому, а наоборот, и результат при этом получится тот же самый. Это относится к любой задаче многоэтапного планирования. Можно сначала планировать первый шаг, при условии, что он приведет систему в состояние 5, затем второй, так чтобы выигрыш за два первые шага (первый — уже опти- мизированный) был максимален, и т. д. После того, как все условные оптимальные управления и соответствующие выигрыши будут извест- ны, можно найти безусловные оптимальные управления на всех шагах. Вычислительно эта схема ничуть не хуже предложенной выше, но в смысле удобства изложения и понимания уступает ей. Поэтому мы всюду будем придерживаться вышеизложенной схемы: условные оп- тимальные управления находятся в обратном порядке, от последнего шага к первому, а безусловные — в прямом порядке, от первого шага к последнему. 4. ЗАДАЧИ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ На практике очень часто встречаются многоэтапные операции, связанные с разумным распределением тех или других ресурсов. Речь может идти, например, о распределении денежных средств, сырья, рабочей силы по предприятиям, отраслям промышленности или этапам отдельных работ или, скажем, о распределении снарядов по целям, общего веса G, отведенного на техническое устройство, по его отдель- ным агрегатам, и т. д. — вообще, о распределении всевозможных средств по каким-то категориям мероприятий. Начнем с наиболее простой, «классической» задачи распределения ресурсов, на которой легко будет продемонстрировать особенности подобных задач. Задача ставится следующим образом. Имеется определенное начальное количество средств Ко (необяза- тельно в денежной форме), которые мы должны распределять в тече- ние т лет между двумя отраслями производства I и II. Средства, 142
вложенные в каждую отрасль, приносят за год определенный доход, зависящий от объема вложений. Если мы вложим средства X в отрасль 1, то за год получим доход, равный/(X); при этом вложен- ные средства частично уменьшаются (амортизируются, тратятся), так что к концу года от них остается какая-то часть: Ч>(Х)<Х. Аналогично, средства У, вложенные в отрасль II, приносят за год доход g(Y) и уменьшаются до ф(У)<У. По истечении года, оставшиеся от Ко средства заново распреде- ляются между отраслями I и II. Новых средств извне не поступает, и в производство вкладываются все оставшиеся в наличии средства; доход в производство не вкладывается, а накапливается отдельно. Требуется найти такой способ управления ресурсами (какие средства, в какие годы и в какую отрасль вкладывать), при котором суммарный доход от обеих отраслей за пг лет будет максимальным. Будем решать задачу методом динамического программирования, по развернутой выше стандартной схеме. 1. Система S в данном случае — две отрасли со вложенными в них средствами. Она характеризуется двумя параметрами X и У, выражаю- щими количества средств в отраслях I и II соответственно. Естествен- ным «шагом» (этапом) процесса является хозяйственный год. В процес- се управления величины X и У меняются в зависимости от двух при- чин: — перераспределение средств между отраслями в начале каждого года; — уменьшение (трата) средств за год, сказывающееся в конце каж- дого года. Управлением Ut на t-м шаге будут количества средств X,, Уг, вкла- дываемые в отрасли I и II на этом шаге. Управление операцией U со- стоит из совокупности всех шаговых управлений: U = (IA,U2....Um)- (4-1) Нам нужно найти такое (оптимальное) управление «==(«1, «2, •••, ит), (4.2) при котором суммарный доход, приносимый обеими отраслями за т т лет W — 2 wb был максимальным: i=I W = Wmax. (4.3) 2. Состояние системы перед t-м шагом характеризуется одним параметром К — количеством средств, сохранившихся после преды- дущих i — 1 шагов. Управление t/; на t-м шаге будет состоять в том, 143
что мы выделим в отрасль I средства Хг, величина Yt определится ав' томатически; она будет равна оставшимся средствам: Yt = K—Xt. Выигрыш (доход) на г-м шаге будет: ^(X,Xj=/(XJ+g(X-Xj. (4.4) 3. Под влиянием этого управления на i-м шаге система перейдет из состояния К в состояние X' = <p(Xj + t(X-Xj. (4.5) 4. Основное функциональное управление имеет вид: Гг(Х)= щах {/(Xj+g(X-Xj + + 1 (ф (XJ-|-ф (X— Хг-))}, (4.6) где знак О^Х^К обозначает, что максимум берется по всем неотри- цательным вложениям Xi, не превосходящим наличного запаса средств К. Условным оптимальным управлением на z-м шаге хг(Х) будет то из значений X,-, при котором выражение в фигурных скобках до- стигает максимума. 5. Условный оптимальный выигрыш на последнем шаге будет Wm (К) = шах {/ (Xm) + g (К —Хт)}; (4.7) о<хт</< ему соответствует условное оптимальное управление хт(К), при ко- тором этот максимум достигается. 6. Зная функцию находим по формуле (4.6) условные оп- тимальные выигрыши на двух последних, на трех последних и т. д. шагах: max {f (Xm_i)+g(K — XOT_J + + (ф(Хт_1) + ф(Х -xm_j)}; Wm-2(K)^ max [f(Xm-2) + g(K—Xm_2)~t 0<Xm_2<K + Wm-t (ф(Хт_2)+ф(Х-Хт_2))1; (4.8) Г, (X) = max* {/(XJ + g (X -XJ + . + ^2(ф(ХЛ-ф(Х-ХП)! ; и соответствующие им условные оптимальные управления: Хщ— 1 (X), Хщ—2 (К), •••> Xj, (X). (4.9) 144
7. Начальное состояние (начальный запас средств) задано, поэтом\ максимальный доход (оптимальный выигрыш) будет = W, (К0). Оптимальное управление на первом шаге будет; Х1=Х1(Л0). Состояние системы после первого шага: К\ = Ф(х1)+ф(Ло — xj. Оптимальное управление на втором шаге: х2=х2 (К,*), и т. д. по цепочке. Состояние системы после i шагов: К' = Ф(х;) + ф(К/- 1-х,). (4.10) Оптимальное управление на /-м шаге: хг = х((/С‘_ и т. д., вплоть до последнего шага, по цепочке: (Д о) “* К > ~Х2 (л 1) *“> ... ~>• ТСт— I *“> Хт {Кт— I) “>• Кт.' Величина Кт будет представлять собой количество средств, ос- тавшихся (при оптимальном управлении) после последнего шага. Со- вокупность средств, вложенных по годам в отрасль I: х = (хп х2, ..., хт) будет представлять собой оптимальное управление, наряду с которым имеет смысл рассмотреть У — (У1> Уг, Ут) =(^о—Xi, К\ — х2.......Km-i— хт) — количество средств, вложенных в отрасль II по годам. Дадим процессу распределения ресурсов геометрическую интер- претацию. Из соображений наглядности сделаем фазовое пространст- во двумерным, хотя можно было бы ограничиться и одномерным. Бу- дем откладывать по оси ОХ средства X, вкладываемые в отрасль I, по оси ОУ — средства Y, вкладываемые в отрасль II. Сумма этих средств не может быть больше, чем количество начальных средств Ко, по- этому фазовое пространство — это часть плоскости ХОУ, заключен- ная внутри равнобедренного прямоугольного треугольника 405 с ка- тетами Ко (рис. 3.17). Так как в начале процесса распределения сумма средств в обеих отраслях равна Ко> то область начальных состояний So есть не что иное, как гипотенуза треугольника АВ. На количество средств в конце пе- риода т лет никаких ограничений, кроме 0 «С X „ + Y.a < Ко, не накла- дывается; поэтому областью S конечных состояний системы яв- ляется весь треугольник 40В (кроме гипотенузы). 145-
Изобразим траекторию точки S в фазовом пространстве (рис. 3.18). Представим себе, что в начале каждого года происходит распре- деление (или перераспределение) средств по отраслям, а в течение го- да вложенные средства тратятся и образуется доход. Тогда каждое звено траектории точки 5 в фазовом пространстве будет состоять из двух полузвеньев: на первом происходит только перераспределение средств и точка S перемещается параллельно АВ, на втором — средст- ва тратятся и точка S перемещается вниз и налево, ближе к началу координат. Исключение составляет только первый шаг, для которого первое полузвено отсутствует: сразу назначаются Хь Уь и начинает- ся трата средств. Сумма абсциссы и ординаты последней точки траек- тории представляет собой количество средств Кч>, которое сохра- нится к концу периода при данном управлении. 5. ПРИМЕР РЕШЕНИЯ ЗАДАЧИ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ Пример. Планируется деятельность двух отраслей производства 1 и II сроком на 5 лет (т = 5). Заданы «функции дохода»: f(X) = l-e-*; §(У) = 1—е-2У и «функции траты»: ср(Х)=0,75Х; ф (У) =0,3 Y. Требуется распределить имеющиеся средства в размере Хо = 2 (условных единиц) между отраслями I и II по годам, исходя из условия максимума дохода. Решение. В соответствии с общей схемой, приведенной в § 4, получаем: 1. Как в п. 1 общей схемы. 146
2. Выигрыш на t-м шаге: wt (К, Хг) = 1 -е-*/+ 1 _е-2(*"**) = 2-(e~xt + е~2 <К~ХЛ). 3. Под Влиянием управления Xt (вложения средств Xt в отрасль I, a Yi = К — Xt в отрасль II ) система на t-м шаге перейдет из со- стояния К в К'=0,75 Xt +0,3 (К —Xt). 4. Основное функциональное уравнение: Wt(K) = max {2 — [е-Л‘-|-е_2(х_х^] 4- о<х. <к + Wi+ , (0,75Хг + 0,3(К-Хг))|- Условное оптимальное управление на t'-м шаге — то, при кото- ром достигается этот максимум. 5. Условный оптимальный выигрыш на последнем шаге: Г6(К)= max {зу5(Л, Х6)} = о<х„<к = max {2—[e_x»-|-e_2<^'Л’,]}. о<х,<к Найдем этот максимум. При фиксированном К выражение, стоящее в фигурных скобках, есть функция аргумента Хь, выпуклая вверх. В зависимости от зна- чения К максимум этой функции может достигаться либо внутри от- резка (О, К) (рис. 3.19), либо на левом его конце (рис. 3.20). Чтобы найти этот максимум, продифференцируем выражение Х5) = 2 —[е-А» + е~2(/<-А‘)] при фиксированном /С по Х6 и приравняем производную нулю = е~*» — 2е-2<к-А‘) = 0. (5.1) дХ> 147
На данном (пятом) шаге нам еще удастся решить уравнение (5.1) в буквенном виде, на дальнейших шагах такие задачи придется решать численно (графически). Из (5.1) имеем: —Xs = ln2—2К |-2Х5; (5.2) Х6 = (2К — 1п2)/3. ' (5.3) Отсюда следует, что если К >(1п 2)/2 а? 0,347, ю максимум достигает- ся внутри отрезка (0, К) в точке х6(К) — (2К — 1п 2)/3, если же К < (In 2)/2 « 0,347, то максимум достигается в конце отрезка- х6(К)=0. Таким образом, условное оптимальное управление на последнем (пятом) шаге найдено: если мы подошли к этому шагу с запасом средств К (1л 2)/2, то из этих средств следует выделить в отрасль I долю (5.3); если же мы подошли к пятому шагу с запасом средств, меньшим, чем (1п2)/2, то все эти средства надо отдать в отрасль II. Как же быть, если мы подойдем к пятому шагу с запасом средств, в точности равным (1п 2)/2? Очевидно, в этом случае оба управления указывают одно и то же, а именно: выделять средств в отрасль I не нужно. Запишем най- денное условное оптимальное управление на пятом шаге в виде фор- мулы [ 0 при Хб(К) = 1(2К-1п2)/3 при К > (1п2)/2. (5.4) Найдем теперь условный оптимальный выигрыш (доход) на пятом шаге, который получится при таком управлении: (К) = 2 —{е-х‘ W -|-е-I 2£К-* <X>J}, или, подставляя сюда выражения (5.4): I —е~2Л 9 2 —1'^2 е~~ К 2 при К С (In 2)/2, при К >(1п 2)/2. Так как нам в дальнейшем придется вычислять величину U^5(K) для разных значений аргумента, построим ее график в зависимости от К (рис. 3.21). На том же графике, но в другом масштабе, изобразим зависимость от К условного оптимального управления х6(К). Вторая кривая пред- ставляет собой ломаную линию, которая до К = (1п 2)/2 идет по оси абсцисс, а после этой точки возрастает линейно. Построением этого графика заканчиваются все процедуры, свя- занные с оптимизацией последнего шага. 6. Переходим к предпоследнему (четвертому) шагу. Задачу его условной оптимизации будем решать численно, задаваясь рядом значений К (количества средств, Оставшихся после третьего шага). Чтобы не делать лишней работы, выясним, в каких пределах может на ходиться К- Найдем самое большое из возможных значений К. Оно 148
будет получено, если на первых трех шагах все средства будут вложе- ны в отрасль 1, где траты минимальны; тогда после трех лет получим: К,иох =К0-0,753 = 0,844. Наименьшее значение К получится, если на первых трех шагах все средства будут вложены в отрасль II: ' Km;n = Ко-0,33=о,054. На участке 0,054 -? 0,844 заключены все возможные значения К. Назначим на этом участке несколько опорных значений К: К = 0,1; 0,2; 0,3; 0,4; 0,5; 0,6; 0,7; 0,8 и для каждого из них найдем услов- Рис. 3.21 Рис. 3.22 ное оптимальное управление на четвертом шаге xt(K) и условный мак- симальный доход на двух последних шагах IF4(K). Для этого построим серию кривых, изображающих «полуоптимальный» выигрыш Wi на двух последних шагах (при любом управлении на четвертом шаге и при оптимальном — на пятом): (К, Х4) = ю4 (К, К4) + U76 (0,75Х4 + 0,3 (K-XJ), где первое слагаемое wi(K, Х4) = 2 — |e~x«4-e—а второе слагаемое Wb определяется по графику рис. 5.3, для чего нужно войти в него вместо К с аргументом К' ~ 0,75Х4 + 0,3(К—Х4). Кривые зависимости IF4 от Х4 (при заданном К) для шестого шага представлены на рис. 3.22. Найдем на каждой из кривых точку с максимальной ординатой и пометим ее кружком. Ордината такой точки представляет собой ус- ловный максимальный доход на двух последних шагах IF4(K), а абс- цисса — условное оптимальное управление х4(К). Определив эти ве- личины для каждого значения К =0,1; 0,2; . . . ; 0,8, построим графики зависимостей и х4(К) для четвертого шага (рис. 3.23). 149
Далее переходим к оптимизации третьего шага. Для него возмож- ные значения К находятся в пределах от 2-0,32 = 0,18 до 2-0,752 = = 1,12. Снова зададимся рядом опорных значений К ' К = 0,3; 0,5; 0,7; 0,9; 1,1 и для каждого из них вычислим доход на третьем шаге в зависимости от К и управления Х3: w3 (К, Х3) =2 — [е-*« 4-е-2 <«-*•>]. Затем прибавим к нему уже оптимизированный доход на двух последних шагах й^4, который мы определим по графику рис. 3.21, входя в него вместо К аргументом К' = 0,75 Х3-|-0,3 (К — Х3), и получим «полуоптимальный» выигрыш на трех последних шагах (при оптимальном управлении на двух последних и любом управлении — на третьем шаге) Ws (К, Х3) = w3 (К, Х3) 4. IF4 (0,75 Х3 4- 0,3 (X —Х3)). Для этой функции опять построим графики зависимостей от Х3 при фиксированном К- На каждой из кривых снова отметим мак- симум (рис. 3.24). После этого построим на одном графике (рис. 3.25) две кривые: условное оптимальное управление х3(Х) и условный оп- тимальный выигрыш №7з(Х). 150
Совершенно аналогично решается задача оптимизации второго шага. Варьируются значения /< от 2-0,3 = 0,6 до 2-0,75 = 1,5: К ~ 0,6; 0,9; 1,2; 1,5. Определяется доход на втором шаге: ю2 (К. Х2) =2 — [е~х- + е-2(к-х.)]. К нему прибавляется условный максимальный доход 1Г3(К'), опреде- ляемый по графику рис. 3.25 со входом /С = 0,75 Х2+ 0,3 (Л— Х2). Получается величина U72, для которой снова строятся графики (рис. 3.26). На каждой кривой находится максимум и строятся две кривые: х2(К) и 1Г2(К) (рис. 3.27). Осталось оптимизировать один только первый шаг. Это — уже более легкая задача, так как начальное состояние системы Ко — 2 нам известно и, значит, не должно варьироваться. Поэтому для первого шага строится только одна кривая зависимости Кг) от Xj при известном Ко (рис. 3.28), где (/<о, Кх) = юг (Ко, ^) 4- (К') = = 2—[е-^ 4- е-2 (хо-х,)] + а последний член находится по графику рис. 3.27 при входе в него с ар- гументом К' — 0,75Хг + О,3(Ко — Кг), где Ко = 2. Определяя на единственной кривой (см. рис. 3.28) максимум, най- дем окончательное (уже не условное) значение максимального дохода за все пять лет: Wmax = Гг(2) =4,35 и соответствующее ему безусловное оптимальное управление на первом шаге: *1 = 1,6. 151
6. После того, как процесс построения условных оптимальных управлений и выигрышей закончен, надо провести вторую стадию оп- тимизации, проходя, шаг за шагом, процесс управления от первого шага до последнего по цепочке: х4 -> К1 -> х2 -> К 2 -> xs -> К з -> х4 К < -> х5 -> К в. Зная х4 = 1,6, находим запас средств после первого шага: /<; =0,75^ 4-0,3 (Ко— х1) = 1,32. Войдя с этим значением К\ в график х2(/С) на рис. 3.27, находим оптимальное управление на втором шаге: Рис. 3.28 х2 = 1,02. Остаток средств после второго шага будет: Kz = 0,75 x2-j-0,3(К* —х2) =0,86. С этим значением К*2 входим в график х3(/С) (см. рис. 3.25) и находим оптимальное упра- вление на третьем шаге х3 = 0,62. Остаток средств после третьего шага: Кз = 0,75х3 + 0,3 (/<*2 -х8) = 0,54. По графику рис. 3.23 находим оптимальное управление на четвер- том шаге х4 = 0,30. Остаток средств после четвертого шага: К* = 0,75 х4 0,3 (Л|—х4) = 0,30. С этим значением К\ входим в график х5(К) (см. рис. 3.21) и находим оптимальное управление на последнем шаге х6 = 0. Итак, планирование закончено: найдено оптимальное управление, указывающее, сколько средств при начальном их запасе Ко = 2 нуж- но вкладывать в отрасль I по годам. Это управление будет: х = (1,60; 1,02; 0,62; 0,30; 0). Учитывая, что наличные средства перед началом каждого года известны и равны: Ко=2; К* = 1,32; /^ = 0,86; Кз = 0,54; ^ = 0,30, сразу же находим и количества средств, вкладываемых в отрасль II по годам: у = (0,40; 0,30; 0,24; 0,24; 0,30). Таким образом, можно сформулировать следующие рекомендации по вложению средств. Из имеющегося в начале запаса Ко = 2 и оста- 152
юшихся средств в конце каждого года нужно вкладывать по годам в от- расли 1 и И следующие суммы: трасли Год i 2 3 4 S 1 1,60 1,02 0,62 0,30 0 11 0,40 0,30 0,24 0,24 0,30 При таком распределении средств за пять лет будет получен мак- симальный доход, равный №тОх = 4,35. Остаток средств в конце периода будет равен: 0,3-0,30 — 0,09. Рис. 3.29 На рис. 3.29 изображена оптимальная траектория в фазовом пространстве (каждый этап, кроме первого, разделен на полуэтапы). Из рассмотренного примера видно, насколько сложной и кропот- ливой является пошаговая оптимизация «вручную», даже для наиболее элементарных задач (только две отрасли производства; простейшие «функции дохода» и «функции трат»). При сколько-нибудь более слож- ных условиях разработка оптимального плана методом динамического программирования практически невозможна без привлечения быстро- действующих ЭЦВМ, 153
6. ДРУГИЕ ЗАДАЧИ РАСПРЕДЕЛЕНИЯ РЕСУРСОВ Задача распределения ресурсов имеет много вариантов. Некоторые из них сравнительно мало отличаются от простейшей задачи, рассмот- ренной в §§ 4 и 5, другие настолько непохожи на нее по своей словесной формулировке, что иной раз трудно уловить в них общие черты. Здесь и в следующем параграфе мы приведем несколько примеров подобных задач. 1. Распределение ресурсов по неоднородным этапам В задаче, рассмотренной в § 4, этапы были однородными в том смысле, что «функции дохода» /(X), g(Y) и «функции траты» ф(Х), ф(У) были одинаковыми для всех шагов. Может оказаться, что они меняют- ся от шага к шагу, а именно для t-го шага они равны: h(X), ФДХ), (У)1 (i = l, 2, т). В этом случае стандартная схема решения задачи почти не меняет- ся. Основное функциональное уравнение принимает вид Wt(K)= max (*,) + £/(К-*;) + + Г(+1(фг (Х;) + Фг (К-Хг))). Условие оптимизации m-ro шага будет: Wm(K)= max [fm(Xm)+gm(K-Xm)}, 0<хт^к а во всем остальном процедура построения решения останется неиз- менной. 2. Задана о резервировании ресурсов Имеется всего одна отрасль производства и некоторый запас средств Ко, который можно вкладывать в производство не целиком, а частично резервировать. Если на i-м шаге в производство вложены средства X, то они дают доход /г(Х) и уменьшаются до <рг(Х). Требуется рационально распределить имеющиеся и остающиеся средства на т шагов так, чтобы суммарный доход за все т шагов был максимален. Нетрудно видеть, что эта задача сводится к предыдущей Дейст- вительно, резервированные средства можно считать вложенными в ка- 154
кую-то фиктивную вторую отрасль, где они не тратятся, но и не дают дохода: ^(У) = 0; фДГ) = У М..........m). С учетом этого условия задача решается совершенно так же, как зада- ча распределения ресурсов по неоднородным этапам. Геометрическая интерпретация задачи в фазовом пространстве показана на рис. 3.30. Рассмотрим частный случай задачи о резервировании ресурсов, когда на всех этапах tp( (X) — 0 (Z = 1, т), т. е. вложенные средства расходуются целиком (рис. 3.31). Так как средства тратятся целиком, то каждый горизонтальный участок траек- тории доходит до самой оси ординат. Поставленная задача сводится к отысканию максимума функции т аргументов (Хь Х2, .... Хт): т где Х2, Хт неотрицательны и ограничены условием: т 2W, (6.1) I— 1 Если доход Л(Х) (как это естественно предполагать) представляет собой неубывающую функцию вложенных средств X, то знак неравен- ства в формуле (6.1) можно отбросить, так как в этих условиях расхо- довать средства не до конца невыгодно. Заметим, что некоторые простейшие задачи резервирования ре- сурсов допускают элементарное решение и без метода динамического 155
программирования. К ним принадлежит, например, простейший чай, когда «функция дохода» на всех этапах одна и та же: (,(Х) = )2(Х)= ... = fm(X) = f(X) и средства расходуются полностью: Ф1(Х)==фДХ)= ... слу- вниз один Нетрудно убедиться, что если функция дохода выпукла (рис. 3.22), то выгоднее всего вложить все средства в какой-то этап, а в остальные не вкладывать. Если же.функция дохода выпукла вверх (рис. 3.33), то максимум дохода достигается при равномерном распределении средств между этапами: хг = х2 = ... = хт — KJm. 3. Задача распределения ресурсов между тремя и более отраслями Предположим, что в условиях задачи § 4 ресурсы распределяются не между двумя отраслями (I и II), а между несколькими: 1, II, .... (н). причем для каждой (/-й) отрасли заданы: «функция ^дохода» /г(/)(Х), выражающая доход, приносимый средствами X, вложенными на i-м году в /-ю отрасль, и «функция траты» <рг(,)(Х) < X, показывающая, насколько убывают средства X, вложенные на i-м году в /-ю отрасль. Задача отличается от рассмотренной в пунк- те 1 данного параграфа только размерностью (числом параметров, определяющих состояние системы). Например, для трех отраслей I, II и III фазовое пространство показано на рис. 3.34. Для случая более чем трех отраслей геомет- рическая интерпретация теряет наглядность, но сущность задачи ос- тается такой же. Состояние системы будет определяться уже не парой чисел X, Y, а п числами Х‘”, Х<2>, ..., Х<«>, обозначающими вложения в каждую из отраслей Процесс распреде- ления средств, как и в двумерном случае может быть разделен на этапы 156
и произведена сначала условная оптимизация (от конца к началу), а потом — безусловная( от начала к концу). Состояние системы перед началом каждого шага по-прежнему будет характеризоваться суммой средств, подлежащих распределению, т. е. одним числом /(. Сложнее будет обстоять дело с управлением. Управление на z-м шаге будет состоять в выделении средств не в одну отрасль, а в п от- раслей: п— 1 хд\ л/2»......2 х/'>. Придется находить максимум функции нескольких переменных. При числе отраслей п > 3 задача оптимизации становится очень громозд- кой и без помощи ЭВМ вряд ли может быть решена. 7. РАСПРЕДЕЛЕНИЕ РЕСУРСОВ СО ВЛОЖЕНИЕМ ДОХОДОВ В ПРОИЗВОДСТВО До сих пор в задачах о распределении ресурсов мы рассматривали «доход», приносимый предприятиями, совершенно независимо от рас- пределяемых средств; он даже мог выражаться в других единицах (например, ресурсы — в человеко-часах, а доход — в рублях). Теперь мы рассмотрим случай, когда доход вкладывается в производство (пол- ностью или частично). Разумеется, для этого доход и средства должны быть приведены к единому (денежному) эквиваленту. Задача о распределении ресурсов со вложением доходов в произ- водство может ставиться по-разному, в зависимости от того, вклады- вается доход полностью или частично и какая величина максимизи- руется. Ниже приводится ряд задач, в каждой из которых идет речь о рас- пределении ресурсов по двум отраслям производства со вложением (полным или частичным) доходов в производство, при разных целевых функциях. 1. Доход вкладывается в производство полностью, максимизирует- ся сумма всех средств (основные плюс доход) после т-го этапа. В этом случае выигрыш W представляет собой сумму всех средств, сохранившихся в обеих отраслях после завершения последнего этапа, плюс доход, данный обеими отраслями на последнем этапе. Весь этот выигрыш приобретается только на одном, последнем этапе, но он представляет собой частный случай аддитивного показателя эффективности, для которого т /= । если считать, что выигрыши на всех этапах, кроме последнего, равны нулю te»1 = ay2 = ••• =аУт=1=0; wm = W. 157
Так как всче средства (и основные и Доход) вкладываются в произ- водство на равных основаниях, нет надобности рассматривать отдельно «функции дохода» и «функции траты», а достаточно ввести для каждой отрасли только по одной функции: для отрасли I — функцию F t(X), показывающую, сколько средств (включая и доход) получится в конце t-го шага в отрасли 1 при вложении в нее средств X в начале этого ша- га. Аналогичная функция для отрасли II будетСг(У). Назовем функции ^(Х), бг(П «функциями изменения средств» на z-м этапе. Заметим, что вообще воз- можно любое из соотношений: ^(Х)>Х; Лг(Х)<Х; Ff(X)=X (аналогично для бг(У)). Рассмотрим фазовое прост- ранство, соответствующее дан- ной задаче (рис. 3.35). Таким пространством будет уже не треугольник AQB (как в зада- чах без вложения доходов), а весь первый квадрант XW (средства могут не только умень- шаться, но и расти). Траекто- рия по-прежнему состоит из ря- да звеньев, распадающихся на полузвенья; первое полузвено (для всех этапов, кроме перво- Рис 335 го) изображает перераспределе- “ ’ ' ние средств (точка S движется параллельно АВ), второе — трату и приобретени средств (точка S может двигаться в любом на- правлении). В отличие от ранее рассмотренных задач, здесь доход приносит только одно, последнее, звено, которое на рис. 3.35 выделе- но жирной стрелкой. В данном случае значение показателя W непосредственно видно на чертеже — это сумма абсциссы и ординаты точки Sm, изображающей конечное состояние системы. Задача оптимального управления: вы- вести точку на прямую АШВШ, параллельную АВ и наиболее уда- ленную от начала координат. Значение выигрыша для любой траекто- рии в фазовом пространстве представляет собой каждый из отрезков, отсекаемый прямой АаВа на осях координат. Построим схему решения этой задачи методом динамического про- граммирования, без подробных словесных объяснений (по образцу предыдущих задач). На функции FAX) и GAY) пока не будем накла- дывать никаких ограничений. Выигрыш на всех шагах, кроме последнего, равен нулю, поэтому не будем его записывать. На последнем же шаге он выражается 158
формулой: wm (К, Хт) = Fm (Хт) + Gm (К -Хп), (7.1) где /< — средства, с которыми мы подошли к последнему шагу. Основное функциональное уравнение динамического программи- рования будет: Гг(Л)= max [Гг+1(Л'(^) + Сг(/<-Хг.))), (7.2) О где К — средства, с которыми мы подошли к t-му шагу. На последнем шаге получаем условный оптимальный выигрыш, равный Wm(K) = max (Fm(Xm)-)-Gm(K—Хт)}, (7.3) о<х„ <к и условное оптимальное управление, при котором этот выигрыш до стигается: хт(К). Далее , по формуле (7.2) находим все условные выигрыши и услов- ные оптимальные управления на всех шагах, начиная с последнего, после чего процесс проходит в прямом направлении и определяются безусловные оптимальные управления на каждом шаге. Такова схема решения задачи методом динамического программи- рования при любом виде функций изменения средств Ft(X), G,(Y). Однако, если на эти функции наложить некоторые (очень естественные) ограничения, схема может быть сильно упрощена. Предположим, что все функции F^X), Gt(Y) представляют собой неубывающие функции своих аргументов, т. е. при увеличении коли- чества вложенных средств сумма дохода и оставшихся средств к концу этапа не может уменьшиться. Покажем, что при этом условный оптимальный выигрыш есть неубывающая функция от исхода каждого из предыдущих шагов, т. е. от суммы средств в его конце. Действительно, пусть исход какого-то, скажем, (i — 1)-го шага (сумма средств в его конце) равен Ki—i- Рассмотрим оптимальный выи- грыш при этом условии как функцию v Так как выигрыш приоб- ретается только на последнем шаге, то безразлично, рассматривать ли этот выигрыш за все шаги, или только за последний шаг, или за все шаги начиная с t-го. Выберем последнее: рассмотрим оптимальный выигрыш W за все шаги начиная с z-го, как функцию Ki—р Wt(K,-t). (7.4) Нужно доказать, что эта функция — неубывающая. Доказатель- ство будем вести методом полной индукции, но не от i к i -j-1, а, наобо- рот, от i 1 к I. Предположим, что доказываемое свойство справедли- во для i + 1, т. е. Wi+dKi) (7.5) есть неубывающая функция своего аргумента Kt (суммы средств в конце z-ro шага). Докажем, что тогда неубывающей функцией будет и (7.4). Действительно, согласно уравнению (7.2) (где К^ обозначено 159
просто К) функция Wt(Kt—i) представляет собой максимум выраже- ния Wl+ , (Гг (Хг) + G; (Ki-! —Xz)) (7.6) Покажем, что (7.6) есть неубывающая функция от Kt-i, тогда будет ясно, что и ее максимальное значение W^Kt-d с увеличением Кг_, убывать не может. Зафиксируем какое-то значение Kt-i- Пусть для этого значения выражение (7.6) достигает максимума по Xt, равного W^Kt-i), при определенном управлении х,. Придадим теперь величине Хг_, не- которое, положительное приращение AKt-i. У нас образовался не- который избыток средств, который мы можем вложить дополнительно либо в отрасль I, либо в отрасль II, либо в обе сразу. Так как функции Ft(X), G;(Y) неубывающие, то от такого «добавления» средств каждое слагаемое под знаком функции (7.6) может только увеличить- ся, а значит, и их сумма может только увеличиться, а не стать мень- ше. Что при этом станет с функцией (7.6)? Согласно нашему допущению, функция — неубывающая, значит, при увеличении Kt—i вы- ражение (7.6) уменьшиться не может. Итак, переход от i + 1 к i дока- зан. Покажем теперь, что наше свойство справедливо для последнего шага (i + 1 = т). Это доказывается просто. По формуле (7.3) выигрыш на т-м шаге при оптимальном управлении представляет собой макси- мум выражения Fm^m) + Gm(K,n-i-Xm) и, естественно, является неубывающей функцией от Km-i (это только что было доказано для любого i, а значит, и для i = т). Таким обра- зом, Wm(Km-i) есть неубывающая функция Кт-\, а значит, согласно принципу полной индукции, и любой из выгрышей Wi (Ki-i) — неубы- вающая функция, что и требовалось доказать. Из доказанного вытекают очень простые рекомендации по опти- мальному управлению. Действительно, если окончательный оптималь- ный выигрыш есть неубывающая функция от общей суммы средств, реализуемой на исходе каждого шага, то оптимальное управление со- стоит в том, чтобы в результате каждого шага получать максималь- ное значение этой суммы средств. Значит, управление каждым отдель- ным шагом можно выбирать исходя из интересов этого отдельного шага, не учитывая остальных. Эта особенность поставленной задачи приводит к тому, что процесс планирования сильно упрощается. Нет уже надобности в сложной про- цедуре нахождения условных оптимальных выигрышей и условных оптимальных управлений — для каждого шага, начиная с первого, сразу находится безусловное оптимальное управление. На первом шаге нужно выбрать то управление х1( при котором обращается в максимум Ki — сумма средств после первого шага: Ki = max (Л№) ( Gi(/<o—Хх)}. О /С» 160 На втором — то управление, при котором обращается в максимум величина F2(X2) + G2(Ki — Х2): /<2= max {F2(X2)+G2(K*-X)}, 0<Х2 и т. дГдо Кт-\- Максимальный выигрыш на m-м шаге будет равен: Wm= max {Fm (Xm)4-Gm(X,*-i—Xm)). Таким образом, при неубывающих функциях Ft(X), Gt(Y) постав- ленная задача распределения ресурсов только внешне похожа на за- дачу динамического программирования, а по существу — гораздо про- ще ее. Подобные вырожденные задачи динамического программирования, где оптимальное управление состоит в простой оптимизации каждого шага, нередко встречаются на практике. Если, не обратив внимания на такую их особенность, решать их все же методом динамического программирования, решение, разумеется, будет верным, но потребует во много раз больше времени, чем если бы сразу учесть их вырож- денность. 2. Доход вкладывается в производство полностью на всех этапах, кроме последнего; максимизируется доход на последнем шаге. Задача отличается от рассмотренной выше тем, что максимизи- руется не сумма оставшихся средств плюс доход на последнем шаге, а только один доход на последнем шаге, независимо от того, сколько средств сохранилось от первоначально вложенных. Для того, чтобы отделить сумму оставшихся средств от дохода, нужно для последнего шага задать не функции изменения средств, а по отдельности «функции дохода» fm(X), gm(Y) и «функции траты» фт(Х), Фт(^)- Легко убедиться, что задача так поставленная, сводится к пре- дыдущей. Действительно, полагая на последнем шаге Fm(X) — fm(X); Gm(Y)=gm(Y), получаем условия п. 1. Естественно, что если все функции Ft(X), Gt(Y) (i = 1, ..., m) — неубывающие, данная задача, как и предыдущая, будет вырожденной. 3. Доход вкладывается в производство не полностью, а какая-то часть его отчисляется; максимизируется полный отчисленный доход на всех этапах плюс остаток средств после т-го этапа. Для решения этой задачи должны быть заданы «функции дохода»: П(Х), gi(Y) (i = l,...,m), «функции траты»: Фг(Х)<Х; ^(Y)^Y (i=l............ m), и еще, дополнительно, «функции отчислений»: /ДП)^£> (i = l, .... m), 6 Зак. 573 161
показывающие, какая часть дохода D, полученного на i-м шаге, не вкладывается в производство на следующем (i + 1)-м шаге, а отчис- ляется. Наметим схему решения задачи методом динамического програм- мирования. Состояние системы перед началом z-ro шага будем характе- ризовать количеством средств X, подлежащих распределению; оно получается из исхода предыдущего шага путем отчисления определен- ной доли дохода. Выигрыш на z-м шаге будет wt Xt) = г; (fг (Хг)+§г (X -Хг)). Управление X, на i-м шаге (вложение средств Х( в отрасль I, а ос- тальных средств — в отрасль II) переводит систему из состояния К в новое состояние: Х' = Фг(Х;) + фг(Х-Х0+Гг(Хг) + (х -ха-с- а- (ха+gi (х-хг)). Основное функциональное уравнение: Wi (К) + + + W, +, (Ф/ (Хг) + фг (X -Хг) + ft (Хг) + +gi (к -xj+rs (jt (хг)+gi (к -ха))}. Условный оптимальный выигрыш на т-м шаге: Wm(K)= max {UXj+gUX-XJ-Wm(Xj + WX-Xm)}. о<хт<к / В остальном схема динамического программирования остается той же, как и раньше, для невырожденных задач распределения ре- сурсов. Рекомендуем читателю в качестве упражнения набросать схемы решения следующих задач распределения ресурсов. 4. Доход вкладывается в производство не полностью, а частично', максимизируется только полный отчисленный доход за все т шагов, без учета оставшихся средств. 5. Доход вкладывается в производство не полностью, а частично', максимизируется суммарное количество средств (основные плюс доход) после т-го шага, без учета ранее отчисленных сумм. Не будет ли какая-нибудь из этих задач при некоторых условиях вырожденной? *в2
8. РЕШЕНИЕ ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ С УЧЕТОМ ПРЕДЫСТОРИИ ПРОЦЕССА Все задачи динамического программирования, которые мы до сих пор рассматривали, отличались следующей особенностью: «доход» wt на каждом z-м шаге и максимальный доход W начиная с Z-ro шага и далее зависели только от состояния S системы S перед данным, Z-м шагом и от примененного управления U h но не зависели от того, ка- ким образом (каким путем) система пришла в состояние S, т. е. в ре- зультате каких управлений, когда и как это произошло. Другими сло- вами, задачу оптимизации управления на каждом (Z-м) шаге мы реша- ли с учетом настоящего состояния S, но без учета предысто- рии процесса. Например, решая задачу распределения ресурсов между двумя (или более) отраслями производства, мы в качестве характеристики состояния системы перед каждым шагом брали одну величину — имею- щиеся в нашем распоряжении средства К; нам совершенно не было дела до того, когда и как система пришла в это состояние, т. е. как рас- пределялись средства между отраслями на всех предыдущих этапах. Важно было только количество средств К, с которым мы пришли к оче- редному шагу. Во многих задачах динамического программирования эта «неза- висимость от предыстории» не имеет места. Например, доход на Z-m шаге может зависеть не только от количества средств, вложенного в каждую отрасль на данном шаге, а еще и от того, какие средст- ва и на каких шагах вкладывались в нее ранее. Теоретически всегда можно учесть предысторию процесса с по- мощью следующего приема: включить в число фазовых координат, ха- рактеризующих состояние S системы S перед данным шагом, все те параметры из прошлого, от которых зависит будущее. Например, если доход на Z-м шаге зависит не только от вложенных средств Xt, но и от ранее вложенных средств Z, можно характеризо- вать состояние системы перед Z-м шагом не просто имеющимся в нашем распоряжении запасом средств К, а совокупностью (К, Z), где Z — ранее вложенные средства. Если существенна не только общая сумма ранее вложенных средств, но и когда именно и сколько средств вкладывалось — в прин- ципе можно «обогатить» состояние S и этими сведениями из прошло- го. Таким образом, теоретически всегда можно ввести в число парамет- ров, характеризующих состояние системы в настоящий момент, сколь- ко угодно параметров из «прошлого». Однако, на практике такое «обо- гащение» фазового пространства быстро приводит к необозримо слож- ной схеме динамического программирования, настолько сложной, что самый метод перестает быть пригодным. Ведь главная идея динами- ческого программирования: «вместо того, чтобы один раз решать сложную задачу, много раз решать сравнительно простую» перестает себя оправдывать, если «простая» задача перестает быть «простой». 6* 163
Поэтому попытки решать методом динамического программиро- вания задачи со сложным влиянием «предыстории» обычно ни к чему хорошему не приводят. Однако, если влияние «предыстории» может быть учтено с помощью небольшого числа параметров (одного, двух, трех), иногда удается построить сравнительно простую схему динамического программиро- вания и решить задачу оптимизации. В качестве примера задачи «с предысторией» рассмотрим задачу о профилактическом ремонте техники. Задача ставится следующим образом. Имеется техническое устройство S, эксплуатируемое в течение т лет. Эксплуатационные расходы зависят от следующих факторов: — от «возраста» устройства t, т. е. количества лет, протекшего со времени ввода его в эксплуатацию; — от количества профилактических ремонтов k, произведенных до момента t; — от количества лет т, протекшего со времени последнего профи- лактического ремонта*». Предположим, что профилактический ремонт производится (если производится) мгновенно и в начале года. Естественно предположить, что затраты на этот ремонт (стоимость ремонта) зависят от тех же ар- гументов t, k и т, что и эксплуатационные расходы. Мы хотим так распределить профилактические ремонты по годам, чтобы сумма общих затрат (эксплуатационные расходы плюс расходы на ремонт, если он производился) достигали минимума. Поставленная задача может быть решена методом динамического программирования, если характеризовать состояние системы (техни- ческого устройства 5) к началу каждого шага тремя фазовыми.коорди- натами: t — «возрастом» системы, k — количеством ремонтов в прош- лом ит — временем, протекшим с момента последнего ремонта. Чтобы решить задачу оптимизации управления, нужно задать- как эксплуатационные расходы, так и расходы на ремонт в функции от этих фазовых координат. Введем следующие обозначения. Эо(/) — стоимость эксплуатации устройства за год, начинающийся в момент /, если до момента t никакого ремонта не производилось; Эх(/, т) — стоимость эксплуатации устройства за год, начинаю- щийся в момент I, если до момента t производился один ремонт, и со времени этого ремонта прошло т лет; и вообще Эй(/, т) — стоимость эксплуатации устройства за один год, начи- нающийся в момент t, если до момента t производилось k ремонтов, и со времени последнего из них прошло т лет. *) Строго говоря, эксплуатационные расходы зависят не только от времени т, прошедшего после последнего ремонта, но и от сроков предыдущих k ремонтов; но эта зависимость слаба, и ее можно не учитывать. 164
R0(t) — стоимость ремонта, производимого в момент t, если до момента t никакого ремонта не производилось; /?!.(/, т) — стоимость ремонта, производимого в момент t, если до момента t производился один ремонт, и со времени этого ремонта прош- ло т лет; и вообще Rk((, т) — стоимость ремонта, производимого в момент t, если до момента t производилось k ремонтов, и со времени последнего из них прошло т лет. Будем изображать состояние технического устройства S точкой S в фазовом пространстве; по одной раст» устройства — время /, по другой — время т, протекшее с момента последнего ремонта, по третьей — количество ремонтов k (рис. 3.36). Так как при всех условиях т < t и k < t, то все возможные состояния системы будут изображаться точками внутри трехгранного угла QAIB. Если до момента t ремонта не было, точка S находится на оси 0/; если был один ре- монт — точка S находится в плоскости КО'L, параллельной /От и отстоящей от нее на рас- стояние 1, и т. д. Чтобы не пользоваться пространственной картиной, «расслоим» фазовое пространство на несколько частей, которые мы будем обозна- чать: (0), (1), (2)..........(k), ... Часть (0) фазового пространства представляет собой просто ось 0/; часть (1) — треугольник на плоскости КО'L, часть (2) — треуголь- ник на плоскости, параллельной /От и лежащей от нее на расстоянии 2 и т. д. С увеличением номера пространства размеры треугольников все время уменьшаются. Части фазового пространства (0), (1), (2), ..., (k), ... показаны на рис. 3.37. Перед началом каждого года у нас есть выбор между двумя уп- равлениями: U° — не делать ремонта (продолжать эксплуатировать устройст- во S). U1 — сделать ремонт (и после него продолжать эксплуатировать устройство). Посмотрим, какие перемещения в фазовом пространстве испыта- ет точка 5 под действием каждого управления. 165
Пусть точка S находится в пространстве (0) — на оси 01 в точке с координатой I (см. рис. 3.37). Под влиянием управления £/° (продол- жать эксплуатировать) она за год переместится в точку с абсциссой t 4- 1 на той же оси. Под влиянием управления U1 (сделать ремонт) она переместится в точку S' в пространстве (1) с координатами (t 1, 1). Вторая коор- дината т = 1, так как ремонт производится в начале года, т. е. за год до конца очередного шага. Теперь пусть точка S занимает какое-то положение в про- странстве (1). Управление U° (продолжать эксплуатировать) приведет к тому, что как t, так и т за один шаг увеличатся на одну едини цу, т. е. точка S переместится вверх и вправо (параллельно гипо- тенузе треугольника) в точку с координатами (t + 1, т -f- 1), если прежние координаты были (/, т). Если же мы применим управле- 166
ние IP (сделаем ремонт), точка переместится в пространство (2), в точ- ку S' с координатами (/ + 1, 1). Вообще, если точка S находится в пространстве (k) (k 1), то управление [7° перемещает ее на один шаг вправо и вверх, из точки с координатами (/, т) в точку с координатами (/ 4- 1, т -f- 1), а управ- ление U1 — в следующее по порядку пространство (k 4~ 1), в точку с координатами (/4-1, 1). Запишем правила перехода точки S в фазовом пространстве под влиянием управлений U° и IP в виде «таблицы преобразования» (см. табл. 8.1, первые пять столбцов). Таблица 8.1 Исходное положение Новое состояние Расход на данном шаге, начинающемся в момент t простран- ство координа- ты Управление простран- ство координаты (0) (/) U0 и1 (0) (1) (/+1) (/+1,1) Эо (/) ^(О+Э! (/, 0) (1) (1, Т) и° IP- (1) (2) (/-Н,т+1) (/+1,1) Э1 (/, Т) Я1(/, т)+Э2(/, 0) • • • • (*) (i, т) и0 и1 (*) (*+D (/4*1 ,т+1) (/+1,1) Эй (/, т) /?й(/,т)+ЭА+1(/,0) • • • • . . . Таким образом, нам ясно, как перемещается точка в фазовом пространстве под влиянием любого управления, т. е. мы знаем функ- цию S' = <p(S, t/), согласно которой меняется состояние системы под влиянием приме- ненного управления U (U = U°, LP). Теперь посмотрим, к какому «выигрышу» — расходу wt на дан- ном шаге приведет каждое управление. Если мы применим управле- ние U°, то на данном шаге мы будем иметь только эксплуатационные расходы; если управление IP — расходы на ремонт плюс эксплуата- ционные на ближайший год, но другие, чем если бы ремонта не было. Запишем эти расходы в той же табл. 8.1 в виде добавочного столбца. Пользуясь этой таблицей, мы можем теперь для любого состоя- ния системы S и любого управления (U° или IP), примененного в лю- бой момент /, найти: — куда переместится точка S под действием управления; — к какому расходу средств это приведет. После того, как такая таблица составлена, уже нетрудно органи- зовать самую процедуру оптимизации. Мы начнем, как всегда, с по- следнего шага, переберем все возможные состояния системы перед 167
этим шагом и для каждого из них найдем условное оптимальное уп- равление (U° или U1) на m-м шаге и условный оптимальный выигрыш (минимальный расход) на последнем шаге. Далее будем оптимизировать (т — 1)-й шаг, так чтобы он, в совокупности с уже оптимизирован- ным m-м, дал минимальный расход и т. д. Продемонстрируем эту методику на конкретном примере. Пример. Участок железнодорожного пути эксплуатируется в течение т—б лет. Эксплуатационные расходы за один год, начинающийся в момент t, (в условных единицах) выражены функциями: Эо((), 3r(t, т), Э2(/, т), Э3(/, т), Э4(/, т), Э6(/, т) (индекс — количество предшествующих ремонтов, т — коли- чество лет, протекшее с последнего ремонта пути). Стоимость ремонта задана функциями R0(t), Ri(t, т), R2(t, т), R3(t, т), R^t, т). Значения функций Эи/? приведены в табл. 8.2 и 8.3. Таблица 8.2 Функция t 0 2 3 4 5 э„ (О 1.9 2,5 3,1 4,0 5,1 6,6 э, (t, Т) / X —«ч 0 1 2 3 4 5 0 2,2 2,4 3,8 5,0 6,3 1 — — 2,5 3,9 5,1 6,4 2 — — — 4,0 5,1 6,5 3 — — — — 5,1 6,6 4 — — — — — 6,6 Эг (t, г) t X 0 I 2 3 4 4 б 0 2,3 3,7 4,8 5,5 1 — — — 3,8 4,9 5,7 2 — — — — 5,0 6,0 3 — — — — — 6,2 Э3 (/, г) X. / т 0 1 2 3 4 5 0 2,8 3,9 4,5 1 — — — — 4,0 ‘ 4,7 2 — — — — — 5,5 Э4 <J, т) 0 1 2 3 4 5 0 — — — — 3,5 4,2 1 — — — — — 4,5 Эз (t. г) f X 0 1 2 3 4 5 0 1 — — — — 3,8 168
Таблица 8.3 функция 1 2 3 4 5 R» (0 — 1,2 1,4 1,8 2,3 3,0 Ri (t, т) 1 1,2 1,4 1,9 2,4 2 —— — 1,5 2,0 2,5 3 — — — 2,1 - 2,6 4 — — — — 2,9 «г (/. 1 2 3 4 5 1 1,2 1,5 2,0 2 — —— — 1,6 2,1 3 — — — — 2,3 R, (1. г) 1 2 3 4 5 1 — — — 0,.8 1,1 2 — — — — 1,4 R, (/, г) 1 2 3 4 5 1 — — — 1,0 Таблица 8.4 Условная оптимизация шестого шага Про- странство Состояние систе- мы (координаты Г г) Расход при управлении Расход при уп- гравлении U1 Оптимальное управление Минималь- ный расход (0) 1=5 6,6 3,0+6,3=9,3 и» 6,6 (1) (5,1) 6,4 2,4+5,5=7,9 и° 6,4 (5,2) 6,5 2,5+5,5=8,0 и° 6,5 (5,3) 6,6 2,6+5,5=8,1 и° 6,6 (5,4) 6,6 2,9+5,5=8,4 и° 6,6 (2) (5,1) 5,7 2,0+4,5=6,5 и° 5,7 (5,2) 6,0 2,1+4,5=6,6 и0 6,0 (5,3) 6,2 2,3+4,5=6,8 и0 6,2 (3) (5,1) 4,7 1,1+4,2=5,3 и» 4,7 (5,2) 5,5 1,4+4,2=5,6 и° 5,5 (4) (5,1) 4,5 1,0+3,8=4,8 и° 4,5 169
Таблица 8.5 Условная оптимизация пятою шага 1 Прост- ранство Состояние системы (коорди- наты /. т) Расход при управ- лении 0° 1 Расход при управ- лении Ui Оптималь- ное уп- равление Мини- мальный расход (0) 1 = 4 5,14-6,6=11,7 2,3+5,0+6,4= 13,7 и0 11,7 (1) (4,1) (4,2) (4,3) 5,1+6,5=11,6 5,1+6,6=11,7 5,1+6,6=11,7 1,9+4,8+5,7=12,4 2,0+4,8+6,0=12,8 2,1+4,8+6,2=13,1 и° и° и0 Н,6 11,7 Н,7 (2) (4,1) (4,2) 4,9+6,0=10,9 5,0+6,2=11,2 1,5+3,9+4,7=10,1 1,6+3,9+4,7=10,2 и1 и1 10,1 10,2 (3) (4,1) 4,0+5,5=9,5 0,8+3,5+4,5=8,8 и1 8,8 Условная оптимизации четвертого шага (0) 1=3 4,0+11,7=15,7 1,8+3,8+11,6=17,2 и0 15,7 (1) (3,1) (3,2) 3,9+11,7=15,6 4,0+11,7=15,7 1,4+3,7+10,1 = 15,2 1,5+3,7+10,1=15,3 и1 и1 15,2 15,3 (2) (3,1) 3,8+10,2=14,0 1,2+2,8+8,8=12,8 и1 12,8 Условная оптимизация третьего шага (0) 1=2 3,1+15,7=18,8 1,4+2,4+15,2=19,0 I/O 18,8 (1) (2,1) 2,5+15,3=17,8 1,2+2,3+12,8=16,3 и1 16,3 Условная оптимизация второго шага (0) 1=1 2,5+18,8=21,3 1,2+2,2+16,3=19,7 и1 19,7 Оптимизация первого шага (0) 1=0 2,0+19,7=21,7 — и° 21,7 Решение. Пользуясь таблицами функций 8.2 и 8.3 и таблицей преобра- зования 8.1, развернем процесс динамического программирования. Как всегда, начнем с оптимизации последнего (шестого) шага. Все возможные состояния системы $ перед этим шагом будут изображаться точками с абсциссой t = 5 в пространствах (0), (1), (2), (3), (4) (см. рис. 3.38). Для шестого (последнего) шага оптимальным будет то управление (UQ или U1), при ко- тором расход на последнем шаге минимален. Расходы будем вычислять согласно последнему столбцу табл. 8.1. На рис. 3 38, кроме состояния системы, мы будем обозначать еще и оптимальное управление: U° будет обозначаться стрелкой, направленной вправо (в пространстве (0)) и вправо и вверх (в остальных про- странствах). Управление U1 , выводящее точку из данной части фазового про- странства и переводящее в следующую по порядку часть, будем изображать стрелкой, направленной вправо и вниз У каждой точки внутри кружка будем записывать минимальный расход на всех оставшихся шагах, соответствующий данному состоянию системы (условный оптимальный выигрыш). 170
Рис, 3.38 171
Расчеты, связанные с оптимизацией, будем оформлять в виде таблиц (см табл. 8.4 и 8.5 на стр 169, 170) Таким образом, оптимизация закончена Она привела нас к следующим выводам. Минимальный расход равен 21,7. Достигается он при следующем оптималь- ном управлении: и = (f/о, (/1, U\ U1, U°), т. е.: — на первом году участок эксплуатируется без ремонта; — в начале второго, третьего, четвертого и пятого годов производится ре- монт; — на шестом году участок эксплуатируется без ремонта. При этом расходы достигают минимума, равного 21,7 условных единиц*). 9. ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ, НЕ СВЯЗАННЫЕ СО ВРЕМЕНЕМ До сих пор мы рассматривали только такие задачи динамическо- го программирования, где планируемая операция развивалась во вре- мени и распадалась на ряд шагов (этапов), следующих друг за другом в естественном, временном порядке — от первого шага к последнему. Вообще, это не обязательно: разбиение на шаги или «этапирование» в задачах динамического программирования может быть произведено не по времени, а по любому другому признаку, например, по поряд- ковому номеру того или другого объекта. В качестве примера рассмотрим следующую задачу. Пусть имеется группа предприятий Пт, П2....Пга, (9.1) которые выпускают одну и ту же продукцию. В нашем распоряжении— какой-то запас средств Кд, который мы можем вложить в группу пред- приятий (9.1) с тем, чтобы произвести сверх плана максимальное ко- личество продукции. Предположим, что каждое предприятие может освоить только ограниченное количество средств, и fei, k2, .... km (9.2) представляют собой максимальные суммы, которые могут освоить соот- ветственно предприятия (9.1). Если в предприятие Пг вложены сред- ства X, оно даст <Рг(Х) единиц дополнительной (сверхплановой) про- дукции. Требуется так распределить имеющиеся средства между предприя- тиями, чтобы суммарный объем W дополнительной продукции был мак- симальным. Управление средствами состоит в том, что предприятиям выделяются соответственно средства: хи хг, .... хт, *) При анализе этого примера следует иметь в виду, что численные данные выбра- ны из методических соображений и ничего общего с реальностью не имеют. 172
не превосходящие в сумме имеющегося капитала Ко' I т / 2W0, г=1 р требуется найти оптимальное управление, при котором W = 2 wt = max, i=i где wt — дополнительная продукция z-ro предприятия. Поставленная задача легко решается методом динамического программирования; «этапом» процесса распределения средств явля- ется выделение средств z-му предприятию. Будем нумеровать этапы (шаги) в порядке номеров предприятий (т. е. в произвольном порядке). Предположим, что средства предприя- тиям Пп ..., Пет__] уже выделены, и к последнему, m-му шагу мы приш- ли с каким-то запасом средств К. Очевидно, оптимальное управление на последнем шаге состоит в том, чтобы выделить m-му предприятию все оставшиеся средства К, если они не превосходят km, и максимально возможное количество средств kmt, если К km. Таким образом, условное оптимальное управление на последнем шаге: К при К < km, km при К > km. При таком управлении максимальный доход на последнем шаге будет ^т(Ю = №т(/<) = фт(хт(К)). (9.3) Перейдем к планированию предпоследнего шага — выделению средств на (т— 1)-е предприятие. Пусть после т — 2 шагов в нашем распоряжении остались средства К. Мы должны выбрать такое управ- ление Хщ—1 km — 1, при котором доход на (т— 1)-м шаге плюс уже оптимизированный доход на последнем обращается в максимум: Wm^(K)= max + (9.4) 0 1 ^Ktn— 1 И Т. Д. Основное функциональное уравнение динамического программи- рования будет Wt(K)= max {фг(Хг) + Г/+1 (К-Хг)), (9.5) о <х. а вся процедура условной и безусловной оптимизации ничем не отли- чается от той задачи о распределении ресурсов по неоднородным эта- пам с резервированием, которую мы рассматривали выше, в § 6. хт(К) = I 173
Таким образом, метод динамического программирования, который первоначально представлялся нам как специфический метод оптими- зации процессов, развивающихся во времени, имеет гораздо более шиА рокое поле применений. Пример. Предстоит спроектировать многоступенчатую космическую раке-^ ту в пределах определенного стартового веса G Кабина космонавта имеет задан- ный вес gK. Предполагается, что ракета будет иметь т ступеней. Стартовый вес 1 ракеты складывается из весов всех ступеней ракеты плюс вес кабины: б = Со + £к, где (?о — вес, выделенный на все т ступеней. Каждая ступень имеет какой-то запас горючего. После израсходования горючего отработанная ступень сбрасывается и вступает в действие следующая. Скорость ракеты в конце активного участка W складывается из т прира- щений скорости и»г, ш2, ..., wm, которые она приобретает на отдельных участках траектории, в результате работы каждой ступени. Добавочная скорость шг, при- даваемая ракете на i-м шаге, зависит, во-первых, от веса Х{, выделенного на t-ю ступень, и во-вторых, от того пассивного веса Р, который приходится нести этой ступени: шгМ(Хг, Р). (9.6) Требуется найти такое распределение веса по отдельным ступеням, при котором скорость в конце активного участка максимальна. Решение. Рассмотрим т ступеней ракеты как т этапов набора скорости Состояние S системы перед началом каждого шага мы будем характеризовать одним параметром Q — оставшимся весом, подлежащим распределению между ступенями Управление на t-м шаге состоит в выборе веса Xt, отводимого из ос- тавшегося веса Q на данную, t-ю ступень. Так как приращение скорости, согласно формуле (9.6), зависит от двух ар- гументов — веса ступени и пассивного веса Р, определим этот пассивный вес Очевидно, он равен Р = Q — Xrl~ gK, и приращение скорости будет: ^=/(Лг, Q-xi+gK). Под влиянием управления Xg система переходит из состояния Q в состоя- ние Q' = Q — Xi Основное функциональное уравнение будет иметь вид: 1У.((?) = тах{/(Хг, Q-X. + gK)4-F/+I (Q-X)}. (9.7) Оптимальное управление на t-м шаге есть то значение Xg = хг, при ко- тором достигается этот максимум. Оптимальное управление на m-м шаге (при естественном предположении, что с увеличением веса, отводимого на ступень, приращение скорости увеличи- вается), состоит в том, чтобы отвести на последнюю ступень весь оставшийся вес Q При этом на последнем шаге будет приобретена скорость: Fm(Q) = HQ, Ы- (9.8) Далее процедура динамического программирования разворачивается обыч- ным порядком. В результате находится оптимальный набор весов ступеней- х = (хь х2...хт), (9.9) придающий последней ступени (кабине) максимальную скорость: W'max=F1(Qo). 174
10 ЗАДАЧИ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ I С МУЛЬТИПЛИКАТИВНЫМ КРИТЕРИЕМ До сих пор мы рассматривали только такие задачи динамического программирования, в которых выигрыш (критерий, или показатель эффективности) складывался из суммы выигрышей wt на отдельных ша- гах: (Ю.1) i= I т. е. был аддитивен. Иногда возникают задачи, в которых величина W представляет собой не сумму, а произведение: «7= П wt, (10.2) i= 1 где wt — выигрыш на г-м шаге (предполагается, что все Wt положитель- ны). Такой показатель или критерий эффективности называется мультипликативным. Нетрудно убедиться, что любая задача с мультипликативным кри- терием может быть сведена к задаче с аддитивным критерием. Для этого достаточно, например, прологарифмировать выражение (10.2) и искать решение, обращающее в максимум логарифм величины W. Так как логарифм — возрастающая функция, то максимум логарифма соответствует максимуму величины W. Однако для решения задач с мультипликативным критерием нет прямой надобности непременно логарифмировать его. Вся процедура динамического программирования может быть для этого случая по- строена непосредственно. В основу ее кладется такой выбор условного оптимального управления на каждом шаге, при котором обращается в максимум выигрыш на всех оставшихся шагах, равный произведе- нию выигрыша на данном шаге и уже оптимизированного выигрыша на всех последующих шагах. Основное функциональное уравнение динамического программи- рования для этого случая будет иметь вид: Wt (S) = max К (S, Wl+, (Фг (S, Дг))}, (10.3) а условие оптимальности последнего шага сохранится в том же виде, как при аддитивном критерии: rm(S) = rnax{®m(S, Дт)}. (10.4) Um Вся процедура динамического программирования с мультипли- кативным критерием ничем не отличается от обычной, кроме того, что под знаком максимума стоит не сумма, а произведение. Рассмотрим одну из типичных задач динамического программиро- вания с мультипликативным критерием. 175
Распределение средств для повышения надежности технического устройства Имеется техническое устройство S, состоящее из т элементов, или узлов Эх, Э2, ... Эт (см. рис. 3.39). Безотказная работа каждого элемента безусловно необходима для работы устройства S в целом. Элементы могут отказывать (выходить из строя), причем незави- симо один от другого. Надежность (вероятность безотказной работы) всего устройства равна произведению надежностей всех элементов: tn Р = п pt, (10.5) i=l где pt — надежность z-ro элемента. В нашем распоряжении имеются некоторые средства Ко (в денеж- ном, весовом или ином выражении), которые можно употребить на по- Рис. 3.39 вышение надежностей элементов. Количество средств X, вложен- ное в приспособления, повышаю- щие надежность z-го элемента, до- водит ее до значения Pt^fi(X). (10.6) Все функции fi(X) — неубывающие. Требуется определить оптимальное распределение средств по эле- ментам, Приводящее к наибольшей надежности устройства в целом. Задача решается методом динамического программирования. Пе- ред нами — задача с мультипликативным критерием. Выигрыш на t-м шаге Pt — fi(Xt), где управление X, — количество средств, вло- женное в г-й элемент. Основное функциональное уравнение имеет вид: № max {fi(Xi)-Pi+l(K-~Xi)], (10.7) где Pt(K) — условный оптимальный выигрыш, т. е. максимальная на- дежность устройства, составленного из всех элементов, начиная с z-ro и до m-го, если после i — 1-го шага, т. е. после обеспечения средствами предыдущих i — 1 элементов, в нашем распоряжении остались сред- ства К- Условное оптимальное управление на z-м шаге хг(К) — то ко- личество средств, при котором достигается этот максимум. Как и во всех задачах распределения ресурсов, где средства рас- ходуются до конца, а выигрыш — неубывающая функция, оптималь- ное управление на последнем шаге состоит в том, чтобы выделить на этот шаг все оставшиеся средства: = (10.8) При этом достигается условный оптимальный выигрыш, равный Рт(К)ЧМ- i (10.9) 176
Последовательным применением формулы (10.7) для i — т— 1, т — 2....2, как всегда, находим условные оптимальные управления Хт — I (ТС), Хт—2 (ТС), ..., ^2 (ТС) и условные оптимальные выигрыши Рт_,(К), Рт-2 (К), .... Р2 (К). Первый шаг в данном случае оптимизируется не условно, а без- условно, так как исходное количество средств Ко задано: />i(Ko) = max (f1(X1).P2(K0-X1)}. (10.10) 0 X, /Со То управление Х1 = Х1(/С0), при котором достигается максимум (10.10), и есть безусловное опти- мальное управление на первом шаге, а Р^К^) — безусловный опти* мальный выигрыш, т. е. максимально достижимая данными средства- ми надежность устройства. Далее оптимальное управление строится по схеме: К Г = Ко—хг хг Ki = К*—х2 ... Кт— 1 — Кт — i~Xm — 1 ~> Хт—> Кт — 0. 11. БЕСКОНЕЧНОШАГОВЫЙ ПРОЦЕСС ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ Все задачи динамического программирования, которые мы рас- сматривали до сих пор, относились к процессам, разделяющимся на конечное число т шагов. Разумеется, все практические задачи, свя- занные с планированием экономических и подобных им операций, от- носятся к этому классу — планировать имеет смысл только на конеч- ный (пусть даже очень большой) участок времени вперед. Однако, есть задачи, в которых этот участок времени представляется заранее не вполне определенным, и нас может интересовать решение задачи оптимального планирования безотносительно к тому, на каком именно шаге операция закончится. В таких случаях иногда бывает целесооб- разно рассмотреть в качестве модели явления некоторый идеализи- рованный бесконечношаговый управляемый процесс, ко- торый получится из реального при т -> оо. Эта модель удобна тем, что в ней не существует исключительного по своей роли «последнего ша- га» — все шаги между собой равноправны, процесс В известном смысле однороден. Условное оптимальное управление в таком процес- се оказывается не зависящим от номера шага, а зави- сящим только от состояния S системы S перед началом шага. Разу- меется, для этого нужно, чтобы шаги были однородными, т. е. функции, определяющие доход и изменение состояния системы под действием управления, были для всех шагов одинаковыми. 177
Следует подчеркнуть, что в однородном бесконечношаговом про- цессе одинаковыми для всех шагов оказываются только условные оптимальные управления; что касается безусловного опти- мального управления, то оно, будучи зависимым от состояния систе- мы, достигнутого к данному шагу, в общем случае меняется от шага к шагу. Заметим, что в отличие от конечношаговых задач, для которых оп- тимальное управление всегда существует, бесконечношаговые задачи могут и не иметь решения. Чтобы убедиться в этом, рассмотрим эле- ментарный пример. Пусть имеется задача распределения ресурсов с резервированием (см. § 6), но с бесконечным числом шагов. Средства X, вложенные в производство, дают за год доход /(X) и расходуются до конца. В на- шем распоряжении имеется исходный запас средств Ко, который тре- буется оптимальным образом распределить по годам, так чтобы сум- марный доход был максимален. Существование и вид решения зависит от того, каков вид функции f(X). Предположим, что эта функция выпукла вниз (рис. 3.40). Тогда очевидно, что оптимальное решение существует и состоит в том, .чтобы вложить в производство все имеющиеся средства в пер- вый же год. Действительно, предположим, что мы, например, разделили средства пополам, первую половину вложили в производ- ство на первом году, а вторую — на следующем году. Очевидно, это будет невыгодно, так как для выпуклой вниз функции /(X) 2f(Kol2)<f(Ko). Предположим теперь, что функция /(X) выпукла вверх (рис. 3.41). Очевидно, что в этом случае выгодно не вкладывать в производст- во все средства сразу, а «растянуть» их. Например, если мы, вместо то- го, чтобы вкладывать в производство все средства на первом же шаге, распределим их на два шага, то получим больший доход: 2f(K0/2)>f(K0), на три шага — еще больший, и т. д. При увеличении числа шагов, на которые распределяются средства, доход только возрастает. 178
Определим предел, к которому будет стремиться суммарный до- ход при неограниченном возрастании числа шагов, в которые вклады- ваются средства, и значит, при одновременном уменьшении числа средств, вкладываемых на каждом шагу. Предположим сначала, что мы планируем на т лет и каждый год вкладываем в производство одну и ту же сумму &Х = Кй1т, а затем устремим т к бесконечности, а ДХ — к нулю. Из рис. 3.42 видно, что при достаточно малом ДХ можно заменить участок кривой /(X) участком касательной в начале координат. Тогда доход, получаемый за год, будет приближенно равен Г(0)ДХ»Г (О)Хо//и, где /'(0) — значение производной функции дохода в начале коорди- нат. При этом суммарный доход за весь период т лет будет приближен- но равен (О)Хо. (11.1) При т-> оо приближенное равенство (11.1) превращается в точ- ное. Таким образом, мы получили парадоксальный вывод: чем меньше средств мы вкладываем в производство на каждом году, тем больше будет доход; в пределе, при т-+ оо, получится максимальный до- ход (П.1). Если же прямо перейти к предельному случаю и положить АХ = 0, т. е. не вкладывать в производство никаких средств, то, оче- видно, и доход будет равен нулю. Это пример бесконечношаговой задачи, где оптимального решения не существует. При любом конечном т оно су- ществует и состоит в том, чтобы вкладывать средства во все этапы по- ровну, а при бесконечном числе шагов перестает существовать. При постановке и решении бесконечношаговых задач методом ди- намического программирования всегда необходимо исследовать вопрос о существовании решения*) **. Бесконечношаговая модель в задачах динамического программи- рования в ряде случаев может оказаться проще, чем конечношаговая. Действительно, вместо ряда функциональных уравнений, решаемых одно за другим в обычной процедуре динамического программирова- ния, здесь приходится решать всего только одно функциональное уравнение для условного оптимального выигрыша, пригодное для любого шага. Запишем это единственное функциональное уравнение. Пусть бес- конечношаговый управляемый процесс происходит в физической си- *) Условия существования решения в бесконечношаговых задачах рассмотрены, например, в [10]. 179
стеме S; обозначим S — состояние этой системы после какого-то (лю- бого) шага. Под влиянием управления U система S за следующий шаг переходит в новое состояние S', зависящее от предыдущего состояния S и примененного управления L7: S' ==ф (S, U). За этот шаг мы получаем выигрыш (доход) w, также зависящий от S и U-. w — f(S, U). Тогда можно написать основное функциональное уравнение для бесконечношаговой задачи в виде: W (S) = max U(S, l/) + №(<p(S, U))\, (11.2) и где 11^(5) — условный максимальный выигрыш, который можно по- лучить, управляя системой, находящейся в состоянии S. В уравнении (11.2) ЙДЗ) — единственная неизвестная функция; остальные функции (ф, /) являются заданными. Условное оптимальное управление u(S) — то управление, при котором достигается максимум (11.2). В некоторых простейших задачах удается подобрать функцию W(S) так, чтобы она удовлетворяла уравнению (11.2). Общих методов аналитического решения функциональных уравнений не существует. В случаях, когда подобрать функцию W(S), удовлетворяющую урав- нению (11.2), не удается, прибегают к приближенному решению этого уравнения. Для этого может быть применен метод последовательных приближений, состоящий в следующем: решается задача динамичес- кого программирования для конечного, все возрастающего числа ша- гов т; если решение существует, то при возрастании т функции Wt(S) и ut(S), определяющие условный оптимальный выигрыш и условное оптимальное управление для шагов, достаточно удаленных от конца, стабилизируются, приближаясь к соответствующим функциями U7(S) и u(S) для бесконечношагового процесса, в качестве которых они и мо-' гут быть приближенно взяты. В заключение отметим, что бесконечношаговые задачи динами- ческого программирования могут получаться не только за счет неогра- ниченного увеличения числа шагов при заданной длине каждого шага, но и за счет неограниченного уменьшения длины шага А/, когда дис- кретное поэтапное управление переходит в непрерывное. Такие задачи достаточно сложны, и мы не будем на них останавливаться.
4 МОДЕЛИРОВАНИЕ ОПЕРАЦИЙ ПО СХЕМЕ МАРКОВСКИХ СЛУЧАЙНЫХ ПРОЦЕССОВ 1. МАРКОВСКИЙ СЛУЧАЙНЫЙ ПРОЦЕСС С ДИСКРЕТНЫМИ состояниями Многие операции, которые приходится анализировать под углом зрения выбора оптимального решения, развиваются как случай - н ы е процессы, ход и исход которых зависят от ряда случайных факторов, сопровождающих эти операции. Для того, чтобы вычислить числовые параметры, характеризую- щие эффективность таких операций, нужно построить некоторую ве- роятностную модель явления, учитывающую сопровождающие его случайные факторы. Для математического описания многих операций, развивающихся в форме случайного процесса, может быть с успехом применен матема- тический аппарат, разработанный в теории вероятностей для так называемых марковских случайных процессов. Поясним понятие марковского случайного процесса. Пусть имеется некоторая физическая система S, состояние кото- рой меняется с течением времени (под системой S может пониматься что угодно: техническое устройство, ремонтная мастерская, вычисли- тельная машина, железнодорожный узел и т. д.). Если состояние си- стемы S меняется во времени случайным, заранее непредсказуемым образом, мы говорим, что в системе S протекает случайный про- цесс. Примерами случайных процессов могут быть: — процесс функционирования ЭЦВМ; — процесс наведения на цель управляемой ракеты или косми- ческого летательного аппарата; — процесс обслуживания клиентов парикмахерской или ремонт- ной мастерской; — процесс выполнения плана снабжения группы предприятий и т. д. Конкретное протекание каждого из таких процессов зависит от ряда случайных, заранее непредсказуемых факторов, таких как: — поступление заказов на ЭЦВМ и вид этих заказов; случайные выходы ЭЦВМ из строя; — случайные возмущения (помехи) в системе управления раке- той; 181
— случайный характер потока заявок (требований), поступаю- щих со стороны клиентов; — случайные перебои в выполнении плана снабжения и 1. д. Случайный процесс, протекающий в системе S, называется мар- ковским процессом (или «процессом без последействия»), если он обладает следующим свойством: Для каждого момента времени t0 вероятность любого состояния системы в будущем (при t > t0) зависит только от ее состояния в на- стоящем (при t=tQ) и не зависит от того, когда и каким образом систе- ма пришла в это состояние (т. е. как развивался процессе прошлом). 1 Другими словами, в марковском случайном процессе будущее раз- витие его зависит только от настоящего состояния и не зависит от «пре- дыстории» процесса. Рассмотрим пример. Пусть система S представляет собой техни- ческое устройство, которое уже проработало некоторое время, соот- ветственным образом «износилось» и пришло в некоторое состояние, характеризующееся определенной степенью изношенности S. Нас ин- тересует, как будет работать система в будущем. Ясно, что, по крайней мере в первом приближении, характеристики работы системы в буду- щем (частота отказов, потребность в ремонте) зависят от состояния устройства в настоящий момент и не зависят от того, когда и как устройство достигло своего настоящего состояния. На практике часто встречаются случайные процессы, которые, с той или другой степенью приближения, можно считать марков- скими. Теория марковских случайных процессов является в настоящее время очень обширным разделом теории вероятностей с широким спект- ром различных приложений — от описания физических явлений типз диффузии или перемешивания шихты во время плавки в доменной печи до процессов образования очередей или распространения мутаций ге- нов в биологической популяции. Нас будут интересовать, главным об- ( разом, применения теории марковских случайных процессов к построе- нию математических моделей операций, ход и исход которых сущест- венно зависит от случайных факторов. Марковские случайные процессы делятся на классы по некоторым признакам, в зависимости от того, как и в какие моменты времени си- стема S может менять свои состояния. Случайный процесс называется процессом с дискрет- ными состояниями, если возможные состояния системы: S1( S2, S3, ... можно перечислить (перенумеровать) одно за другим, а сам процесс состоит в том, что время от времени система S скачком (мгновенно) перескакивает из одного состояния в другое. Пример 1. Техническое устройство5состоит из двух узлов: 1 и II, каждый из которых может в ходе работы устройства отказать (выйти из строя). Воз- можны следующие состояния системы: 182
S, — оба узла работают; S2 — первый узел отказал, второй работает; S3 — второй узел отказал, первый работает; S4 — оба узла отказали. Процесс, протекающий в системе, состоит в том, что она случайным обра- зом, в какие-то моменты времени, переходит (перескакивает) из состояния в со- стояние. Всего у системы четыре возможных состояния, которые мы перенумеро- вали Перед нами — процесс с дискретными состояниями Кроме процессов с дискретными состояниями существуют случай- ные процессы с непрерывными состояниями: для этих процессов харак- терен постепенный, плавный переход из состояния в состояние. На- пример, процесс изменения напряжения в осветительной сети пред- ставляет собой случайный процесс с непрерывными состояниями. Рис. 4.2 Рис. 4.1 В данной главе мы будем рассматривать только случайные про- цессы с дискретными состояниями. При анализе случайных процессов с дискретными состояниями очень удобно пользоваться геометрической схемой — так называемым графом состояний. Граф состояний геометрически изобра- жает возможные состояния системы и ее возможные переходы из со- стояния в состояние. Пусть имеется система S с дискретными состояниями: Si, S2, Sn. Мы будем изображать каждое состояние прямоугольником, а воз- можные переходы («перескоки») из состояния в состояние — стрел- ками, соединяющими эти прямоугольники (рис. 4.1). Заметим, что стрелками отмечаются только непосредственные переходы из состояния в состояние; если система может перейти из состояния Sj в 83 только через S2, то стрелками отмечаются только переходы 8, S2 и S2 -> 83, но не Sj -> S3. Пример 2. Система 5 — автомашина, которая может находиться в одном из пяти возможных состояний: Sx — исправна, работает; S2 — неисправна, ожидает осмотра; 183
S3 — осматривается; S4 — ремонтируется; S6 — списана. Граф состояний системы показан на рис. 4.2. Пример 3. Построить граф состояний в условиях примера 1 (предпола- гается, что ремонт узлов в ходе процесса не производится). Решение. Граф состояний представлен на рис. 4.3. Отметим, что на графе не показан возможный переход, из состояния S4 непосредственно в S4, который осуществится, если строго одновременно выйдут из строя оба узла. Возможностью такого события мы пренебрегаем. Рис. 4.4 Рис. 4.3 Пример 4. Система 5, как и в примере 1, представляет собой техническое устройство, состоящее из двух узлов: I и II; каждый из них может в какой-то момент времени отказать. Отказавший узел немедленно начинает восстанавли- Рис. '4,5 184
ваться. Возможные состояния системы: Sj — оба узла работают; S2 — первый узел восстанавливается, второй работает; S3 — первый узел работает, второй восстанавливается; S4 — оба узла восстанавливаются Граф состояний системы показан на рис. 4.4 Пример 5. В условиях примера 4 каждый узел перед гем, как начать вос- станавливаться, подвергается осмотру с целью локализации неисправности. Состояния системы будем для удобства нумеровать не одним, а двумя ин- дексами; первый будет означать состояния первого узла: 1 — работает, I 2 — осматривается, 3 — восстанавливается; второй — те же состояния для второго узла, так что, например, S23 будет озна- чать: первый узел осматривается, второй — восстанавливается, и т. д. Возможные состояния системы S будут: Su — оба узла работают, S12 — первый узел работает, второй осматривается, S33 — оба узла восстанавливаются (всего 9 состояний). Граф состояний показан на рис. 4.5. 2. СЛУЧАЙНЫЕ ПРОЦЕССЫ С ДИСКРЕТНЫМ И НЕПРЕРЫВНЫМ ВРЕМЕНЕМ. МАРКОВСКАЯ ЦЕПЬ Способы математического описания марковского случайного про- цесса, протекающего в системе с дискретными состояниями, зависят от того, в какие моменты времени — заранее известные или случай- ные — могут происходить переходы («перескоки») системы из состоя- ния в состояние. Случайный процесс называется процессом с дискрет- ным временем, если переходы системы из состояния в состояние возможны только в строго определенные, заранее фиксированные мо- менты времени: tlt t2.В промежутки времени между этими момен- тами система S сохраняет свое состояние. Случайный процесс называется процессом с непрерыв- ным временем, если переход системы из состояния в состояние возможен в любой, наперед неизвестный, случайный момент t. Рассмотрим прежде всего марковский случайный процесс с дискрет- ными состояниями и дискретным временем. Пусть имеется физическая система S, которая может находиться в состояниях: ^2, •••> S„, причем переходы («перескоки») системы из состояния в состояние воз можны только в моменты: ti> tn •••> tk. Будем называть эти моменты «шагами» или «этапами» процесса и рассматривать случайный процесс, происходящий в системе S, как функцию целочисленного аргумента: 1,2, ..., k,... (номера шага). 185
Случайный процесс, происходящий в системе, состоит в том, что в последовательные моменты времени tlr t2, t3, ..., система S оказы- вается в тех или других состояниях, ведя себя, например, следую- щим образом: '2 или же <Si —> S2 —>- Sj —*Sa —S3 —> S4 —> Si —> .... В общем случае в моменты tlt t2, ... система может не только ме- нять состояние, но и оставаться в прежнем, например: —> S] —> S2 —> S3 S3 —> S3 —>- S4 —> St —> Рас. 4.6 Условимся обозначать S,(ft) событие, состоящее в том, что после k шагов система находится в состоянии S,. При любом k события S^, Sa<*>, ..., S/*>, .... Sn(ft> образуют полную группу и несовместны. Процесс, происходящий в системе, можно представить как после- довательность (цепочку) событий, например: Si<°), S2<*’, Sx<2>, S2(3), S3<4>, ... Такая случайная последовательность событий называется мар-' ковской цепью, если для каждого шага вероятность перехода из любого состояния S; в любоеS; не зависит от того, когда и как система пришла в состояние Sj. Мы будем описывать марковскую цепь с помощью так называе- мых вероятностей состояний. Пусть в любой момент времени (после любого, k-m шага) система S может быть в одном из со- стояний: Sn S2, ..., Sn, т. е. осуществится одно из полной группы несовместных событий: S/*>, S2<*>....................... Sn^>. 186
Обозначим вероятности этих событий: Л(1) = Р(5](1)); P2(1)=P(S2<’>); .... Pn(l)=P(S„(l)) — вероятности после первого шага, Р1(2)=Р(«г'2)); p2(2)=P(S2<2>); рп (2) =Р (Sn(2>) (2.1) — вероятности после второго шага; и вообще после k-го шага: p1(^) = /3(S1'ft>); pdk) = P(S2^ ...; pn(k)=P(Sn^). (2.2) Легко видеть, что для каждого номера шага k Pi(k) + Pt,(k) + ... 4-pn(k) = 1, так как это — вероятности несовместных событий, образующих пол- ную группу. Рис. 4.7 Будем называть вероятности Pi№), pz(k)...pn(k) вероятностями состояний; поставим задачу: найти ве- роятности состояний системы для любого k. Изобразим состояния системы в виде графа (рис. 4.6), где стрелка- ми указаны возможные переходы системы из состояния в состояние за один шаг. Случайный процессе (марковскую цепь) можно представить себе так, как будто точка, изображающая систему S, случайным образом перемещается (блуждает) по графу состояний, перескакивая из состоя- ния в состояние в моменты 4, t2, ..., а иногда (в общем случае) и задер- живаясь какое-то число шагов в одном и том же состоянии. Например, последовательность переходов Si —>- S3 —S2 —> S2 Л3 —> S5 —> Se —> S2 можно изобразить на графе состояний как последовательность различ- ных положений точки (см. пунктирные стрелки, изображающие пере- ходы из состояния в состояние на рис. 4.7). «Задержка» системы в со- стоянии S2 на третьем шаге изображена стрелкой, выходящей из со- стояния $а и в него же возвращающейся. 187
Для любого шага (момента времени /1( /2.4, ••• или номера 1, 2..k, ...) существуют какие-то вероятности перехода системы из любого состояния в любое другое (некоторые из них равны нулю, если непосредственный переход за один шаг невозможен), а также вероят- ность задержки системы в данном состоянии. Будем называть эти вероятности переходными веро- ятностями марковской цепи. Марковская цепь называется однородной, если переходные вероятности не зависят от номера шага. В противном случае марков- ская цепь называется неоднородной. Рассмотрим сначала однородную марковскую цепь. Пусть система S имеет п возможных состояний 51( S2, •••, Sn. Предположим, что для каждого состояния нам известна вероятность перехода в любое другое состояние за один шаг (в том числе и вероятность задержки в данном состоянии). Обозначим Рц вероятность перехода за один шаг из состоя- ния St в состояние Sf, Pti будет вероятность задержки системы в со- стоянии S;. Запишем переходные вероятности Рц в виде прямоуголь- ной таблицы (матрицы): Рц Рц ... Р1) ... Pin Рц Р.2 • • • Рц ... Р.п Рп Pi. • •• Рц ... Pin Рп1 Рп. « • • Рп] ... Рпп (2.3) Некоторые из переходных вероятностей Pt} могут быть равны ну- лю: это означает, что за один шаг переход системы из i-ro состояния в /-е невозможен. По главной диагонали матрицы переходных вероятностей стоят вероятности Рц того, что система не выйдет из состояния S;, а останется в нем. Пользуясь введенными выше событиями Sift), S^, ..., пере- ходные вероятности Рн- можно записать как условные вероятности: 188
Отсюда следует, что сумма членов, стоящих в каждой строке мат- рицы (2.3), должна быть равна единице, так как, в каком бы состоянии система ни была перед fe-м шагом, события S(2ft>, , Snk) несовмест- ны и образуют полную группу. При рассмотрении марковских цепей часто бывает удобно пользо- ваться графом состояний, на котором у стрелок проставлены соответ- ствующие переходные вероятности (см. рис. 4.8). Такой граф мы будем называть «размеченным графом состояний». Заметим, что на рис. 4.8 проставлены не все переходные вероят- ности, а только те из них, которые не равны нулю и меняют состоя- ние системы, т. е. Рц при i «вероятности задержки» Рп, Р22, проставлять на графе излишне, так как каждая из них допол- няет до единицы сумму переходных вероятностей, соот- ветствующих всем стрелкам, исходящим из данного состояния. Например, для графа рис. 4.8 Р И — 1--(Р12 + Р 1з)> Р 22 = 1 — (Р 23 + Р^> PS3 ~ 1 -(Р32 + РЗв)> Рц = 1 (Р 43 + Р 46 + Р 4б)> Р3Ь = 1 Р3в> Рев ” 1' Pei- Если из состояния S; не исходит ни одной стрелки (переход из не- го ни в какое другое состояние невозможен), соответствующая вероят- ность задержки Рц равна единице. Имея в распоряжении размеченный граф состояний (или, что рав- носильно, матрицу переходных вероятностей) и зная начальное состоя- ние системы, можно найти вероятности состояний Р1(/г), p2(k)...pn(k) после любого (/?-го) шага. Покажем, как это делается. Предположим, что в начальный момент (перед первым шагом) си- стема находится в каком-то определенном состоянии, например, STO. Тогда, для начального момента (0) будем иметь: Pi(0) = 0; р2 (0) =0;...; рт (0) = 1;...; рп(0) = 0, т. е. вероятности всех состояний равны нулю, кроме вероятности на- чального состояния Sm, которая равна единице. Найдем вероятности состояний после первого шага. Мы знаем, что перед первым шагом система заведомо находится в состоянии Sm. Значит, за первый шаг она перейдет в состояния Sb S2.....Sm, ..., Sn с вероятностями Р Р Р Р 1 ml» 1 m2» ••• » 1 mm» ••• » 1 mn’ записанными в m-й строке матрицы переходных вероятностей. Таким образом, вероятности состояний после первого шага будут: Pi(P)=PmP, МО-Ртз; pm(l)=Pmm;...; Рп(1)=Ртп- (2.4) 189
Найдем вероятности состояний после второго шага: Pi(2), р2(2), .... рг(2),..., рп(2). Будем вычислять их по формуле полной вероятности, с гипотезами: — после первого шага система была в состоянии Sjj — после первого шага система была в состоянии S2; — после первого шага система была в состоянии Si; — после первого шага система была в состоянии Sn. Вероятности гипотез известны (см. (2.4)); условные вероятности перехода в состояние 5г при каждой гипотезе тоже известны и записаны в матрице переходных вероятностей. По формуле полной вероятности получим: Pi (2) = Pi (1) Ри 4* А (И Р21 4" ••• + Рп (О Рnii Pi (2) = Pi (1) Рi2 + Pa (1) Р22 4- ••• 4~Pn (1) Pn2> Pl (2) —Pi (1) Рц 4- P2 (1) Рц 4" ••• 4" Pn (1) Pnb Pn (2) —Pl (1) Лп4- Pa (1) Pin 4" ••• +Pn G) PM> или, гораздо короче, п PiM^Pi^Pp a=i.............n). (2.6) В формуле (2.6) суммирование распространяется формально на все состояния Sj, ..., Sn; фактически учитывать надо только те из них, для которых переходные вероятности Рц отличны от нуля, то есть те состояния, из которых может совершиться переход в состоя- ние Sz (или задержка в нем). Таким образом, вероятности состояний после второго шага из- вестны. Очевидно, после третьего шага они определяются аналогично: п Pi(^=^p}(2)P}i, (2.7) /=1 и вообще после &-го шага: п Pi(k)~£Pj(k-l)PJt (1 = 1...... п). (2.8) Итак, вероятности состояний pt(k) после k-ro шага определяются рекуррентной формулой (2.8) через вероятности состояний после (k — 1)-го шага; те, в свою очередь—через вероятности состояний после (k — 2)-го шага, и т. д. 190
Пример 1. По некоторой цели ведется стрельба четырьмя выстрелами в мо- менты времени /1; /2, ts, tt. Возможные состояния цели (системы 5): Si — цель невредима; S2 — цель незначительно повреждена; S3 — цель получила существенные повреждения; S4 — цель полностью поражена (не может функционировать). Размеченный граф состояний системы показан иа рис. 4.9. В начальный момент цель находится в состоянии Sj (не повреждена). Оп- ределить вероятности состояний цели после четырех выстрелов Решение. Из графа состояний имеем: Pi2 = 0,4i Р1з = 0,2; Р14 = 0,1 и Ри~. 1 -(Р12 + Р1з + Л1) =0,3. Рис. 4.9 Аналогично находим: Р21 = 0; Р22 = 0,4; Раз = 0,4; P24 = 0,2j Р31 = 0; Р32 = 0; Р33 = 0,3; P34 = 0,7t Р41 = 0; Р42 = 0; Р43 —0; Р 44 — 1. Таким образом, матрица переходных вероятностей имеет вид: Иг; 11 = 0,4 0,4 0 0 0,2 0,1 0,4 0,2 0,3 0,7 0 1 Так как в начальный момент цель S находится в состоянии S], то Р1(0) = 1. Вероятности состояний после первого шага (выстрела) берутся из первой строки матрицы: Pi(l) = 0,3; р2(1) = 0,4; р3(1) = 0,2; Л(1) = 0,1. Вероятности состояний после второго шага: Pi (2) = Pi (1) Рц = 0,3-0,3 = 0,09; р2 (2)=Pi (О Рщ + Ра (1) Р22=0,.3-0,4 + 0,4-0,4 = 0,28; р3(2)=р1(1)Р13 + р3 (1) Р23 + р2(1)Р33 = 0,3.0,2 + 0,4.0,4 + 0,2.0,3 = 0128; р4 (2) = р4 (1) Р14 + р2 (1) Р24 + Р3 (1) Р34 + Р4 (1) Р44 = =0,3-0,1+0.4-0,2-4-0,2-0,7 + 0,1.1 = 0,35. 191
Вероятности состояний после третьего шага: Р1 (3) = Р1 (2) Рц=0,09-0,3 = 0,027; Рг (3) = Pi (2) Pi2 + Р2 (2) Р22 = 0,09- 0,4 + 0,28-0,4 = 0,148; Рз (3) = Pi (2) Pis + Ра (2) Р2з + р3 (2) Рзз = = 0,09-0,24-0,28.0,4 + 0,28-0,3 = 0,214; Pt (3) = Pi (2) Р14 + Рг (2) Рц + Рз (2) Pst + Pt (2) Ptt = = 0,09.0,1 +0,28.0,2 + 0,28-0,7 + 0,35-1 = 0,611. Вероятности состояний после четвертого шага: Pi (4) = Pl(3) Ри= 0,0081; P2(4) = Pi (3)Р12 + р2 (3) Р22=0,27-0,4 + 0,148-0,4 =0,0700, Рз (4) = Р1 (3) Р1з + р2 (3) Р23 + Рз (3) Рзз = = 0,027-0,2 + 0,148-0,4 + 0,214-0,3 = 0,1288; Рз (4) = Pi (3) Pi4 + р2 (3) Р24 + Рз (3) Р34 + р4 (3) Р44 = = 0,027-0,1 +0,148-0,2 + 0,214-0,7 + 0,611-1 =0,7931. Таким образом, нами получены вероятности всех исходов обстрела цели (четырех выстрелов): — цель не повреждена: Р1(4) ~ 0,008; — цель получила незначительные повреждения; Рг(4) ~ 0,070; — цель получила существенные повреждения: Рз(4) ж 0,129; — цель поражена полностью: Р1(4) ~ 0,793. Мы рассмотрели однородную марковскую цепь, для кото- рой вероятности перехода от шага к шагу не меняются. Рассмотрим теперь общий случай — неоднородную мар- ковскую цепь, для которой вероятности перехода Рц меняются от шага к шагу. Обозначим — вероятность перехода системы из состояния Sf в состояние Sy на k-м шаге, то есть условную вероятность Г**'=P(S^’/S}*-1>). Предположим, что нам заданы матрицы вероятностей перехода на каждом шаге. Тогда вероятность того, что система S после k шагов будет находиться в состоянии St, выразится формулой: Pt(k)=T р№ — 1)Рд) (t = 1......... п), (2.9) которая отличается от аналогичной формулы (2.8) для однородной цепи Маркова только тем, что в ней фигурируют вероятности перехода, за- висящие от номера шага k. Вычисления по формуле (2.9) ничуть не сложнее, чем в случае однородной цепи. Пример 2. Производится три выстрела по цели, которая может быть в тех же четырех состояниях S1, S2, S3, S4, что и в предыдущем примере, но вероят- ности перехода для трех последовательных выстрелов различны н заданы тремя матрицами: 192
0,05 0,3 0,4 0,25 |p(3)[l_ 0 °>1 °>6 °>3 8 11 8 0 0 0,1 0,9 0 0 0 1 В начальный момент цель находится в состоянии Sx. Найти вероятности со- стояний после трех выстрелов. Решение. Имеем: Р1(1) = 0,3; р2(1) = 0,4; р3(1) = 0,2; Р4(1) = 0,1; ' Р1 (2) = рх(1) P<V = O,3-0,1 = ЩОЗ; Р2 (2)=Р1 (1) Р\22Чр2 (1) = 0,3-0,4+0,4-0,2 = 0J20; р3 (2) = Р1 (1) Р$+р2 (1) + Р3 (1) Р$ = = 0,3-0,3 + 0,4-0,5 + 0,2-0,2 = 0,33; р4 (2)=Р1 (О р|24’+р2 (1) р^ +р3(1)/Ч2? р4+0) Р^=0,3-0,2+ + 0,4-0,3 + 0,2-0,8 + 0,1 -1=0,44- рх (3) = рх (2) Р^’ =0,03-0,05 ж 0,002; Р2 (3) = РХ (2) Р^’ + Рг (2) РЙ> =0,03-0,3 + 0,20-0,1 = 0,029; р3 (3) = р, (2) Р<3’ + р2 (2) Р^ + р, (2) Р<33 > = =0,3-0,4 + 0,20-0,6+0,33-0,1 =0,165; ’р4 (3) = Р1 (2) Р<3> + р2 (2) Р<3> + рз (2) Р<3> + р4 (2) Р<3> = =0,03-0,25 + 0,20-0,3 + 0,33-0,9 + 0,44.1 ж 0,804. Итак, вероятности состояний после трех выстрелов: Pj(3)w0,002; р2(3) =0,029; р,(3) = 0,165; р( (3) »0,804. 7 Зак. 673 193
3. МАРКОВСКИЙ ПРОЦЕСС С ДИСКРЕТНЫМИ СОСТОЯНИЯМИ И НЕПРЕРЫВНЫМ ВРЕМЕНЕМ. УРАВНЕНИЯ КОЛМОГОРОВА ДЛЯ ВЕРОЯТНОСТЕЙ СОСТОЯНИЙ В предыдущем параграфе мы рассматривали марковскую цепь, т. е. случайный процесс, протекающий в системе, которая случайным образом может переходить из состояния в состояние только в некоторые заранее определенные, фиксированные моменты времени. На практике значительно чаще встречаются ситуации, когда переходы системы из состояния в состояние происходят не в фиксиро- ванные, а в случайные моменты времени, которые заранее указать не- возможно — переход может осуществиться, вообще говоря, в любой момент. Например, выход из строя (отказ) любого элемента аппаратуры может произойти в любой момент времени; окончание ремонта (восста- новление) этого элемента также может произойти в заранее не зафикси- рованный момент и т. д. Для описания таких процессов в ряде случаев может быть с успе- хом применена схема марковского случайного процесса с дискретны- ми состояниями и непрерывным временем, который мы будем для крат- кости называть непрерывной цепьюМаркова. Рис. 4.10 Покажем, как выражаются вероятности состояний для такого процесса. Пусть имеется ряд дискретных состояний: Si, S2,..., Sn; переход (перескок) системы S из состояния в состояние может осуществ- ляться в любой момент времени. Граф состояний системы представлен на рис. 4.10. 194
Обозначим pi{t) — вероятность того, что в момент t система S будет находиться в состоянии S, (i = 1, п). Очевидно, для любого мо- мента t сумма вероятностей состояний равна единице: S Рг(О = 1. (3.1) так как события, состоящие в том, что в момент t система находится в состояниях S1( S2..Sn, несовместны и образуют полную группу. Поставим задачу — определить для любого t вероятности состояний: Pi (О» Ра(Л...Рп(0- ___________О___________> Для того, чтобы найти эти ве- 0 t t+At t роятности, необходимо знать харак- теристики процесса, аналогичные “ ’ переходным вероятностям для мар- ковской цепи. В случае процесса с непрерывным временем нам не при- дется задавать определенные, отличные от нуля, переходные вероят- ности Рц; вероятность перехода (перескока) системы из состояния в со- стояние точно в момент t будет равна нулю (так же как вероятность любого отдельного значения непрерывной случайной величины). Вмес- то переходных вероятностей Рц мы введем в рассмотрение плот- ности вероятностей перехода Кц. Пусть система S в момент t находится в состоянии S;. Рассмотрим элементарный промежуток времени А/, примыкающий к моменту t (рис. 4.11). Назовем плотностью вероятности перехода предел отношения вероятности перехода системы за время А/ из состояния St в состояние Sy к длине промежутка А/: = (3.2) д/->о Дг где Рц(ЛР) — вероятность того, что система, находившаяся в момент /в состоянии 5г, за время AZ перейдет из него в состояние Sj (плот- ность вероятностей перехода определяется только для /=/=0. Из формулы (3.2) следует, что при малом AZ вероятность перехода Рi}(ДР) (с точностью до бесконечно малых высших порядков) равна XO-AZ: Лу(А/)«%г7А/. Если все плотности вероятностей перехода Xi} не зависят от t (т. е. от того, в какой момент начинается элементарный участок AZ), мар- ковский процесс называется одно родным; если эти плотности представляют собой какие-то функции времени ^-(0, процесс назы- вается неоднородным. При пользовании сокращенным назва- 7* 195
нием «непрерывная марковская цепь» мы также будем различать одно- родные и неоднородные цепи. Предположим, что нам известны плотности вероятностей пере- хода Xjj для всех пар состояний S,, Sj. Рис. 4.12 Построим граф состояний системы S и против каждой стрелки про- ставим соответствующую плотность вероятности перехода (рис. 4.12). Такой граф, с проставленными у стрелок плотностями вероятнос- тей перехода, мы будем называть размеченным графом со- стояний. Рис. 4.13 Оказывается, зная размеченный граф состояний, можно определить вероятности состояний: Р1(а РаЮ..... Р„(0 (3-3) как функции времени. А именно, эти вероят- ности удовлетворяют определенного вида дифференциальным урав- нениям, так называемым уравне- ниям Колмогорова. Решая эти уравнения, мы получим вероятности (3.3). Продемонстрируем методику вывода уравнений Колмогорова для вероятностей состояний на конкретном примере. Пусть система S имеет четыре возможных состояния: Si, S2, <S3, S4; размеченный граф состояний системы показан на рис. 4.13. Поставим себе задачу: найти одну из вероятностей состояний, на- пример, Pi(/). Это есть вероятность того, что в момент t система будет находиться в состоянии Sx. Придадим t малое приращение Л/ и найдем вероятность того, что в момент t + Л/ система будет находиться в состоянии Как это событие может произойти? Очевидно, двумя способами: — в момент t система уже была в состоянии а за время А/ не вышла из этого состояния 198
или — в момент I система была с состоянии S3, а за время \t перешла из него в S). Вероятность первого варианта найдем как произведение вероят- ности рх(/) того, что в момент t система была в состоянии Sx, на услов- ную вероятность того, что, будучи в состоянии <SX, система за время Ы не перейдет из него в S2. Эта условная вероятность (с точностью до бесконечно малых высших порядков) равна 1 Х12Д/. Аналогично, вероятность второго варианта равна вероятности то- го, что в момент t система была в состоянии Ss, умноженной на услов- ную вероятность перехода за время Л/ в состояние Sx: Рз (0 ^31 А/. Применяя правило сложения вероятностей, получим: Pi 4* А/) = Pi (t) (1 —^12 А/) + Рз (0 ^з1 Раскроем скобки в правой части, перенесем рх(/) в левую и разде- лим обе части равенства на Л/; получим: Pi (< + д/)-Р1 (Z) = М ^12 Р1 (0 4” ^31 Рз (0* Теперь устремим Л/ к нулю и перейдем к пределу: - lim = _^12 Р1 (/) % рз (р. Д^о А/ Левая часть есть не что иное, как производная функции ^=-^2Pi(04-4iPJ0- (3.4) at Таким образом, выведено дифференциальное урав- нение, которому должна удовлетворять функция p^t). Аналогич- ные дифференциальные уравнения могут быть выведены и для осталь- ных вероятностей состояния: р2(0, Рз(0> Р$)- Рассмотрим второе состояние S2 и найдем p2(t 4- А/) — вероят- ность того, что в момент (/ 4* А/) система S будет находиться в состоя- нии S2. Это событие может произойти следующими способами: — в момент t система уже была в состоянии S2, а за время А/ не перешла из него ни в S3, ни в S4; или — в момент t система была в состоянии Sx, а за время А/ перешла из него в S2; или — в момент t система была в состоянии S4, а за время А/ перешла из него в S2. Вероятность первого варианта вычисляется так: p2(t) умножается на условную вероятность того, что система за А/ не перейдет ни в Ss, ни в S4. Так как события, состоящие в переходе за время AZ из S2 в S8 197
и из S2 в S4, несовместны, то вероятность того, что осуществится один из этих переходов, равна сумме их вероятностей, т. е. ^23 At + ^24^ (с точностью до бесконечно малых высших порядков). Вероятность то- го, что не осуществится ни один их этих переходов, равна 1 — ^23Д^ — — Х24Д/. Отсюда вероятность первого варианта: Pi (0 (1 -^23 At-^24 ^). Прибавляя сюда вероятности второго и третьего вариантов, по- лучим: Рг (t + At) ~Pi (t) (1 ^23 At А24 Д/) 4~ + Pi (t) \2 Д^ 4- Pj (t) л12 \t. Перенося р2(/) в левую часть, деля на Д/ и переходя к пределу, получим дифференциальное уравнение для р2(0: ) = -^23 Pi (t)-А.24 р2 (0 + ^12 Р1 (0 + ^42 Pi (t). (3.5) at Рассуждая аналогично для состояний S3, S4, получим в результа- те систему дифференциальных уравнений, составленных по типу (3.4) и (3.5). Отбросим в них для краткости аргумент t у функций plt р2, р3, pt и перепишем эту систему в виде: ~~ = --^12 Р1 + ^31 Рз> at “77 = ^23 Pi ^ii Pi Н~^12 Pl + ^42 Pi’ at аРз_ . . (3-6) ,, — 'v31 Рз ^31Рз~Г ^23 Pi’ at ~~ ~ ^42 Pi 4* ^24 Pi “Ь ^34 Рз- at Эти уравнения для вероятностей состояний и называются уравнения- ми Колмогорова. Интегрирование этой системы уравнений даст нам искомые вероят- ности состояний как функции времени. Начальные условия берутся в зависимости от того, каково было начальное состояние системы S. Например, если в начальный момент времени (при t — 0) система S находилась в состоянии то надо принять начальные условия: ПРИ /=0 £1 = 1, Р2=Рз=Р4=0- Заметим, что всех четырех уравнений для р2, р3, р4 можно было бы и не писать; действительно, pv 4- р2 -f- р3 4- р4 = 1 для всех t, и любую из вероятностей ръ р2, р3, pt можно выразить через три ос- тальные. Например р4 можно выразить через р2, р3 в виде 1 — (Р1 +Рг4-Рз) 198
и подставить в остальные уравнения. Тогда специального уравнения для вероятности р4 можно и не писать. Однако в дальнейшем нам будет удобнее пользоваться полной системой уравнений типа (3.6). Обратим внимание на структуру уравнений (3.6). Все они построе- ны по вполне определенному правилу, которое можно сформулировать следующим образом. В левой части каждого уравнения стоит производная вероятности состояния, а правая часть содержит столько связано с данным состоянием. Если стрелка направлена из состояния, соответствующий член имеет знак «минус»; если в состояние— знак «плюс». Каждый член равен произведению плотности вероятности перехода, соответс- твующей данной стрелке, умноженной на ве- роятность того состояния, из которого ис- ходит стрелка. Это правило составления дифферен- циальных уравнений для вероятностей со- стояний является общим и справедливо для любой непрерывной марковской цепи; с его помощью можно совершенно механически, без всяких рассуждений, записывать диффе- ренциальные уравнения для вероятностей со- стояний непосредственно по размеченному графу состояний. членов, сколько стрелок Пример. Размеченный граф состояний системы $ имеет вид, показанный на рис 4.14 Написать систему дифференциальных уравнений Колмогорова и начальные условия для решения этой системы, если известно, что в начальный момент система находится в состоянии S4. Решение. Система уравнений Колмогорова имеет вид: — —(^12 + Чз) Р1, at . . . ,, — Л12 Pi Т Л32 Рз, at ,,------(^32 + ^31) Рз + ^13 Pi + ^53 Рз, at dPi г - ,, — —Pi Т Л34 Рз, at dps = —Л-3 р5 -|- л4. р4. at Начальные условия. при / = 0 р4 = 1, Р2 = Рз = Р4 = Рб=О. 199
4. ПОТОК СОБЫТИЙ. ПРОСТЕЙШИЙ ПОТОК И ЕГО СВОЙСТВА При рассмотрении случайных процессов, протекающих в системах с дискретными состояниями и непрерывным временем, часто приходит- ся встречаться с так называемыми «потоками событий». Потоком событий называется последовательность одно- родных событий, следующих одно за другим в какие-то, вообще гово- ря, случайные моменты времени. Примерами могут быть: — поток вызовов на телефонной станции; - — поток включений приборов в бытовой электросети; — поток грузовых составов, поступающих на железнодорожную станцию; — поток неисправностей (сбоев) вычислительной машины; — поток выстрелов, направляемых на цель, и т. д. Рис. 4.15 При рассмотрении процессов, протекающих в системе с дискрет- ными состояниями и непрерывным временем, часто бывает удобно представлять себе процесс так, как будто переходы системы из состоя- ния в состояние происходят под действием каких-то потоков со- бытий (поток вызовов, поток неисправностей, поток заявок на об- служивание, поток посетителей и т. д.) Поэтому имеет смысл рассмот- реть подробнее потоки событий и их свойства. Будем изображать поток событий последовательностью точек на оси времени Ot (рис. 4.15). Пользуясь таким изображением, не надо за- бывать, что положение каждой точки на оси абсцисс случайно. Поток событий называется регулярным, если события сле- дуют одно за другим через строго определенные промежутки времени. Такой поток сравнительно редко встречается на практике, но представ- ляет определенный интерес как предельный случай. При исследовании операций чаще приходится встречаться с пото- ками событий, для которых и моменты наступления событий и проме- жутки времени между ними случайны. В данном параграфе мы рассмотрим потоки событий, обладающие некоторыми особо простыми свойствами. Для этого введем ряд опреде- лений. 1. Поток событий называется стационарным, если вероят- ность попадания того или иного числа событий на участок времени длиной т (рис. 4.15) зависит только от длины участка и не зави- сит от того, где именно на оси 0/ расположен этот участок. 200
2. Поток событий называется потоком без последей- ствия, если для любых непересекающихся участков времени число событий, попадающих на один из них, не зависит от того, сколько со- бытий попало на другой (или другие, если рассматривается больше двух участков). 3. Поток событий называется ординарным, если вероятность попадания на элементарный участок двух или более событий пренебре- жимо мала по сравнению с вероятностью попадания одного события. Рассмотрим подробнее эти три свойства потоков и посмотрим, ка- ким физическим условиям они соответствуют и за счет чего могут на- рушаться. Стациона рность потока означает его однородность по времени: вероятностные характеристики такого потока не должны ме- няться в зависимости от времени. В частности, так называемая интен- сивность (или «плотность») потока событий — среднее число собы- тий в единицу времени — для стационарного потока должна оставать- ся постоянной. Это, разумеется, не значит, что фактическое число собы- тий, появляющихся в единицу времени, постоянно — нет, поток может иметь местные сгущения и разрежения. Важно, что для стационарного потока эти сгущения и разрежения не носят закономерного характера, а среднее число событий, попадающих на единичный участок времени, остается постоянным для всего рассматриваемого периода. На практике часто встречаются потоки событий, которые (по край- ней мере, на ограниченном участке времени) могут рассматриваться как стационарные. Например, поток вызовов, поступающих на теле- фонную станцию, скажем, на интервале от 12 до 13 часов может счи- таться стационарным. Тот же поток в течение целых суток уже не будет стационарным (ночью интенсивность потока вызовов гораздо меньше, чем днем). Заметим, что так же обстоит дело и с большинством физи- ческих процессов, которые мы называем «стационарными» — в действи- тельности они стационарны только на ограниченном участке времени, а распространение этого участка до бесконечности — лишь удобный прием, применяемый в целях упрощения. Отсутствие последействия в потоке означает, что события, образующие поток, появляются в последовательные моменты времени независимо друг от друга. Например, поток пассажи- ров, входящих на станцию метро, можно считать потоком без после- действия, потому что причины, обусловившие приход отдельного пас- сажира именно в данный момент, а не в другой, как правило, не свя- заны с аналогичными причинами для других пассажиров. Если такая зависимость появляется, условие отсутствия последействия оказы- вается нарушенным. Рассмотрим, например, поток грузовых поездов, идущих по же- лезнодорожной ветке. Если, по условиям безопасности, они не могут следовать один за другим чаще, чем через интервал времени т0, то между событиями в потоке имеется зависимость, и условие отсутствия последействия нарушается. Если интервал т0 мал по сравнению со средним интервалом между поездами т, такое нарушение несуществен- но, но если интервал т0 сравним с т, его приходится учитывать. 201
Ординарность потока означает, что события в потоке приходят поодиночке, а не парами, тройками и т. д. Например, поток клиентов, направляющихся в парикмахерскую, практически можно считать ординарным, чего нельзя сказать о потоке клиентов, направляющихся в ЗАГС для регистрации брака. Поток атак истре- бителей по бомбардировщику, находящемуся над вражеской террито- рией, ординарен, если они атакуют цель поодиночке, и не ордина- рен, если они идут в атаку парами или тройками. Если в неординарном потоке события происходят только парами, только тройками и т. д., то можно его рассматривать как ординарный «поток пар», «поток троек» и т. д. Несколько сложнее обстоит дело, если число событий, образующих «пакет» (группу одновременно при- ходящих событий) случайно. Тогда приходится наряду с потоком пакетов рассматривать случайную величину X — число событий в па- кете, и математическая модель потока становится более сложной: он 5?, % J I... ф » » ф • а • 1 о— О t, t] tj t Рис. 4.16 представляет собой не только последовательность моментов появления пакетов, но и последовательность случайных величин — чисел собы- тий в каждом пакете (рис. 4.16), где хъ х2, ..., xt, ... — значения, принятые случайной величиной X в первом, втором и т. д. пакетах. Пример неординарного потока событий со случайным числом событий в пакете — поток товарных вагонов, прибывающих на сортировочную станцию («пакетом» является поезд). Рассмотрим поток событий, обладающий всеми тремя свойствами: стационарный, без последействия, ординарный. Такой поток назы- вается простейшим (или стационарным пуассоновским) потоком. Название «простейший» связано с тем, что математическое описание со- бытий, связанных с простейшими потоками, оказывается наиболее простым. Отметим, между прочим, что «самый простой», на первый взгляд, регулярный поток со строго постоянными интервалами между событиями отнюдь не является «простейшим» в вышеназванном смыс- ле слова: он обладает ярко выраженным последействием, так как мо- менты появления событий связаны между собой жесткой функцио- нальной зависимостью. Именно из-за этого последействия анализ про- цессов, связанных с регулярными потоками, оказывается, как правило, труднее,V’а не легче по сравнению с простейшими. Простейший поток играет среди других потоков особую роль. А именно, можно доказать, что при суперпозиции (взаимном наложе- нии) достаточно большого числа потоков, обладающих последействием (лишь бы они были стационарны и ординарны), образуется суммарный 202
поток, который можно считать простейшим, и тем точнее, чем большее число потоков складывается’'. Если поток событий не имеет последействия, ординарен, но не стационарен, он называется нестационарным пуассо- новским потоком. В таком потоке интенсивность % (среднее число событий в единицу времени) зависит от времени: Л == Л (Z), тогда как для простейшего потока X = const. Пуассоновский поток событий (как стационарный, так и неста- ционарный) тесно связан с известным распределением Пуас- сона. А именно, число событий потока, попадающих на любой участок, распределено по закону Пуассона. л. О Рис. 4.17 *-•—> t Поясним, что это означает. Рассмотрим на оси 0Z, где наблюдается поток событий, некоторый участок времени длины т (см. рис. 4.17), начинающийся в момент Zo и заканчивающийся в момент Zo + т. Не- трудно доказать (доказательство дается во всех курсах теории ве- роятностей), что вероятность попадания на этот участок ровно т со- бытий выражается формулой: а’" Рт^ — &'а (m=0, 1,...), (4.1) ml где а — среднее число событий, приходящееся на участок т. Для стационарного (простейшего) пуассоновского потока величи- на а равна интенсивности потока, умноженной на длину интервала: а — Хт, т. е. не зависит от того , г д е на оси 0Z взят участок т. Для нестацио- нарного пуассоновского потока величина а выражается формулой: а = J X(Z)dZ, о и, значит, зависит от того, в какой точке Zo начинается участок т. Рассмотрим на оси 0Z простейший поток событий с интенсивностью X (рис. 4.18). Нас будет интересовать интервал времени Т между со- Для этого дополнительно требуется, чтобы складываемые потоки были сравни- мы по интенсивности, т. е., чтобы среди них не было, скажем, одного, превос- ходящего по интенсивности сумму всех остальных. 203
седними событиями в этом потоке. Очевидно, Т есть величина случай- ная; найдем ее закон распределения. Сначала найдем функцию рас- пределения: F(t)=P(T<t), т. е. вероятность того, что величина Т примет значение, меньшее, чем t. Отложим от начала интервала Т (точки/0)отрезок^ и найдем вероят- ность того, что интервал Т будет меньше t. Для этого нужно, чтобы на участок длины t, примыкающий к точке t0, попало хотя бы одно событие потока. Вычислим вероятность этого F(t) через вероятность противоположного события (на участок t не попадет ни одного события потока): F(O = l-Po. to Рис. 4.18 Вероятность Ро найдем по формуле (1.4), полагая m = 0: откуда функция распределения величины Т будет: F(0 = l—e~w (/>0). (4.2) Чтобы найти плотность распределения f(t) случайной величины Т, продифференцируем выражение (4.2) по t: (4.3) Закон распределения с плотностью (4.3) называется показа- тельным (или экспоненциальным). График его имеет вид, пред- ставленный на рнс. 4.19. Величина X называется параметром, показательного закона. Показательный закон распределения, как мы увидим дальше, иг- рает большую роль в теории марковских случайных процессов. Найдем числовые характеристики случайной величины Т — ма- тематическое ожидание (среднее значение) mt и дисперсию Dt. Имеем: — (0 di — J Интегрируя по частям, получим: mt — —~. (4.4) 204
Дисперсию величины Т найдем через второй начальный момент: оо оо = (t) dt—m? = f V2e~w — о о откуда, снова интегрируя по частям, получим; * А,2 (4.5) Извлекая корень квадратный из дисперсии, найдем среднее квад- ратическое отклонение случайной величины Т: Рис. 4.19 Рис. 4.20 ние и среднее квадратическое отклонение равны друг другу и о б- ратны параметру %. Таким образом, исследуя структуру простейшего потока собы- тий, мы пришли к заключению: промежуток времени Т между сосед- ними событиями в простейшем потоке распределен по показательному закону, его среднее значение и среднее квадратическое отклонение равны 1/Х, где X — интенсивность потока. Для нестационарного пуассоновского потока закон распределе- ния промежутка Т уже не будет показательным; вид этого закона будет зависеть, во-первых, от того, где на оси 0/ расположено первое из со- бытий, и, во-вторых, от вида зависимости %(/), характеризующей пере- менную интенсивность потока. Однако если %(/) меняется сравнитель- но медленно и его изменение за время между двумя событиями невели- ко, то закон распределения промежутка времени между событиями мож- но приближенно считать показательным (4.3), полагая в этой формуле величину X равной среднему значению Х(/) на том участке, который нас интересует. В заключение данного параграфа выведем выражение для так на- зываемого «элемента вероятности появления события». Рассмотрим на оси 0/ простейший поток событий с интенсивностью К и элементарный участок А/, прилежащий в точке t (рис. 4.20). Найдем вероятность того, что на участке Д/ появится какое-то событие потока, т. е. участок не будет «пуст». Так как поток ордина- рен, вероятностью появления на участке Д/ более чем одного собы- тия можно пренебречь. Обозначим Ро(Д0 вероятность того, что на 20S
участке Д/ не будет события, а РХ(Д/) — вероятность того, что на нем появится одно событие. В силу ординарности потока P^t^l-P^t), а вероятность Р0(Ы) вычисляем по формуле (4.1): Ро (Л/) = -22- е-« = е~а = e~w, откуда Рх (ДО « 1 —е-ш. Разлагая е—w в ряд по степеням АД/ и пренебрегая величи- нами высшего порядка малости, получим: РХ(Д/)» 1—(1—АД/). Отсюда Рх (ДО « (4.7) т. е. вероятность появления на элементарном участке времени Д/ ка- кого-то события потока приближенно равна АД/, где % — интенсивность потока. Эту вероятность мы будем называть «элементом вероятности появления события». Очевидно, такая же формула будет справедлива и для нестацио- нарного пуассоновского потока, с той разницей, что величину А нуж- но брать равной ее значению в той точке t, к которой примыкает учас- ток Д/: РХ(Д/)«А(/) Д/. 5. ПОТОКИ ПАЛЬМА. ПОТОКИ ЭРЛАНГА Поток событий называется потоком Пальма (или потоком с ограниченным последействием), если промежутки времени между последовательными событиями: Л, Т2.... Tt, ... представляют собой независимые, одинаково распределенные случай- ные величины (рис. 4.21). Простейший поток есть частный случай потока Пальма: в нем рас- стояния Pi, Т2, ..., Tt, ... представляют собой случайные величины, распределенные по одному и тому же показательному закону; их неза- висимость следует из того, что простейший поток есть поток без после- действия, и расстояние по времени между любыми двумя событиями не зависит от того, каковы расстояния между другими. Рассмотрим пример потока Пальма. Некоторый элемент техничес- кого устройства (например, радиолампа) работает непрерывно до свое- го отказа (выхода из строя), после чего он мгновенно заменяется новым. Срок работы элемента случаен. Если отдельные экземпляры элементов выходят из строя независимо друг от друга, то поток отказов (или «по- 206
ток восстановлений», так как отказ и восстановление происходят в один и тот же момент) представляет собой поток Пальма. Если к тому же срок работы элемента распределен по показательному закону, поток Пальма превращается в простейший (стационарный пуассоновский) поток. Другой пример: группа самолетов идет в боевом порядке «колон- на» (рис. 4.22) с одинаковой для всех самолетов скоростью V. Каждый из ннх, кроме ведущего, обязан выдерживать строй, т. е. держаться на Рис. 4.21 заданном расстоянии от впереди идущего. Это расстояние, измеряемое дальномером, выдерживается с ошибками. Моменты пересечения са- молетами заданного рубежа при этих условиях образуют поток Пальма, так как случайные величины Тг = у-; Т.г = у-; ... независимы. За- метим, что тот же поток не будет потоком Пальма, если самолеты стре- мятся выдержать заданное расстояние не от соседа, а от ведущего всю колонну. Рис, 4.22 Многие потоки событий, встречающиеся на практике, хотя и не являются в точности потоками Пальма, но могут быть ими приближен- но заменены. Важными для практики образцами потоков Пальма являются так называемые потоки Эрланга. Эти потоки образуются в резуль- тате «просеивания» простейших потоков. Рассмотрим на оси Qt простейший поток событий (рис. 4.23) и со- храним в нем не все точки, а только каждую вторую; остальные выбро- сим (на рис. 4.23 сохраненные точки показаны жирными). В результа- те такой операции «прореживания» или «просеивания» образуется сно- ва поток событий; он называется потоком Эрланга второ- го порядка. Рис, 4,23 207
Вообще, потоком Эрланга k-т о порядка ЭЛ назы- вается поток, получающийся, если в простейшем потоке сохранить каждую k-ю точку, а остальные выбросить. Например, на рис. 4.24 показано образование потока Эрланга 4-го порядка Э4 (три точки простейшего потока выбрасываются, а чет- вертая сохраняется). Очевидно, простейший поток представляет собой частный случай потока Эрланга, а именно поток Эрланга 1-го порядка Эх. Итервал времени Т между соседними событиями в потоке Эрлан- га k-ro порядка представляет собой сумму k независимых случайных величин — расстояний между событиями в исходном простейшем по- токе: k T = Ti + T2 + ... + Tfe j Tt. Рис. 4.24 Каждая из этих случайных величин распределена по показательному закону: /1(/)=ке-^ (/>0). Закон распределения интервала Т между соседними событиями в пото- ке Эй называется законом Эрланга k-vo порядка. Найдем выражение для плотности распределения этого закона; обозначим ее Для этого рассмотрим на оси (рис. 4.25) простейший поток с интенсивностью X, в котором события разделены интервалами 7\, Тъ, ..., и найдем элемент вероятности fh(t)dt—вероятность того, что интервал Т = 2Tt окажется в пределах элементарного участка (t, t 4* dt). Для этого, во-первых, на участок длиной t должно попасть ровно k — 1 точек простейшего потока; вероятность этого события, соглас- но формуле (4.1), равна Кроме того, последняя (£-я) точка должна попасть на элементар- ный участок (/, t + dt) — вероятность этого равна Kdt (см. формулу (4.7)). Перемножая эти вероятности, получим: rft(0 dt = (^^- e-^Kdt, lh' ' (k—1)1 откуда г (^>0). (5.1) 208
Очевидно, при k = 1 получается обычное показательное распре- деление: f1(O = Xe-^ (f>0). (5.2) Найдем характеристики закона Эрланга k-ro порядка: его мате- матическое ожидание mt(k> и дисперсию Случайная величина Т, распределенная по закону Эрланга k-ro порядка, получается сло- жением k независимых случайных величин: Я Т~1Т„ 1=1 где каждая из величин Т,- распределена по показательному закону (5.2) с математическим ожиданием 1/Х и дисперсией 1/Х'2 (см. формулы (4.4) и (4.5)). Применяя теоремы сложения математических ожиданий и дисперсий, имеем Dt^=-^. (5.3) Извлекая из последнего выражения квадратный корень, найдем среднее квадратическое отклонение: Таким образом, мы нашли математическое ожидание, дисперсию и среднее квадратическое отклонение интервала между соседними со- бытиями в потоке Эрланга k-ro порядка: ^'=4; (5.4) Л Л® Л Заметим, что как закон распределения так и все его характе- ристики выражены не через интенсивность самого потока Эрланга ЭЛ, а через интенсивность X порождающего его простейшего потока, кото- рый подвергался прореживанию. Представляет интерес выразить их через интенсивность (среднее число событий в единицу времени) самого потока Эрланга Эй. Обозначим Лй — интенсивность потока 3fe. Оче- видно Afe=X/^; X = kAk, 209
так как из исходного простейшего потока с интенсивностью А> берется только /г-я часть. Подставляя выражение Л через Aft в формуле (5.1), получим f kXh(kXht)k~x n-UAbl е или (*>°)- (б-5) Математическое ожидание, дисперсия н среднее квадратическое отклонение этого закона будут: m/)= —; Dt^~—L-; а/>= —-—. (5.6) 4 Aft * kXh* 1 yrxh Теперь предположим, что, сохраняя неизменной интенсивность потока ЛА: ЛА =Л = const, мы будем менять только порядок k закона Эрланга. Его математичес- кое ожидание останется постоянным: ’ (5.7) а дисперсия и среднее квадратическое отклонение будут меняться: Dt^> = —; а(<*> = — . (5.8) /ГЛ V } Из формул (5.8) видно, что при k -> оо и дисперсия, и среднее квадратическое отклонение стремятся к нулю. А что это зна,- чит? Это значит, что при k->- оо поток Эрланга заданной интенсивности j\ неограниченно приближается к регулярному потоку с постоянным интервалом между событиями: Т = const =— . Л Это свойство потоков Эрланга удобно в практических примене- ниях: оно дает возможность, задаваясь различными k, получать пото- ки, обладающие различным последействием — от полного отсутствия последействия (1г — 1) до жесткой функциональной связи между мо- ментами появления событий (k = оо). Таким образом, порядок потока Эрланга k может служить в какой-то степени «мерой последействия». В целях упрощения часто бывает удобно приближенно заменить реальный поток событий — потоком Эрланга с тем же последействием. Это делают, согласовывая характеристики реального потока — мате- матическое ожидание и дисперсию интервала между событиями — с те- ми же характеристиками заменяющего потока Эрланга. 210
Пример. В результате статистической обработки интервалов времени меж- ду событиями в некотором потоке получены следующие характеристики: — среднее значение интервала mt = 2 мин, — среднее квадратическое отклонение интервала О( = 0,9 мин. Требуется подобрать поток Эрланга, обладающий приблизительно теми же характеристиками, найти его интенсивность Л и порядок k. Решение. Интенсивность Л есть величина, обратная среднему интервалу между событиями: Л = l/mt= 1/2 = 0,5 (соб/мин) Из формулы (5.8) находим порядок потока Эрланга k: Выбирая в качестве k ближайшее целое число, получаем k = 5. Итак, данный поток можно приближенно заменить потоком Эрланга 5-го порядка с плотностью вида: или (Z) = 4,l/4 е—2-5 z (/>0). (5.9) Вид кривой распределения (5.9) показан на рис. 4.26 Особое внимание, уделяемое здесь потокам Эрланга по сравнению с другими потоками Пальма (с произвольным законом распределения интервала времени между соседними событиями) объясняется тем, что при помощи этих потоков можно сводить не-марковские процессы к марковским. Как это делается, мы увидим дальше, в § 10, 11 настоящей главы, а также в § 6 гл. 5. Потоки Эрланга весьма удобны для приближенного представле- ния потоков Пальма любого вида, так как потоки Эрланга различных порядков образуют целую гамму, дающую постепенный переход от про- стейшего потока (полное отсутствие последействия) к потоку с регу- лярными интервалами (полное, жесткое последействие). Возможности приближенного представления любых потоков Пальма потоками типа Эрланга еще более расширяются, если воспользоваться «обобщенными законами Эрланга», которые получаются при сложении нескольких слу- чайных величин, распределенных по показательным законам с разными параметрами (см., например, [8]), а также «смешанными обобщенными законами Эрланга», которые получаются, если сложить несколько обобщенных законов Эрланга с коэффициентами («весами»), образую- щими в сумме единицу. 211
6. ПУАССОНОВСКИЕ ПОТОКИ СОБЫТИЙ И НЕПРЕРЫВНЫЕ МАРКОВСКИЕ ЦЕПИ Рассмотрим некоторую физическую систему S с дискретными со- стояниями Si, S2....Sn> которая переходит из состояния в состояние под влиянием каких-то случайных событий, например, вызовы на теле- фонной станции, выходы нз строя (отказы) элементов аппаратуры, вы- стрелы, направленные по цели и т. д. Будем себе это представлять так, будто события, переводящие си- стему из состояния в состояние, представляют собой какие-то пото- ки событий (потоки вызовов, потоки отказов, потоки выстрелов и т. д.). Пусть система S с графом состояний, показанным на рис. 4.27, в момент t находится в состоянии St и может перейти из него в состоя- ние Sj под влиянием какого-то пуассоновского потока событий с ин- тенсивностью как только появляется первое событие этого потока, система мгновенно переходит (перескакивает) из в S;. Как мы знаем, вероятность этого перехода за элементарный промежуток времени А/ (элемент вероятности перехода) равна Хг;А/. Таким образом, плотность вероятности перехода Хг7 в непрерывной цепи Маркова представляет собой не что иное, как интенсивность потока собы- тий, переводящего систему по соответствующей стрелке. Если все потоки событий, переводящие систему S из состояния в состояние, пуассоновские (стационарные или нестационарные — безразлично), то процесс, протекающий в системе, будет марковским. Действительно, пуассоновский поток обладает отсутствием последей- ствия, поэтому, при заданном состоянии системы в данный момент, ее переходы в другие состояния в будущем обусловлены только появле- нием каких-то событий в пуассоновских потоках, а вероятности появ- ления этих событий не зависят от «предыстории» процесса. В дальнейшем, рассматривая марковские процессы в системах с дискретными состояниями и непрерывным временем (непрерывные марковские цепи), нам удобно будет во всех случаях рассматривать переходы системы из состояния в состояние как происходящие под вли- янием каких-то потоков событий, хотя бы в действительности эти события были единичными. Например, работающее техническое устройство мы будем рассматривать как находящееся под действием потока отказов, хотя фактически оно может отказать толь- ко один раз. Действительно, если устройство отказывает в тот момент, когда приходит первое событие потока, то совершенно все рав- но — продолжается после этого поток отказов или же прекращает- ся: судьба устройства от этого уже не зависит. Для нас же будет удобнее иметь дело именно с потоками событий. Итак, рассматривается система S, в которой переходы из состоя- ния в состояние происходят под действием пуассоновских потоков со- бытий с определенными интенсивностями. Проставим эти интенсив- ности (плотности вероятностей переходов) на графе состояний систе- мы у соответствующих стрелок. Получим размеченный граф состоя- 218
ний (рис. 4.27); по которому, пользуясь правилом, сформулированным в § 3, можно сразу записать дифференциальные уравнения Колмо- горова для вероятностей состояний. Пример 1. Техническая система $ состоит из двух узлов: I и II; каждый из иих независимо от другого может отказывать (выходить из строя). Поток от- казов первого узла — пуассоновский, с интенсивностью Ку, второго — также пуассоновский, с интенсивностью 1П. Каждый узел сразу после отказа на- чинает ремонтироваться (восстанавливаться). Поток восстановлений (оконча- ний ремонта ремонтируемого узла) для обоих узлов — пуассоновский с интен- сивностью X. Рис. 4.28 Рис. 4.27 Составить граф состояний системы и написать уравнения Колмогорова для вероятностей состояний. Определить, при каких начальных условиях нужно решать эти уравнения, если в начальный момент (1 = 0) система работает исправно. Решение. Состояния системы: Su — оба узла исправны, S21 — первый узел ремонтируется, второй исправен, S12 — первый узел исправен, второй ремонтируется, S22 — оба узла ремонтируются. Размеченный граф состояний системы показан на рис. 4.28. Интенсивности потоков событий иа рис. 4.28 проставлены из следующих соображений. Если система 5 находится в состоянии Su, то иа нее действуют два потока событий: поток неисправностей узла I с интенсивностью X,, переводящий ее в состояние S21, и поток неисправностей узла II с интенсивностью Х,п> пере- водящий ее в S12. Пусть теперь система находится в состоянии S21 (узел I ремон- тируется, узел II—исправен). Из этого состояния система может, во-первых, вер- нуться в Su (это происходит под действием потока восстановлений с интенсив- ностью %); во-вторых, — перейти в состояние S22 (когда ремонт узла I еще не закончен, а узел II тем временем вышел из строя); этот переход происходит под действием потока отказов узла II с интенсивностьюХ,п. Интенсивности потоков у остальных стрелок проставляются аналогично. Обозначая вероятности состояний рп, р21, р12 и р22 и пользуясь правилом, сформулированным в § 3, запишем уравнения Колмогорова для вероятно- стей состояний: 213
— (^ + Ьи) Рп+цд+^лг’ -~= — (Ы-^п) Р21 +KI Pll + XP'22, -^= -~(& + Ь1) Pia + ^-u Рц + Хр22> -—=— 2Xp22 + \j Р214-К] Р12. (6.1) Начальные условия, при которых нужно решать эту систему: При t — 0 Рц = 1, Р21 = Р12 — Р22 = О- Помехи Рис 4.29 Заметим, что, пользуясь условием Р11 + Р21 + Р12 + Р22 = h можно было бы уменьшить число уравнений на одно. Действительно, любую из вероятностей рп, р21, р12, р22 можно выразить через остальные и подставить в уравнения (6.1), а уравнение, содержащее в левой части производную этой ве- роятности — отбросить. Заметим, кроме того, что уравнения (6.1) справедливы как для постоянных интенсивностей пуассоновских потоков X, так и для переменных: ^ = ^,(0; К,, = (/); Х = А.(О- Пример 2. Группа в составе пяти самолетов в строю «колонна» (рис. 4.29) совершает налет на территорию противника. Передний самолет (ведущий) является постановщиком помех; до тех пор, пока он не сбит, идущие за ним самолеты не могут быть обнаружены и атакованы средствами ПВО противника. Атакам подвергается только постановщик помех. Поток атак — пуассоновский, с интенсивностью X (атак/час). В результате атаки постановщик помех пора- жается с вероятностью р. Если постановщик помех поражен (сбит), то следующие за ним самолеты обнаруживаются и подвергаются атакам ПВО; на каждый из них (до тех пор, по- ка он не поражен) направляется пуассоновский поток атак с интенсивностью X; каждой атакой самолет поражается с вероятностью р. Когда самолет поражен, атаки по нему прекращаются, но на другие самолеты не переносятся. Написать уравнения Колмогорова для вероятностей состояний систе- мы и указать начальные условия. Решение. Будем нумеровать состояния системы соответственно числу со- хранившихся самолетов в группе: S5 — все самолеты целы; S4 — постановщик помех сбит, остальные самолеты целы; 214
S3 — постановщик помех и один бомбардировщик сбиты, остальные само- леты целы; S2 — постановщик помех и два бомбардировщика сбиты, остальные само- леты целы; Sj — постановщик помех и три бомбардировщика сбиты, один самолет цел; So — все самолеты сбиты. Состояния мы отличаем друг от друга по числу сохранившихся бом- бардировщиков, а не по тому, какой именно из них сохранился, так как все бомбардировщики по условиям задачи равноценны — атакуются с одинако- вой интенсивностью и поражаются с одинаковой вероятностью. Граф состояний системы показан на рис. 4 30. Чтобы разметить этот граф, определим интенсивности потоков событий, переводящих систему из состояния в состояние. Из состояния S5 в S4 систему переводит поток поражающих (или «успешных») атак, т. е. тех атак, которые приводят к поражению постановщика (разумеется, если он раньше не был поражен). Интенсивность Рис. 4.30 потока атак равна X, но не все они — поражающие: каждая из них оказывается поражающей только с вероятностью р. Очевидно, интенсивность потока пора- жающих атак равна Хр; эта интенсивность и проставлена в качестве Х54 у первой слева стрелки на графе (рис. 4.30). Займемся следующей стрелкой и найдем интенсивность Х43. Система нахо- дится в состоянии S4, т. е., целы и могут быть атакованы четыре самолета. Она перейдет в состояние S3 за время А/, если за это время какой-нибудь из самоле- тов (все равно, какой) будет сбит. Найдем вероятность противоположного собы- тия — за время Д/ ни один самолет не будет сбит: (1— крМ) (l^kpM) (1—Хр М) (1— кр Ы) = (1—кр Д/)4ж 1—4Хр Ы. Здесь отброшены члены высшего порядка малости относительно Д/. Вычитая эту вероятность из единицы, получим вероятность перехода из S4 в S3 за время Д/ (элемент вероятности перехода): 4ХрД/, откуда Х43 = 4Хр, что и проставлено у второй слева стрелки. Заметим, что интенсивность этого по- тока событий просто равна сумме интенсивностей потоков поражающих атак, направленных на отдельные самолеты Рассуждая наглядно, можно получить этот вывод следующим образом: система 5 в состоянии S4 состоит из четырех са- молетов; на каждый нз них действует поток поражающих атак с интенсивностью Хр; значит на систему в целом действует суммарный поток поражающих атак с интенсивностью 4Хр. С помощью аналогичных рассуждений проставляются интенсивности по- токов событий у остальных стрелок. 215
Уравнения Колмогорова для вероятностей состояний имеют вид» dPs . dt - -Xppe, ~Z"= —4%pp4-f-Xpp8, dt ~77= —3X,pp3-}- 41pp4, at —— = — 2Xppa + 3Xpp3, dt = —^PPi + 2X,ppa, Inn —=Xpp1. dt Так как в начальный момент (при t = 0) все самолеты -целы, начальные условия будут: при t = Q р5=1. Р4=Рз=Рг=Р1 = Ро=О- Рис. 4.31 Пример 3. Условия те же, что и в примере 2, но интенсивность X относит- ся к общему потоку атак, направляемому иа всю группу. До тех пор, пока постановщик помех цел, все эти атаки направляются на него; когда он сбит, ата- ки распределяются равномерно между оставшимися самолетами, так что на один самолет приходится в среднем 1/й (атак/час), где k—число сохранившихся само- летов. Составить граф состояний, разметить его и записать уравнения Кол- могорова для вероятностей состояний. Решение. Размеченный граф состояний показан на рис. 4.31. Уравнения Колмогорова: #5 . dt------lpPil dp& . _ Хрр4 4 1рр8, dt dps dt dPi dt = — Xppj 4- %pp2, dPo . "dF = lpP1, lpps 4- lppit Крр, Ьррз, Начальные условия =.те же, что и в примере 2. 216
Отметим, что в данном параграфе мы только выписывали дифференциальные уравнения для вероятностей состояний, но не за- нимались решением этих уравнений. По этому поводу можно заметить следующее. Уравнения для ве- роятностей состояний представляют собой линейные дифференциаль- ные уравнения с постоянными или переменными коэффициентами — в зависимости от того, постоянны или переменны интенсивности ki} потоков событий, переводящих систему из состояния в состояние. Система нескольких линейных дифференциальных уравнений тако- ко типа только в редких случаях может быть проинтегрирована в квад- ратурах: обычно такую систему приходится решать численно — либо вручную, либо на аналоговой вычислительной машине (АВМ), либо, наконец, на ЭЦВМ. Все эти способы решения систем дифференциаль- ных уравнений затруднений не доставляют; поэтому самое существен- ное — уметь записать систему уравнений и сформулировать для нее начальные условия, чем мы и ограничились здесь. 7. ПРЕДЕЛЬНЫЕ ВЕРОЯТНОСТИ СОСТОЯНИЙ Пусть имеется физическая система S с дискретными состояниями: Si> Sj,..., Sn, в которой протекает марковский случайный процесс с непрерывным временем (непрерывная цепь Маркова). Граф состояний показан на рис. 4.32. Рис. 4.32 Предположим, что все интенсивности потоков событий, переводя- щих систему из состояния в состояние, постоянны: А.0 = const, другими словами, все потоки событий — простейшие (стационарные пуассоновские) потоки. Записав систему дифференциальных уравнений Колмогорова для вероятностей состояний и проинтегрировав эти уравнения при задан- 217
ных начальных условиях, мы получим вероятности состояний, как функции времени, т. е. п функций: й(0> Рг(О...... РпЮ> при любом t дающих в сумме единицу: § А (0 = 1- ;=j Поставим теперь следующий вопрос: что будет происходить с сис- темой S при /—> оо? Будут ли функции pi(/), р2(0, Р«(0 стремиться к каким-то пределам? Эти пределы, если они существуют, называются предельными (или «финальными») вероятностями состояний. Можно доказать следующее общее положение. Если число состоя- ний системы S конечно и из каждого состояния можно перейти (за то или иное число шагов) в каждое другое, то предельные вероятности со- стояний существуют и не зависят от начального состояния системы. Рис. 4.33 Рис. 4.34 На рис. 4.33 показан граф состояний, удовлетворяющий постав- ленному условию: из любого состояния система может рано или позд- но перейти в любое другое. Напротив, для системы, граф состояний которой показан на рис. 4.34, условие не выполнено. Очевидно, что если начальное состояние такой системы S1( то, например, состояние Se при t ->• оо может быть достигнуто, а если начальное состояние S2 — не может. Предположим, что поставленное условие выполнено, и предель- ные вероятности существуют: limpz(^)=p; (i = 1, 2...., и). (7.1) t ->оо Предельные вероятности мы будем обозначать теми же буквами pi, Рг, < Рп, что и сами вероятности состояний, разумея подними на этот раз не переменные величины (функции времени), а постоянные числа. 218
Очевидно, предельные вероятности состояний, так же как и до- предельные, в сумме должны давать единицу: п 2 А- = 1- :=! Таким образом, при /—> оо в системе S устанавливается некоторый предельный стационарный режим: он состоит в том, что система случайным образом меняет свои состояния, но вероятность каждого из них уже не зависит от времени: каждое из состояний осу- ществляется с некоторой постоянной вероятностью. Каков смысл этой вероятности? Она представляет собой не что иное, как сред- нее относительное время пребывания си- стемы в данном состоянии. Например, если у системы 5 три возможных состояния: Si, S2 и S3, причем их предельные вероят- ности равны 0,2, 0,3 и 0,5, это означает, что после перехода к устано- вившемуся режиму система S в среднем две десятых времени будет находиться в состоянии Sx, три десятых — в состоянии S2 и полови- ну времени— в состоянии S3. Возникает вопрос: как вычислить пре- дельные вероятности состояний ри р2, ..., рп? Оказывается, для этого в системе уравнений Колмогорова, описывающих вероятности состояний, нужно положить все левые час- ти {производные) равными нулю. Действительно, в предельном (установившемся) режиме все вероят- ности состояний постоянны, значит, их производные равны нулю. Если все левые части уравнений Колмогорова для вероятностей состояний положить равными нулю, то система дифференциальных уравнений превратится в систему линейных алгеб- раических уравнений. Совместно с условием Ерг=1 (7.2) <=i (так называемым «нормировочным условием») эти уравнения дают возможность вычислить все предельные вероятности Pv Р2, - > Рп- Пример 1. Физическая система 5 имеет возможные состояния: S1; S2, S3, S4, размеченный граф которых дан на рис. 4.35 (у каждой стрелки поставлено численное значение соответствующей интенсивности). Вычислить предельные ве- роятности состояний: р1( р2, р3, рц. Решение. Пишем уравнения Колмогорова для вероятностей состояний: dpt к , = — 5р4 -f- ps, dt dp? ~dT dp3 dt dpt dt = — Рг + 2pi + 2р3, = — Зр3 4- Зрх -|- 2р4, = — 2ра 4- р2- (7.3) 219
Полагая левые части равными нулю, получим систему алгебраических уравие- ний для предельных вероятностей состояний: О = — 5р14-р3, О = — рг 4- 2pi 4- 2ps> О = — Зр3+Зр14-2р4, - - О = — 2р4 4* Ра- Уравнения (7.4) —так называемые однородные уравнения (без свободного члена). Как известно из алгебры, эти уравнения определяют величины р1, ра, р3, pt только с точностью до постоянного множителя. К счастью, у нас есть нор- мировочное условие: Pi + Ра + Рз + Pt = К (7-5) которое, совместно с уравнениями (7.4), дает возможность найти все неизвест- ные вероятности. Рис. 4.35 Действительно, выразим из (7.4) все неизвестные вероятности через одну из них, например, через pv Из первого уравнения: Рз= 5р4. Подставляя во второе уравнение, получим: р2 = 2рл + 2р3 = 2рл + 10рл = 12ft. Четвертое уравнение дает: Pi =• ЧгРа = 6Р1- Подставляя все эти выражения вместо р2, р3, р4 в нормировочное условие (7.5), получим Pi + 12pj + 5рл + брл = 1. Отсюда 24рл=1, Рл = 1/24, P2=12pi = 1/2. Рз = 5рл =6 /24, р4=брл = !/4. Таким образом, предельные вероятности состояний получены, они равны: Pi = 4ai, Ра — Чаг Рз = 8/з4> Pi = 4i- (7.6) Это значит, что в предельном, установившемся режиме система $ будет проводить в состоянии Зл в среднем одну двадцать четвертую часть времени, в состоянии S2 — половину времени, в состоянии S3 — пять двадцать четвертых и в состоянии S4 — одну четверть времени. 220
Заметим, что решая эту задачу, мы совсем не пользовались одним из урав- нений (7 4) — третьим Нетрудно убедиться, что оно является следствием грех остальных: складывая все четыре уравнения, мы получим тождественный нуль. С равным успехом, решая систему, мы могли бы отбросить любое из четырех урав- нений (7.4). Примененный нами способ составления алгебраических уравнений для предельных вероятностей состояний сводился к следующему: сперва написать дифференциальные уравнения, а затем положить в них левые части равными ну- лю. Однако можно записать алгебраические уравнения для предельных вероят- ностей и непосредственно, не проходя через этап дифференциальных. Проиллю- стрируем это на примере. Пример 2. Граф состояний системы показан на рис. 4.36. Написать ал- гебраические уравнения для предельных вероятностей состояний. Решение. Не записывая дифференциальных уравнений, прямо пишем соот- ветствующие правые части и приравниваем их и^лю; чтобы не иметь дела с от- рицательными членами, сразу переносим их в другую часть, меняя знак! ^21 Рг + ^з! Рз — (^12 + ^13) Р1> ^12 Р1 = (^23 + ^21) Рг. (у ^-1з Pi 4" ^-гз Рз + ^4з Ра — ^з! Рз, ^21 Рг — ^43 Ра- Чтобы в дальнейшем сразу же писать такие уравнения, полезно Запом- нить следующее мнемоническое правило: «чтд втекает, то и вытекает», то есть для каждого состояния сумма членов, соответствующих входящим стрелкам, рав- на сумме членов, соответствующих выходящим-, каждый член равен интенсивнос- ти потока событий, переводящего систему по данной стрелке, умноженной на вероятность того состояния, из которого выходит стрелка. В дальнейшем мы во всех случаях будем пользоваться именно этим кратчай- шим способом записи уравнений для предельных вероятностей. Пример 3. Написать алгебраические уравнения для предельных вероят- ностей состояний системы S, граф состояний которой дан на рис. 4.37. Решить эти уравнения. Решение. Пишем алгебраические уравнения для предельных вероятно- стей состояний: ^31 Рз — ^ii Pi, ^12 Pl — ^23 Рз, ^23 Pi — ^31 Рз- Нормировочное условие: Р1 + Рг + Рз = 1. Выразим С помощью первых двух уравнений (7.8) р2 и р3 через pt: ^-12 Рз— л Р1‘> Аз1 Р2^Т~ л 23 Р1- (7.8) (7.10) Подставим их в нормировочное условие (7.9): । ^12 „ । ^12 t Pi+т—Pi + т— Pi = l л23 л31 221
откуда Далее, из (7 10) получим 8. ПРОЦЕСС «ГИБЕЛИ И РАЗМНОЖЕНИЯ» В предыдущем параграфе мы убедились, что зная размеченный граф состояний системы, можно сразу написать алгебраические уравне- ния для предельных вероятностей состояний. Таким образом, если две непрерывные цепи Маркова имеют одинаковые графы состояний и раз- личаются только значениями интенсивностей kiit то нет надобности на- Рис. 4.38 ходить предельные вероятности состояний для каждого из графов в от- дельности: достаточно составить и решить в буквенном виде уравнения для одного из них, а затем подставить вместо Хг> соответствующие зна- чения. Для многих часто встречающихся форм графов линейные урав- нения легко решаются в буквенном виде. В данном параграфе мы познакомимся с одной очень типичной схемой непрерывных марковских цепей — так называемой «схемой гибели и размножения»*). Марковская непрерывная цепь называется «процессом гибели и размножения», если ее граф состояний имеет вид, представленный на рис. 4.38, т. е. все состояния можно вытянуть в одну цепочку, в кото- рой каждое из средних состояний (S2, ..., S„_i) связано прямой и об- ратной связью с каждым из соседних состояний, а крайние состояния (Si, Sn) — только с одним соседним состоянием. Пример 1. Техническое устройство состоит из трех одинаковых узлов; каждый из них может выходить из строя (отказывать); отказав- ший узел немедленно начинает восстанавливаться. Состояния систе- мы нумеруем по числу неисправных узлов: *' Происхождение термина «схема гибели и размножения» ведет начало от биоло- гических задач, где подобной схемой описывается процесс изменения числен- ности популяции. 222
So — все три узла исправны; Sj — один-узел отказал (восстанавливается), два исправны; S2 — два узла восстанавливаются, один исправен; 83 — все три узла восстанавливаются. Граф состояний показан на рис. 4.39. Из графа видно, что про- цесс, протекающий в системе, представляет собой процесс «гибели и размножения». Рис. 4.39 Схема гибели и размножения очень часто встречается в самых раз- нообразных практических задачах; поэтому имеет смысл заранее рас- смотреть эту схему в общем виде и решить соответствующую систему алгебраических уравнений с тем, чтобы в дальнейшем, встречаясь с кон- кретными процессами, протекающими по такой схеме, не решать зада- чу каждый раз заново, а пользоваться уже готовым решением. Итак, рассмотрим случайный процесс гибели и размножения с гра- фом состояний, представленным на рис. 4.40 Рис. 4.40 Напишем алгебраические уравнения для вероятностей состояний. Для первого состояния Sj имеем: ^12 Р1 — ^21 Pi- (8.1) Для второго состояния S2 суммы членов, соответствующих входя- щим и выходящим стрелкам, равны: ^23 Pz + ^21 Р2 = ^12 Р1 + ^32 Рз* Но, в силу (8.1), можно сократить справа и слева равные друг дру- гу члены ^i2Pi и ^21Р2; получим: ^23 Pz ~ ^32 Рз» и далее, совершенно аналогично, ^34 Рз ~ ^43 Р4> 223
Одним словом, для схемы гибели и размножения члены, соответ- ствующие стоящим друг над другом стрелкам, равны между собой: ^4—t. kpk~i =^fe. и— t Pv (8.2) где k принимает все значения от 2 до п. Итак, предельные вероятности состояний plt рг...рп в любой схеме гибели и размножения удовлетворяют уравнениям: S со -Л* Ci С2. • во ” ео со • 'll 1 II ' tx й е. ‘ S 3 s ’ << • • • (8.3) ^4—1. uPk—l = ^k, Ь— 1 Pv 1, nPn—1 ~^n. n—lPn и нормировочному условию: Р1+Р2 + - + Рп = 1- (8.4) Будем решать эту систему следующим образом: из первого урав- нения (7.3) выразим р2: Р2=7^Р1» (8.5) Л21 из второго, с учетом (8.5), получим: р3=^р2=Нк2^ <8-б> Л32 ™32 ^21 из третьего, с учетом (8.6): P4 = r1HL2Pv Л43 Л32 Л21 и вообще п - Х*-1’ ••• Х12 п /о 7\ Pk = , л л ~ Р1‘ (о. 1) Kk. 4—1 л4-1, 4—2 • • • л21 Эта формула справедлива для любого k от 2 до п. Обратим внимание на ее структуру. В числителе стоит произведе- ние всех плотностей вероятности перехода (интенсивностей) стоя- щих у стрелок, направленных слева направо, с начала и вплоть до той, которая идет в состояние Su, в знаменателе — произве- дение всех интенсивностей стоящих у стрелок, идущих справа налево, опять-таки, с начала и вплоть до стрелки, исходящей из состояния Sk. При k = п в числителе будет стоять произведение интен- сивностей стоящих у всех стрелок, идущих слева направо, а в знаменателе — у всех стрелок, идущих справа налево. 224
Итак, все вероятности р1( р2, .... рп выражены через одну из них: Ру. Подставим эти выражения в нормировочное условие: Ру-\-рг-\- 4-...-\-Рп = 1. Получим: , ^12 , ^23 ^12 Pi+г" Р1 + ” Л21 Л32 Л21 , . 4— 1, п h—2, п— 1 ’ ' "Г" ) л %, n—1 Лп—1, п—2 ' 4-1, k 4-2, k-\ X12 х х P1 ЛЛ, Л-1 ЛЛ-1, Л-2 Л21 41 откуда | I I _L2 I I п 1 ’ № «—* . и— i . п__у^ 41 4241 4, Л-1 4- 1, Л-2 ••'41 " Ч, П-1 •41 (8-8) Остальные вероятности выражаются через рр. %12 р2=~Ру, ^21 Рз=Нк2Л’ Л32 ^21 (8-9) Рп 4—1 , П •• .^12 4.И-.---41 Таким образом, задача «гибели и размножения» решена в общем виде: найдены предельные вероятности состояний. Пример 2. Найти предельные вероятности состояний для процесса гибели и размножения, граф которого показан на рис. 4.41. Рис. 4.41 Решение По формулам (8.8) и (8.9) имеем: ___________________1___________________1_________2_ Р1= 2 2-1 2-1-3 “ 2 1 1 “ 5 ’ 1 4- — 4- — +---- 1 4- — + — -ф- — ^ 3 3-2 3-2-2 3 3 2 224 1^2 _LJL_2_ Р2 = ~3 ? = 15’ Рз=3* ’ Т = 15 ’ Р4= 2 ' 5 “ 5 § Зчк 5/3 225
Пример 3. Прибор состоит из трех узлов; поток отказов — простейший, среднее время безотказной работы каждого узла равно t&. Отказавший узел сра- зу же начинает ремонтироваться; среднее время ремонта (восстановления) узла равно /р; закон распределения этого времени показательный (поток восста- новлений — простейший). Найти среднюю производительность прибора, если при трех работающих узлах она равна 100%, при двух — 50%, а при одном и менее — прибор вообще не работает. Решение. Перечень состояний системы и граф состояний уже приводились в примере 1 данного параграфа. Разметим этот граф, т. е. проставим у каждой стрелки соответствующую интенсивность (см. рис. 4.42). Так как поток отказов каждого узла — простейший, то промежуток вре- мени между отказами в этом потоке распределен по показательному закону с па- раметром % = 1//б. где fo—среднее время безотказной работы узла. ip ip ip Рис. 4.42 По стрелкам вправо систему переводят отказы. Если система на- ходится в состоянии So, то работают три узла; каждый из них подвергается по- току отказов с интенсивностью l/7g; значит, поток отказов, действующий на всю систему, в три раза более интенсивен: А01 = 3/Zg Если система находится в состоянии Sj, то работают два узла; общий поток отказов имеет интенсивность: Ai?J = 2//g Аналогично Л23 =» 1/#д По стрелкам влево систему переводят ремонты (восстановления). Среднее время восстановления узла равно £р, значит, интенсивность потока вос- становлений, действующего на один ^восстанавливаемый узел, равна ц = \Цр, на два узла — 2//р, на три узла — 3//р Эти значения %10, Х21, XS2 и проставлены на рис. 8.5 у стрелок, ведущих влево. Пользуясь полученным выше общим решением задачи гибели и размноже- ния, имеем (ставя р0 вместо pi): Pi — 3 ) Pol Мб/ /7р\2 Рг — 31 —— I Pol Мб / Рз = (-=Ч Ро. Мб / 226
- - /п Зададимся конкретными значениями /б = 10 (час),ft, =5 (час). Тогда -£- = 0,5 и 113/ |_3/ 11/ =8/27> Pi—Sli'al21~l2l21’ Pz—S14*8/27=6/27' Рз=с1/8'8/г7==1/27- * "г /2"г /4 "г /8 Средняя производительность прибора в установившемся режиме: iooo/oPu+woP1=(f^f) % =51,9% номинала. 9. ЦИКЛИЧЕСКИЙ ПРОЦЕСС Марковский случайный процесс, протекающий в системе, назы- вается циклическим, если состояния связаны между собой в кольцо (цикл) с односторонними переходами (см. рис. 4.43 на стр. 228). Напишем алгебраические уравнения для предельных вероятностей состояний: ^23 Pi — ^12 Р1> ^34 Рз = ^23 Pi> t-k—I, kPk— 1 = fc-н Pk> "^n— 1, П Pn— I =^n, I Pn> 1 Pn — ^12 Pl> (9.1) плюс нормировочное условие: Pi + Рз + ••• + Pn = 1 • Из уравнений (9.1), отбросив последнее, выразим все вероят- ности р2........ через рх: „ ___ 2 Рг — — Pi, Л23 Хпч Х.,9 ^*93 ^,<9 Рз =“ р2 = ~~ Р1=^-Р1’ Л.!4 Л23 Л34 Л34 Р4=7-Р1. л4, ^12 Pft=——Pl, М, 44-1 8* 227
Подставляя эти выражения в (9.2), получим: Pi + (т hr F••• + г—) Pi — 1» \Л23 Л36 ЛП1 / откуда 1 Р1 ~ ' /1.1 ГГ’ 1 + ^12 I т F т-+ ••• + i I \ л23 ^т/ ^“12 ^2 = Р1, Л23 ^12 Рз = Р1. Л34 А<12 Pk = X----— Р1> л/г, А- + I (9.2) X. 2 Рп= г1- Pi- кп\ Формулы (9.2), выражающие предельные вероятности состояний для циклического процесса, можно привести к более удобному и на- глядному виду, если перейти от интенсивностей 'Кц к средним време- нам tt пребывания системы (подряд) в состоянии 8г (1 = 1, п). Рис. 4.43 Рис. 4.44 Действительно, пусть из состояния St, как это имеет место в цик- лической схеме, исходит только одна стрелка (рис. 4.44). Пусть систе- ма S находится в состоянии 8г. Найдем математическое ожидание вре- мени Tt, которое она еще пробудет в этом состоянии. Так как процесс— марковский, закон распределения времени Tt не зависит от того, сколь- ко времени система уже пробыла в состоянии 8;; значит, он та- кой же, каким был бы, если бы система только что пришла в состояние 8г, т. е., представляет собой не что иное, как показатель- ный закон распределения промежутка времени Т между соседними событиями в простейшем «потоке уходов» системы из состояния 8f. Параметр этвго закона равен Х,г>г+1, а среднее время пребывания си- стемы в состоянии 8г (если она в нем уже находится) равно /г = ,—!—. V '+1 Отсюда 1ц /+| = — для всех г = 1, 2, ..., п — 1. Для t = п получим (в силу ЦИКЛИЧНОСТИ) 1П>1 228 1 ~in
Подставив эти выражения в формулы (9.2). после элементарных пре- образований получим: ^1+^2+ Рп - - - ’ Ц -W2+ ••• + tn или, короче: % = -^— (k = \, ...,п), (9.3) Ё "ti i = I т. е. предельные вероятности состояний в циклической схеме относятся как средние времена пребывания системы подряд в каждом из состояний. Пример 1. Электронная цифровая вычислительная машина может нахо- диться в одном из следующих состояний: S, — исправна, работает; S2 — неисправна, остановлена; ведется поиск неисправности! S3 — неисправность локализована; ведется ремонт; S4 — ремонт закончен; ведется подготовка к пуску машины. Все потоки событий — простейшие. Среднее время безотказной работы ЭЦВМ (подряд) равно 0,5 (суток) Для ремонта машину приходится останавли- вать в среднем па 6 часов. Поиск неисправности длится в среднем 0,5 часа. Пос- ле окончания ремонта машина готовится к пуску в среднем 1 час. Найти пре- дельные вероятности состояний. Рис. 4.45 Решение. Граф состояний имеет вид циклической схемы (рис. 4.45). Определим среднее время пребывания ЭЦВМ подряд в каждом состоянии: ^2 = 1/48> ^ = г/4, <4 = 1М (СуТОК), откуда, по формулам (9.3): 1/2 Рз — 12/з9> Р4 — 2/зв> или, в десятичных дробях, р1 = 0,615; рг = 0,026; р3=О,ЗО8; р4 = 0,051. 229
Таким образом, если процесс сводится к простому циклическому с односторонними переходами, предельные вероятности состояний находятся очень просто: из соотношения средних времен пребывания (подряд) в каждом из состояний. Во многих случаях практики приходится иметь дело с ветвя- щимся циклическим процессом, где граф состояний , в отдельных узлах образует разветвления. Пример 2. ЭЦВМ может находиться в следующих состояниях: Sx — исправна, работает; S2 — неисправна, остановлена; ведется поиск неисправности; S3 — неисправность оказалась незначительной и устраняется местными средствами; S4 — неисправность оказалась серьезной и устраняется бригадой специа- листов; S5 — подготовка к пуску Процесс, протекающий в системе — марковский (все потоки событий — простейшие). Среднее время исправной работы машины подряд равно tlt среднее время поиска неисправностей — t2, среднее время ремонта местными средства- ми —73, среднее время ремонта бригадой специалистов — tit среднее время подготовки ЭЦВМ к пуску — /5. Неисправность ЭЦВМ может быть ликвидирована местными средствами с вероятностью а с вероятностью 1 — требует вызова бригады специалис- тов. Труд бригады оплачивается в размере k (руб/час). Требуется найти предельные вероятности состояний и определить средний расход, идущий на оплату работы ремонтной бригады в единицу времени (в сут- ки). Решение. Строим размеченный граф состояний (рис. 4.46). Если из состоя- ния выходит только одна стрелка, то интенсивность потока событий, стоящей у этой стрелки, равна единице, деленной на среднее время пребывания (подряд) в этом состоянии. Если из состояния выходят не одна стрелка, а две, то общая интенсивность, равная единице, деленной иа среднее время пребывания (подряд) в данном состоянии, умножается для каждой стрелки на вероятность того, что переход совершится именно по этой стрелке. Уравнения для предельных вероятностей состояний имеют вид: 3 1 Рг — т Pi> М 1 1 1 *т~ Рг = ~ Рз. -2 1— 1 Рз + у- Р4=-у Р5, *3 Г4 *5 1 1 76 Рб= G Р1’ плюс нормировочное условие: Pi + Ра + Рз + Pi + Ph = I- (9.4) (9.5) Из уравнений (9.4) одно, как мы знаем, можно отбросить; отбросим самое сложное — четвертое, а из остальных выразим р2, ра, plt р6 через р±: 230
h p2 = Рь &i3 SPtz 1г £Й3 Рз— Рз— г т Р1— т Pi- ‘2 Р> ‘1 4 (1-^)Г4 (1-<Я*4 h (1-^)7« р4- _ г Рз- - ?1 Рт = - Ps = у- Pi- li Рис. 4.46 Подставляя в (9.5), имеем' „ Л , А , кк , ('-А. , U Pi I । Н~ _ ± _ -к z + \ 11 11 ^1 G / Отсюда <1 ₽l G+/2+^3+(l--Я /4+6> ’ <2 ^1 "Мг + ЯзЧ- (1 —-Я ^4 + ^5 =_________ЯЙз Рз Г1 + Г2+^з + (1-^)^ + Г6 ’ (1_-^К_______t 4 G+M-.^3+(i-.m+75 ’ ___________h_________ Н + ^2 4" + (1 —^4 + ^5 Средняя доля времени, которую система проводит (в установившемся ре- жиме) в состоянии S4 (ремонт бригадой специалистов) равна р4. Значит, за час система проводит в этом состоянии в среднем р4 часов. Умножая эту величину на 24/г, получим средний расход средств на оплату бригады специалистов за сутки: С = 24fep4. Обратим внимание на структуру вероятностей рг, р2, ..., р6 в схеме ветвя- щегося цикла. Они, так же как и в случае простого цикла, представляют собой отношения средних времен пребывания (подряд) в состояниях к сумме всех таких времен, с той разницей, что для состояния, лежащего на «ветке», это среднее вре- мя множится на вероятность перехода по данной «ветке» (^ или 1 — 5s) Поль- зуясь этим правилом, можно сразу писать предельные вероятности состояний для любой ветвящейся циклической схемы 231
10. ПРИБЛИЖЕННОЕ СВЕДЕНИЕ НЕ-МАРКОВСКИХ ПРОЦЕССОВ К МАРКОВСКИМ. МЕТОД «ПСЕВДОСОСТОЯНИЙ» На практике мы почти никогда не имеем дела с марковскими про- цессами в чистом виде: реальные процессы почти всегда обладают тем или другим последействием. Для марковского процесса время пре- бывания системы подряд в каком-либо состоянии распределено по по- казательному закону; на самом деле это далеко не всегда бывает так. Например, если поток событий, переводящий систему из состояния в состояние есть поток отказов какого-то узла, то более естественно предположить, что оставшееся время безотказной работы узла зави- сит от того, сколько времени узел уже рабо- тал. При этом время пребывания узла в рабочем состоянии пред- ставляет собой случайную величину, распределенную не по показа- тельному, а по какому-то иному закону. Возникает вопрос о том, мож- но ли приближенно заменять не-пуассоновские потоки — пуассоновс- кими и к каким ошибкам в предельных вероятностях состояний мо- жет привести подобная замена. Для этого необходимо уметь хотя бы приближенно исследовать случайные процессы, протекающие в систе- мах с последействием. Рассмотрим некоторую физическую систему S, в которой проте- кает случайный процесс, направляемый какими-то не-пуассоновскими потоками событий. Если мы попробуем для этого процесса написать уравнения, выражающие вероятности состояний как функции време- ни, мы увидим, что в общем случае это нам не удастся. Действитель- но, для марковской системы мы вычисляли вероятность того, что в мо- мент t -f- Д/ система будет в состоянии S;, учитывая только то, в ка- ком с о сто я н и и система была в момент t, и не учитывая, сколь- ко времени она была в этом состоянии. Для не-марковской си- стемы этот прием уже непригоден: вычисляя вероятность перехода из одного состояния в другое за время Д/, мы должны будем учитывать, сколько времени система уже провела в данном состоянии. Это приводит, вместо обыкновенных дифференциальных уравнений, к урав- нениям с частными производными, то есть к гораздо более сложному математическому аппарату, с помощью которого только в редких случаях можно получить нужные результаты. Возникает вопрос: а нельзя ли свести искусственно (хотя бы при- ближенно) не-марковский процесс к марковскому? Оказывается, в некоторых случаях это возможно: а именно, если число состояний системы не очень велико, а отличающиеся от про- стейших потоки событий, участвующие в задаче, представляют собой (точно или приближенно) потоки Эрланга. Тогда, вводя в схему воз- можных состояний системы некоторые фиктивные «псевдосостояния», удается свести не-марковский процесс к марковскому и описать его с помощью обыкновенных дифференциальных уравнений, которые при t -> оо переходят в алгебраические уравнения для предельных вероятностей состояний. Поясним идею метода «псевдосостояний» на конкретном примере. 232
Пример 1. Рассматривается система S — техническое устройст- во, которое может выходить из строя под влиянием простейшего пото- ка неисправностей с интенсивностью X. Отказавшее устройство немед- ленно начинает восстанавливаться. Время восстановления (ремонта) Т распределено не по показательному закону (как надо было бы для того, чтобы процесс был марковским), а по закону Эрланга 3-го порядка: /з(/)= МиШе-цг (/>0). (Ю.1) Требуется свести данный не-марковский процесс к марковскому и найти для него предельные вероятности состояний. Решение. Случайная величина Т — время вссстановления — рас- пределена по закону Эрланга и, значит, представляет собой сумму трех случайных величин Tlt Т2, Т3, распределенных по показательному за- кону (см. § 5 гл. 4) с параметром ц: (/>0). (10.2) Истинных состояний системы всего два: <$! — устройство исправно; S2 — устройство восстанавливается. Граф этих состояний показан на рис.4.47 (он относится к цикли- ческой схеме). Однако в виду того, что переход по стрелке S2 -> Sj происходит под влиянием не простейшего, а эрланговского потока событий, про- цесс, происходящий в системе, марковским не является, и для него мы не можем написать ни дифференциальных, ни алгебраических урав- нений. Чтобы искусственно свести это процесс к марковскому, введем в цепочку состояний, вместо одного состояния S2, ТРИ последователь- ных «псевдосостояния». SV> — ремонт начинается; 8<2> — ремонт продолжается; 8^3) — ремонт заканчивается, т. е. разделим ремонт на три этапа или «фазы», причем время пребыва- ния системы в каждой из фаз будем считать распределенным по показательному закону (10.2). Граф состояний будет иметь вид, пока- занный на рис. 4.48, где роль одного состояния S2 будут играть три псевдосостояния S^1), 8(г2> и S^3>. Процесс, протекающий в такой системе, уже будет марковским. Обозначим р^, р<22), —предельные вероятности пребывания системы в псевдосостояниях $(Л 5(22). 8^3>; тогда р2=рР+рР+р<23\ Обозначая Л = 1/Х, /2 = 1/н» 233
можем сразу написать (как для обычной циклической схемы) предель- ные вероятности состояний: fi — Pi — _ _ _ _ - > ^Нг-Мг-Нг h + 3f2 р(» = р^=^3)=_Л_ 11 + з/2 p2=pv,+<,+/’(23, = ^1-=- fi + 3f2 Заметим, что величина 3/2 представляет собой не что иное, как среднее время восстановления (ремонта) — оно равно сумме средних времен пребывания системы в каждой фазе ремонта. Переходя в формулах для ри р2 от средних времен 4, /2 к интен- сивностям потоков, по формулам 4 = 1Д, 4 = I/р, получим: Р1 = Н/(Н + 3^)> р2 = ЗМи + 3^). (Ю.З) Таким образом, получен вывод: для нашего элементарного приме- ра вероятность пребывания в каждом из двух состояний, как и для марковского цикла, равна относительному среднему времени пребы- вания подряд в каждом из состояний. Следующий пример будет несколько сложнее. Пример 2. Техническое устройство S состоит из двух одинаковых узлов, каждый из которых может выходить из строя (отказывать) под влиянием простейшего потока неисправностей с интенсивностью К. Отказавший узел немедленно начинает ремонтироваться. Время ремонта Т распределено по закону Эрланга второго порядка: /2(/) = И2/е-»' (/>0). Требуется найти предельные вероятности состояний системы. Решение. Истинных состояний системы три (нумеруем их по числу отказавших узлов). So — оба узла работают; Si — один узел работает, другой ремонтируется; S2 — оба узла ремонтируются. Разделим условно ремонт на две фазы: ремонт начинается и ремонт заканчивается. 234
Длительность каждой фазы будем считать распределенной по показа- тельному закону (10.2). Процесс, происходящий в системе, приводит- ся к марковскому, если ввести такие псевдосостояния: — один узел работает, другой начинает ремонтироваться; S[2> — один узел работает, другой кончает ремонтироваться; — оба узла начинают рамонтироваться; S^I>2> — один узел начинает ремонтироваться, а другой кончает; S(2.2) — оба узла кончают ремонтироваться. Граф состояний системы с псевдосостояниями показан на рис. 4.49. На стрелках, ведущих из Sp-‘> в Sp'2> и из SP 2) в S^, написано 2ц, а не ц, потому что перейти в следующую фазу ремонта (окончание ремонта) может любой из двух узлов. Рис. 4.49 Уравнения для предельных вероятностей состояний имеют вид: 2Хр0 ф- цр),1- + fipt1’ +2цр<22- 2> = (%+ ц) р<2\ Ар<» =2цр(’-»> 2цр(21’1>-|-^р(2)=2цр(1.2), Иру-2> =2цр<22-2>, iip<2> = 2Лр0. Из третьего, пятого и шестого уравнений (10.4) имеем: 2Л Р2) =— Ро, Н (Ю.4) (10.5) 235
что дает возможность уменьшить число неизвестных: подставляя (10.5) в оставшиеся три уравнения (10.4), получим: 2Хр0 4-рр<2‘ -2> = (X4- ц)р<», 1 > 4- цр<2‘ • 2> = (X 4- ц) — р0> И М”+ —2Ро = 2^-2). ц (10.6) Из этих трех уравнений с тремя неизвестными р0, р<Р, р^'-2> можно по произволу отбросить любое, например, последнее, и доба- вить нормировочное условие: Р„ + Р'11 ’ + Р12) + PV ’ ” + Р(21’ 2) + Р2- 2) = Ь или, с учетом (10.5), (1+-Ьо+ (1 +^Р(|1) + 4р<2112) = 1- Решим два первых уравнения (10.6) вместе с уравнением (10.7). Выразим из первого уравнения р(2’’2) через р0 и р<”: 1 Р'1’- —Ро (Ю.8) \ и / 1 и и подставим это выражение во второе уравнение; получим: (Х4- 2И)рО> = [2X4- ^(Х4-и)]ро. или, после сокращения на (Х4-2н): /?<’> = —Ро- (10.9) и Подставляя это в (10.8), выразим и вероятность р(2‘• 2> через р0: pV’2)=^Po- (10J0) Теперь подставим (10.9) и (10.10) в нормировочное - усло- вие (10.7): откуда 1 fl 2 I |Л / j Q j . Ро ~ 14- 4Х/р 4- 4Х2/ц2 ~ ц24-4Хц + 4Р • После этого найдем все остальные предельные вероятности: из (10.9), (10.10) ,п 2Хр .. 2Р n( 1 ) =-------!------n( I . 2 ) = ------------- • 1 |л‘24-4Хи + 4Х2 2 (124- 4Хц 4- 4Х2 236
из (10.5): Р<2> = ------2Х,г nd. О =_______№ 1 + Пц + 4V ? u2+4bM + W>’ р(2. 2) = ----------- 2 ц2 + 4Хц+ 4V После того, как найдены вероятности псевдосостояний, можно найти и вероятности состояний: ц2 Ро ____________• П = nd) + п(2) = _ p2 + 4fyt + 4V ’ 1 ц2+4Хц+4Х2 Р2 = Ptf •' > + /^’ •2) + Р? ’2) = - — ,, . 2 2 2 2 ц2 + 4^ + 4Х2 Например, при % = 1, р = 4 (в стационарном режиме) вероятность того, что оба узла работают, равна р0 — 16/25 = 0,64; вероятность того, что один узел ремонтируется рг = 8/25 = 0,32; вероятность то- го, что оба узла ремонтируются ръ = 1/25 = 0,04. Заметим, что метод псевдосостояний допускает сравнительно простое решение задачи только в самых простых случаях, когда чис- ло состояний исходной системы невелико. Однако, иногда удается применить этот метод и к задачам, где число состояний не очень мало; во всяком случае, получить если не буквенное, то численное прибли- женное решение соответствующей системы линейных алгебраических уравнений. Возможности метода псевдосостояний существенно расширяются, если пользоваться в качестве потоков событий не одними только эрлан- говскими -потоками в чистом виде, а и обобщенными эрланговскими и смешанными обобщенными эрланговскими распределениями, о кото- рых упоминалось в конце § 5.
5 ТЕОРИЯ МАССОВОГО ОБСЛУЖИВАНИЯ 1. ЗАДАЧИ ТЕОРИИ МАССОВОГО ОБСЛУЖИВАНИЯ При исследовании операций очень часто приходится сталкивать- ся с анализом работы своеобразных систем, называемых система- ми массового обслуживания (СМО). Примерами таких систем могут служить: телефонные станции, ремонтные мастерские, билетные кассы, справочные бюро, магазины, парикмахерские и т. п. Каждая СМО состоит из какого-то числа обслуживающих единиц, которые мы будем называть каналами обслуживания. В качестве «каналов» могут фигурировать: линии связи, рабочие точки, приборы, железнодорожные пути, лифты, автомашины и т. д. Системы массового обслуживания могут быть одноканальными или многоканальными. Каждая СМО предназначена для обслуживания (выполнения) какого-то потока заявок (или «требований»), поступающих на СМО в какие-то, вообще говоря, случайные моменты времени. Об- служивание поступившей заявки продолжается некоторое (вообще го- воря, случайное) время, после чего канал освобождается и готов к при- нятию следующей заявки. Случайный характер потока заявок приво- дит к тому, что в какие-то промежутки времени на входе СМО скапли- вается излишне большое число заявок (они либо образуют очередь, либо покидают СМО необслуженными); в другие же периоды СМО будет работать с недогрузкой или вообще простаивать. Каждая система массового обслуживания, в зависимости от числа каналов и их производительности, а также от характера потока заявок, обладает какой-то пропускной способностью, позво- ляющей ей более или менее успешно справляться с потоком заявок. Предмет теории массового обслуживания — установление зависимо' сти между характером потока заявок, числом каналов, их производи- тельностью, правилами работы СМО и успешностью (эффективностью) обслуживания. В качестве характеристик эффективности обслуживания, в зави- симости от условий задачи и целей исследования, могут применяться различные величины и функции, например: — среднее количество заявок, которое может обслужить СМО в единицу времени; — средний процент заявок, получающих отказ и покидающих СМО необслуженными; 238
— вероятность того, что поступившая заявка немедленно будет принята к обслуживанию; — среднее время ожидания в очереди; — закон распределения времени ожидания; — среднее количество заявок, находящихся в очереди; — закон распределения числа заявок в очереди; — средний доход, приносимый СМО в единицу времени и т. д. Случайный характер потока заявок, а в общем случае и длитель- ности обслуживания приводит к тому, что в системе массового обслужи- вания будет происходить какой-то случайный процесс. Чтобы дать рекомендации по рациональной организации этого процес- са и предъявить разумные требования к СМО, необходимо изучить слу- чайный процесс, протекающий в системе, описать его математически. Этим и занимается теория массового обслуживания. Заметим, что за последние годы область применения математи- ческих методов теории массового обслуживания непрерывно расши- ряется и все больше выходит за пределы задач, связанных с «обслужи- вающими организациями» в буквальном смысле слова. Как своеобраз- ные системы массового обслуживания могут рассматриваться: элект- ронные цифровые вычислительные машины; системы сбора и обработки информации; автоматизированные производственные цехи, поточные линии; транспортные системы; системы противовоздушной обороны и т. п. Близкими к задачам теории массового обслуживания являются многие задачи, возникающие при анализе надежности технических устройств. Математический анализ работы СМО очень облегчается, если слу- чайный процесс, протекающий в системе, является марковским. Тогда удается сравнительно просто описать работу СМО с помощью аппара- та обыкновенных дифференциальных (в предельном случае — линей- ных алгебраических) уравнений и выразить в явном виде основные характеристики эффективности обслуживания через параметры СМО и потока заявок. Мы знаем, что для того, чтобы процесс, протекающий в системе, был марковским, нужно, чтобы все потоки событий, переводящие си- стему из состояния в состояние, были пуассоновскими (потоками без последействия). Для СМО потоки событий — это потоки заявок, по- токи «обслуживанию заявок и т. д. Если эти потоки не являются пуас- соновскими, математическое описание процессов, происходящих в СМО, становится несравненно более сложным и требует более громозд- кого аппарата, доведение которого до явных, аналитических формул удается только в редких, простейших случаях. Однако, все же аппарат «марковской» теории массового обслуживания может пригодиться и в том случае, когда процесс, протекающий в СМО, отличен от марков- ского—с его помощью характеристики эффективности СМО могут быть оценены приближенно. Следует заметить, что чем сложнее СМО, чем больше в ней каналов обслуживания, тем точнее оказываются прибли- женные формулы, полученные с помощью марковской теории. Следует также заметить, что в ряде случаев для принятия обоснованных ре- 239
шений по управлению работой СМО вовсе и не требуется точного зна- ния всех ее характеристик — зачастую достаточно и приближенного, ориентировочного. В настоящей главе будут изложены элементы теории массового обслуживания, главным образом в той простейшей форме, которую они приобретают в рамках марковской теории. Для более подробного оз- накомления с теорией массового обслуживания в ее современной, раз- витой форме, читатель может обратиться к специальным монографиям, например, [14], [12], [20]. 2. КЛАССИФИКАЦИЯ СИСТЕМ МАССОВОГО ОБСЛУЖИВАНИЯ И ИХ ОСНОВНЫЕ ХАРАКТЕРИСТИКИ Системы массового обслуживания вообще могут быть двух типов. 1. Системы с отказами. В таких системах заявка, поступившая в момент, когда все каналы заняты, получает «отказ», покидает СМО и в дальнейшем процессе обслуживания не участвует. 2. Системы с ожиданием (с очередью). В таких системах заявка, поступившая в момент, когда все каналы заняты, становится в очередь и ожидает, пока не освободится один из каналов. Как только освобо- дится канал, принимается к обслуживанию одна из заявок, стоящих в очереди. Обслуживание в системе с ожиданием может быть «упорядоченным» (заявки обслуживаются в порядке поступления) и «неупорядоченным» (заявки обслуживаются в случайном порядке). Кроме того, в некото- рых СМО применяется так называемое «обслуживание с приоритетом», когда некоторые заявки обслуживаются в первую очередь, предпочти- тельно перед другими. Системы с очередью делятся на системы с неограниченным ожида- нием и системы с ограниченным ожиданием. В системах с неограниченным ожиданием каждая заявка, посту- пившая в момент, когда нет свободных каналов, становится в очередь и «терпеливо» ждет освобождения канала, который примет ее к обслу- живанию. Любая заявка, поступившая в СМО, рано или поздно будет обслужена. В системах с ограниченным ожиданием на пребывание заявки в оче- реди накладываются те или другие ограничения. Эти ограничения мо- гут касаться длины очереди (числа заявок, одновременно находящих- ся в очереди), времени пребывания заявки в очереди (после какого- то срока пребывания в очереди заявка покидает очередь и уходит), общего времени пребывания заявки в СМО и т. д. В зависимости от типа СМО, при оценке ее эффективности могут применяться те или другие величины (показатели эффективности). Например, для СМО с отказами одной из важнейших характеристик ее продуктивности является так называемая абсолютная про- пускная способность — среднее число заявок, которое может обслужить система за единицу времени. 240
Наряду с абсолютной, часто рассматривается относитель- ная пропускная способность СМО — средняя доля поступивших заявок, обслуживаемая системой (отношение среднего числа заявок, обслуживаемых системой в единицу времени, к средне- му числу поступающих за это время заявок). Помимо абсолютной и относительной пропускной способностей, при анализе СМО с отказами нас могут, в зависимости от задачи ис- следования, интересовать и другие характеристики, например: — среднее число занятых каналов, — среднее относительное время простоя системы в целом и от- дельного канала и т. д. Перейдем к рассмотрению характеристик СМО с ожиданием. Очевидно, для СМО с неограниченным ожиданием как абсолют- ная, так и относительная пропускная способность теряют смысл, так как каждая поступившая заявка рано или поздно будет обслуже- на. Зато для такой СМО весьма важными характеристиками являются: — среднее число заявок в очереди, — среднее число заявок в системе (в очереди и под обслуживанием), — среднее время ожидания заявки в очереди, — среднее время пребывания заявки в системе (в очереди и под об- служиванием), и другие характеристики ожидания. Для СМО с ограниченным ожиданием интерес представляют обе группы характеристик: как абсолютная и относительная пропускная способности, так и характеристики ожидания. Для анализа процесса, протекающего в СМО, существенно знать ос- новные параметры системы: число каналов п, интенсивность потока заявок к, производительность каждого канала (среднее число зая- вок |х, обслуживаемое каналом в единицу времени), условия образо- вания очереди (ограничения, если они есть). В зависимости от этих параметров мы и будем в дальнейшем вы- ражать характеристики эффективности работы СМО. Заранее условимся (чтобы не оговаривать это всякий раз отдель- но), что мы будем считать все потоки событий, переводящие СМО из состояния в состояние, пуассоновскими. В тех редких случаях, когда мы будем рассматривать не-марковские системы массового обслужи- вания, мы будем каждый раз оговаривать это специально. Напомним, что в случае, когда пуассоновский поток стационарен (простейший поток), интервал времени Т между событиями в этом по- токе есть случайная величина, распределенная по показательному за- кону: f(O = Xe~w (/>0), (2.1) где — интенсивность потока событий. В случае, когда из какого-то состояния <$г систему выводят сразу несколько простейших потоков, величина Т — время пребывания си- стемы (подряд) в данном состоянии есть случайная величина, распре- деленная по закону (2.1), где X — суммарная интенсивность всех по- токов событий, выводящих систему из данного состояния. 241
3. ОДНОКАНАЛЬНАЯ СМО С ОТКАЗАМИ Рассмотрим простейшую из всех задач теории массового обслу* живания — задачу о функционировании одноканальной СМО с отка- зами. Пусть, система массового обслуживания состоит только из одного канала (п — I) и на нее поступает пуассоновский поток заявок с ин- тенсивностью X, зависящей, в общем случае, от времени: Х = НО- (3.1) Заявка, заставшая канал занятым, получает отказ и покидает си- стему. Обслуживание заявки продолжается в течение случайного времени То5у распределенного по показательному закону с параметром р: /(0=це-^' (/>0). (3.2) Из этого следует, что «поток об- служивании» — простейший, с ин- тенсивностью р. Чтобы представить себе реально этот поток, вообразим Рис. 5.1 один непрерывно занятый канал — он будет выдавать обслуженные заявки потоком с интенсивностью р,. Требуется найти: 1) абсолютную пропускную способность СМО (А); 2) относительную пропускную способность СМО (q). Рассмотрим единственный канал обслуживания как физическую систему S, которая может находиться в одном из двух состояний: So — свободен, Si — занят. Граф состояний системы показан на рис. 5.1. Из состояния So в Si систему, очевидно, переводит поток заявок с интенсивностью X; из Sj и So — «поток обслуживаний» с интенсив- ностью р. Обозначим вероятности состояний ро(0 и Pi(0- Очевидно, для лю- бого момента t Po(O + Pitf) = l. (3.3) Составим дифференциальные уравнения Колмогорова для вероят- ностей состояний согласно правилу, данному в § 3 гл. 4. Имеем: ^ = — Xpo+HPi, = — Mh + *-Ро- (3.4) Из двух уравнений (3.4) одно является лишним, так как р0 и свя- заны соотношением (3.3). Учитывая это, отбросим второе уравнение, 242
а в первое подставим вместо рА его выражение (1 — р0): ---------^Ро + М (1 — Ро)> - at или ~~ — — (и + М Ро 4* И- (3.5) at Это уравнение естественно решать при начальных условиях: Ро(О) = 1, Р!(0) = о (в начальный момент канал свободен). Линейное дифференциальное уравнение (3.5) с одной неизвестной функцией р0 легко может быть решено не только для простейшего по- тока заявок (X = const), но и для Ро<Р)к случая, когда интенсивность этого потока со временем меняется (А, = А(/)). Не останавливаясь на последнем случае, приведем реше- ние уравнения (3.5) только для случая X = const: = <3-6> ь ~г ц л Р Зависимость величины р0 от Рис 52 времени имеет вид, изображенный на рис. 5.2. В начальный момент (при t ~ 0) канал заведомо свободен (ро(О) = 1). С увеличением t вероятность рй уменьшается и в пределе (при / оо) равна -. Величина р^), дополняющая ро(0 до еди- ницы, изменяется как показано на том же рис. 5.2. Нетрудно убедиться, что для одноканальной СМО с отказами ве- роятность р0 есть не что иное, как относительная пропускная способ- ность q. Действительно, р0 есть вероятность того, что в момент / канал сво- боден, иначе вероятность того, что заявка, пришедшая в момент t, будет обслужена. А значит, для данного момента времени t среднее от- ношение числа обслуженных заявок к числу поступивших также рав- но р0: q = Ро- В пределе, при t -+ оо, когда процесс обслуживания уже устано- вится, предельное значение относительной пропускной способности будет равно: ^ + р. ’ (3.7) Зная относительную пропускную способность q, легко найти аб- солютную А. Они связаны очевидным соотношением: Л = М- (3-8) 243
а я в о к среди поданных. X И В пределе, при t -> оо, абсолютная пропускная способность тоже установится и будет равна Д = (3.9) л 4-р Зная относительную пропускную способность системы q (вероят- ность того, что пришедшая в момент I заявка будет обслужена), легко найти вероятность отказа: Ротк = 1—?• (3.10) Вероятность отказа Ротк есть не что иное, как средняя до- ля необслуженных В пределе, при t -> оо, Пример. Одноканальная СМО с отказами представляет собой одну теле- фонную линию. Заявка — вызов, пришедший в момент, когда линия занята, получает отказ. Интенсивность потока вызовов X = 0,8 (вызовов в минуту). Средняя продолжительность разговора ^об=1.5мин- Все потоки событий — про- стейшие. Определить предельные (при t -> оо) значения: 1) относительной пропускной способности ц; 2) абсолютной пропускной способности А; 3) вероятности отказа Ротк. Сравнить фактическую пропускную способность СМО с номинальной, ко- торая была бы, если бы каждый разговор длился в точности 1,5 мин, и разгово- ры следовали бы один за другим без перерыва. Решение. Определяем параметр р потока обслуживании: р,= 1/7об= 1/1,5 = 0,667. По формуле (3.6) получаем относительную пропускную способность СМО: 0.667 „ _ о =-------------- 0,455. 4 0,8ф-0,667 Таким образом, в установившемся режиме система будет обслуживать около 45% поступающих вызовов. По формуле (3.9) находим абсолютную пропускную способность: Д=Ц = 0,8.0,455=с 0,364, т. е. линия способна осуществить в среднем 0,364 разговора в минуту. Вероятность отказа: РОтк= 1 —9=0,545, значит около 55% поступивших вызовов будет получать отказ Номинальная пропускная способность канала: Дном = = 0,667 (разговора в минуту), ‘ об что почти вдвое больше, чем фактическая пропускная способность, получаемая с учетом случайного характера потока заявок и случайности времени обслужи- вания. 244
4. МНОГОКАНАЛЬНАЯ СМО С ОТКАЗАМИ Рассмотрим n-канальную СМО с отказами. Будем нумеровать со- стояния системы по числу занятых каналов (или, что в данном случае то же, по числу заявок, связанных с системой). Состояния будут: So — все каналы свободны, S, — занят ровно один канал, остальные свободны, Sk — заняты ровно k каналов, остальные свободны, Sn — заняты все п каналов. Граф состояний СМО представлен на рис. 5.3. Разметим граф, т. е. проставим у стрелок интенсивности соответствующих потоков событий. По стрелкам слева направо систему переводит один и тот же Рис. 5.3 поток — поток заявок с интенсивностьюX. Если система находится в со- стоянии Sh (занято k каналов) и пришла новая заявка, система пере- ходит (перескакивает) в состояние S^i- Определим интенсивности потоков событий, переводящих систе- му по стрелкам справа налево. Пусть система находится в состоянии <Sj (занят один канал). Тог- да, как только закончится обслуживание заявки, занимающей этот канал, система перейдет в So; значит, поток событий, переводящий систему по стрелке S1 -> So, имеет интенсивность р. Очевидно, если обслуживанием занято два канала, а не один, поток обслуживании, переводящий систему по стрелке S2-> Si, будет вдвое интенсивнее (2ц); если занято k каналов—в k раз интенсивнее (&ц.). Проставим соответствующие интенсивности у стрелок, ведущих справа налево. Из рис. 5.3 видно, что процесс, протекающий в СМО, представляет собой частный случай процесса гибели и размноже- ния, рассмотренного нами в § 8 гл. 4. Пользуясь общими правилами, можно составить уравнения Кол- могорова для вероятностей состояний: — ^Po + HPi> at ~~ = —"Ь Р) Pi + Ро + %РРи at .............................................. (4.1) — — — (X 4~ ^Н) Рь + Хщ _ 1 (k 4-1) [ipk +-1, ~ = — ПЦРп + Хрп-ь 245
Уравнения (4.1) называются уравнениями Эрланга. Естественными начальными условиями для их решения являются: рв(0)=1; Р1(0) = р2(0)= ... =р„(0)=0 (в начальный момент система свободна). Интегрирование системы уравнений (4.1) в аналитическом виде довольно сложно; на практике такие системы дифференциальных уравнений обычно решаются численно, на АВМ или ЭЦВМ. Такое решение дает нам все вероятности состояний Po(*h ft (О, Р„ (0. •••» Рп (О как функции времени. Естественно, нас больше всего будут интересовать предел ь- ные вероятности состояний р0, ръ .... ph,.... рп, харак- теризующие установившийся режим работы СМО (при t оо). Для нахождения предельных вероятностей воспользуемся уже готовым ре- шением задачи, полученным для схемы гибели и размножения в § 8 гл. 4. Согласно этому решению, = -Т^т-Ро=^Ро, (*=1,2, ...,«); ___________________1_______________ 1 + । (W)2 । (Мр)л 11 Т" 21 nl (4-2) В этих формулах интенсивность потока заявок % и интенсивность потока обслуживаний (для одного канала) р не фигурируют по отдель- ности, а входят только своим отношением Мр. Обозначим это отноше- ние А/p = р и будем называть величину р «приведенной интенсивностью» потока заявок. Физический смысл ее таков: величина р представляет собой среднее число заявок, приходящих в СМО за среднее время обслужи- вания одной заявки. С учетом этого обозначения, формулы (4.2) примут вид: о* Ph = др ft» (* = 1, 2.../г); к! Формулы (4.3) называются формулами Эрланга. Они выражают предельные вероятности всех состояний системы в зависи- мости от параметров к, р и п (А — интенсивность потока заявок, р — интенсивность обслуживания, п — число каналов СМО). Зная все вероятности состояний Ро> Р1> Ph> •••> ft>. 246
можно найти характеристики эффективности СМО: относительную пропускную способность q, абсолютную пропускную способность А и вероятность отказа Дотк. Действительно, заявка получает отказ, если приходит в момент, когда все п каналов заняты. Вероятность этого равна ^отк ~ Рп~ Ро- (4.4) Вероятность того, что заявка будет принята к обслуживанию (она же относительная пропускная способность q) дополняет Р0№ до еди- ницы: <7=1 —рп- (4.5) Абсолютная пропускная способность: Д = М = М1-Рп). (4.6) Одной из важных характеристик СМО с отказами является сред- нее число занятых каналов (в данном случае оно совпадает со средним числом заявок, находящихся в системе). Обозначим это среднее число k. __ Величину k можно вычислить непосредственно через вероятности Ро> Pi...Рп по формуле: ^=0-ро4-1-р1+... +п-рп (4.7) как математическое ожидание дискретной случайной величины, при- нимающей значения 0, 1, .... п с вероятностями р0, р1; ..., рп. Однако значительно проще выразить среднее число занятых каналов через аб- солютную пропускную способность А, которую мы уже знаем. Дейст- вительно, А есть не что иное, как среднее число заявок, обслуживаемых в единицу времени-, один занятый канал обслуживает в среднем за еди- ницу времени р заявок; среднее число занятых каналов получится де- лением А ла р: k- А р ц или, переходя к обозначению й./р=р, £ = р(1—рп). (4.8) Пример. Повторяются условия примера предыдущего параграфа (X = 0,8, р = 0,667), однако вместо одноканальной СМО (п = 1) рассматривается трех- канальная (п = 3), т е число линий связи увеличено до трех Найти вероятнос- ти состояний, абсолютную и относительную пропускную способности, вероят- ность отказа и среднее число занятых каналов. Решение. Приведенная интенсивность потока заявок: р = Х./р,=0,8/0,667 = 1,2. По формулам Эрланга (4 3) получаем: р Pi = ~^ Ро=1.2ро, 847
р2 Pi — Ро = 0 > 72 Ро, Р3 Рз = ТГ Ро = 0,288ро, ОI ________________1____________ Ро~ 1-^1,2^0.72^0,288 ~0,312, р1Я5 1,2-0,312 = 0,374; р2 « 0,72-0,312=0,224} р3® 0,288-0,312 ==0,090. Вычисляем вероятность отказа: Р отк= Рз=0,090. Относительная и абсолютная пропускные способности равны: q = 1— р3 = 0,910; Л = Х9 = 0,8.0,910 = 0,728. Среднее число занятых каналов: fe=p(l — р3>= 1,2-0,91 ® 1,09, т. е. при установившемся режиме работы СМО в' среднем будет занят один с не- большим канал из трех — остальные два будут простаивать. Этой ценой добы- вается сравнительно высокий уровень эффективности обслуживания — около 91% всех поступивших вызовов будет обслужено 5. ОДНОКАНАЛЬНАЯ СМО С ОЖИДАНИЕМ Рассмотрим сначала простейшую из всех возможных СМО с ожи- данием — одноканальную систему (п = 1), на которую поступает поток заявок с интенсивностью X; интенсивность обслуживания р (т. е. в среднем непрерывно занятый канал будет выдавать р обслужен- ных заявок в единицу (времени). Заявка, поступившая в момент, когда канал занят, становится в очередь и ожидает обслуживания.- Очереди нет Рис. 5.4 Предположим, сначала, что количество мест в очереди ограниче- но числом т, т. е. если заявка пришла в момент, когда в очереди уже стоят т заявок, она покидает систему необслуженной. В дальней- шем, устремив т к бесконечности, мы получим характеристики одно- канальной СМО без ограничений по длине очереди. Будем нумеровать состояния СМО по числу заявок, находящихся в системе (как обслуживаемых, так и ожидающих обслуживания): So — канал свободен, Sj — канал занят, очереди нет, S2 — канал занят, одна заявка стоит в очереди, 248
Sb — канал занят, k — 1 заявок стоит в очереди, Sm+) — канал занят, т заявок стоят в очереди. Граф состояний СМО показан на рис. 5.4. Интенсивности потоков событий, переводящих в систему по стрелкам слева направо, все равны X, а справа налево — р. Действительно, по стрелкам слева направо систему переводит поток заявок (как только придет заявка, система переходит в следующее состояние), справа же налево — поток «ос- вобождений» занятого канала, имеющий интенсивность р (как только будет обслужена очередная заявка, канал либо освободится, либо уменьшится число заявок в очереди). Изображенная на рис. 5.4 схема представляет собой схему гибели и размножения. Пользуясь общим решением, данным для схемы ги- бели и размножения в § 8 гл. 4, напишем выражения предельных ве- роятностей состояний: Pi = (Vp) р0, Р2 = (Х/р)2 р0, Pk = (W)/e Ро> (5.1) Pm+i =(2l/p)m+' ро, Ро“ l + (X/p) + (W+ - + (Vp)'”+I’ Вводя обозначение Мр = р, перепишем формулы (5.1) в виде: Pi = РРо- Рг=Р2 Ро> Pk=Pk Ро< pm+i =Рт+’ ро, 1 _ Ро~ 14-р+р2+ - +Рт+’ ~ = [1 + Р + Р2+ - + р'"+1]-1. . (5.2) Заметим, что в знаменателе последней формулы (5.2) стоит геомет- рическая прогрессия с первым членом 1 и знаменателем р; суммируя эту прогрессию, находим: Ро = (1-р^+2)/(1_р) = i_pm+2 ’ (5>3)
Таким образом, формулы (5.2) окончательно примут вид: Ро~ l-p^ + 2 Pi = РРо. Р2 = Р2Ро> Pfe = P& Ро» (5.4) Рт+1 = Рт+ 1 Ро. Обратим внимание на то, что формула (5.3) справедлива только при р Ф 1 (при р = 1 она дает неопределенность вида 0/0). Но сумму геометрической прогрессии со знаменателем р = 1 найти еще проще чем по формуле (5.3): она равна т 4* 2, и в этом случае р0 = = l/(m -f- 2). Заметим, что тот же результат мы могли бы получить более сложным способом, раскрывая неопределенность (5.3) по пра- вилу Лопиталя. Определим характеристики СМО: вероятность отказа Ротк, от- носительную пропускную способность q, абсолютную пропускную спо- собность А, среднюю длину очереди г, среднее число заявок, связанных с системой k. Очевидно, заявка получает отказ только в случае, когда канал за- нят и все т мест в очереди — тоже: р pm+1 о-р) “отк Рт-}-\— |__рт + 2 Находим относительную пропускную способность: <7 = 1—р = 1— рт4' .(L~p)... ч 1 отк 1 |_рш + 2 (5.5) (5.6) Абсолютная пропускная способность: A =Xq. Найдем среднее число г заявок, находящихся в очереди; определим эту величину как математическое ожидание дискретной случайной ве- личины R — числа заявок, находящихся в очереди: С вероятностью р2 в очереди стоит одна заявка, с вероятностью р3 две заявки, вообще с вероятностью рь в очереди стоят k — 1 заявок, на- конец, с вероятностью рш+! в очереди стоят т заявок. Среднее число заявок в очереди получим, умножая число заявок в очереди на соот- ветствующую вероятность и складывая результаты: r — 1 'р2 4* 2'Рз 4-... 4- (k—1)4* ••• 4*т'Рт+1 — = 1 •ргРо4-2-р3ро 4- ... 4- (£—1)-Р*Ро+ - + т-рт+' р0. (5.7) ?50
Вынесем в этом выражении р2р0 за скобки: r = P2PoU Ч-2р+ ... (k~ 1)р*-2+ ... -bmp'"-1]. (5.8) Выведем формулу для суммы, стоящей в скобках (этой формулой мы будем часто пользоваться в дальнейшем). Очевидно, рассматривае- мая сумма представляет собой не что иное, как производную по р суммы 2 =Р-ЬР2+ ... -|-р*-'-)_ ... 4-р-п, а для этого выражения мы можем воспользоваться формулой суммы геометрической прогрессии: (5.9) 1 —р Продифференцируем (5.9) по р: у- 11— (т+1)р'7'](1— р) +(р—рт+’) (1-р)2 - __ 1—(/п+1) рт—р+ (m-f-1) рт+1-)-р —рт+1 (1—р)а 1— (т-|-1)рш+ трт+* 1—рш (т+ 1 — тр) (1-р)2 “ (1—Р)а Итак, выражение для суммы, стоящей в скобках в правой части (5.8), найдено: 1 4-2р+ ... + ... + (5.10) Подставляя его в (5.8), получим: |_-р>”(^+1-/ПР)> Г Р (1-Р)2 Учитывая выражение для р0 из (5.4), имеем: ~ а (!—Р) I1—Рт(т-Н—'пр)] Р (1_р'п + 2)(1_р)2 или, окончательно, Таким образом, мы вывели выражение для среднего числа заявок, ожидающих обслуживания в очереди. Выведем теперь формулу для среднего числа k заявок, связанных с системой (как стоящих в оче- реди, так и находящихся под обслуживанием). Будем решать задачу следующим образом: рассмотрим общее число заявок К, связанных с системой, как сумму двух случайных величин: числа заявок, стоя- щих в очереди, и числа заявок, находящихся под обслуживанием: 251
где /? — число заявок в очереди, Q — число заявок под обслужива- нием. По теореме сложения математических ожиданий k = M [К] = Л1 |/?|4-Л1[Й] = г 4-ю, где г — среднее число заявок в очереди, со — среднее число заявок под обслуживанием. Величину г мы только что нашли; найдем величину со. Так как канал у нас один, то случайная величина Q может принимать только два значения: 0 или 1. Значение 0 она принимает, если канал свобо- ден; вероятность этого равна 1—р р0~ i-p^+2 • Значение 1 она принимает, если канал занят; вероятность этого равна 1 Р-Рт+2 Ро )_рт+2 • Отсюда находим математическое ожидание числа заявок, находящихся под обслуживанием: со=0-р04-1-(1-ро) = -Р_^-2 Таким образом, среднее число заявок, связанных с СМО, будет _______________________ _ __ т-4-2 * = (5J2) где величина г определяется по формуле (5.11). Выведем выражение еще для одной существенной характеристики СМО с ожиданием: среднего времени ожидания заявки в очереди. Обо- значим его/ож. Пусть заявка проходит в систему в какой-то момент времени. С вероятностью р0 канал обслуживания не будет занят, и ей не придется стоять в очереди (время ожидания равно нулю). С вероят- ностью рг она придет в систему во время обслуживания какой-то заяв- ки, но перед ней не будет очереди, и заявка будет ждать начала своего обслуживания в течение времени 1/ц (среднее время обслуживания одной заявки). С вероятностью рг в очереди перед рассматриваемой заявкой будет стоять еще одна, и время ожидания в среднем будет равно 2/р, и т. д. Вообще, с вероятностью ph пришедшая заявка застанет в системе k заявок и будет ждать в среднем единиц времени; здесь k может быть любым целым числом до т. Что же касается k = т + 1, т. е. случая, когда вновь приходящая заявка застает канал обслужи- вания занятым и еще т заявок в очереди (вероятность этого pm+I), то время ожидания в этом случае также равно нулю, потому что заяв- 252
ка не становится в очередь (и не обслуживается) Поэтому среднее время ожидания будет: 'ож = Pl И Рз Н ••• + Ph----F ••• 4" Рт-• ММ и и Подставляя сюда выражения для рт, получаем: А>ж ~РоР---h Ро Р2 Ь ••• + Ро Р ’-F ••• + Ро Рт — = и и и н = — £ (1 + 2p-f- ... +kpk~l 4- ... -j-mp"1-1). и Преобразуем сумму в скобках, пользуясь формулой (5.10): 7 — РоР 1—Pm(m+1—^р) 0,к И (1- Р)’ или, выражая р0 через р: ^ож 1 р (1 — р> 1—Pm (/n4-1 —/пр) _ р[1—Рт (/п 4-1—/пр)] ,г .п. Ц l-p^+2 (1—р)2 н(1-рт + 2)(1-Р) ' ’ Сравнивая это выражение с формулой (5.11), замечаем, что т. е. среднее время ожидания равно среднему числу заявок в очереди, де- ленному на интенсивность потока заявок. Выведем еще формулу для среднего времени пребывания заявки в системе. Обозначим ТсиеТ случайную величину — время пребыва- ния заявки в СМО. Эта случайная величина складывается из двух сла- гаемых (тоже случайных): Т = Т 4-0 •* сист ®ж ~ » где Тож — время ожидания заявки в очереди, 0 — случайная вели- чина, равная времени обслуживания То5, если заявка обслуживает- ся, и нулю, если она не обслуживается (получает отказ). По теореме сложения математических ожиданий: ^сист = М [Тсист] = М [Т0Н(] 4- М [0], но, в наших обозначениях, Л4 [7\>ж] =t0K, а /VI[0] = qt06 = qlp. Отсю- да находим: /еиот = 70ж 4- q/p, или, с учетом формулы (5.4), *еист=г/Х-Н/И- (5.15) Пример 1. Автозаправочная станция (АЗС) представляет собой СМО с од- ним каналом обслуживания (одной колонкой). Площадка при станции допу- скает пребывание в очереди на заправку не более трех машин одновременно ,/п=3). Если в очереди уже находится три машины, очередная машина, 253
прибывшая к станции, в очередь не становится, а проезжает мимо. Поток машин, прибывающих для заправки, имеет интенсивность Х = 1 (машина в ми- нуту). Процесс заправки продолжается в среднем 1,25 мин. Определить: — вероятность отказа; — относительную и абсолютную пропускную способности СМО; — среднее число машин, ожидающих заправки; — среднее число машин, находящихся на АЗС (включая и обслуживаемую); — среднее время ожидания машины в очереди; — среднее время пребывания машины на АЗС (включая обслуживание). Решение. Находим приведенную интенсивность потока заявок: ц= 1/1,25 = 0,8; р = %/р = 1/0,8= 1,25. По формулам (5.4): 1 — 1,25 А> = ----3—ж 0,122, pj = 1,25.0,122 «0,152, 1 — 3,05 р2 = 1,25.0,122 ж 0,191, р3 = 1,25.0,122 ж 0,238, р4 = 1,25-0,122 «0,297. Вероятность отказа Ротн ж 0,297. Относительная пропускная способность СМО q = 1 — Ротк = 0,703. Абсолютная пропускная способность СМО А = kq = 0,703 (машины в мин.) Среднее число машин в очереди находим по формуле (5.11) - 1,2541-1,25’ (3+1-3,75)] Г =------------------------------- 1,00, (1—1,25») (1-1,25) т. е. среднее число машин, ожидающих в очереди на заправку, равно 1,56. Прибавляя к этой величине среднее число машин, находящихся под об- служиванием получаем среднее число машин, связанных с АЗС: fe = r + co ~ 2,44. Среднее время ожидания машины в очереди, по формуле (5.14) равно (ож = — = 1,56 (мин). К Прибавляя к этой величине Л4[0] = <y/p. = 0,703/0,8 ж 0,88, получим сред- нее время, которое машина проводит на АЗС: 7ОИОТ= 1,56 + 0,88 = 2,44 (мин). До сих пор мы рассматривали работу одноканальной СМО с ожи- данием при ограниченном числе т мест в очереди. Теперь снимем это ограничение, т. е. устремим т к бесконечности. При этом число возможных состояний системы станет бесконечным, и граф состояний примет вид, показанный на рис. 5.5. Попытаемся получить вероятности состояний СМО с неограничен- ной очередью путем предельного перехода (при т -> оо) из формул (5-4). Заметим, что при этом знаменатель в последней формуле (5.2) представляет собой сумму бесконечного числа членов 254
геометрической прогрессии. Эта сумма сходится только, когда прогрес- сия бесконечно убывающая, т. е. при р < 1. Можно со- вершенно строго доказать, что р < 1 есть условие, при котором в СМО с ожиданием существует предельный установившийся режим; прир > 1 такого режима не существует, и очередь при t -> оо растет до бесконечности. Очереди нет Рис. 5.5 Предположим, что р = А,/р < 1, т. е. что предельный режим существует. Устремим в формулах (5.4) т к оо и выведем формулы для предельных вероятностей состояний в СМО без ограничений по длине очереди. Получим: Ро = 1 - Р> р1 = р(1 —р), р2=рг(1 — р)> (5.16) Ра==Р*(1 — Р). При отсутствии ограничений по длине очереди каждая заявка, пришедшая в систему, будет обслужена, поэтому q = 1, A = kq = k. Среднее число заявок в очереди получим из (5.11) при т-+ оо: Среднее число заявок равно в системе по формуле (5.12) при т -> оо будет 5“?+»=Л+₽=Л;- (5Л8) Среднее время ожидания 70)Ь также получим из формулы (5.14) при т оо: или, в другой форме: '«-М.-РГ (6'20) ?55
Среднее время пребывания заявки в СМО равно среднему време- ни ожидания плюс среднее время обслуживания (обол = 1/р: ?сист=-1-Г£-4-—. (5.21) [X 1 — р ц р 1 — р Пример 2. На железнодорожную сортировочную горку прибывают соста- вы с интенсивностью X. = 2 (состава в час). Среднее время, в течение которого горка обрабатывает состав, равно 0,4 часа. Составы, прибывшие в момент, когда горка занята, становятся в очередь и ожидают в парке прибытия, где имеются три запасных пути, на каждом из которых может ожидать один состав Состав, прибывший в момент, когда все три запасных пути в парке прибытия заняты, становится в очередь на внешний путь. Все потоки событий — простейшие. Найти: — среднее число составов, ожидающих очереди (как в парке прибытия, так и вне его); — среднее время ожидания состава в парке прибытия и на внешних путях; — среднее время нахождения состава на сортировочной станции (включая ожидание и обслуживание); — вероятность того, что прибывший состав займет место на внешних путях Решение. В нашем случае % = 2, ц = 1/0,4 = 2,5, %/р. = р — 2/2,5 = = 0,8 <1, и СМО в среднем «справляется» с поступающим на нее потоком зая- вок. Среднее число составов, ожидающих очереди (как в парке прибытия, так и вне его), найдем по формуле (5.17): Среднее число составов, ожидающих очереди на внешних путях, подсчи- таем так: с вероятностью рв вне парка прибытия будет ожидать один состав, с ве- роятностью рв — два состава и т д., с вероятностью р^(й >5) — (k — 4) состава. Среднее число составов, ожидающих вне парка, будет: г’ = 1Рв + 2Рб4-... + (&—4) ph4-... = 1 (1 —р) р14-2 (1 —р) рв4-...4- 4-...4-(fe—4) (1—р) р*4-. .. = (1—р) р’ [14-2р4-Зр*4-. .]. Формулу для бесконечной суммы в скобках получаем предельным пере- ходом (при т -> оо) из формулы (5.10): 14-2р4~Зрг+. (5,22) (1—р)а Отсюда Подставляя сюда р = 0,8, получим: 7 = 1,64. Вероятность того, что прибывающий состав займет место на внешних пу- тях, определяется еще проще: она равна вероятности того, что длина очереди будет не меньше трех, т. е Р4 + Рв4-Рб4-... = (1—Р) Р44-0— Р) Р54-О— Р) Р64-.-- = = (1-р) р4 (14-р4-р2 + • ••) = р4 = 0,84^ 0,41. ?56
Среднее время ожидания в парке прибытия определяем, рассматривая различные гипотезы о числе составов, находящихся в системе: 12 3 ---Pi + Р2+ [Рз + Р4+Рб+---1 — II |Л [X « — {1-Р (1-р) + 2р2 (1 —р)+3 [р3 (1 —р) + р4 (1-Р) +...]} = н = —(p(l-p) + 2p2U-p)+3p3J = И = — {р— р24-2ра — 2р34-3р3]=— [р + р2 + р3]=—Рт- Р • р р р 1—р Для р = 0,8, р = 2,5, получаем, что среднее время ожидания в парке прибытия равно 0,8—0,41 0,4----—----= 0,78 (час) ~ 47 (мин). Что же касается среднего времени ожидания на внешних путях, то оно равно — Р +— Р5 + — Р»+...=— (1—Р)Р4 + —(1—Р)Р5+—(1—Р) Рв + --- = р р р р р р (1—р) р4 „ (1—р) р4 1 1 р4 = ----[ 1 + 2рЧ-Зра4- ... ]=----, = —Т~, Р И (1—Р)2 И 1—Р т. е. для наших численных данных, 0,4-0,41/0,2=0,82 (час) » 49 (мин) Среднее время пребывания состава на сортировочной станции (считая ожи- дание и обслуживание) будет равно: <СиСт = 0,82 + 0,78 + 0,4= 2 (час). 6. МНОГОКАНАЛЬНАЯ СМО С ОЖИДАНИЕМ Рассмотрим n-канальнуюСМО с ожиданием, на которую поступает поток заявок с интенсивностью X; интенсивность обслуживания (для одного канала) р; число мест в очереди т. Состояния системы будем нумеровать по числу заявок, связанных с системой: О) X X о о. о V о So — все каналы свободны, Sj—занят один канал, остальные свободны, Sk — заняты k каналов, остальные свободны, — заняты все п каналов, S„+i—заняты все п каналов; одна заявка стоит в очереди, S„+r — заняты все п каналов, г заявок стоят в очереди, Sn+m — заняты все п каналов, tn заявок стоят в очереди. 9 Зак 573 257
Граф состояний приведен на рис. 5.6. У каждой стрелки простав- лены соответствующие интенсивности потоков событий. Действитель- но, по стрелкам слева направо систему переводит всегда один и тот же поток заявок с интенсивностью X; по стрелкам справа налево систему переводит поток обслуживаний, интенсивность которого равна р, ум- ноженному на число занятых каналов. Очереди нет Рис. 5.6 Граф на рис. 5.6 представляет собой схему гибели и размножения, для которой решение в общем виде уже получено. Напишем выраже- ния для предельных вероятностей состояний, сразу же обозначая Х/р = р: р Ра р" Р1=-урРо. Р2=-^-Ро..............Рп=-^-Ро, р"+1 p"+2 р"+т Рп+1— — Ро. Рп+2— Ро» .... Рп + т— ———- Ро> пл! п2 nl пт п\ Р л2 р0 = 1 н—и — + 0 1 и 21 рп рп+> рп+5 nl "I" nnl п2 nl р'1^" пт nl или, суммируя геометрическую прогрессию со знаменателем р/п подчеркнутые члены): р2 Р2-— РО- р" Prt = ^Po. Рн+1 Р ----г Ро> п-п! Рп+2 р--Г‘ Vt Ро’ П2П! pH -j- Ifl Рп + т= — ; Ро- пт п! (6-1) 258
Таким образом, все вероятности состояний найдены. Найдем некоторые характеристики эффективности обслужи ва ния. Поступившая заявка получает отказ, если заняты все п каналов и все т мест в очереди: л«+"г '°отк ~ Рп + т ~ —- рп. (6-2) пт Относительная пропускная способность, как всегда, дополняет вероятность отказа до единицы рп + т Ро- Абсолютная пропускная способность СМО будет равна: = Х 1 р"+т Ро пт (6.3) Найдем среднее число занятых каналов. Для СМО с отказами оно совпадало со средним числом заявок, находящихся в системе. Для СМО с очередью среднее число занятых каналов не совпадает со сред- ним числом заявок, находящихся в системе: последняя величина от- личается от первой на среднее число заявок, находящихся в очереди. Сохраним обозначение k для среднего числа заявок, связанных с си- стемой, а среднее число занятых каналов обозначим г. Каждый заня- тый канал обслуживает в среднем р заявок в единицу времени; вся же СМО обслуживает в среднем А заявок в единицу времени. Деля одно на другое, получим: - А /, о"+т \ 2 =— = — 1 —-с-------- р0 . ц р \ Пт-п1 У или г = р 11 — ----ро\. (6.4) \ пт-п! °/ Среднее число заявок в очереди можно вычислить непосредствен- но, как математическое ожидание дискретной случайной величины, умножая любое возможное число заявок на вероятность того, что имен- но это число заявок будет в очереди, и складывая результаты: ! 0^4*2 Г = 1 -рп+ I 2 -Рп+2 + ••• +^’Pn-|-m=l -Ро+"- + n-nl n2-nl Р р = р Ро пт-пГ° П-п1 (6.5) Введем обозначение р/п = к и перепишем (6.5) в виде: г =— р0 [ 1 2х + Зх2-р ... '] (6.6) n-nl 9* 259
Заметим, что выражение в скобках есть не что иное, как уже вы- численная нами в предыдущем параграфе сумма (5.10), где вместо р поставлено х. Пользуясь этой формулой и подставляя результат в (6.6), получим: р” + 'ро 1— (т + 1) к-^-тк п-п! (1—-х)2 (6.7) Складывая среднее число заявок в очереди г и среднее число заня- тых каналов z, получим среднее число заявок, связанных с системой: k = z-\-r. (6.8) Теперь найдем среднее время ожидания заявки в очереди: 70ж. Сде- лаем ряд гипотез о том, в каком состоянии застанет систему вновь при- шедшая заявка и сколько времени ей придется ждать обслуживания. Если заявка застанет не все каналы занятыми, ей вообще не при- дется ждать (соответствующие члены в математическом ожидании от- бросим, как равные нулю). Если заявка придет в момент, когда заня- ты все п каналов, а очереди нет, ей придется ждать в среднем время, равное 1/пр (потому что поток освобождений п каналов имеет интен- сивность пр). Если заявка застанет все каналы занятыми и одну заяв- ку перед собой в очереди, ей придется в среднем ждать время 2/пр (по 1/пр на каждую впереди стоящую заявку) и т. д. Если заявка застанет в очереди г заявок, ей придется ждать в среднем время г/пр. Если вновь пришедшая заявка застанет в очереди уже т заявок, то она вообще не будет ждать (но и не будет обслуживаться). Среднее время ожида- ния найдем, умножая каждое из этих значений на соответствующую вероятность: 7 1 । 2 т -ож ~ Рп Н------------Рп+ 1 + ••• П-------Рп + т— 1 — пр пр пр Рп , , т(>Г1 + т-' ~ Ро +----------Г Ро + Н---------— Ро nl n-nl п -nl 1 пр р” Ро п- п! р /пр"1-' Так же, как и в случае одноканальной СМО с ожиданием, заме- чаем, что это выражение отличается от выражения для средней длины очереди (6.5) только множителем 1/рр = 1/Х, т. е. ^ож (6.9) Подставляя' сюда выражение для г, найдем: - _ РпРо 1—(m+l) + ^ОЖ , пцп! (1-х)2 (6.10) 260
Среднее время пребывания заявки в системе, так же, как и для одноканальной СМО, отличается от среднего времени ожидания на среднее время обслуживания, умноженное на относительную про- пускную способность: /сист = Л1[ТОЖ] + М [0] = /ож -f- qfti. (6.Н) Пример 1. Автозаправочная станция (АЗС) с двумя колонками (п = 2) предназначена для обслуживания машин. Поток машин, прибывающих на АЗС, имеет интенсивность % = 2 (машины в минуту); среднее время обслуживания одной машины <Об = 1/Н=2 (МИН). Площадка у АЗС может вместить очередь не более т — 3 (машин). Машина, прибывшая в момент, когда все три места в очереди заняты, покидает АЗС (по- лучает отказ). Найти характеристики СМО: — вероятность отказа, — относительную и абсолютную пропускную способности, — среднее число занятых колонок, — среднее число машин в очереди, — среднее время ожидания и пребывания машины на АЗС. Решение. Имеем: п = 2, т = 3, А. = 2, р. = 1/^Об = 0>5, р = 4, х = р/п = 2. По формулам (6.1) находим: 4 42 42 2—24 125 14- — +-----+~-------- 1 2 2 1—2 Вероятность отказа: 47 В Ротк = Рп+т = РВ = — Ро = 64р„ = 0,512. Относительная пропускная способность: ?=1-Ротк = 0,488. Абсолютная пропускная способность: А = = 0,976 (машины в минуту). Среднее число занятых каналов (колонок): г= А/р=0,976/0,5=1,952 (т. е. обе колонки почти все время заняты). Среднее число машин в очереди находим по формуле (6.7): 7______ 2-2-125 (1— 2Y 125 261
Среднее время ожидания в очереди — по формуле (6.9)! 70!К = г/А, = 2,18/2= 1,09 (мин). Среднее время пребывания машины на АЗС (включая время обслуживания)! ^сист ~ (ож+ ^об=1,09 + 0,976 = 2,07 (мин). Выше мы рассмотрели n-канальную СМО с ожиданием, когда в оче- реди одновременно могут находиться не более т заявок. Так же, как и в предыдущем параграфе, посмотрим, что будет, если длина очереди не ограничена каким-то числом т, а может быть сколь угодно большой. Граф состояний в этом случае — бесконеч- ный (см. рис. 5.7). Вероятности состояний получим из формул (6.1) предельным пе- реходом (при т оо). Заметим, что сумма соответствующей геомет- Очереди, нет Рис. 5.7 рической прогрессии сходится при к — р/п < 1 и расходится при х > 1; соответственно, установившийся режим будет существовать при х< 1, а при х > 1 очередь будет бесконечно возрастать. До- пустим, что х< I и устремим в формулах (6.1) величину т к беско- нечности. Получим выражения для предельных вероятностей состоя- ний: Г Р р2 Ро = П Н- — Ро, р-‘ Рг=— Ро» р Рп~=~ Р0> р'! +1 Рп + 1 - ~ Ро» п п! pft+1 п! (п—р) (6.12) р п‘-П1 Рп+г пг-п! Ро, 262
Так как каждая заявка рано или поздно будет обслужена, то ха- рактеристики пропускной способности СМО равны- Р =0 1 отк Среднее число заявок в п- п! (1 —х)2 а среднее время ожидания — из (6.10): 7 = 1, Л = Л? = Л. очереди получим при т -> оо из (6.7): РЛ+'РП Среднее число занятых каналов z найдется по-прежнему через аб- солютную пропускную способность: z = —=—=р, (6.15) ц ц а среднее число заявок, связанных с СМО — как среднее число заявок в очереди плюс среднее число заявок, находящихся под обслужива- нием (среднее число занятых каналов): й = г + г. (6.16) Пример 2. Автозаправочная станция с двумя колонками (п = 2) обслужи- вает поток машин с интенсивностью X = 0,8 (машин в минуту). Среднее время обслуживания одной машины 1 /об=---= 2 (мин). В В данном районе нет другой АЗС, так что очередь машин перед АЗС может расти практически неограниченно. Найти характеристики СМО. Решение Имеем: п = 2, Л = 0,8, р. = 1//од = 0,5, р = 1,6, х = р/п = = 0,8 Поскольку х < 1, очередь не растет безгранично и имеет смысл гово рнть о предельном стационарном режиме работы СМО. По формулам (6.11) на ходим вероятности состояний: Г 4,09'1-1 р„ = 1 + 1,6+1,28+—!— »0,111, " [ 2-0,4J Pi — 1,6р0 « 0,178, р2 = 1 ,28р0 — 0,142, 1,63 i,64 Рз = -^ Ро«0,114, P4 = ,jy^ Ро« 0,091 и т. д. Среднее число занятых каналов найдем, разделив абсолютную пропускную способность СМО Л = % = 0,8 на интенсивность обслуживания и = 0,5; г=0,8/0,5= 1,6. Вероятность отсутс1вия очереди у АЗС будет: Р0 + Р1 + Р2 ~ 0,431. 263
Среднее число машин в очереди: _ 1,63-0,111 г = —----1« 0,71. 2.2-0,42* Среднее число машин на АЗС: fe=7-hz«0,71 + 1,6 = 2,31 Среднее время ожидания в очереди: Сж ” л «0,89 (мин), Л Среднее время пребывания машины на АЗС: <сист=/ож + <об~ 0,89+2 = 2,89 (мии). 7. СМО С ОГРАНИЧЕННЫМ ВРЕМЕНЕМ ОЖИДАНИЯ До сих пор мы рассматривали СМО с ожиданием, ограниченным только длиной очереди (числом т заявок, одновременно находящихся в очереди). В такой СМО заявка, раз ставшая в очередь, уже не по- кидает ее и «терпеливо» дожидается обслуживания. На практике не- редко встречаются СМО другого типа, в которых заявка, подождав некоторое время, может уйти из очереди (так называемые «нетерпели- вые» заявки). Очереди нет Рис. 5.8 Рассмотрим СМО подобного типа, оставаясь в рамках марковской схемы. Предположим, что имеется n-канальная СМО с ожиданием, в ко- торой число мест в очереди не ограничено, но время пребывания заяв- ки в очереди ограничено некоторым случайным сроком Точ со средним значением 70Ч, таким образом, на каждую заявку, стоящую в очереди, действует как бы «поток уходов» с интенсивностью 1 v = —— Сч Если этот поток пуассоновский, то процесс, протекающий в СМО, будет марковским. Найдем для него вероятности состояний. Будем снова нумеровать состояния системы по числу заявок, связанных с си- стемой — как обслуживаемых, так и стоящих в очереди: 264
ь f So—все каналы свободны, “ Sj—занят один канал, S I о c=r { о2—заняты два канала, cl I S? ................................ о | Sn — заняты все п каналов, Sn+i — заняты все п каналов, одна заявка стоит в очереди, 5п-)-л—заняты все п каналов, г заявок стоит в очереди, и 7. Д. Граф состояний системы показан на рис. 5.8. Разметим этот граф, т. е. проставим у стрелок соответствующие интенсивности. Снова, как и раньше, у всех стрелок, ведущих слева направо, будет стоять интенсивность потока заявок X. Для состояний без очереди у стрелок, ведущих из них справа налево, будет, как и рань- ше, стоять суммарная интенсивность потока обслуживании всех заня- тых каналов. Что касается состояний с очередью, то у стрелок, веду- щих из них справа налево будет стоять суммарная интенсивность по- тока обслуживании всех п каналов пр, плюс соответствующая интен- сивность потока уходов из очереди. Если в очереди стоят г заявок, то суммарная интенсивность потока уходов будет равна rv. Как видно из графа, перед нами опять схема гибели и размноже- ния; применяя общие выражения для предельных вероятностей состоя- ний в этой схеме, напишем: %/р Р: Ро. __ (%/р)2 Рй — о, Ро> 2! Ро. .... (W%f п n! (np-|-v) (np-|-2v)...(np+z-v) п fl , М* . , I (%/р)" (W Г % , р0=(! +т+^-+- +—+ — _____________+... ++ ...1) (np+v) (np+2v) (np-f-v) (np+2v) ...(np-f-rv) J J 205
или, вводя обозначения: р = Х/ц, P = v/p,, ______И________I I_______________г___________ („+Р)(п + 2Р) ' (п+Р)(п + 2₽)...(п+;Р) р Pi=— Ро> Р2 Р2 = РО- Р" Рп = , Ах _ pn р Рп+1 — _ А» п! п + Р = Р2 Рп+2 nl (п + Р)(п+2Р) (7.1) Е--------------С----------- Рп, п< (п + Р) (п+2Р).. (п-НлР) Отметим некоторые особенности рассмотренной СМО с «нетерпе- ливыми» заявками по сравнению с ранее рассмотренной СМО с «тер- пеливыми» заявками. Если длина очереди не ограничена заранее никаким числом и за- явки «терпеливы» (не уходят из очереди), то стационарный предель- ный режим существует только в случае р < п (при р и соответствую- щая бесконечная геометрическая прогрессия расходится, что физичес- ки соответствует неограниченному росту очереди при t -> оо). Напро- тив, в СМО с «нетерпеливыми» заявками, уходящими рано или поздно из очереди, установившийся режим обслуживания при I -> оо дости- гается всегда, независимо от приведенной интенсивности потока заявок р. Это следует из того, что ряд в знаменателе первой формулы (7.1) сходится при любых положительных значениях р и [3. Для СМО с «нетерпеливыми» заявками понятие «вероятность от- каза» не имеет смысла — каждая заявка становится в очередь, но мо- жет и не дождаться обслуживания, уйдя раньше времени. Относительную пропускную способность q такой СМО можно под- считать следующим образом. Очевидно, обслужены будут все заявки, кроме тех, которые уйдут из очереди досрочно. Подсчитаем, какое в среднем число заявок покидает очередь досрочно. Для этого вычислим среднее число заявок в очереди: r= 1 -рп+14-2'Р*+-*+ ••• +r'P«+r_H>, • (7-2) 266
На каждую из этих заявок действует «поток уходов» с интенсив ностью V. Значит, из среднего числа г заявок в очереди в среднем бу- дет уходить, не дождавшись обслуживания, vr заявок в единицу вре- мени; всего в единицу времени в среднем будет обслужено А = А — vr заявок. Относительная пропускная способность СМО будет А Л — vr , v - а - — =--------= 1------г. 4 X X X (7.3) (7.4) Среднее число занятых каналов г по-прежнему получим, деля аб- солютную пропускную способность на р: , -А А, — vr о- г = —=------ =р—рг. ц р г 1 (7.5) Это позволяет вычислить среднее число заявок в очереди г, не сум- мируя бесконечного ряда (7.2). Действительно, из (7.5) получим: - Р г (7.6) а входящее в эту формулу среднее число занятых каналов можно найти как математическое ожидание случайной величины Z, принимающей значения 0,1, 2...п с вероятностями р0, рь р2> •••> П — (Ро + Pi + г=О-Ро+ l-Pi + 2-p8+ ... +«-Н—(Ро+Р1+ - +Pn-i)] = — Р14~2рг+ ... +М1 — (Po + Pi+ ••• Ч'Рп—1)1- (7.7) Мы не будем выводить формул для среднего времени ожидания в очереди, так как для этого требуются сравнительно сложные вы- кладки. Заметим, что, в отличие от формул §§ 5, 6, где суммы большого (или бесконечного) числа слагаемых «свертываются» при помощи формул для суммы геометрической прогрессии, в формуле (7.1) фигурирует сумма бесконечного ряда, не являющегося прогрессией. Однако эта сум- ма вычисляется приближенно, причем достаточно легко, так как члены ряда быстро убывают с увеличением их номера. В качестве прибли- женного значения для бесконечной суммы берется сумма конечного числа г — 1 членов, а остаток оценивается следующим образом: Р" nl (п+ 0) (п + 20) ... (п + г0) Рг Р1 Р р" nl 0 2.0. .... г 0 (»+₽) (п+20)...(л+(г+1)0) , Рг + 1 , nl (р/0)г , (Р/0>' +‘ Н + (г+1)! (7-8) 267
Можно доказать, что бесконечная сумма в квадратных скобках меньше, чем е₽/Р, и выражение (7.8) меньше, чем Р1 (р/Р)г р/р п! г! В заключение заметим, что если в формулах (7.1) перейти к преде- лу при v -> 0 (или, что то же, при [3 -> 0), то при р < п получатся формулы (6.10) предыдущего параграфа, т. е. «нетерпеливые» заявки станут «терпеливыми». 8. ЗАМКНУТЫЕ СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ До сих пор мы рассматривали такие системы массового обслужи- вания, где заявки приходили откуда-то извне и интенсивность по- тока заявок не зависела от состояния самой системы. В настоящем параграфе мы рассмотрим системы массового обслуживания другого типа — такие, в которых интенсивность потока поступающих заявок зависит от состояния самой СМО. Такие системы массового обслужи- вания называются замкнутыми. В качестве примера замкнутой СМО рассмотрим следующую си- стему. Рабочий-наладчик обслуживает п станков. Каждый станок мо- жет в любой момент выйти из строя и потребовать обслуживания со стороны наладчика. Интенсивность потока неисправностей каждого станка равна X. Вышедший из строя станок останавливается. Если в этот момент рабочий свободен, он берется за наладку станка; на это он тратит среднее время где р — интенсивность потока обслуживании (наладок). Если в момент выхода станка из строя рабочий занят, станок ста- новится в очередь на обслуживание и ждет, пока рабочий не освобо- дится. Требуется найти вероятности состояний данной системы и ее ха- рактеристики: — вероятность того, что рабочий не будет занят, — вероятность наличия очереди, — среднее число станков, ожидающих очереди на ремонт и т. д. Перед нами — своеобразная система массового обслуживания, где источниками заявок являются станки, имеющиеся в ограниченном количестве и подающие или не подающие заявки в зависимости от своего состояния: при выходе станка из строя он перестает быть источником новых заявок. Следовательно, интенсивность общего потока заявок, с которым приходится иметь дело рабочему, зависит от того, сколько имеется неисправных станков, т. е. сколько заявок связано с процес- сом обслуживания (непосредственно обслуживается или стоит в оче- реди). £68
Характерным для замкнутой системы массового обслуживания является наличие ограниченного числа источни- ков заявок. В сущности, любая СМО имеет дело только с ограниченным чис- лом источников заявок, но в ряде случаев число этих источников так велико, что можно пренебречь влиянием состояния самой СМО на по- ток заявок. Например, поток вызовов на АТС крупного города исходит, в сущности, от ограниченного числа абонентов, но это число так вели- ко, что практически можно считать интенсивность потока заявок не- зависимой от состояний самой АТС (сколько каналов занято в данный момент). В замкнутой же системе массового обслуживания источники заявок, наряду с каналами обслуживания, рассматриваются как эле- менты СМО. Рассмотрим сформулированную выше задачу о рабочем-наладчике в рамках общей схемы марковских процессов. Система, включающая рабочего и п станков, имеет ряд состояний, которые мы будем нумеровать по числу неисправных станков (станков, связанных с обслуживанием): So — все станки исправны (рабочий свободен), Sj — один станок неисправен, рабочий занят его наладкой, S2 — два станка неисправны, один налаживается, другой ожидает очереди, Sn — все п станков неисправны, один налаживается, п — 1 стоят в очереди. Граф состояний приведен на рис. 5.9. Интенсивности потоков событи й, переводящих систему из состояния в состояние, проставлены у стрелок. Из состояния So в Sj систему переводит поток неисправнос- тей всех работающих станков; его интенсивность равна пк. Из состоя- ния S в S2 систему переводит поток неисправностей уже не п, а п— 1 станко в (работают всего п — 1) и т. д. Что касается интенсивностей потоков событий, переводящих систему по стрелкам справа налево, то они все одинаковы — работает все время один рабочий с интенсив- ностью обслуживания р. Пользуясь, как обычно, общим решением задачи о предельных вероятностях состояний для схемы гибели и размножения (§8 гл. 4), напишем предельные вероятности состояний: п(п—1)Х» п ₽2 — 2 Ро> Р2 1 14-я (Х/р) + « (и-1) (Х/р)2+ ... +«(/2-1) ...1-(Х/р)" 269
Вводя, как и раньше, обозначения Х/р = р, перепишем эти фор- мулы в виде; _____________________।___________________ । 1+пр+ п (п—1)рг+ ... -рп(п—1)... 1-р" Р1 == « Р Ро> рг = п(п— 1)р2р0, Рп = п(п— 1)... 1 р«р0. (8.1) Итак, вероятности состояний СМО найдены. В силу своеобразия замкнутой СМО, характеристики ее эффек- тивности будут отличны от тех, которые мы применяли ранее для САЮ с неограниченным количеством источников заявок. Очереди нет Рис. 5.9 Роль «абсолютной пропускной способности» в данном случае бу- дет играть среднее количество неисправностей, устраняемых рабочим в единицу времени. Вычислим эту характери- стику. Рабочий занят наладкой станка с вероятностью —Ро- (8.2) Если он занят, он обслуживает р станков (ликвидирует р неис- правностей) в единицу времени; значит, абсолютная пропускная спо- собность системы Л = (1 — р0)р. (8.3) Относительную пропускную способность для замкнутой СМО мы не вычисляем, так как каждая заявка, в конце концов, будет обслуже- на: q = 1. Вероятность того, что рабочий не будет занят: ^своб= 1 ^зан Ро- (8.4) Вычислим среднее число неисправных стан- ков, иначе — среднее число станков, связанных с процессом обслужи- вания. Обозначим это среднее число w. Вообще говоря, величину w мож- но вычислить непосредственно, по формуле w — 1 'Pi 4~2-Рг+ •••А~п'Рп> но проще будет найти ее через абсолютную пропускную способность А. Действительно, каждый работающий станок порождает поток не- 270
исправностей с интенсивностью X; в нашей СМО в среднем работает и — w станков; порождаемый ими средний поток неисправностей будет иметь среднюю интенсивность (п — w)K-, все эти неисправности устра- няются рабочим, следовательно, (« — ш) Х = (1— р0)р, откуда w = n — (1—Ро) или w = n—(8.5) о Определим теперь среднее число станков г, ожидающих наладки в очереди. Будем рассуждать следующим образом: общее число стан- ков W, связанных с обслуживанием, складывается из числа станков 7?, стоящих в очереди, плюс число станков Q, непосредственно находящих- ся под обслуживанием: W = R + Q. Число станков Q, находящихся под обслуживанием, равно едини- це, если рабочий занят, и нулю, если он свободен, т. е. среднее значе- ние Q равно вероятности того, что рабочий занят: ® = 1 — Ро- Вычитая эту величину из среднего числа w станков, связанных с обслуживанием (неисправных), получим среднее число станков, ожи- дающих обслуживания в очереди: г =п— — (1— p0)=n — (1 — р0) (1 + — \ (8.6) Р \ Р / ' Остановимся еще на одной характеристике эффективности СМО: на производительности группы станков, обслуживаемых рабочим. _ Зная среднее число неисправных станков w и производительность I исправного станка за единицу времени, можно оценить среднюю по- терю L производительности группы станков в единицу времени за счет неисправностей: L = wl. Пример 1. Рабочий обслуживает группу из трех станков. Каждый станок останавливается в среднем 2 раза в час Процесс наладки занимает у рабочего, в среднем, 10 минут Определить характеристики замкнутой СМО: вероятность занятости рабочего; его абсолютную пропускную способность Я; среднее коли- чество неисправных станков; среднюю относительную потерю производитель- ности группы станков за счет неисправностей Решение. Имеем, п = 3, Х = 2, — = — = 6, р = Х/ц = 1/3. /об 1/6 271
По формулам (8.1) 1+3-1/3+3-2-1/32+3-2-1-1/33 Вероятность занятости рабочего: Р зан= 1 —Ро= 0,654. Абсолютная пропускная способность рабочего (среднее число неисправ- ностей, которое он ликвидирует в час): <4 = 0,654-6 = 3,94. Среднее число неисправных станков находим по формуле (8.5): Средняя относительная потеря производительности группы станков за счет неисправностей w/n = 0,347, т. е. за счет неисправностей группа станков теряет около 35% производительности. Рассмотрим теперь более общий пример замкнутой СМО: бригада из т рабочих обслуживает п станков (т < п). Перечислим состояния системы: О) X X ч OJ Q- OJ СТ о So—все станки работают, рабочие не заняты, Sx—один станок остановился, один рабочий занят, S2—два станка остановились, два рабочих заняты, —т станков остановились, все рабочие заняты, Sm+i—m-j-1 станок остановился, т из них налаживаются, один ждет очереди, Sn — все п станков остановились, т из них налаживаются, п—т ждут очереди. Очереди нет Рис. 5.10 Граф состояний системы показан на рис. 5.10 (интенсивности по» токов событий проставлены у стрелок). Применяя общее решение для схемы гибели и размножения, находим предельные вероятности со- стояний: п А Р1=~.-----Ро>. 1 М- Pi~ 1-2 ( 2 Ро> 272
„ я(п-1)(п-2) ( А \з л Ро ~ 1 О , I и J Р°’ 1-2-3 _ п (п—1) (п—2)... (п — т + 1) Рт 1-2-3 ... т п (п — \) ... (п~ т) рт+1 =------------------ Ро. 1 -2 ... т-т \ Li / п(п — 1)... (п—т —1) / А \п>+ 2 Рт+^~ Ро' Ь2... т-т2 п Pw п(л —1) ... 1 Рп 1-2 .т-тп~т л+'+т ± + L 'И '-2 \ !» / п(п—\) ... (п — «1+0 I \т I П (п— 1) (П—т) /ЗЛ'”'*’1 н- 1-2... т-т А VI-1 Обозначая, как I -2 .. m \ n (n— 1) ... 1 1-2 .. m • mn~'n \ ц ) всегда, X/p. = p, приведем формулы к виду: l+2Lp + 2fci).p2+. 1! Н 2! И n(n—1) ...(n - m+1) ---------- p ф ml «(»— 1) - (n—m) ,t ml т »(»-!) - 1 on ml mn~m Pi —РРо, п(п — 1) о Р2 =1 2! Р Ро' _ п(Д-1)(П-2) 3 Рз — О1 Р Ро» 31 (8.7) n(n—1) ... (n — m+1) Pm - ml P P°’ n(n -1) ... (n - m) O ---------- P Ро» ml m n(n—1) ... (n —ffl —1) + 2 po> ml m2 Рт + Рт+2 — П (п— !) ... 1 „ рл=-", „Lm-P" Ро- ml тп m 273
Через эти вероятности выражается среднее число г занятых рабо- чих: г = 0-/?о+ ' •/°1 + 2-р2+ +^-(Рт +рт-Н + ••• +рп) = = Р1+2/?24- ... + (/77—1)Рт —1 +/Т2 (1—Ро — ₽1—••• — Рт—|). (8.8) Через z выражается, в свою очередь, среднее число станков, обслу- живаемых бригадой в единицу времени (абсолютная пропускная спо- собность): А =гц, (8.9) а также среднее число неисправных станков: ы = п—— п-----------z~. (8.10) 7. Р ' ’ Отсюда же находится и средняя потеря производительности груп- пы станков в единицу времени за счет неисправностей: нужно умно- жить среднее число неисправных станков w на производительность I одного станка в единицу времени. Пример 2. Два рабочих обслуживают группу из шести станков Остановки каждого (работающего) станка случаются, в среднем, через каждые полчаса. Процесс наладки занимает у рабочего в среднем 10 минут Определить характе- ристики замкнутой СМО: — среднее число занятых рабочих, — абсолютную пропускную способность, — среднее количество неисправных станков Решение. Имеем: п=6, т = 2, А. = 2, ц=1/?об==6, p = >v/p=l/3. По фор- мулам (8.7) /, 6 1 6-5 1 6.5-4 1 6-5.4.3 1 Ро — [ 14- • 4- • —-1------------------------—1— \ 1 3 ~1-2 3И1 -2-2 3:i ' 1.2-22 3-> 6-5-4.3-2 1 6-5-4-3.2-1 1 1 4----------- • — 4----------- • — I =----------~ о 153 1-2.23 3 "> 1-2-24 З6 ) 6,549 ’ ’ Pi «6/1-1/3-0,153 ж 0,306. Отсюда среднее число занятых рабочих: г= 1Л-|-2(1— р0— Pl) = 1-0,153 +2-0,541 « 1,235. По формуле (8.9) находим абсолютную пропускную способность Д= 1,235-6 = 7,41. По формуле (8 10) находим среднее число Неисправных станков ш = 6—7,41/2=2,295. 274
9. СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ СО «ВЗАИМОПОМОЩЬЮ» МЕЖДУ КАНАЛАМИ До сих пор мы рассматривали только такие СМО, в которых каж- дая заявка может обслуживаться только одним каналом; незанятые каналы не могут «помогать» занятому в обслуживании. Вообще, это не всегда бывает так: встречаются системы массового обслуживания, где одна и та же заявка может одновременно обслу- живаться двумя и более каналами. Например, один и тот же вышедший из строя станок могут обслуживать два рабочих сразу. Такая «взаимо- помощь» между каналами может иметь место как в открытых, так и в замкнутых СМО. При рассмотрении СМО со взаимопомощью между каналами не- обходимо учитывать два фактора: 1. Насколько убыстряется обслуживание заявки, когда над ним работает не один, а сразу несколько каналов? 2. Какова «дисциплина взаимопомощи», т. е. когда и как несколь- ко каналов берут на себя обслуживание одной и той же заявки? Рассмотрим сначала первый вопрос. Естественно предположить, что если над обслуживанием заявки работает не один канал, а несколь- ко (£) каналов, интенсивность потока обслуживании не будет убы- вать с увеличением k, т. е. будет представлять собой некоторую неубы- вающую функцию числа k работающих каналов. Обозначим эту функ- цию |i(£). Возможный вид функции |i(£) показан на рис. 5.11. Очевидно, что неограниченное увеличение числа одновременно работающих каналов не всегда ведет к пропорциональному увеличению скорости обслуживания; естественнее предположить, что при некото- ром критическом значении k = /?кр дальнейшее увеличение числа за- нятых каналов уже не повышает интенсивности обслуживания. Для того, чтобы проанализировать работу СМО со взаимопомощью между каналами, нужно, прежде всего, задать вид функции р(й). Самым простым для исследования будет случай, когда функция р(й) возрастает пропорционально k при k < Акр, а при k > kKp оста- ется постоянной и равной цтоа. =£крц (см. рис. 5.12). Если при этом общее число каналов п, которые могут помогать друг другу, не превос- ходит 1гкр: ^кр’ «74
то можно считать интенсивность обслуживания заявки несколькими каналами пропорциональной числу каналов. Остановимся теперь на втором вопросе: дисциплине взаимопомощи. Самый простой случай этой дисциплины мы обозначим условно «все как один». Это означает, что при появлении одной заявки ее начинают обслуживать все п каналов сразу и остаются занятыми, пока не закон- чится обслуживание этой заявки; затем все каналы переключаются на обслуживание другой заявки (если она есть) или ждут ее появления, если ее нет, и т. д. Очевидно, в этом случае все п каналов работают как один, СМО становится одноканальной, но с более высокой интенсив- ностью обслуживания. Возникает вопрос: выгодно или невыгодно вводить такую взаимо- помощь между каналами? Ответ на этот вопрос зависит от того, ка- кова интенсивность потока заявок, каков вид функции р.(&), каков тип СМО (с отказами, с очередью), какая величина выбирается в качестве характеристики эффективности обслуживания. Пример 1. Имеется трехканальная СМО с отказами: интенсивность потока заявок X = 4 (заявки в минуту), среднее время обслуживания одно# заявки одним каналом (og = 0,5 (мин), функция p.(fe)=ftp,. Спрашивается, выгодно ли с точки зрения пропускной способности СМО вводить взаимопомощь между ка- налами по типу «все как один»? Выгодно ли это с точки зрения уменьшения сред- него времени пребывания заявки в системе? Решение, а. Без взаимопомощи, п = 3, % = 4, ц = 1/0,5 = 2, р = Х/р, = 2. По формулам Эрланга (см. § 4) имеем: 3 щ -0,158; 3 » 0,21. Ро 2 2» 23 14----4----4---- II 2! 31 23 4 Ротк = Рз= 3| Ро = 3 19 Относительная пропускная способность СМО: q= 1 —Ротк ~ 0,79. Абсолютная пропускная способность: А = ^«4-0,79= 3,16. Среднее время пребывания заявки в СМО найдется, как вероятность того, что заявка будет принята к обслуживанию, умноженная на среднее время об- служивания: /сист = 0,79-0,5 = 0,395 (мин). Не нужно забывать, что это среднее время относится ко всем заявкам — как обслуженным, так и необслуженным Нас же может интересовать среднее время, которое пробудет в системе обслуженная заявка. Эго время рав- но: <СИСТ = ^Об=0>5 (мин>- б. Со взаимопомощью. X 2 п* — 1, Х = 4, р.*=3р = 6, р* = — = —; ц* 3 276
1 3 2 3 2 Ро== 14-2/3 = -Г: °1= 3 ' 5 " 5 ’ 2 2 3 Р<УТК== Р1 = г • <?— 1 К = К =0>® О DO 4 = Х<? = 4-0,6= 2,4- Среднее время пребывания заявки в СМО: (сист = Р1 1/3^ = 2/5-6 = 0,0667 (мин). Среднее время пребывания обслуженной заявки в СМО; ^>=1/3)1=0,167 (мин). Таким образом, при наличии взаимопомощи «все как один» про- пускная способность СМО заметно уменьшилась. Это объясняется уве- личением вероятности отказа: за то время, пока все каналы заняты обслуживанием одной заявки, могут прийти другие заявки, и, естест- венно, получить отказ. Что касается среднего времени пребывания заявки в СМО, то оно, как и следовало ожидать, уменьшилось. Если, по каким-то соображениям, мы стремимся ко всемерному уменьшению времени, которое заявка проводит в СМО (например, если пребывание в СМО опасно для заявки), может оказаться, что, несмотря на умень- шение пропускной способности, все же будет выгодно объединить три канала в один. Рассмотрим теперь влияние взаимопомощи типа «все как один» на работу СМО с ожиданием. Возьмем для простоты только случай не- ограниченной очереди. Естественно, влияния взаимопомощи на про- пускную способность СМО в этом случае не будет, так как при любых условиях обслужены будут все пришедшие заявки. Возникает вопрос о влиянии взаимопомощи на характеристики ожидания: среднюю дли- ну очереди, среднее время ожидания, среднее время пребывания в СМО. В силу формул (6.13), (6.14) §6 для обслуживания без, взаимо- помощи среднее число заявок в очереди будет - _ рл+ ' Ро п-п\ (1 —х)2 ’ среднее время ожидания: 7 = Р" Ро ож пи,-п! (1 — х)2 (9-1) (9-2) а среднее время пребывания в системе: ^СИСТ 4* 1/Н’ (9.3) где Ро =----------—---------п------ттч—» х = —. (9.4) р рл + > п ’ II 21 "I" п1 п1 (п—р) 277
Если же применяется взаимопомощь типа «все как один», то си- стема будет работать как одноканальная с параметрами р* — Х/р* = Х/пц = р/и = х и ее характеристики определятся формулами (5.14), (5.15) § 5: х г —----. 1 —X 7 = J_____L_ ™ „ц 1_х> 7 —7 л___L — * сист ои.+ пм.(1_х) (9.5) (9.6) (9.7) Пример 2. Имеется трехканальная СМО с неограниченной очередью; ин- тенсивность потока заявок X = 4 (заявки в мин.), среднее время обслуживания /Об = 0,5 (мин) Функция ii(/e) = /гп (&кр > 3). Выгодно ли, имея в виду: — среднюю длину очереди, — среднее время ожидания обслуживания, — среднее время пребывания заявки в СМО вводить взаимопомощь между каналами типа «все как один»? Решение, а. Без взаимопомощи. п = 3, Л -- 4, it = 1/0,5 = 2, р = Х/р. = 2, х = р/п == 2/3. По формулам (9.1) — (9.4) имеем 1 2г 2! ₽0 = 24 _1_ 2 2г 2! 24 ~ 9 ‘ ' 1! + 21 +"зГ+ 31 (3—2) 2«-1/9 8 --------— =— = 0,889; 3-31 (1/3)г 9 toiK ==7/Х= 2/9=0,222; ^сист=^ож+ 7об= 2/9+ 1/2=0,722. б. Со взаимопомощью п*=1, Х=4, По формулам (9.5) — (9.7) находим: -_(2/3)*_ 1/3 1 2/3 Сж— г. . .,— □ =0,333; о 1/3 3 ^сист = ^огк + бэб:= 1/3 + 1/6 = 0,500. р*=3ц = 6, р*=Х/р* = х=2/3. 4 — = 1,333; Таким образом, средняя длина очереди и среднее время ожидания в очереди в случае взаимопомощи, больше, но среднее время пре- бывания заявки в системе — меньше. Из рассмотренных примеров видно, что взаимопомощь между ка налами типа «все как один», как правило, не способствует повышению эффективности обслуживания: время пребывания заявки в СМО умень- шается, но зато ухудшаются другие характеристики обслуживания. 278
Поэтому желательно изменить дисциплину обслуживания так, чтобы взаимопомощь между каналами не мешала принимать к обслуживанию новые заявки, если они появятся за время, пока все каналы заняты. Назовем условно «равномерной взаимопомощью» следующий тип взаимопомощи. Если заявка приходит в момент, когда все каналы сво- бодны, то все п каналов принимаются за ее обслуживание; если, в мо- мент обслуживания заявки, приходит еще одна, часть каналов пере- ключается на ее обслуживание; если, пока обслуживаются эти две заявки, приходит еще одна, часть каналов переключается на ее обслу- живание и т. д., до тех пор, пока не окажутся занятыми все п каналов; если это так, вновь пришедшая заявка получает отказ (в СМО с отказа- ми) или становится в очередь (в СМО с ожиданием). При такой дисциплине взаимопомощи заявка получает отказ или становится в очередь только тогда, когда нет возможности ее обслужить. Что касается «простоя» каналов, то он в этих условиях минимален; если в системе имеется хотя бы одна заявка, все каналы работают. Выше мы упомянули, что при появлении новой заявки часть занятых каналов освобождается и переключается на обслуживание вновь прибывшей заявки. Какая часть? Это зависит от вида функции р(£). Если она имеет вид линейной зависимости, как показано на рис. 5.12, и /гкр> п, то все равно, какую часть каналов выделить на обслуживание вновь поступившей заявки, лишь бы все каналы были заняты (тогда суммарная интенсивность обслуживании при лю- бом распределении каналов по заявкам будет равна пр). Можно дока- зать, что если кривая р(7г) выпукла кверху, как показано на рис. 5.11, то нужно распределять каналы по заявкам как можно более равномерно. Рассмотрим работу п-канальной СМО при «равномерной» взаимо- помощи между каналами. 1. СМО с отказами Будем нумеровать состояния СМО по числу заявок, находящихся в состоянии обслуживания: 30—СМО свободна, Sj—одна заявка обслуживается всеми п каналами. 32 — две заявки обслуживаются всеми п каналами, Sk—k заявок обслуживаются всеми п каналами, Sn — п заявок обслуживаются всеми п каналами. Рис. 5.13 279
Мы видим, что граф состояний (см. рис. 5.13) здесь тот же, что для одноканальной СМО с производительностью р* = пц и ограниченной очередью, имеющей п — 1 мест. Поэтому для определения характери- стик системы мы можем воспользоваться формулами § 5, подставляя в них х = 2./р* = V/гц вместо р = Х/р: р _ х"(1—X) . ,g g. 0ТК ~ 1 —хп+ ' ’ ' ' Л = М = ^-1~^г. (9.10) 1 — X Пример 3. В условиях примера 1 сравнить относительную и абсолютную пропускную способности СМО, а также среднее число занятых каналов: а) при отсутствии взаимопомощи, в) при наличии равномерной взаимопомощи между каналами. Решение а Без взаимопомощи. Из примера 1 имеем: q = 0,79, А = 3,16. Среднее число занятых каналов Г= Л/р = 1,58. б. С равномерной взаимопомощью. х = Х/рп= 4/2.3=2/3. По формуле (9.9) 1— (2/3)3 7= ~ 0,887; Л = 4<?»3,51; 2=3,51/2^1,76. Таким образом, за счет применения разумно организованной вза- имопомощи между каналами, пропускная способность СМО несколько повысилась. Соответственно увеличилась и средняя занятость кана- лов. 2. СМО с очередью Рассмотрим СМО с очередью и максимальным числом заявок в оче- реди т. Предположим, что между каналами имеется «равномерная» взаимопомощь и р(/г) = &р. Состояния системы опять будем нуме- ровать по числу заявок, находящихся в СМО: So—система свободна, Sj — одна заявка обслуживается всеми п каналами, 52—две заявки обслуживаются всеми п каналами, Sk—k заявок обслуживаются всеми п каналами, очереди нет, Sn—п заявок обслуживаются всеми п каналами, очереди нет, 280
S„+i —n заявок обслуживаются всеми и каналами, одна заявка стоит в очереди, Sn+m—п заявок обслуживаются всеми п каналами, в очереди стоит т заявок. Граф состояний СМО приведен на рис. 5.14. Рис. 5.14 Мы опять получили граф того же вида, что и на рис. 5.13, но с уве- личенным на т числом состояний. Значит, нам нужно воспользовать- ся формулами § 5 для одноканальной СМО с производительностью ц* = пр и числом мест в очереди л + т — 1. Получим; р ~ л +_____ (9 ц) ? = ; (9Л2) Д = = (9.13) ’ 1__x« + m+t ' ' ' Пример 4. В условиях примера 1 сравнить абсолютную и относительную пропускные способности для случая отсутствия взаимопомощи и наличия рав- номерной взаимопомощи, если в очереди имеется два места (т = 2). Решение, а. Без взаимопомощи. Из примера 1 имеем р ~ 0,79; A ss3,16. б. С равномерной взаимопомощью По формулам (9.11) —(9.13) для п = 3, Л = 4, р = 2, р = 2, х = р//г=2/3 I__72/3)3 57 имеем: о=--------=—т- = 0,88, 4=Лр = 3,52. 4 I—(2/3)4 65 Предоставляем читателю самостоятельно подсчитать среднее число заявок в очереди, среднее время ожидания и среднее время пребыва- ния в системе для обоих вариантов примера 4 и убедиться, что при на- личии равномерной взаимопомощи между каналами все характери- стики СМО меняются только в желательном для нас направлении. Не следует, однако, забывать, что организация такой взаимопо- мощи между каналами далеко не для всех СМО осуществима. 10. СИСТЕМА МАССОВОГО ОБСЛУЖИВАНИЯ С ОШИБКАМИ Иногда на практике приходится встречаться с такими случаями, когда заявка, принятая к обслуживанию в СМО, обслуживается не с полной достоверностью, а с некоторой вероятностью р #= 1; другими 281
словами, могут иметь место ошибки в обслуживании, результатом которых является то, что некоторые заявки, прошедшие СМО и якобы «обслуженные», в действительности остаются необслуженными из-за «брака» в работе СМО. Примерами СМО с ошибками могут быть: справочные бюро, иногда выдающие неправильные справки и указания; корректор, могущий пропустить ошибку или неверно ее исправить; телефонная станция, иногда соединяющая абонента не с тем номером; система ПВО, для которой «обслуживанием» является обстрел цели, как известно, не всегда кончающийся ее поражением и т. д. В разомкнутой СМО с ошибками появление ошибки в обслужива- нии практически не сказывается на потоке заявок: число источников заявок так велико, что интенсивность потока заявок вследствие ошиб- Очереди нет Рис. 5.15 ки практически не меняется. Поэтому для разомкнутых систем массо- вого обслуживания учет ошибок в обслуживании сводится только к то- му, что относительная пропускная способность системы уменьшается: она умножается на р < 1, где р — вероятность безошибочного обслу- живания. Соответственно, умножается на р и абсолютная пропускная способность. Что касается остальных характеристик СМО, таких, на- пример, как время ожидания, число заявок в очереди и т. д., то на них ошибки в обслуживании не сказываются. Другое дело — для замкну- той системы массового обслуживания, когда заявка, обслуженная с ошибкой, вновь становится в очередь на обслуживание, и, следова- тельно, увеличивает загрузку СМО. В качестве примера замкнутой СМО с ошибками рассмотрим одно- го рабочего, обслуживающего п станков. Интенсивность потока неис- правностей одного работающего станка равна X, среднее время об- служивания (наладки) станка /об = 1/ц; с вероятностью р обслужи- вание заканчивается удачно, и станок начинает снова работать; с ве- роятностью 1 — р обслуживание оказывается неудачным, и станок снова становится в очередь на обслуживание. Требуется определить предельные вероятности состояний. Будем нумеровать состояния СМО по числу неисправных стан- ков: So — все станки исправны, Sj — один станок неисправен, налаживается, очереди нет, S2 — два станка неисправны, один налаживается, другой ждет в очереди, 282
Sb — k станков неисправны, один налаживается, k — 1 ждут в оче- реди, Sn — все п станков неисправны, один налаживается, п — 1 ждут очереди, Граф состояний системы показан на рис. 5.15. Наличие ошибок в обслуживании сказывается в том, что у стрелок, идущих справа на- лево, стоит не интенсивность обслуживания ц, а интенсивность «успеш- ного обслуживания» рр, где р — вероятность того, что обслуживание будет выполнено успешно. Действительно, пусть, например, система ’ находится в состоянии Sk (один станок налаживается, k — 1 ждут оче- реди). Вероятность того, что за время А/ будет закончено обслужива- ние, равна цА/; но это обслуживание лишь с вероятностью р будет успешным и переведет систему из состояния Sk в н с вероятностью же 1 — р оно будет неуспешным и заявка снова вернется в очередь, следовательно, система опять останется в состоянии Sk- Значит, ин- тенсивность потока успешных обслуживаний будет равна рр, что и от- мечено на рис. 5.15. Полученный граф ничем не отличается от того, который приведен на рис. 5.9, стой разницей, что вместо р на нем стоит р* = рр. Значит, характеристики СМО с ошибками могут быть вычис- лены по формулам § 8, с заменой р на рр. Пример 1. Рабочий обслуживает группу из трех станков. Остановки рабо- тающего станка случаются в среднем два раза в час Процесс наладки отнимает у рабочего в среднем 10 минут, причем неисправность устраняется с вероят- ностью 2/3 (и остается неустраненной с вероятностью 1/3.). Определить характе- ристики этой замкнутой СМО: вероятность занятости рабочего, абсолютную пропускную способность; среднее количество неисправных станков Решение. Для п — 3, А.— 2, р,= 1//об = 6, р = 2/3, р,* = рр, = 4, р* = = Л/ц* = 1/2 по формулам (8.1) находим 1 Ро' 1 Ч-З-1/24-3-2-1/2аЧ-3.2-1-1/23 ~0,211- Вероятность занятости рабочего: Рзан = 1 —Рп ~ 0,789. Абсолютная пропускная способность (число неисправностей, устраняе- мые рабочим в час): 4=0,789-4 «3,16. Среднее число неисправных станков находим по формуле (8.5)! 0,789 ш = 3—-L—= 1,42. 1/2 Оригинальный случай СМО с ошибками представляет такая си- стема массового обслуживания, в которой характер обслуживания зависит от длины очереди: при увеличении этой длины обслуживающий канал начинает «спешить» — в связи с этим уменьшается время обслу- живания, но увеличивается вероятность ошибки. Разумеется, такая обстановка создается только там, где «каналом обслуживания» явля- ется живой человек. Рассмотрим пример такой СМО. Возьмем замкнутую одноканаль- ную СМО с п источниками заявок (рабочего, обслуживающего п стан- 283
ков). Пусть при отсутствии очереди (в нормальных условиях) среднее время обслуживания равно /об, а значит интенсивность потока обслу- живаний равна р(0) = 1//об. При наличии в очереди ожидающих на- ладки станков рабочий начинает торопиться, и интенсивность потока обслуживаний увеличивается. Обозначим интенсивность потока обслу- живании при наличии в очереди г станков через ц(г). Одновременно с увеличением темпа обслуживания (в связи с увеличением числа стан- ков, ожидающих в очереди) увеличивается и вероятность ошибки; при отсутствии очереди (в нормальных условиях) она равна р(0), а при наличии в очереди г станков — р(г). Очевидно, нужно перемножить для каждого г интенсивность обслуживания и вероятность ошибки и вве- сти одну «приведенную» интенсивность обслуживания: р*(г) = р(г)-р(г) (г = 0, и—1). Очереди нет Рис. 5.16 Граф состояний СМО представлен на рис. 5.16 (нумерация состоя- ний — та же, что и выше). Применяя общие формулы для предельных вероятностей в схеме гибели и размножения, получим: nk ц*(0) Р°’ п(п — 1) X2 >(0)и*(1) Ро’ _ n (n-1) (n-2) Xs 3 (0) ц* (1) Ц* (2) Pi Pi _ п (п—1)... (п—fe+1) Xй Рк~ и*(0)ц*(1)...и*(Ь-1) (10.1) п(п-1)...1Д" п ц*(0)ц*(1) ...ц*(п-1) Ро' __Г] । । —1) хг Ро L + ц*(0) + и*(О)и*О) , п (п — 1) ... (п— fe + 1) Xft ц*(0)р*(1)...ц*(/г-1) + ' । п(п—1) ... 1-Хя 1-1 н*(0)ц*(1) ..-и* (п-1) J 284
11. СИСТЕМЫ МАССОВОГО ОБСЛУЖИВАНИЯ С НЕ-ПУАССОНОВСКИМИ ПОТОКАМИ СОБЫТИЙ Все рассмотренные до сих пор задачи теории массового обслужи- вания относились только к случаю, когда процесс, протекающий в СМО, представляет собой непрерывную марковскую цепь (марковский про- цесс с дискретными состояниями и непрерывным временем), другими словами, когда все потоки событий, переводящие систему из состояния в состояние (потоки заявок, обслуживаний, уходов и т. д.) являются пуассоновскими. Для получения предельных характеристик системы в установившемся стационарном режиме требовалось, чтобы эти пото- ки были не только пуассоновскими, но и простейшими (с постоянными интенсивностями). Рис. 5.17 Рис. 5.18 На практике очень часто оказывается, что потоки событий, дейст- вующие в системе массового обслуживания, заметно отличаются от простейших. Особенно это относится к потоку обслуживаний. Дейст- вительно, мы знаем, что в простейшем потоке интервал времени между двумя соседними событиями распределен по показательному закону f(/)=pe-^ (*>0). (см. рис. 5.17). Очевидно, что время 7’об обслуживания заявки вовсе не обязательно распределяется по такому закону; напротив, гораздо более типичным является случай, когда закон распределения времени обслуживания /(/) отличен от показательного, и его наивероятнейшее значение не равно нулю (см. рис. 5.18). В случае, когда закон распределения времени обслуживания отличен от показательного, все ранее рассмотренные методы описания процессов, протекающих в СМО, становятся, строго говоря, непри- годными. В частности, нельзя записать ни линейных дифференциаль- ных уравнений для вероятностей состояний, ни линейных алгебраи- ческих уравнений для предельных вероятностей. Математический ап- парат исследования становится гораздо более сложным; аналитические формулы для характеристик СМО удается получить только для самых простых случаев. Приведем (без доказательства) некоторые из полученных в этой области результатов. 285
1. СМО с отказами Пусть на «-канальную систему массового обслуживания с отказа- ми поступает простейший поток заявок с интенсивностью X, а время обслуживания имеет произвольное распределение с математическим ожиданием — J tf (t) dt. (H.l) о Доказано (см. [16]), что в этом случае формулы Эрланга для ве- роятностей состояний остаются справедливыми, а именно (k = 0,..., п), kl (П-2) где р = Х/р = А/об. 2. Одноканальная СМО с ожиданием Пусть имеется одноканальная система массового обслуживания с неограниченной очередью (п = 1, т = оо); на вход ее поступает про- стейший поток заявок с интенсивностью X; закон распределения вре- мени обслуживания /(/) — произвольный, с математическим ожиданием (об = 1/р. и средним квадратическим отклонением о(об- Величина называется коэффициентом вариации времени обслу- живания (этот коэффициент показывает, насколько велик разброс времени обслуживания относительно его среднего значения). Доказано (см. напр., [20]), что для одноканальной СМО с прос- тейшим потоком заявок и произвольно распределенным временем об- служивания среднее число заявок, находящихся в очереди, выражает- ся формулой: "^Р2(1+ц'2) (Ц.З) 2(1—р) ’ где р = Х/р, v — коэффициент вариации времени обслуживания. Что касается среднего времени ожидания в очереди, то оно выражается формулой: _Р2 П+а'2) 2Х (1 — р)’ 286
Формулы (11.3), (11.4) обычно называются формулами Поляче- ка-Хинчина [20]. Заметим, что для показательного распределения /(/) = ре-^ (/>0) коэффициент вариации р_ > = 1/р== j ?0б 1/Р В этом случае формулы (11.3) и (11.4) превращаются в ранее вы- веденные нами формулы (5.17) и (5.20) (см. § 5): Рассмотрим крайний случай, когда время обслуживания вообще не случайно и равно своему математическому ожиданию: ^об = 1/Р- Тогда °to6 = 0> f = 0, и формулы (11.3), (11.4) дают. г =----s---- 2(1—р) ? =_______Р!___ ож 2% (1 -р) ’ (11.5) (11.6) т. е. как среднее число заявок в очереди, так и среднее время ожида- ния при строго постоянном времени обслуживания вдвое меньше, чем при случайном времени обслуживания, распределенном по показа- тельному закону. Пример 1. Поток железнодорожных составов, поступающих на сортировоч- ную станцию для обработки,—простейший поток с интенсивностью А, — 2 (со- става в час). Среднее время, затрачиваемое на обработку одного состава, равно /об = 20 (мин); его среднее квадратическое отклонение о(об = 8 (мин). Опре- делить среднее число составов, ожидающих обработки и среднее время ожида- ния обработки в очереди, а также среднее число составов, связанных с обслу- живанием на сортировочной станции. Решение. Переходя к одной и той же единице измерения времени (час) имеем: 1 1 ц=г— =—=3 (состава в час). ?сб 1/3 Коэффициент загрузки станции (приведенная интенсивность потока заявок); р= А/р, = 2/3. Коэффициент вариации времени обслуживания: Р = %бЛоб = 8/20 = 0,4. 287
По формулам (11.3) и (11.4) находим среднее число составов, ожидающих обработки __(2/3)^(1+0,4^) 0 77 2(1—2/3) ~ ' и среднее время ожидания обработки: = — 0,385 (час). Среднее число составов, связанных с сортировочной станцией, равно сред- нему числу составов в очереди г плюс среднее число составов под обслуживанием; последнее же равно вероятности занятости СМО, т. е. отношению среднего числа составов, поступающих в единицу времени к среднему числу составов, обслужи- ваемых каналом в единицу времени Отсюда среднее число составов (заявок) в системе равно: fe = /-|-p = 0,77 + 2/3 ss 1,437. Приведенные аналитические формулы относятся, как уже было сказано, к самым простейшим не-пуассоновским СМО. В случае более сложных СМО (многоканальных, с особенностями обслуживания и т.д.), простых аналитических формул получить не удается. В некоторых случаях исследование СМО с не-пуассоновскими потоками событий может быть произведено с помощью метода псевдосостояний, описан- ного в § 10 гл. 4. В качестве примера рассмотрим одноканальную СМО с очередью (без ограничений). На вход системы поступает простейший поток заявок с интенсивностью X; время обслуживания То§ распределено по закону Эрланга 2-го порядка с математическим ожиданием 1/р, т. е. представ- ляет собой сумму двух независимых случайных величин с одинаковым показательным распределением. Обозначим параметры этих показа- тельных распределений р/ и найдем значение р/. По теореме сложения математических ожиданий имеем: 1/р' + 1/р' = 2/р' = 1/р, откуда р' = 2р. Таким образом, время обслуживания То5, распределенное по за- кону Эрланга 2-го порядка с математическим ожиданием 1/р, может быть представлено, как сумма двух независимых случайных величин Тов* и Тоб’, имеющих каждая показательное распределение с па- раметром 2р. Эти два времени Tig1 и можно представить как две последовательные «фазы» процесса обслуживания. Рассмотрим различные состояния СМО, нумеруя их по числу зая- вок в системе и фазе обслуживания: So — заявок в системе нет (обслуживания не происходит); Si,i — одна заявка находится в СМО, обслуживание в пер- вой фазе, очереди нет; 51,2 — одна заявка находится в СМО, обслуживание во вто- рой фазе, очереди нет; 288 5г, 1 —две заявки находятся в СМО, первая обслуживается (первая фаза), вторая стоит в очереди; 5г,2 — две заявки находятся в СМО; первая обслуживается (вторая фаза), вторая стоит в очереди; Sk, । — k заявок находятся в СМО, одна под обслуживанием (первая фаза), остальные — в очереди; St,2—k заявок находятся в СМО, одна под обслуживанием (вторая фаза), остальные — в очереди; Размеченный граф состояний системы приведен на рис. 5.19. Дей- ствительно, из состояния So в Si,! систему переводит поток заявок с интенсивностью К. Из состояния Stli в Si,2 систему переводит по- ток с интенсивностью 2р (поток окончаний первой фазы обслуживания). Из состояния Si,2 в So —такой же поток. Из состояния 5ы в S2,i си- стему переводит поток заявок и т. д. Рис. 5.19 Пользуясь размеченным графом состояний, запишем линейные ал- гебраические уравнения для вероятностей состояний: — 2рР|, 2, (Х-+2р)Р|1 =>+0 + 2цр212, (Л, + 2р) 2 = 2p,pj (К + 2р) р2,1 = , । ~t~ 2ЦР3 2, (Z + 2р) /?2,2 = ^Р\ , 2 ^РР2,1> (Х + 2р)pk( +2ррА+12, (X + 2р) pk, 2 = ^Pk— i. 2 4“ ‘fyPk, i, (11-7) 10 Зак. 873 289
или вводя обозначение А/р = р, РРо = 2Р|,2» (р + 2)р1(1 =рр0 + 2р2 2) (р + 2)Р1.2 = 2Р1.1, (Р + 2)р2 != рр! j4-2p3 2; (И.8) (P + 2)Pft, 1=?^-!, ,+4+1.2. (P + 2)Pft.2=PPft_1>2 + 4, !, Это — система бесконечного числа уравнений с бесконечным чис- лом неизвестных р(), р1Л, р, ,2, P2,i, р2,2, ••• Существуют способы, по- зволяющие решать также системы буквенно, но они сравнительно слож- ны, и мы не будем на них останавливаться. Ограничимся указанием на то, как может быть решена система (11.8) при конкретных значе- ниях параметров X и р. Прежде всего оценивается максимальное практически возможное число заявок в очереди — это можно сделать грубо, приняв закон рас- пределения времени обслуживания показательным. Когда это сделано, удается отбросить некоторые (последние, начиная с какого-то номера) из уравнений, после чего система (11.8) превращается в систему конеч- ного числа уравнений с конечным числом неизвестных, которая решает- ся обычными методами вычислительной алгебры (см., например [21]). При большом числе уравнений удобно бывает пользоваться методом итераций (последовательных приближений), причем в качестве перво- го приближения можно взять значения вероятностей состояний, полу- чаемые при показательном распределении времени обслуживания, раз- делив вероятности поровну между двумя фазами обслуживания. Применяя метод псевдосостояний, можно, в принципе, прибли- женно свести любой не-марковский процесс массового обслуживания к марковскому; однако, при большом числе псевдосостояний решение системы линейных уравнений не только в буквенном, но и в численном виде становится затруднительным. В таких случаях для исследова- ния процесса, протекающего в СМО, можно воспользоваться универ- сальным методом моделирования случайных процессов — так назы- ваемым методом статистических испытаний (Монте-Карло), который будет рассмотрен в гл. 8.
6 МЕТОД ДИНАМИКИ СРЕДНИХ 1. ИДЕЯ МЕТОДА. ОБЛАСТЬ ПРИМЕНИМОСТИ В гл. 4 и 5 мы познакомились с методами описания случайных процессов, протекающих в различных физических системах, с помощью специального математического аппарата — теории непрерывных мар- ковских цепей. Этот аппарат дает возможность составить линейные дифференциальные уравнения для вероятностей состояний, а также линейные алгебраические уравнения для предельных вероятностей состояний, отражающих относительное время пребывания системы в каждом из этих состояний для предельного, установившегося режима. Эти методы представляют собой удобный математический аппарат только в том случае, когда число возможных состояний системы S сравнительно невелико. В случае, когда число возможных состояний системы велико (порядка нескольких десятков, а то и сотен), эти методы перестают быть удобными. Во-первых, совместное решение большого числа не только дифференциальных, но и алгебраических уравнений затруднительно даже при наличии ЭЦВМ. Кроме того, если даже нам удастся решить эти уравнения и найти вероятности всех состояний си- стемы, полученные результаты будут трудно обозримыми. Для того, чтобы их осмыслить, нам все равно придется пользоваться какими-то обобщенными характеристиками процесса, какими-то средними значениями (такими, например, как «среднее число занятых каналов» или «среднее число заявок в очереди», которыми мы поль- зовались в теории массового обслуживания). До сих пор мы такие средние характеристики вычисляли через вероятности со- стояний. Однако в случае, когда состояний слишком много, такой способ становится неприемлемым. Возникает вопрос: а нельзя ли составить и решить уравнения непосредственно для интересующих нас сред- них характеристик, минуя вероятности состояний? Оказы- вается, можно — иногда точно, иногда — приближенно, с некоторой погрешностью. Такими задачами и занимается так называемый «ме- тод динамики средних». Он ставит себе целью непосредственное изу- чение средних характеристик случайных процессов, протекающих в сложных системах с большим (практически необозримым) числом состояний. Любопытно, что основой применимости метода динамики сред- них является именно то, что препятствует изучению явлений более 10* 291
подробными методами: сложность изучаемых процессов и большое чис- ло участвующих в них элементов. Как и везде, где применяются ме- тоды теории вероятностей, массовость изучаемых явлений позволяет установить в них сравнительно простые закономерности. Продемонстрируем идею метода динамики средних на следующем простейшем примере. Пусть имеется сложная физическая система S, состоящая из боль- шого числа IV однородных элементов (или «единиц»), каждый из которых может случайным образом переходить из состояния в состоя- ние. Предположим, что все потоки событий, переводящие систему S (и каждый элемент) из состояния в состояние — пуассоновские (хотя в общем случае и не простейшие, а с интенсивностями, произвольным образом зависящими от времени). Тогда процесс, протекающий в си- стеме, будет марковским. Допустим, что каждый элемент может быть в любом из п возмож- ных состояний: #1, й’г» •••, #», а состояние системы S в каждый момент характеризуется числом эле- ментов, находящихся в каждом из состояний. Нам требуется исследо- вать случайный процесс, протекающий в системе S. В принципе, можно было бы применить ту же методику, которую мы уже применяли ранее при изучении подобных процессов, а именно, рас- смотреть все возможные состояния системы S: Sn, о....о — все элементы находятся в состоянии в других состояниях нет ни одного элемента; Sn—i, 1,0.....о — один элемент находится в состоянии <оа, все остальные — в состоянии Slt и т. д., и найти вероятности этих состояний. Однако при большом чис- ле элементов IV даже перечисление возможных состояний системы S затруднительно, не то, что составление и решение уравнений для ве- роятностей состояний. Очевидно, нам нужно идти другим путем. Отвлечемся от возмож- ных состояний системы в целом и сосредоточим свое внимание на от- дельном элементе % (так как все элементы однородны, все равно, какой это будет элемент) и рассмотрим для него граф состояний (рис. 6.1). Введем в рассмотрение случайную величину Xk(t) — число единиц, находящихся в момент t в состоянии <£h. Будем ее называть кратко чис- ленностью состояния <oft в момент t. Очевидно, для любого момента t сумма численностей всех состояний равна общей числен- ности элементов: Xi (0 + ^2 (0 + ••• + хп (0 ~ N, или, короче: п (1.1) k= i Рассмотренная нами величина Xk(t) для любого t представляет собой случайную величину, а вообще, при меняющемся t —-случайную функцию времени. MS
Поставим себе задачу: найти для любого t основные характерис- тики случайной величины Xk(t) — ее математическое ожидание и дисперсию: Dh(t) — D[Xh (01. (1.2) (1.3) Другими словами, для каждого момента времени t мы хотим знать среднее значение численности каждого состояния, а также разброс фак- тической численности около сред- ней. Для того, чтобы найти эти характеристики, надо знать интен- сивности всех потоков событий, пе- реводящих элемент (не систему, а именно элемент!) из состоя- ния в состояние. Предположим, что эти интен- сивности нам известны и простав- лены на.графе состояний (см. рис. 6.1). Тогда численность каждого состояния Xh(t) можно представить как сумму случайных величин, каждая из которых связана с от- дельным (4-м) элементом, а именно: Рис. 6.1 равна единице, если этот элемент в момент времени t находится в состоянии Sk, и равна нулю, если не находится: 4° (о- 1, если 4-й элемент в момент t находится в состоя- нии Sh; (1.4) О, если не находится. Очевидно, для любого момента t общая численность состояния равна сумме случайных величин (1.4): * jo=(о+ю> илн короче i — 1 (1-5) Если интенсивности кц потоков событий, переводящих каждый элемент из состояния в состояние, нам известны (а, стало быть, не слу- чайны), то величины ^’(О, х‘i 2,(0,.... x[N}(t) для отдельных элементов независимы между собой. По теореме сложения математических ожиданий (для которой, кста- ти, независимости не требуется) и теореме сложения дисперсий: 293
(1-6) ад = 2o[x'°w]- 4=1 Найдем числовые характеристики — математическое ожидание идисперсию—случайной величины Х(* (0, заданной выражением (1.4). Эта величина имеет два возможных значения: 0 и 1. Вероятность пер- вого из них равна рк(!) — вероятности того, что элемент находится в состоянии <oh (так как элементы однородны, то для всех них эта вероят- ность одна и та же). Ряд распределения каждой из случайных величин X<£’(0 один и тот же и имеет вид: --------М— - (1-7) 1-М)Ы0 где в верхней строке указаны возможные значения случайной вели- чины, а в нижней — их вероятности. Математическое ожидание случайной величины, заданной рядом распределения (1.7), равно: м [х<;’ (01 =0.(1 -pk (0) + 1 .pk (0 =pft (0, где pft(0 — вероятность того, что отдельный элемент в момент t будет находиться в состоянии gft. Дисперсия случайной величины с рядом распределения (1.7) равна: 7Ф1ММо-м<(1-р*(0) + + (1 -ph (0)2 рк (0 = pk (0 (1 -рк (0). Подставляя эти выражения в формулы (1.6), найдем математичес- кое ожидание и дисперсию численности k-ro состояния: mA(0=Mpft(0, (1.8) ^й(0=Л7рй(О(1—Pfe(0). (1-9) Таким образом, нам удалось для любого t найти математическое ожидание и дисперсию численности любого состояния они вы- ражаются формулами (1.8) и (1.9) через число элементов N и вероят- ность &-го состояния любого элемента. Зная дисперсию Dh (t), можно найти среднее квадратическое от- клонение численности состояния Oft(O=/^(O(l-Pfe(0)> (1.10) и, значит, для любого момента времени t указать ориентировочно диа- пазон практически возможных значений численности: mA(0±3ofe(0. (1.11) 294
Таким образом, не определяя вероятностей состояний системы S в целом, а занимаясь только вероятностями состояний отдельных ее элементов, можно определить, чему равна для любого момента / средняя численность каждого состояния и в каких пределах находится факти- ческая численность. Если мы знаем вероятности всех состояний одного элемента Pi, Р«» ...» Рп как функции времени, то нам известны и средние численности состоя- ний: т1г т2, ..., тп и их дисперсии: Dlt D,, .... Dn и средние квадратические отклонения: 01, о2, ..., ап. Таким образом, поставленная вероятностей состояний одного Эти вероятности, как извест- но, могут быть найдены как реше- ния дифференциальных уравнений Колмогорова для вероятностей со- стояний; правила их составления даны в § 6 гл. 4. Для этого нужно только знать (точно или прибли- женно) интенсивности потоков со- бытий, переводящих каждый эле- мент из состояния в состояние. По- ка что мы будем предполагать, что задача сводится к определению отдельного элемента. эти интенсивности нам известны и не случайны. О том, из каких Рис- 62 соображений можно определять эти интенсивности, мы будем говорить несколько позже (см. § 2). Заметим, что вместо дифференциальных уравнений для вероятнос- тей состояний можно (и иногда бывает удобнее) писать уравнения н е- посредственно для средних численностей состояний. Действительно, как видно из формулы (1.8), средняя численность каждого состояния пропорциональна вероятности этого состояния (отличается от нее множителем (V) и, очевидно, удовлетво- ряет тем же дифференциальным уравнениям, только интегрировать их нужно при .других начальных условиях, соответствующих н а- чальным численностям состояний. Пример 1. Система S состоит из N однородных элементов; граф состояний каждого элемента представлен на рис. 6.2. В начальный мо- мент (при t = 0) все элементы находятся в состоянии Написать систему дифференциальных уравнений, которым должны удовлетво- 285
рять средние численности состояний mlt т2, т3, mit и указать, при ка- ких начальных условиях ее нужно решать. Считая уравнения решен- ными, написать выражения для дисперсий численностей состояний. Решение. Непосредственно по графу (рис. 6.2) составляем урав- нения Колмогорова для вероятностей состояний: ~~~------^-12 Pi 4-^з1 Рз> at ~ —(^23 4* Pl 4" ^-12 Pit at = —?„31 ps X2S p2 4-I43 plt at ~77~ = X43 pt 4- X24 p2. at (1-12) Мы знаем, что одно из этих уравнений (любое) может быть отбро- шено, но мы пока сохраним их все. Умножим левую и правую части каждого из уравнений (1.12) на число элементов N и введем.в левых частях N под знак производной; получим: ^u-mpi+чл, at = -(Х23 4- Ч) MP* 4- КР1, at —^..Р^ = — ^”31 Np3 4* ^23 4* ^43 ^Pt> at ^-=-^3NPl + ^Np2. (1-13) Теперь вспомним, что Np.2=mit Np3 = m3, Npi = mi, (аргумент t у этих функций для краткости отброшен) и перепишем уравнения (1.13) в виде: dm4 . , « , —л12 гп2 4- /'-al гп3, at ~ ---(^23 4- ^21) m2 4* ^12 т11 " (1л4) ----------^31 тз + ^2з т2 + ^43 ^4> at dtJii л . л —— — — Х43 т4 4“ ^24 dt 2М
В уравнениях (1.14) неизвестными функциями являются непо- средственно средние численности состояний. Как видно, эти уравнения составлены совершенно по тому же правилу, что и уравнения для вероятностей состояний, поэтому их можно было со- ставить сразу, минуя промежуточные этапы (1.12) и (1.13). Так мы и будем поступать в дальнейшем. Очевидно, для каждого t средние численности состояний удовлет- воряют условию: + тг 4- т3 + = N, и поэтому одно (любое) из уравнений (1.14) можно отбросить. Отбро- сим, например, третье уравнение (оно наиболее сложно) и в остальные уравнения вместо т3 подставим выражение: m3 = N~(m1 + m2 + mt). Получится окончательно система трех дифференциальных уравнений: ~ ~ ?"12 + 41 [# — \т1 + ™2 + at ~~~ — -----(4з + ^24) т2 + ^12 т1> at ~ ,7~ ~ ~"4з ^4 + 41 ^2- at (1.15) Эту систему нужно решать при начальных условиях: /=0; m1 = N, т2~т3=т4 — 0. (1.16) Интегрирование такой системы дифференциальных уравнений для кон- кретных значений входящих в нее параметров (Af, Х12, Х31, Х24, А,34, Х43) проще всего осуществить на машине или же вручную, методом чис- ленного интегрирования. Предположим, что это осуществлено и нами получены четыре функ- ции, выражающие средние численности состояний: mJO, m2(0, m3(t), m^t). Найдем дисперсии численностей состояний: Di(0, О2(/), О3(/), О4(/). Ранее мы показали, что Dft(O=lVpft(O(l-pft(O)- (1-17) Отсюда, учитывая зависимость тк (/) —Npk (/), получим: , Z)ft(0 = ^(0(l-~^-), ^=1,2,3,4. (1.18) Таким образом, если интенсивности потоков событий, переводя- щих элемент из состояния в состояние, не зависят от численностей со- 297
стояний, то, вычислив средние численности состояний m^t)...tnn(f), можно сразу же найти дисперсии численностей состояний по формулам: Z)2(O = m2(o(l--^ (1-19) Dn(0 = /nn(0(l--^) и их средние квадратические отклонения: о1(0 = ’КД>; М0 = АЙ;-; пп(0 = /О)- П.20) Заметим, что зная математические ожидания и средние квадрати- ческие отклонения численностей состояний, мы получаем возможность оценивать также и вероятности различных состояний системы в целом, т. еч например, вероятность того, что численность какого-то состояния будет заключена в определенных пределах. Действительно, предполо- жим, что число элементов N в системе велико. Тогда численность ка- кого-то (&-го) состояния можно приближенно считать распределенной по нормальному закону. А если это так, то вероятность того, что случай- ная величина Хк (численность /г-го состояния) будет заключена в ка- ких-то границах от а и до 0, будет выражаться формулой: Р(Х;;е(а,Р)) = ф(^М_ф/^М , (1.21) \ °k / \ / где тк, <ук — математическое ожидание и среднее квадратическое от- клонение численности k-ro состояния, Ф(х) — функция Лапласа (см. приложение, табл. 1). Вернемся к уравнениям для средних численностей состояний и сформулируем правило их составления. Оно состоит в следующем. Если в системе S, состоящей из N однородных элементов типа S, происходит марковский случайный процесс, причем известен граф состояний каждого элемента и указаны интенсивности всех потоков событий, переводящих элемент 8 из состояния в состояние (не зави- сящие от численностей состояний), то для средних численностей со- стояний можно составить дифференциальные уравнения, пользуясь следующим мнемоническим правилом: Производная средней численности состояния равна сумме столь- ких членов, сколько стрелок связано с данным состоянием-, если стрелка направлена из состояния, член имеет знак «минус», если в состояние— знак «плюс». Каждый член равен произведению интенсивности потока событий, переводящего элемент по данной стрелке, на среднюю числен- ность того состояния, из которого исходит стрелка. Составленные по этому правилу дифференциальные уравнения, в которых неизвестными функциями являются средние численности 298
состояний, мы будем называть уравнениями динамики средних. Пример 2. Физическая система S состоит из ^ = 200 однородных элемен- тов — приборов <?. Каждый из приборов может находиться в одном из двух со- стояний: — исправен, $2 — неисправен. Переход элемента из состояния в состояние $2 происходит под дейст- вием потока неисправностей с интенсивностью А, = 2; среднее время ремонта (восстаиовлеиия) прибора равно /р = 1/р, = 1/3. Составить уравнения динамики средних и решить их при условии, что в начальный момент все приборы исправ- ны. Изобразить зависимости mt(t) и m2(i) на графике. Найти и построить на гра- фике функции О1(0, стг(0 — средние квадратические отклонения численностей 'состояний. •« Рис. 6.3 Решение. Граф состояний элемента имеет вид, показанный на рис. 6.3. Обозначаем: т1 — среднее число исправных элементов в момент t, т2 — среднее число неисправных элементов в тот же момент. Уравнения для средних численностей состояний будут: 0,0 --------2/П1 + Зи12, at dmi 0,0 at (1.22) Вместо двух уравнений можно ограничиться одним, если учесть, что для любого t m2 — N—mt. (1.23) Подставляя (1.23) в первое уравнение (1.22), получим: ^-~=—бпц+ЗАГ. (1.24) at Интегрируя это уравнение при начальном условии t — Q\ mt — Nt получим: 'П1(0 = Л/(4- + -4-е-5^. (1.25) \ О О J Из (1.23) имеем: т2(/)=У-И^ + 4-е~5^= 4-У(1-е~59. (1.26) \ и О / О 299
Построим на графике функции (1.25) и (1.26) (рис. 6.4). Из графика видно, что при t -* оо средние численности состояний стремятся к предельным значе- ниям: т-х -г 3/5/V) т2 -> 2/5/V. Определим дисперсии численностей состояний: Очевидно, дисперсия численности второго состояния будет такая же: о2(0=£1(0- Средние квадратические отклонения численностей состояний равны: +4e“5'Vi-e-5()- Zu ) График функции показан на рис. 6.5. 2. УЧЕТ ЗАВИСИМОСТИ ИНТЕНСИВНОСТЕЙ ПОТОКОВ СОБЫТИЙ ОТ ЧИСЛЕННОСТЕЙ СОСТОЯНИЙ. ПРИНЦИП КВАЗИРЕГУЛЯРНОСТИ До сих пор, применяя метод динамики средних, мы считали, что интенсивности потоков событий, переводящих элемент из состояния в состояние, нам заранее известны и не случайны. Тем самым предпола- галось, что они не зависят от численностей состоя- ний, которые, как известно, случайны. Однако, на практике очень часто эта бывает не так. Процессы, протекающие в системе элементов, чаще всего складываются так, что интенсивности потоков событий, пе- реводящих элемент из состояния в состояние, зависят от того, сколько элементов в данном состоянии (да и в других состояниях) имеется в си- стеме. Например, в примере 2 предыдущего параграфа мы предполагали, что среднее время ремонта элемента (величина, обратно пропорцио- зоо
нальная интенсивности потока ремонтов) не зависит от того, сколько элементов одновременно находится в ремонте. Это действительно так, если элементы настолько редко выходят из строя, что практически не может создаться «затора» при их восстановлении. Если же это не так, необходимо учитывать тот факт, что время, потребное на ремонт эле- мента, зависит от количества неисправных элементов, имеющихся в наличии. Действительно, рассмотрим систему S, состоящую из IV однород- ных элементов — приборов, которые могут в случайные моменты вы- ходить из строя и направляться в ремонт. Предположим, что ремонт осуществляется одной бригадой, имеющей вполне определенную про- пускную способность (среднее количество ремонтов в единицу време- ни). Тогда время, которое каждый отдельный неисправный элемент пробудет в ремонте, зависит от общего числа ремонтируемых в дан- ный момент элементов: чем это количество больше, тем больше, в сред- нем, пробудет в ремонте каждый отдельный элемент, и тем, следователь- но, меньше будет интенсивность потока событий, переводящего каждый отдельный элемент из состояния «неисправен» в состояние «исправен». Таким образом, интенсивность потока событий, переводящего элемент из второго состояния в первое, зависит от численности первого состояния. Эта численность случайна — значит и интенсивность переводящего потока, строго говоря, будет случай- ной. Другой пример. Пусть система S состоит из большого числа IV автомашин, каждая из которых может быть в состоянии «исправна» или «неисправна». Парк автомашин выполняет вполне определенный круг работ, так что при большом количестве неисправных машин на- грузка, ложащаяся на исправные, увеличивается, и, значит, увеличи- вается интенсивность потоков событий, переводящих их в состояние «неисправна». Снова интенсивность потока событий зависит от числен- ности состояния. В общем случае (ниже мы увидим ряд таких примеров) интенсив- ности потоков событий, переводящих элемент из состояния в состояние, могут зависеть от численности не одного состояния, а сразу несколь- ких. В случае, когда интенсивности потоков событий зависят от чис- ленностей состояний (значит, случайны), мы уже не можем, как это было раньше, писать уравнения динамики средних, так как не знаем численностей состояний, определяющих интенсивности. Однако эту трудность можно обойти, если предположить, что интенсивности пото- ков событий, переводящих элемент из состояния в состояние, зависят не от самих численностей состояний, а от их средних значений (матема- тических ожиданий) тг, т2, ..., тп. Это допущение, которое мы, следуя И. Я. Динеру [13], будем на- зывать «принципом квазирегулярности», позволит написать уравнения динамики средних и решить задачу (правда, не точно, а приближенно, потому что само это допущение — не точное, а приближенное). Заметим, что допущение, о котором идет речь, приводит к су- щественным ошибкам только когда общее число элементов N в систе- ме <S сравнительно мало — тогда фактические численности- состояний 301
Рис. 6.6 могут сильно отличаться от своих математических ожиданий. Если же общее число элементов N велико, отклонение численности каждого состояния от среднего значения относительно мало, и метод динамики средних дает сравнительно малые погрешности. Существенен также вид зависимости, связывающий интенсивнос- ти потоков событий с численностями состояний. Чем ближе эта зависи- мость к линейной (в области практически возможных значений ар- гументов), тем меньшую погрешность дает замена случайных числен- ностей их средними значениями. Поясним методику пользования принципом квазирегулярности на примерах. Пример 1. Система S состоит из большого числа N однородных технических устройств, каждое из которых может быть в одном из двух состояний: $1 — исправно, работает, $2 — неисправно, ремонти- руется. На каждый элемент действует поток неисправностей с интенсив- ностью X, не зависящей от числен- ностей состояний. Ремонтом элемен- тов занята группа рабочих в составе k человек (k X). Каждый неис- правный элемент ремонтируется одним рабочим (взаимопомощи между ними нет); каждый рабочий может ремонтировать в среднем р. эле- ментов в единицу времени. В начальный момент (/ = 0) все элементы исправны. Все потоки событий — пуассоновские (может быть, с пе- ременной интенсивностью). Написать уравнения динамики средних для средних численностей состояний. Решение. Граф состояний элемента (одного технического устрой- ства) имеет вид, представленный на рис. 6.6, где р — интенсивность потока ремонтов, приходящаяся на один ремонти- руемый элемент. Найдем зависимость р от числа Х2 элементов, находящихся в дан- ный момент в состоянии ремонта. Начнем с того, что определим, при данном Х2, суммарную интенсивность М% потока ремонтов, приходя- щегося на все элементы, которые находятся в состоянии $2. Эта суммарная интенсивность есть функция числа элементов, находя- щихся в состоянии ремонта: Л1г = <р (Х2). Так как рабочие работают без взаимопомощи и число их равно k, то суммарная интенсивность потока ремонтов с возрастанием числа ремонтируемых элементов растет по линейному закону (пропорцио- нально числу ремонтируемых элементов) до тех пор, пока их число не достигнет k\ после этого все рабочие будут заняты, интенсивность М? перестанет расти и останется равной pk: Л42 = ф(Х2) = М2 приХ2^, <21) (рк при Х2>я. 302
Построим график функции <р(Х2) (см. рис. 6.7). Она задана только в целочисленных точках; но при составлении уравнений динамики средних с использованием принципа квазирегулярности нам придется заменять случайное число Х2 элементов в состоянии ремонта его мате- матическим ожиданием т2, а оно может быть и не целым. Поэтому нам нужно определить функцию <р и для нецелых значений аргумента. Для этого воспользуемся линейной интерполяцией и соединим точки на графике рис. 6.7 отрезками прямых. Подсчитаем теперь, какова будет средняя интенсивность потока ремонтов, приходящаяся на один ремонтируемый элемент: ЛД р ~ Ф1 (Хг) — • Деля (2.1) на Х2, получим: ( Р Р = Ф1 (*2) = _рл I *2 при Х2 k, при Х2 k. (2.2) График функции <fi(X2) представлен на рис. 6.8. Эта кривая, как и <р(Х2), состоит из двух участков. На первом (от 0 до k) она параллель- на оси абсцисс, на втором — убывает по гиперболическому закону. Теперь нам известна интенсивность потока событий %21 = ц, пе- реводящего один элемент из состояния $2 в Она зависит от факти- ческого (случайного) числа Х2 элементов, находящихся в состоянии <g2. Согласно принципу квазирегулярности, заменим это случайное число его математическим ожиданием т2. Тогда, на основе графа со- стояний (рис. 6.6), дифференциальные уравнения динамики средних запишутся в виде: == _xmi + ф1 (m2) m2i (2.3) at + (2.4) at где тъ т2, — средние численности состояний <g2. зоз
Уравнения (2.3), (2.4) можно переписать в другом виде, если вспо- мнить, что „ tv ч <Р(Х2) . m ,т ч <P(m2) Ф1 vW — 5 ~ , Ф1 (тг) — А 2 ZHg Получим два уравнения: — Xmt + ф (т2), -^ = — Ф^ + Хт,. at (2.5) Из этих двух уравнений мы можем выбрать одно — например, второе, первое отбросить и во второе подставить выражение тх из условия: m1-\-tn2 = N; т1 = N — т2. Получим вместо (2.5) одно дифференциальное уравнение: = — ф(т2) + Х(У—т2). Это — ур внение с разделяющимися переменными: ________dm,________ X (М — m2) — <р (т2) = dt. Интегрируя правую часть от 0 до t, а левую—от 0 до т2 (начальное значение т2 равно нулю), имеем: т2 С _________dm2_________ J X (N—т2) — <р(/п2) о (2.6) Учитывая, что функция <р(т2) задана двумя разными выраже- ниями при т2 k и при т2 > k, имеем: при tn2 С' k т2 т, dm2 ________р dm2 X (М — т2) — цт2 J ХМ — (X 4- р) т2 о о _1 ]п М — (X + р) т2 , X 4- р ХМ откуда т2 = ——— [1 —е~ <х+ч)']. Х-рр. При m2> k (2.7) о dm2 KN — (X + р) т2 т2 4 /г dtn2 KN — ftp — Кт2 804
Первый интеграл равен: 1 |п Xfl - (X 4 р) fe X 4 р. KN Вычисляем второй интеграл: (* J KN — /гц—Km2 k =-------- In (KN — k[i — Xm2) X 1 |n ХЛ/— fcp,—Xm2 T xw — fe (X + p.) ’ Следовательно, при m2> k _ _ 1 |n X<V — (X + p.) fe_l_ (n ХЛ/ — fep—Xffi2 , X 4 p. ХА' X ХЛ/ — k (X 4 |0 откуда m2 = yv—k --------------------------------e~4 X Г X + u зх/(Х.+ ц) 1 —-----— k KN I (2.8) Формулой (2.7) величина m2 будет выражаться при t<_____1 .n XA/-(X4p)fe =______1 )n XW , X 4 p KN X 4 p KN — (X 4 p) k а формулой (2.8) — при больших значениях t. Пример 2. Условия те же, что и в примере 1, с той разницей, что k рабочих, ремонтирующих вышедшие из строя элементы, помогают друг другу, так что k рабочих осуществляют ремонт одного элемента в среднем в k раз скорей, чем один рабочий. Требуется построить для этих условий функцию = <р(Х2) (суммарную интенсивность потока ремонтов), функцию р, = q)j(X2) (интенсивность потока ремонтов, приходящуюся на один ремонтируе- мый элемент) и составить дифференциальные уравнения для средних численностей состояний (уравнения динамики средних). 805
Решение. График зависимости от числа ремонтируемых эле- ментов Х2 представлен на рис. 6.9. Действительно, при любом целом положительном числе элементов, находящихся в состоянии <о2 (Х2 = = 1, 2, 3, ...), все рабочие, работая одновременно над ремонтом этих элементов, порождают один поток ремонтов с интенсивностью /гц; они как бы эквивалентны одному «сверхрабочему» с производительностью, в k раз большей (см. § 9 гл. 5). Таким образом, чтобы решить постав- ленную задачу, достаточно в условиях примера 1 положить k = 1, ' а вместо ц — подставить В реальных условиях зависимость суммарной интенсивности по- тока ремонтов Ms от числа ремонтируемых элементов может быть и не такой простой, как в рассмотренных двух примерах — она может за- висеть от особенностей организа- ции ремонтов в бригаде, от оче- редности обслуживания элемен- тов, от емкости ремонтных ма- стерских, и т. д. Может ока- рис (л 1 заться, что для установления вида функции Ms = <р(Х2) придется делать специальное исследование, например, рассматривая ремонтную бригаду как систему массового обслуживания и строя для нее математическую модель. Пример 3. Рассматривается система, состоящая из N = 100 оди- наковых приборов; каждый прибор состоит из двух одинаковых узлов: один основной, второй резервный. В случае выхода из строя основного узла в работу включается резервный. При выходе из строя обоих узлов выходит из строя и перестает работать весь прибор. Поток неисправ- ностей, действующий на работающий узел, имеет интенсивность на неработающий (исправный) — Х2. Вышедшие из строя узлы ремон- тируются бригадой рабочих. Суммарная интенсивность потока ре- монтов бригады, в зависимости от общего числа ремонтируемых узлов у, задана функцией Alz = q>(t/). Вид функции ф(//) представлен на рис. 6.10. Отдельный прибор (элемент) может находиться в следующих сос- тояниях: Si — исправны оба узла, первый работает, второй в резерве, $2 — первый узел неисправен, ремонтируется, второй узел ра- бота ет; прибор работает, Ss— оба узла неисправны, ремонтируются; прибор не работает. Вышедшие из строя узлы ремонтируются независимо от того, яв- ляется ли узел основным или запасным (ремонты распределяются по узлам равномерно). После исправления вышедшего из строя узла он становится резервным, если другой не вышел из строя, и основным — если вышел. Написать уравнения динамики средних. Решение. Граф состояний элемента (прибора) имеет вид, показан- ный на рис. 6.11. зов
Определим интенсивности потоков событий, переводящих элемент из состояния в состояние. Прежде всего, ?-12 = + ^2- Действительно, пока прибор работает нормально, на оба узла действуют потоки неисправностей: на работающий—с интенсивностью на неработающий—с интенсивностью Х2. На прибор в целом дей- ствует поток с суммарной интенсивностью -|-Л-2. Далее, из состояния $2 в $3 прибор переходит под действием потока неисправностей, приходящегося на единственный работающий узел: Х23 = Обратно, из состояния S2 в 8г, прибор переводит поток ремонтов, приходящийся на один ремонтируемый узел. Общее число узлов, на- ходящихся в ремонте, равно // = Х2 + 2Х3. Действительно, на каждый прибор, находящийся в состоянии при ходится один неисправный узел; на каждый прибор в состоянии <£3 — два неисправных узла. Суммарная интенсивность потока ремонтов будет: v = ф (у) = ф (Х2-|-2Х3). Эта интенсивность делится поровну между всеми ремонтируемыми узлами, так что на один узел приходится интенсивность потока ремон- тов, равная ~ ф(Х2^2Х3) и Х2 -|- 2XS Следовательно, истинная интенсивность потока ремонтов, прихо- дящаяся на один элемент в состоянии <S2, равна: 1 ф(Хг-Ь2Х8) Х2 + 2Х3 Аналогично определим Х32. В состоянии SB прибор имеет два не- исправных узла; на каждый из них приходится поток ремонтов с ин- тенсивностью ф (Х2 2Х3) Х2 + 2Х3 а на оба — поток с интенсивностью, вдвое большей: 2ф (X 3 —р- 2Х3) Х2 + 2Хз Согласно принципу квазирегулярности, заменяем случайные ар- гументы Х2 и Х3 их математическими ожиданиями т2 и т3; получим: 1 _ Ф (т2 + 2/Пз) . 3 ~ 2<р (m2 + 2т3) । Л21 ....... ) ™32' * т2 + 2ms т2 + 2т3 307-
Таким образом, можно проставить на графе состояний все интен- сивности и, согласно общему правилу, записать уравнения динамики средних. Из трех уравнений (для mlt tn2 и т3) пишем первое и послед- нее — второе отбрасываем: = - (X, + Х2) mt + + di т2 Ч* 2пг3 dm3 ~di~ 2<р (т?-\-2т3) т3 т2 4- 2/п3 Из условия mi + тг + тз выражаем т2 через mi и т3: m2 = N— тг—т3 и подставляем в первое и второе уравнения (2.9): dms dt 2<р (N — т1 + т3) т3 N — /П1 + т3 + М^ —mt—m3). (2.9) (2.10) f-^m2, Полученную систему двух нелинейных дифференциальных урав- нений с неизвестными функциями m1( т3 можно решать на машине или вручную (численно). Таким образом, пользуясь принципом квазирегулярности, можно написать уравнения динамики средних, в которых неизвестными функ- циями являются средние численности состояний; эти уравнения при- ближенно описывают изменение средних численностей состояний даже в случае, когда интенсивности потоков событий, переводящих элемент из состояния в состояние, зависят от численностей состояний и, значит, являются случайными. Погрешность, с которой уравнения динамики средних описывают процесс, тем меньше, чем более мно- гочисленна группа элементов и чем ближе нелиней- ным функции, выражающие интенсивности потоков событий в зави- симости от численностей состояний. Возникает вопрос: а нельзя ли, пользуясь тем же методом, что в § 1, приближенно определить не только математические ожидания, но и дисперсии средних численностей состояний? Мы видели, что в случае, когда отдельные элементы переходили из состояния в состоя- ние независимо друг от друга (т. е. интенсивности потоков событий, переводящих элементы из состояния в состояние вовсе не зависели от численностей состояний), дисперсии численностей состояний находи- лись просто по формуле: / (О \ -----(2.11) аов
Исследования показывают, что в случае, когда интенсивности по- токов событий зависят от численностей состояний, этой формулой, вооб- ще говоря, нельзя пользоваться. Она оказывается пригодной только в случаях, когда зависимость интенсивностей потоков событий от чис- ленностей очень слабая (почти пренебрежимая), да и то на сравнитель- но малых участках времени, пока не накопилась погрешность. Если же зависимость интенсивностей от численностей существенна, формула (2.11) дает ошибку. Если функции, выражающие суммарные интенсив- ности потоков (как например, функция ср в примере 1) выпуклы вверх, то формула (2.11) дает заниженное значение для дис- персии: дисперсия, вычисляемая по этой формуле, может быть, скажем, вдвое меньше истинной (а иногда — и более, чем вдвое). Приближенно найти дисперсии численностей состояний можно, выписывая и решая специальные дифференциальные уравнения уже не для математических ожиданий, а для дисперсий Dk(t) и корреля- ционных моментов характеризующих связь между числен- ностями состояний $к, Эти уравнения в каком-то смысле анало- гичны уравнениям динамики средних, составляемым на базе принципа квазирегулярности, но гораздо сложнее их и не обладают той же на- глядностью. Число уравнений и число неизвестных в этих уравнениях равно числу дисперсий плюс число попарных корреляций между чис- ленностями Хъ Х2, ..., Хп, т. е. , (П — 1> _ n (n-h 1> + 2 2 Кроме дисперсий Dk(l) и корреляционных моментов в урав- нения для них входят еще и п функций m2(t), mn(t) — сред- них численностей состояний, которые предполагаются уже определен- ными из уравнений динамики средних. Уравнения для дисперсий Dh(t) и корреляционных моментов оказываются относительно самих этих переменных линейными, хотя математические ожидания численностей tnh(t) входят в них нелинейно. В виду сравнительной сложности вопроса, мы не рассматриваем методику построения системы уравнений для дисперсий и корре- ляционных моментов (для частного случая эти уравнения описаны в статье [22]). 3. УЧЕТ ПОПОЛНЕНИЯ ЧИСЛЕННОСТЕЙ СОСТОЯНИЙ До сих пор мы применяли метод динамики средних к решению толь- ко таких задач, где система была замкнутой, т. е. количество элемен- тов (V,-участвующих в процессе, оставалось неизменным. На практике нередко встречаются задачи, где в ходе процесса численности эле- ментов, находящихся в каких-то состояниях, пополняются извне. Это пополнение очень легко учесть в уравнениях динамики средних. Рассмотрим в качестве примера систему S, состоящую из N одно- родных элементов. Граф состояний элемента показан на рис. 6.12. 309
Интенсивности в общем случае зависят от численностей состояний Хх, Х2, Х3, Х4 (при составлении дифференциальных уравнений эти численности заменяются средними численностями т1г т2, /п3, т^. Если пополнения состава численностей состояний в ходе процес- са не происходит, то уравнения динамики средних будут: ~~~ — ------(^12 + ^1з) "Ь ^21 т2> at ~ ,7 = -----(^21 + ^23 4“ ^24) т2 + ^12 т19 at ~7~ ~ ?‘13 т1 4“ ^23 т2 + ^43 т4» at ~77~ ~ -----^43 т4 + ^24 т2> at (3.1) Рис. 6.12 Рис. 6.13 причем любое из этих уравнений может быть отброшено, и соответст- вующая переменная выражена из условия: + «2 + «з + т4 = X • (3.2) Теперь предположим, что контингент элементов, находящихся в одном из состояний (например, 84) пополняется извне, причем интенсивность пополнения, т. е. число элементов, вводимых в единицу времени в состояние $1( равна 6 (в случае, если за единицу времени вводится случайное число единиц, интенсивностью пополне- ния будет называться среднее число единиц, вводимых извне за едини- цу времени). Величина 6 может быть как постоянной, так и перемен- ной, как зависящей, так и не зависящей от средних численностей со- стояний. При наличии пополнения первое уравнение системы (3.1) изме- нится; в правой части его появится слагаемое, равное пополнению 6: ~ (^12 + ^13) + ^21 /К2~Ь \ (3.3) а остальные уравнения останутся такими, как были. Заметим, что условие (3.2) также изменится. Раньше в любой мо- мент времени сумма всех средних численностей была равна одной и той ДЮ
же величине N; теперь она будет равна изменяющейся со временем численности N(t) = N0+^6(t)dt, (3.4) о где Л(о — начальное значение численности элементов. Таким образом, учет пополнения численностей состояний сводит- ся к тому, что к правой части соответствующего дифференциального уравнения прибавляется слагаемое, равное интенсивности пополнения — среднему числу элементов, вводимых в данное состояние за единицу вре- мени. Пример 1. Рассматривается система, состоящая (в начальный мо- мент) из <V0 однородных технических устройств (приборов), каждый из которых может быть в одном из следующих состояний: — исправен; $2 — неисправен, осматривается; $3 — признан негодным, списан; — ремонтируется. Соответствующие средние численности обозначим пц, т2, ms, mi- Граф состояний элемента показан на рис. 6.13. Интенсивность потока неисправностей работающего прибора рав- на X. Среднее время осмотра не зависит от числа осматриваемых при- боров и равно 70СМ. Неисправный прибор оказывается негодным и спи- сывается с вероятностью р, а с вероятностью 1 — р направляется в ре- монт. Среднее время, которое прибор проводит в состоянии ремонта, 7рем есть некоторая функция от числа х приборов, одновременно нахо- дящихся в ремонте: ^рем ~ f W- Чтобы скомпенсировать убыль приборов в результате списания, производится пополнение численности приборов извне (исправными приборами), причем за единицу времени в систему вводится в среднем 6 = 6(/) исправных приборов. Требуется: — написать уравнения динамики средних с учетом пополнения, — определить, какова должна быть функция 6(0 для того, чтобы списание приборов в среднем было скомпенсировано, — написать формулу для суммарного числа элементов N{t), на- ходящихся во всех состояниях к моменту I. Решение. На графе рис. 6.13 проставляем интенсивности потоков событий. Интенсивность Х41 приближенно принимаем обратно пропор- ци опальной среднему времени ремонта (строго говоря, это верно толь- ко для стационарного пуассоновского потока): Х41= —Ь- 4 f(Xd 311
Заменяя истинную численность ремонтируемых приборов ее математическим ожиданием получим: ~ —------------------------------------- 4 f (т.) Система дифференциальных уравнений динамики средних будет: dm, __ dt ~ dm2 __ dt ~ dm3 __ ИГ ~ dtn.1 _ dl ~ = —^ + -^^4-6, fim.) = _^h_ + Xm1, Сем _ pm2 ^OCM = _ | 0 ~ P) f Сем Заметим, что в данном случае мы не можем так просто отбросить любое из уравнений, как в случае без пополнения, так как условие (3.2) видоизменяется; общее число элементов в системе зависит от вре- мени и равно: t tf(f)=,/Vo4-j6(Odt (3.5) о Для того чтобы в среднем скомпенсировать списываемые приборы, интенсивность пополнения должна быть равна среднему числу прибо- ров, списываемых за единицу времени. Всего в единицу времени спи- сывается (переходит из состояния $2 в $3) в среднем mz *осм приборов; значит, мы должны положить: 6 — ~~ т2. ^осм При такой интенсивности пополнения система уравнений динамики средних примет вид: = — Л/П1 ------!— tn. 4- ~Г— dt f(m4) /осм 2> dm ? 1 , — = 4-^, а{ Еосм Р т ---- = -=--- tn g, dt toCM dm, ~dt (3.6) 1 । 1 — Р --------т. + — — т, f-^осм 312
Из числа уравнений (3.6) можно безболезненно исключить третье, так как величина т3 не входит ни в одну правую часть. Величину т3 в условиях данного примера можно вычислить очень просто: для каж- дого момента / она равна суммарному числу вновь поступивших при- боров (так как все списанные в среднем компенсируются) и, значит, та = | т2 (t) dt. ^осм J о В данном примере 1 пополнение вводилось только в одно состоя- ние; вообще, это может быть и не так (например, можно вводить попол- нение неисправными приборами, которые должны ремонтироваться местными средствами). Заметим, кроме того, что функции пополне- ния могут иметь как положительные, так и отрицательные значения (убыль элементов). Рис. 6.14 Рис. 6.15 Пополнения, вводимые в состояния, иногда бывает удобно изобра- жать наглядно, на графе состояний (рис. 6.14). Условимся изображать их «полустрелками», не идущими ни из какого состояния, а в случае «убыли» — не направленными ни в какое состояние (для наглядности полустрелки, в отличие от стрелок, будем делать двойными). Размечая граф интенсивностями потоков событий, против полустрелок будем писать не интенсивность, приходящуюся на один элемент, а интенсивность приходящуюся на систему в целом (это делается для того, чтобы избежать ненужного деления и умножения на одно и то же число). Пример 2. В условиях примера 1 пополнение численностей отно- сится к двум состояниям: (исправные приборы) и (ремонтируе- мые приборы), причем некоторая доля а вновь поставляемых приборов дается исправными, а доля (1 — а) — неисправными; последние сразу же начинают ремонтироваться. Как и в предыдущем примере, суммар- р ное пополнение в единицу времени равно =— т2. 4)СМ 313
Построить граф состояний, отразив на нем пополнение, написать уравнения динамики средних, определить общее среднее количество элементов в системе N(t) как функцию времени. Решение. Граф состояний показан на рис. 6.15; полустрелки, на- правленные в состояния Si, изображают пополнение. Уравнения динамики средних имеют вид: dmt di dm2 ~dT dms dt атл di ~ = — Un-i +t“— mi + m2> flint) 4 Zoom 1 i = — -— m2 4- лть Доем p = Ш2, AjCM 1 . 1 — p (1 — a) p -----m, 4- ——- m2 4- —— m2. f (mi) 4qcm ^ocm (3-7) Из них по-прежнему удобнее всего исключить третье уравнение и выразить т3 как / m3 = -=^— I m2dt. ^осм J о Общее суммарное число элементов в системе меняется во времени согласно формуле: t У (/) = Л/о -=^— С /пг dt = No -f- та. ‘OCM J о 4. МЕТОД ДИНАМИКИ СРЕДНИХ ДЛЯ СИСТЕМЫ, СОСТОЯЩЕЙ ИЗ НЕОДНОРОДНЫХ ЭЛЕМЕНТОВ До сих пор мы применяли метод динамики средних к системам, состоящим из однородных элементов. Однако, без принципиальных изменений, он может быть применен и к системам, состоящим из неод- нородных элементов разных категорий — разница будет только в том, что число дифференциальных уравнений увеличится. Если число ка- тегорий и состояний не слишком велико, решение задачи трудностей не вызывает. Пример. В автохозяйстве имеется Nr грузовых и Ул легковых автомащин. Каждая грузовая машина может быть в одном из следую- щих состояний: Fj — ожидает вызова на базе, Г2 — совершает порожний рейс к месту погрузки, Г3 — совершает рейс с грузом, Г4 — совершает порожний рейс обратно на базу, 314
Г5 — проходит профилактический осмотр, Г6 — ремонтируется. Каждая легковая машина может быть в одном из следующих со- стояний: Л± — ожидает вызова на базе, Л2 — совершает рейс, Л3 — проходит профилактический осмотр, Л4 — ремонтируется. На базу поступают пуассоновские потоки заявок на грузовые и лег- ковые машины, интенсивности которых Хг и Хл не зависят от числа сво- бодных машин на базе. Пришедшие заявки распределяются равномерно между всеми машинами данной категории, ожидающими вызова. В слу- чае, если на базе нет ни одной свободной машины данной категории, заявка получает отказ (переадресуется на другую базу). На профилактический осмотр берутся только машины, находящие- ся в состояниях Гь Л1. Средняя интенсивность потока профилакти- ческих осмотров грузовой машины равна ^-проф, легковой Х„Роф- Осмотры проводятся специализированной бригадой; суммарный поток осмотров имеет интенсивность А%=а(1—е~^), (4.1) где у — число машин (грузовых и легковых вместе), проходящих осмотр. Средняя длительность профилактического осмотра грузовой и лег- ковой машины одинакова и равна 70СМ. Средняя длительность порожне- го рейса (к месту погрузки или к автобазе) равна /пор- Средняя дли- тельность груженого рейса равна /гР. Средняя длительность рейса легковой машины равна /л. Из профилактического осмотра грузовая машина с вероятностью рг идет в ремонт, а с вероятностью 1 — рг — обратно в состояние Г4. Аналогичные вероятности для легковых машин равны рл и 1 — рл. Ремонт как грузовых, так и легковых машин производится ре- монтной бригадой; суммарный поток ремонтов, производимый брига- дой, имеет интенсивность В2 = 6(1—е~*), (4.2) где х — число машин (грузовых и легковых вместе), одновременно находящихся в ремонте. Кроме состояния профилактического осмотра, машины могут по- ступать в ремонт непосредственно из рейса. Интенсивность потока не- исправностей одной грузовой машины в состоянии порожнего рейса равна VnOp, в состоянии груженого рейса — VrP- Интенсивность пото- ка неисправностей легковой машины, находящейся в рейсе, равна Vя. Требуется: — составить граф состояний элементов системы, — написать дифференциальные уравнения для средних численно- стей состояний. 315
Решение. Вводим обозначения: tnf — среднее число грузовых машин, ожидающих вызова в мо- мент т2г — среднее число грузовых машин, совершающих порожний рейс к месту погрузки; т3г — среднее число грузовых машин, совершающих груженый рейс; т4г — среднее число грузовых машин, возвращающихся порож- няком на базу; т5г — среднее число грузовых машин, проходящих профилакти- ческий осмотр; твг — среднее число ремонтируемых грузовых машин; т,л — среднее число легковых машин, ожидающих вызова; т2л — среднее число легковых машин, совершающих рейс; т3л—среднее число легковых машин, проходящих профилакти- ческий осмотр; т4л — среднее число ремонтируемых легковых машин. Граф состояний системы, распадающийся на два подграфа — Г и Л, показан на рис. 6.16. Рис. 6.16 Определим теперь интенсивности потоков событий, пере- водящих элементы (грузовые и легковые машины) из состояния в со- стояние. Некоторые из этих интенсивностей зависят от численностей состояний, другие не зависят. Для первых мы, при составлении диф- ференциальных уравнений, согласно принципу квазирегулярности, заменим численности состояний, от которых они зависят, средними численностями. Найдем ХУ2 — интенсивность потока событий, переводящего гру- зовую машину, ожидающую вызова, в состояние Г2 — рейс к месту погрузки. Вызовы грузовых машин, по условиям задачи, образуют по- ток с интенсивностью V; но вызов принимается только тогда, когда в состоянии Г4 есть хотя бы одна машина. Поэтому интенсивность по- тока принятых вызовов Х„р (а только такие вызовы могут пере- 816
водить грузовую машину из состояния Г, в Г2) зависит от числа X' машин в состоянии 1\ следующим образом: »г (Д’ при X/ > 1, пр ~ ( 0 при X/ = 0. Эта функция такого же вида, как нам встречалась уже ранее, в при- мере 2 §2, и встретится еще не раз в следующих примерах. Поэтому мы сейчас введем две функции, которые в дальнейшем будут обозначать- ся всегда одинаково: R(x) и р(х) (ими мы будем пользоваться во многих конкретных задачах динамики средних). Определим функцию R(x) следующим образом: п . . ( х при х < 1; .ч £(*)= , , (4.4) ( 1 при Х> 1. График этой функции представлен на рис. 6.17. Функцию р(х) определим формулой: р (х) =------= X при 1, при Х> 1. (4-5) 1 2 X График функции р(х) изображен на рис. 6.18. При помощи функции R(x) интенсивность Х„р потока принятых вызовов грузовых машин записывается так: ^p=v#(xo. (4-6) Теперь вычислим интенсивность ?Лг потока событий, переводя- щих отдельную грузовую машину из состояния G в Г2 (см. рис. 6.16): . г ^пр n R (^1 ) 7 г Л / Y П Л!г X/ (4.7) Далее найдем другие интенсивности. Имеем: Мз = 1//поР; Хз4 = 1//гр; %41 = 1//пор,‘ ^15 =^проф- (4.8) Теперь определим интенсивность потока событий, переводя- щего элемент (грузовую машину), находящийся в состоянии ГБ (про- 317
филактический осмотр), в состояние Г!. Эту интенсивность вычислим следующим образом. Суммарная интенсивность потока осмотров, ко- торый производит бригада, согласно формуле (4.1), равна: Аг = а[1 — е~(х»г+х’л1]. (4.9) Эту интенсивность нужно поровну разделить между всеми маши- нами, находящимися в состояниях Г5 и Л3; получится а [i _e-(V+V)l —t------------— (осмотров в единицу времени). ^5Г + -^3Л (4.Ю) Но это еще не все: ведь в состояние Гх переходит не каждая маши- на, прошедшая осмотр, а только какая-то часть из них. Чтобы получить из (4.10) интенсивность Х51, нужно умножить (4.10) на (1 —рг) — ве- роятность того, что машина из профилактического ремонта вернется в состояние Гх; получим: 7Г а (1 — рг) [1 — е-(х‘Г+х“Л)] д _ — —------------------------ Хзг + Хзл Аналогично находим: г _ арг [1—е-(х»г+х*л)] 66 ~ Х5Г + Х3Л (4.Н) (4-12) Интенсивность потока ремонтов, переводящих элемент из со- стояния Гв в Гх, выразится формулой: >-rei b [1 _ e-(V+V)] х6г+х/ (4.13) где Хвг, X/— численности ремонтируемых в данное время грузовых и легковых машин. Из состояний Г2, Г3, Г4 в состояние Г6 (ремонт) элемент переводит- ся потоками событий с интенсивностями, соответственно равными: ^-26 — vnop; ^зб—vrp; Х46 — Vnop. (4.14) Аналогично определяем интенсивности потоков событий для вто- рого подграфа (легковые машины): Г12 = Гр(Х1л), (4.15) 7 л 1 Л 21 — 1 1л Л Л Л Л] 3 — Л-ПрОф, (4-16) (4.17) V — g(l—Рл) [1 — е—<х»Г+ХзЛ^] 31 - х5г+х3л (4.18) »л арл [1 — е" <Х»Г + Х»Л)] Л34 * х5г+х3л (4.19) 318
*Л24=Л ^^[l-e-(V+X/)] Xer + X/ (4.20) (4.21) Таким образом, все интенсивности потоков событий для обоих подграфов рис. 6.16 найдены. Заменяя в них численности состояний средними численностями, напишем систему дифференциальных уравнений динамики средних в виде: R (тП -Х'роф + Л тр4 + at /г 1 пор + Д(1-Рг) [1-е(т~Г+'п/)] ; &[1-е~(,п»Г+т/)]/п6г . "'sr + "V m6r + 'V dm3r dt dtnj dt dmsr dt 1 ^тг + Г /Пг) т?, dm^ dt dmsr dt dmi1 dt ['’пор ф \ * nop l Г , 1 \ r , 1 — | vrp + I «3 + ------------ \ tr / Г \ 1 rp / ‘nop / г I 1 \ r I 1 I ^nop ~ I ^4 Ч" ~ I tr I tr \ 4 пор/ гр a [1 —e~ (твг+'Пз )] rrilr r< ^проф m j t b [1 —e~ ^'П,Г+'П<Л^ m6r । m6r + m4” ap' 11 —e" <т-’Г + т’'^1 m5r r / г , r\ . r r. ’ '’nop \ttl2 ~T ^4 / “b '’rp т3г + т3л ~knR (m?) — Хпроф + -=T m2 + (4.22) i 4- V1 j т2л + V R (яг/); д!т3л dt а [1—е~('п‘Г+'”зЛ)] т3л т3г + т3л dm,' _ _ 6 [1-е-^-Г+ст?)] т4л dt т6г-{-т3л 4- v” т2 ф b [1-е-(^г + '".л)] т-)л /п6г + тал ^проф Hl j, арл [1— е-("’»г + т/>] Отзл твг4-т8л 319
Напомним, что в этих уравнениях R(x) — функция, определен- ная формулой (4.4). Таким образом, нами написаны десять дифференциальных уравне- ний для средних численностей состояний (6 4-4 = 10). Однако факти- чески решать приходится не так много: любое из шести первых уравне- ний и любое из четырех последних может быть отброшено и соответст- вующая функция выражена из условия: т/ 4- тг 4- тзг 4* 4- тъ 4- = NT, 4- т2л 4- т3л 4- т4л = N*. Таким образом, общее количество дифференциальных уравнений, которое придется решать, равно восьми (5 4-3 = 8). Начальные условия, при которых мы будем решать эту систему, зависят от того, какой вопрос мы хотим выяснить. Если, например, нас интересует по преимуществу начальный период работы базы, вскоре после ее организации, естественно предположить, что в начальный мо- мент все машины находятся в состояниях Гх и Лх; тогда начальные усло- вия будут: t — 0; — Nr\ mJ ~ т3г = tntr — т3 — твг = 0; т/ == уул; щ2л = т3 — /и4л = 0. Если же нас интересует другое, например, насколько быстро си- стема может справиться с «затором», вызванным большим числом неис- правностей, — можно предположить, что в начальный момент уже большое число машин находится в ремонте (состояния Г6 и Л4). Обратим внимание на то, что полученная нами система дифферен- циальных уравнений для средних численностей состояний нели- нейна. Это очень типично для метода динамики средних в условиях, когда интенсивности потоков событий зависят от численностей состоя- ний. Тем не менее решение такой системы дифференциальных уравне- ний на ЭЦВМ или даже вручную (численно) затруднений не представ- ляет. Для этого только нужно задаться численными значениями всех параметров, фигурирующих в задаче. 5. ПРЕДЕЛЬНОЕ ПОВЕДЕНИЕ СРЕДНИХ ЧИСЛЕННОСТЕЙ СОСТОЯНИЙ В предыдущих параграфах мы рассмотрели методику описания процесса, протекающего в сложной (многоэлементной) системе <$ с по- мощью уравнений динамики средних, в которых неизвестными функ- циями являются средние численности состояний: ть т2, ... , тп. Естественно, возникает вопрос: к каким предельным значениям стремятся (если стремятся) эти средние численности при оо? Су- ществует ли, и если существует, то каков установившийся режим? В случае, когда мы рассматривали уравнения для вероятностей состояний, вопрос о предельном режиме решался достаточно просто. Если из любого состояния система могла перейти в любое другое, а число состояний было конечно, то существовал предельный установив- 820
шийся режим, не зависящий от начальных условий. Чтобы найти ве- роятности состояний в этом режиме, достаточно было положить левые части дифференциальных уравнений равными нулю и решить получен- ную систему линейных алгебраических уравнений. Для метода динамики средних дело обстоит несколько сложнее. Напомним, что уравнения динамики средних в общем случае нели- нейны; так же нелинейны и алгебраические уравнения, получаемые из них, если левые части положить равными нулю. Может оказаться, что решение этой системы уравнений не единственно, тогда нужно рас- смотреть совокупность решений и отбросить те из них, которые не от- вечают физическим условиям задачи. Если даже решение единственно, нужно все же исследовать поведение решения системы дифференциаль- ных уравнений при t -*• оо. Продемонстрируем особенно- сти исследования предельного по- ведения средних численностей со- стояний на примере задачи, взятой, ради разнообразия, из области биологии. Пусть в некоторой мест- ности обитают животные двух ви- дов А и В, причем животные перво- го вида (Д) — хищные, и они пи- таются животными второго вида (В), которые довольствуются расти- тельной пищей. Будем характеризовать состоя- 4 В Рис. 6.19 ние каждого животного предельно грубо, учитывая только, живо ли оно еще или погибло. Построение гра- фа состояний элементов системы не вызывает никаких трудностей: этот граф разобьется на два подграфа, соответствующих видам А и В (рис. 6.19). Здесь стрелки, ведущие из А± в А2 и из Bi в В2, учитывают смертность животных, причем для вида В—смертность двух родов: и те случаи, когда особь погибает естественной смертью, и те, когда ее поедает животное вида А. Двойные полустрелки, ведущие в состоя- ния А1г Ви соответствуют пополнению численностей благодаря рождае- мости. Обозначим численности элементов (животных) в состояниях Alt А2, В1г В2 соответственно через X/, Х2Л, ХЛ Х2В, а их математичес- кие ожидания через mf4, т2А, т^, т2в.Мы хотим составить дифферен- циальные уравнения для т^, (средние численности т.2А, т2в пре- дыдущих поколений, как окончательно выбывшие из «активных» элементов системы, не будут входить в эти уравнения, и мы можем ими совсем не интересоваться). Для того, чтобы составить дифференциальные уравнения, нужно задаться видом зависимости интенсивностей потоков X,f2, A,f2, б», gs от XtA, Х±в. Начнем с травоядных животных вида В. Предположим, что запасы пищи, доступной им, не зависят от численности животных ни вида А, 11 Зак. 573 321
ни вида В, и что пищи хватает на всех. Тогда естественно предполо- жить, что средняя рождаемость в единицу времени (в пересчете на одну живую особь вида В) остается постоянной. Обозначим эту постоян- ную с; тогда прирост численности состояния Вг за счет рождения новых животных выразится формулой: бв = сХЛ (5.1) Что касается смертности то мы уже сказали, что она склады- вается из двух слагаемых. Первое — это естественная смертность; мы будем считать ее постоянной (по тем же причинам, по которым считали постоянной рождаемость). Обозначим эту постоянную (среднее число естественных смертей в пересчете на одну живую особь вида В) через k; величина k может быть истолкована как доля животных вида В, по- гибающих в единицу времени естественной смертью. Второе слагаемое в составе л ^2 — это доля животных вида В, поедаемых в единицу вре- мени хищниками вида А. Естественно предположить, что число встреч (в единицу времени) животных видов А и В, кончающихся тем, что А поедает В, прямо пропорционально числу Х,А животных вида А (жи- вых) и числу XtB имеющихся животных вида В, т. е. что это число вы- ражается формулой /X/ -Х^, (5.2) где I — константа. В пересчете на одну живую особь вида А число та- ких смертей («поеданий») в единицу времени будет равно IX^, так что интенсивность потока гибелей, приходящаяся на одну особь вида В в состоянии Bi, выразится так: Kf2=k + lXt. (5.3) Теперь займемся животными вида А. Мы предположили, что их единственную пищу составляет вид В; поэтому естественно, что и рож- даемость и смертность вида А будут зависеть от числа поедаемых в единицу времени животных, приходящихся на одного хищника. Число поедаемых животных задается формулой (5.2), и на одного хищника их приходится в среднем 1ХГВ. Таким образом, смертность хищников 7^2 будет какой-то функцией от 1Хгв, или, так как/ — константа, какой-то функцией от Х^: ^2 =/(*?)• (5.4) Очевидно, функция f будет убывающей функцией от Х±в (т. е. от количества пищи). Действительно, животные будут тем меньше уми- рать, чем больше у них будет пищи. Возможный вид функции / пред- ставлен на рис. 6.20. Аналогично, рождаемость будет какой-то другой функцией от чис- ла животных вида B'.g^X^), и средний прирост популяции хищников за счет рождаемости (в единицу времени) запишется так: ^X^gM. (5.5) Функция естественно, возрастающая функция от Хгв (рис. 6.21). 322
Выпишем теперь дифференциальные уравнения для средних чис- ленностей состояний: а । -----= —- Л12 1 “7“ О , dt dmiB „в , хв ---- — — Л j 2 1 I- ’ dt Пользуясь принципом квазирегулярности и заменяя численности XtA, от которых зависят интенсивности (5.1), (5.3), (5.4), (5.5), их средними значениями тхл, т1в, получим: Мы видим, что в первое уравнение фактически входит только раз- ность функций g и f, характеризующая полный средний прирост. Обоз- начим эту разность через h: h(x)=g(x)—f(x). (5.7) Это — разность возрастающей и убывающей функции, а значит, сама функция h —возрастающая (см. рис. 6.22). В отличие от положи- тельных функций fug, эта функция может менять знак. Предположим, что она меняет знак в какой-то точке хов (рис. 6.22). Значение хов имеет смысл той численности животных вида В, при которой рождаемость и смертность хищников в среднем уравновешиваются. При больших значениях численности вида В численность вида А в среднем возрастает, при меньших — в среднем убывает. Назовем хов критической численностью вида В. Совершенно так же можно ввести критическую численность х0А хищников, при которой число травоядных животных в среднем остает- ся неизменным. Из второго уравнения (5.6) видно, что (5-8) II 323
Когда число хищников больше, чем х0А, то численность вида В убывает, а при меньшем их числе — возрастает. Пользуясь новыми обозначениями, уравнения динамики средних (5.6) можно переписать в виде: ~"1 —h (Ш!В) тгА-, dt at (5.9) В таком виде мы и будем анализировать уравнения для средних численностей состояний системы. Посмотрим, как с изменением I будет двигаться точка на плоскос- ти, изображающая решение miA, mrB системы (5.9) (см. рис. 6.23). Рис. 6.22 Рис. 6.23 При mi8 < хов, т. е. ниже прямой пг^ = хов, согласно первому dmA уравнению (5.9), < 0; это означает, что точка движется влево (одновременно с этим, может быть, вверх или вниз). Выше этой прямой точка движется вправо. Точно так же из второго уравнения (5.9) получаем, что левее прямой т-^ = х0А движение точки направлено вверх, а правее этой прямой — вниз. В моменты прохождения пря- мой т,в ~ хов точка движется строго вертикально: вниз, если она на- ходится правее х0А и вверх — если левее; в моменты прохождения пря- мой тгА — хпА она движется строго горизонтально. Таким образом, точка, изображающая решение системы (5.9), вращается вокруг точки (хол, хов) по часовой стрелке, причем вращает- ся, вообще говоря, не по кругу — может быть, приближаясь к точке (хол, хов), а может быть удаляясь от нее. Точка (хол, хов) — поло- жение равновесия: если в качестве начальных условий для решения системы (5.9) взять х0А, хов, то численности /и/, не бу- дут изменяться, и решение системы (5.9) не зависит от времени: m/(/)=V; mis(0=V- Это положение равновесия может быть устойчивым, если решения системы, начинающиеся из точек, близких к (хол, xos), с течением времени неограниченно приближаются к этой точке; и неустойчивым — если удаляются. 324
На рис. 6.23 изображен случай, когда решение, начинающееся на прямой = хов через один «оборот» оказывается ближе к точке (х0А, Хов), чем в начале. Очевидно, возможны еще два случая: — после одного «оборота» точка окажется дальше от (хол, хов), чем в начале; — после одного «оборота» точка в точности вернется к своему начальному положению. В последнем случае все последующие «обороты» точки т1л, т1в во- круг положения равновесия будут совершаться по одному и тому же замкнутому пути. Такой замкнутый путь в теории дифференциальных уравнений называется циклом; ему соответствует периодическое решение тгв(1): число хищников возрастает, поэтому число тра- воядных начинает убывать, достигает хов; тогда начинает убывать число хищников, и, когда оно минует критическое значение х0А, число траво- ядных начинает возрастать; наконец, численности тех и других живот- ных достигают своих прежних значений и процесс начинается заново. Так же, как и положение равновесия, цикл может быть устойчи- вым (когда решения, начинающиеся вблизи него, неограниченно при- ближаются к циклу) и неустойчивым (когда они удаляются). Вернемся к случаю, изображенному на рис. 6.23. Следующий обо- рот точки (mi4, Ш1В) вокруг положения равновесия еще больше при- близит ее к точке (хол, х№в), и с каждым следующим оборотом точка (/П1Л, /щв) будет все больше приближаться к точке (х0А, хов). Здесь опять-таки может быть два случая: либо точка будет неограни- ченно приближаться к положению равновесия — тогда, очевидно, это положение равновесия будет устойчивым; либо будет с каждым обо- ротом приближаться, но не неограниченно. В этом случае точка •(т1А, т^) будет неограниченно приближаться снаружи к како- му-то циклу, который, конечно, будет устойчивым. Такие же рассуждения можно применить и в случае, когда после одного оборота точка (т^, т^) удалится от положения равно- весия: либо с течением времени она будет неограниченно удаляться от точки (хол, хов), а значит, и от начала координат; либо она будет приближаться к какому-то устойчивому циклу (на этот раз изнутри). Все эти характеры поведения решений системы (5.9) могут по-раз- ному комбинироваться друг с другом, образуя иногда довольно слож- ную картину. Например, изобразим на рис. 6.24 случай, когда поло- жение равновесия устойчиво, и никаких циклов (периодических реше- ний) нет. Здесь будет единственный предельный режим (х0А, хов); и к нему будут стремиться все решения, каковы бы ни были начальные условия. На рис. 6.25 изображен другой случай, когда положение равновесия неустойчиво, а циклов, как и в предыдущем случае, нет. В этом случае никакого предельного режима не существует: числен- ность каждого вида то убывает почти до нуля, то сильно возрастает, причем с каждым «оборотом» эти колебания становятся все больше, воз- растая неограниченно. Разумеется, в точности такой характер предель- ного поведения численностей видов практически не может встретиться. Здесь начнут сказываться не учтенные при формализации задачи факторы: например, ограниченность запасов пищи у травоядных или 325
ошибки, связанные с применением принципа квазирегулярности (ко- торые будут значительны при малых значениях т1А, mj3). Еще один пример возможного характера предельного поведения решений: положение равновесия неустойчиво, имеется один устой- чивый цикл С (см. рис. 6.26). Здесь будет опять единственный пре- Рис. 6.24 Рис. 6.25 дельный режим— периодическое возрастание и убывание численностей, соответствующее предельному циклу С. К этому режиму приближают- ся средние численности m}A(t), m^B(l) при любых начальных условиях. .На рис. 6.27 изображен еще более сложный случай: устой- чивое положение равновесия, вокруг него неустойчивый цикл Ci, а вокруг него — еще один, но устойчивый цикл С2. Пре- дельных режимов здесь два: по- ложение равновесия (х0А, хов) и периодический режим, соот- ветствующий циклу С2. К пер- вому предельному режиму чис- ленности т3А, гщв приближают- ся, если начальные условия находятся внутри цикла С} (заштрихованная область на рис. 6.27); ко второму — если вначале точка (т/, т}в) находилась вне цикла Конечно, может оказаться, что некоторые из перечисленных слу- чаев, при определенных ограничениях на вид функции h(x) (например, для ограниченной функции h(x)) невозможны. Но, во всяком случае, картина предельного поведения решений не всегда будет одна и та же, и для нахождения предельных режимов необходимо исследование системы (5.9) при конкретных значениях входящих в нее числовых параметров и конкретном виде функции h(x). 326
Пример. В условиях рассмотренной выше задачи функция h(x), задающая относительный прирост численности хищников в единицу времени в зависимости от числа травоядных, имеет вид: h (х) = 1-----------; 2000 ф х константы I и х0А равны соответственно 0,001 и 1000. При этом урав- нения динамики средних (5.9) примут следующий вид: dmtA _ dt ~ dm^ _ dt 3 1-------------- (5.10) tn^, 2000 Ч-т!® J Заметим, что хов («критическое» число животных вида В, при кото- ром животные вида А в среднем не размножаются и не вымирают), в дан- ном случае также равно 1000. Решая численно систему (5.10) при различных начальных усло- виях, убеждаемся, что здесь имеет место случай, изображенный на рис. 6.26: существует неустойчивое положение равновесия (1000, 1000) и один цикл, причем устойчивый. Этот цикл и будет играть роль предельного режима, для любых начальных условий. Как показывают вычисления, период этого предельного режима будет приближенно равен 10,8 единиц времени; изменение средних численностей видов А и В в течение этого периода представлено в табл. 5.1, а графически — на рис. 6.28 и 6.29. В качестве начала отсчета времени взят момент наименьшей численности травоядных животных. На рис. 6.28 представлена зависимость средних численностей хищ- ников (т^) и травоядных (nijB) от времени /; на рис. 6.29 показан устойчивый предельный цикл. Цикл размечен по времени; деления соответствуют t = 1,2, .... 10. При t = 10,8 (период цикла) /и/ и возвращаются к первоначальным значениям. »87
Таблица 5.1 Время t 0 1 2 3 4 5 6 7 8 9 10 10,8 Средняя числен- ность хищников т1 1000 790 670 620 650 750 960 1270 1540 1490 1210 1000 Средняя числен- ность травояд ных 450 500 650 930 1310 1810 2170 1950 1200 670 480 450 Анализируя данные, приведенные в табл. 5.1, мы видим, что вна- чале, когда число травоядных мало (в среднем 450), хищники голодают, их число уменьшается, и поэтому число травоядных начинает расти. К тому моменту, когда число травоядных достигает 1000 (это происхо- дит немного больше, чем через 3 единицы времени от начала цикла), среднее число хищников достига- ет своего минимума (около 620). После того, как травоядных становится более 1000, число хищников опять начинает расти и снова достигает 1000 немного позже t = 6. Число травоядных в это время достигает максиму- ма (2170 или немного боль- ше), а потом снова начинает убы- вать, потому что число хищников больше критического 1000. Затем (при t между 8 и 9) число хищ- ников достигает максимума, рав- ного приблизительно 1550, а число травоядных в это время равно критическому 1000. На последнем участке цикла (до момента t — 10,8) убывает и 328
число травоядных (потому что число хищников превосходит 1000), и число хищников (потому что травоядных меньше 1000). В конце периода, при t — 10,8, число хищников опять достигает критиче- ского значения 1000, а число травоядных возвращается к своему наименьшему значению 450. Любопытно, что в природе действительно встречаются такие пе- риодические изменения численностей связанных друг с другом видов. 6. УРАВНЕНИЯ ДИНАМИКИ БОЯ (МОДЕЛЬ А) Метод динамики средних может быть с успехом применен для при- ближенного описания процессов боевых действий, в которых участвуют многочисленные группы тех или других элементов (танки, корабли, са- молеты и т. п.). Более того, именно описание процессов боевых дейст- вий («динамики боя») — одно из первых по времени применений метода динамики средних. Дифференциальные уравнения, описывающие из- менение численностей борющихся групп в процессе боя, под названием «уравнений Ланчестера», появились еще во времена первой мировой войны. Правда, область их применения была тогда очень узка (всего две-три модели), а связь метода с марковскими случайными процессами не установлена. В настоящее время метод динамики средних получил широкое развитие и представляет собой хорошо разработанный и весь- ма гибкий аппарат, позволяющий описывать самые разнообразные боевые ситуации (см. например, [1, 11, 13, 23]). Здесь мы рассмотрим только немногие из задач динамики боя, пре- имущественно под методическим углом зрения, не останавливаясь под- робно на количественной стороне зависимостей. Мы будем рассматривать боевые ситуации, в которых сталкивают- ся группировки, состоящие из большого количества элементов, кото- рые мы будем называть «боевыми единицами» (самолеты, танки, кораб- ли, ракетные установки и т. д.) Кроме боевых единиц, в некоторых мо- делях будут участвовать «вспомогательные единицы» (радиолокацион- ные станции, разведчики, ложные цели и т. д.), отличие которых от боевых единиц — в том, что они не могут сами вести огонь по объектам противника, выполняя различные обеспечивающие задачи. Строя математическую модель, мы будем рассматривать описы- ваемые явления в рамках марковских случайных цепей (с вытекающим из них методом динамики средних). Поэтому мы всегда будем предпо- лагать, что каждая боевая единица производит пуассоновский поток выстрелов с некоторой интенсивностью X, которая мо- жет быть как постоянной, так и переменной, зависящей от времени. При расчете этой интенсивности необходимо принимать во внимание не просто «скорострельность» боевой единицы, а ее фактическую сред- нюю скорострельность, с учетом времени, потребного на расчет прицельных данных, прицеливание, перезаряжание и проч. Если стрельба боевой единицы ведется по однородным целям, каж- дая из которых в результате выстрела по ней может быть только «по- ражена» или «не поражена» («поражение» означает выход из строя), то 829
удобно вместо скорострельности К пользоваться эффективной скорострельностью 1* = Хр, где р — вероятность поражения единицы направленным по ней выстре- лом. Величина V представляет собой не что иное, как интенсивность потока «успешных» (поражающих ) выстрелов, производимого одной боевой единицей. Расчеты показывают, что при рассмотрении динамики боя много- численных групп допущение о пуассоновском характере потока выстре- лов (или успешных выстрелов) не искажает сколько-нибудь серьезно картину явления. Кроме того, надо учитывать, что задача метода ди- намики средних — создание не подробной и точной, а грубо прибли- женной модели боя. Рис. 6.31 Рис. 6.30 Рассмотрим сначала следующую простейшую модель боя — назо- вем ее «моделью А». В бое принимают участие две группировки: К (Красные) и С (Синие) (рис. 6.30). Будем отмечать параметры, относя- щиеся к Красным и Синим верхними индексами «К» и «С». В составе группировки К имеется -однородных боевых единиц (самолетов, танков, кораблей), в составе группировки С — /Vе боевых единиц, од- нородных между собой, но не обязательно однородных с боевыми еди- ницами Красных. Эффективная скорострельность одной боевой еди- ницы Красных равна А,к, Синих — Xе. Относительно организации боя мы примем следующие предположе- ния. 1. Каждая боевая единица Красных может вести огонь по каждой боевой единице Синих, и наоборот. 2. Огонь является прицельным, т. е. направляется по вполне оп- ределенной боевой единице; одним выстрелом нельзя поразить более одной единицы. 3. Обстрелу подвергается с одинаковой вероятностью любая из еще не пораженных единиц; после поражения единицы огонь по ней пре- кращается и немедленно переносится на другую, еще не пораженную. 4. Пораженная единица прекращает стрельбу и в дальнейших бое- вых действиях не участвует. Таким образом, в нашей простейшей модели каждая боевая еди- ница может быть в одном из двух состояний: «не поражена» (и, значит, 830
ведет огонь) и «поражена» (прекратила огонь). Граф состояний элементов системы, разделенный на два подграфа К и С, показан на рис. 6.31. Буквами Х12к, ^12с обозначены интенсивности потоков событий, пере- водящих элемент (боевую единицу) из состояния в состояние. Обозначим, как всегда, Х1К = Х1К(О; Х2к-Х2к(0; *ic = *?(/); Х2С = Х2СЮ численности состояний Кх, К2, Сх, С2 в момент времени I. Через т^, тгк, т2С будем обозначать соответствующие средние чис- ленности. Очевидно, в рассматриваемом случае интенсивности 2i12k, Х12с ме- няются со временем и зависят от численностей состояний (количества стреляющих единиц). Определим эти интенсивности. Будем рассуждать следующим образом. Каждая боевая единица Синих производит в еди- ницу времени Xе успешных выстрелов. В момент t стреляет Xj боевых единиц Синих; все вместе в единицу времени они дают в среднем WXf успешных выстрелов. Эти выстрелы распределяются равномерно меж- ду всеми сохранившимися к данному моменту боевыми единицами Крас- ных, так что на каждую из них приходится в среднем успешных выстрелов. Но это еще не все: интенсивность (6.1) надо умно- жить на функцию 7?(Х\К) (см. формулу (4.4) § 4), которая обращается в нуль при Ххк = 0 (если в момент t у Красных не сохранилось ни одной боевой единицы, Синим попросту не по кому будет стрелять). Учитывая, что = Р(Х) (см. формулу (4.5) § 4), получим ^2 = ГХ1Р(Х1). (6.2) Аналогично находим = (6.3) Зная эти интенсивности и пользуясь принципом квазирегулярно- сти, можно на основе графа (см. рис. 6.31) сразу написать уравнения динамики средних: dm^ ~~dt~ dm-f dt —Xе — Хк т/ R (nil). (6.4) Уравнений для m2K, m2c не пишем, так как для любого t тгк + так = Хк; тГН-Щ2с —№. 831
Заметим, что, как правило, нас и не интересуют численности уничтоженных единиц тгк, т2°, так как активного участия в боевых действиях они не принимают. Решать уравнения (6.4) можно при любых начальных условиях; обычно пблагают, что в начальный момент все единицы целы: t — 0; = NK, nil = №• Обратим внимание на то, что в начальных стадиях боя, далеких от стадии «истощения», среднее число элементов в состояниях Къ С\ больше единицы, значения функций 7?(miK) = 7?(/П1с) = 1, и вместо уравнений (6.4) можно записать: Рис. 6.32 ___ ус т с ------= —л tn, , dt 4mlC ‘)К к --------------= ------------л /72, . dt------------1 (6-5) Уравнения (6.5) известны в ли- тературе как уравнения Ланчестера 2-го рода. Следует отметить, что такие урав- нения, даже в более точной форме (6.4), пригодны для описания дина- мики боя только на начальных его стадиях, когда средние числен- ности обеих группировок еще не малы по сравнению с их начальны- ми численностями, а в далеко зашедщих стадиях боя (стадия «исто- щения») перестают быть пригодными даже приближенно*'. Заметим, что, в отличие от уравнений (6.4), уравнения (6.5) линейны, что представляет существенное преимущество при их решении. При выводе уравнений (6.4), (6.5) мы никак не оговаривали, по- стоянны или переменны эффективные скорострельности X11, Xе — урав- нения справедливы как в том, так и в другом случае. Однако, при по- стоянных эффективных скорострельностях (Хк = const, Xе — const) уравнения (6.5) удается проинтегрировать в явном виде. Опуская эле- ментарные преобразования, приведем прямо окончательный результат: m1K = lVKch jAKZc/ — АЛ1/ 3ish ]АКУ/, (6.6) где chx (е*-)-е~*), shx = -i-(ex—е-х)—гиперболические функции. Кривые щ1к(0, /П1с(0 имеют разный вид в зависимости от первона- чального соотношения сил Л?к/Л/С и соотношения эффективных скоро- *) Об оценке ошибок, связанных сдринцнпом квазирегулярности, см. далее, § 13. 332
стрельностей Кк/Кс. Например, на рис. 6.32 показан случай, когда в начале боя Синие имеют количественное преимущество над Крас- ными (№ > Мк), а в ходе боя Красные побеждают, благодаря большей эффективной скорострельности (Хк > Xе). Обратим внимание на то, что кривая /П1с(0 (численность побеждаемой стороны) подходит к оси абсцисс под углом и при продолжении пересекла бы ее, т. е. средняя численность побеждаемой стороны стала бы отрицательной, что, ра- зумеется, невозможно. Это происходит потому, что для конечных ста- дий боя, когда сторона С близка к состоянию истощения, уравнения (6.5), как мы уже говорили, перестают быть применимыми. Если бы мы решали не уравнения (6.5), а более точные уравнения (6.4), кривая /П|с(0 плавно приближалась бы к оси Ot. Анализируя решение уравнений Ланчестера (6.6), можно просле- дить, как влияют на это решение условия боя (параметры NK, №, Хк и Xе). Для этого разделим уравнения (6.6) на № и № и перейдем к от- носительным количествам сохранившихся боевых единиц в момент t: p/ = ch УХ“ХЧ - |/ ^sh /VX4 = ch V VXC t - sh /FXe t. (6.7) Из формул (6.7) видно, что убывание численностей каждой из сто- рон в большей мере зависит от соотношения сил №/Мк, чем от соотно- шения эффективных скорострельностей Хе/Хк (первое отношение входит в формулы (6.7) непосредственно, а второе — под знаком корня). Это вполне объяснимо: действительно, при той организации боя, которая принята в нашей модели А (стрельба ведется только по непораженным единицам) Красным выгоднее, например, вдвое увеличить число еди- ниц Ак, чем вдвое увеличить эффективную скорострельность каждой Хк: на поражение двух единиц противник вынужден истратить вдвое больше средств, чем на поражение одной. Более подробный анализ решения уравнений Ланчестера 2-го ро- да не входит в наши задачи; интересующегося читателя можно отослать к руководствам [11, 13, 23]. 7. УЧЕТ ПОПОЛНЕНИЯ СИЛ, УПРЕЖДАЮЩЕГО УДАРА, ТЕМПА МОБИЛИЗАЦИИ И ПРОЧИХ ФАКТОРОВ В УРАВНЕНИЯХ ДИНАМИКИ БОЯ В уравнениях динамики боя можно очень просто учесть различные факторы, относящиеся к организации боевых действий, как то: — ввод резервов (пополнение сил), — упреждающий удар одной из сторон; — темп мобилизации боевых средств, — истощение боезапаса И т. д. 833
Покажем, как это можно сделать. Пусть в процессе боя каждая из сторон вводит в действие резервы в количестве бк боевых единиц в еди- ницу времени (для красных) и 6е — для синих. Мы уже умеем (см. § 3) учитывать в уравнениях динамики средних пополнение состава эле- ментов извне. В данном случае ввод резервов учтется с помощью доба- вочного слагаемого в правой части каждого уравнения динамики боя: dzntK dt dm^ dt —Xе 4-бк, (7.1) Величины бк, 6е могут быть как постоянными, так и перемен- ными, как зависящими, так и не зависящими от средних численностей сторон. Решая эти уравнения и анализируя ход изменения чи- сленностей сторон (рис. 6.33), можно сделать заключение о ра- циональном темпе ввода резер- вов, сроке его начала и оконча- ния. В уравнениях динамики боя можно учесть не только попол- нение сил, нои ряд других фак- торов: упреждающий удар, темп мобилизации, истощение налич- ного ресурса боеприпасов и его восстановление и т. д. Для всего это- го достаточно полагать в уравнениях динамики боя эффективные скорострельности Хк, Xе не постоянными, а меняющимися по опреде- ленному закону: V = XK(0; XC = V(/). Пусть, например, Красные наносят Синим упреждающий удар в какой-то момент t = 0, а Синие, застигнутые врасплох, не отвечают никаким противодействием до момента t = т, в который они вводят в действие все свои силы. Тогда в уравнениях динамики боя dmlK _ у ст с dt 1 ’ dmic _ dt 1 (7.2) нужно полагать величину Хс(/) равной нулю до момента t = т и по- стоянной (равной Xе = const) при t > т (рис. 6.34). Так будет обстоять дело, если сторона, подвергашаяся упреж- дающему удару, совсем не отвечает противнику огнем до момента т, а в момент т сразу вводит в бой все свои силы. Естественнее предположить, что Синие, подвергшись нападению, начнут постепенно мобилизовы* 234
вать и вводить в действие свои силы. Это можно учесть опять-таки вве- дением некоторой переменной эффективной скорострельности: /.с (/) =ХС <р (/), где № — номинальная эффективная скорострельность, которая будет достигнута после окончания мобилизации; ф(/) — некоторая возрастаю- щая от 0 до 1 функция (рис. 6.35). Решая уравнения динамики боя при определенном виде функции ф(0, можно учесть влияние темпа моби- лизации на ход и исход боя. С первого взгляда может показаться, что учет мобилизации сил должен производиться теми же методами, что и учет ввода резервов; но это не так. Неотмобилизованные к моменту т силы находятся на тер- ритории, подвергаемой огню противника, еще не войдя в действие; све- жие силы -(резервы) начинают подвергаться огню только с момента ввода. Поэтому мобилизация и ввод резервов учитываются по-разному: первая— переменной скорострельностью, а второй — добавочным чле- ном в правой части уравнения. По аналогичной методике можно учесть в уравнениях динамики боя и ограниченность боезапаса. Предположим, сначала, что боезапас каждой боевой единицы жестко с нею связан (не может передаваться другим) и уничтожается вместе с боевой единицей при ее поражении. Пусть боезапас каждой боевой единицы Красных рассчитан на время тк, а Синих — на тс. Очевидно, тк==/гк/2.ок; тс = тос, где kK — запас снарядов, имеющийся у каждой боевой единицы Крас- ных, kc — соответствующий запас Синих, 2.0к(Х0с) — средние скоро- стрельности (не эффективные!) одной боевой единицы Красных (Синих). Чтобы учесть ограниченность боезапаса, достаточно положить после момента тк для Красных и т° для Синих эффективные скорост- рельности равными нулю: ' /,к=0 при />тк; Xе = 0 при t > тс. Несколько иначе будет учитываться ограниченность боезапаса, если имеется общий для всех единиц склад боепитания, надежно защи- щенный от огня противника и снабжающий боеприпасами все единицы. 335
Пусть склад боепитания красных имеет запас LK снарядов, Синих — Lc снарядов, распределяемый равномерно между всеми непораженными единицами (задержками в доставке боеприпасов пренебрегаем). Найдем время тк, на которое хватит боеприпасов Красным. В еди- ницу времени Красные расходуют в среднем Хок снарядов; к моменту t будет израсходовано в среднем t Мк(/) = (7.3) о Момент тк прекращения огня Красными вследствие нехватки бое- припасов может быть определен из уравнения: гк Л4к(тк) = jmiK?.0Kd/ = Z.K. (7.4) о Практически величину тк можно найти заодно с решением уравне- ний динамики боя, вычисляя для каждого Iх интеграл (7.3) и останавли- вая расчет в тот момент, когда он достиг значения LK (боезапас Красных кончился) или соответствующий интеграл для Синих достиг значения Lc (боезапас Синих кончился). После окончания боезапаса одной из сторон бой становится односторонним (эффективная скорострель- ность другой стороны равна нулю); после окончания боезапаса обеих сторон бой прекращается вообще. Не представляет труда учесть в уравнениях динамики боя и такой фактор, как подвоз боеприпасов. Предлагаем читателю построить такую модель самостоятельно. 8. МОДЕЛЬ Б. СЛУЧАЙ ОТСУТСТВИЯ ПЕРЕНОСА ОГНЯ Уравнения, выведенные в § 6 и обобщенные в § 7, описывают та- кую модель боя (модель А), в которой стрельба ведется только по непо- раженным целям и перенос огня с пораженной единицы на другую, не- пораженную, осуществляется мгновенно. При этом предполагается, что в распоряжении каждой стороны имеется точная информация о том, какие цели поражены, а какие нет, а время, необходимое для учета этой информации, пренебрежимо мало. Таким образом, модель А пред- ставляет собой модель высокоорганизованного боя с полной и незапаздывающей информацией о состоянии противника и мгновенной передачей этой информации по звеньям системы управления. Представляет интерес рассмотреть противоположный крайний случай плохо организованного боя, где информация о состоянии про- тивника не поступает и переноса огня не производится. Назовем такую модель боя «моделью Б». Рассмотрим снова две группировки: К (красные) и С (Синие) в со- ставе Ук и № боевых единиц с эффективными скорострельностями Хк и Xе. Схему организации боя примем следующую. 336
1. Каждая боевая единица Красных может вести огонь по каждой боевой единице Синих и наоборот. 2. Одним выстрелом поражается не более одной боевой единицы. 3. Пораженная боевая единица мгновенно перестает вести огонь. 4. Огонь всех сохранившихся боевых единиц распределяется рав- номерно между всеми боевыми единицами противника — как пора- женными, так и непораженными (перенос огня не производится). Рассмотрим граф состояний элементов системы, распадающийся на два подграфа «К» и «С» (см. рис. 6.31); внешне он ничем не отли- чается от графа модели А, но значения А12к, А12с будут уже другие. Подсчитаем интенсивность Х12к в момент t. Каждая непораженная боевая единица Синих производит поток успешных выстрелов с интен- сивностью Xе; число таких боевых единиц равно Х3С; общее среднее число успешных выстрелов в единицу времени надо разделить на число обстреливаемых целей — в нашем случае оно равно /Vй, так как обстреливаются все цели, и пораженные и непораженные. Зна- . „ A'XS у г ХКХ!К п чит, Л12к = —и аналогично А12с = . Пользуясь принципом квазирегулярности, запишем уравнения динамики боя в виде: drn^ dt А,с ------т,к т,с. 1 1 dm-f dt 7.» -----т,к т,е. № * 1 (8.1) Такой системой дифференциальных уравнений описывается изме- нение средних численностей состояний в модели боя Б, когда переноса огня с непораженных единиц на пораженные не производится. В отли- чие от уравнений Ланчестера 2-го рода (формулы (6.5) § 6), уравне- ния (8.1) не линейны. При постоянных интенсивностях потоков успешных выстрелов Хк — const, Ас = const эта система может быть решена в явном виде. Приведем, опуская про- межуточные выкладки (их можно найти, например, в [13]), только окончательный результат— решение системы (8.1): т /=М'<------------ «се-(«С-Л _иК ик — ис и.е-(М'_иС mf = Xе где ХК ЦК Х.С Д/с UK =---------, Uc =------------- Nc Л'к (8.2) (8.3) Модель Б (без переноса огня) отличается, по сравнению с моделью А, более затяжным, вялым развитием боя, преимущество одной 337
стороны над другой выражено слабее, убывание численностей проис- ходит медленнее. В условиях модели Б (так же как и А) могут быть, причем теми же методами, учтены дополнительные факторы: упреждающий удар, пополнение сил, мобилизация и т. п. 9. МОДЕЛЬ В. УЧЕТ ДЕЯТЕЛЬНОСТИ РАЗВЕДКИ И СИСТЕМЫ УПРАВЛЕНИЯ БОЕМ В § 6 и 8 мы рассмотрели два крайних случая организации боя: идеальную организацию (модель А) и плохую организацию (мо- дель Б). В реальной действительности дело обстоит не так хорошо, как в первом случае, но и не так плохо, как во втором. Перенос огня с пораженной единицы на непораженную произво- дится не мгновенно, как в модели А, но все же производится. В реальной действительности имеются задержки в переносе огня, связанные с запаздыванием получения информации о поражении цели, а также с немгновенной передачей этой информации по звеньям систе- мы управления боем. Однако эти задержки не столь велики, чтобы по- лучилась схема модели Б, с ее стрельбой «вслепую» по всем целям — как пораженным, так и непораженным. В данном параграфе мы построим обобщенную модель боя — мо- дель В, по отношению к которой ранее введенные модели А и Б яв- ляются частными случаями. В модели В учитываются такие факторы, как деятельность разведки и степень совершенства системы управ- ления боем. Рассмотрим следующую модель боя. Происходит бой двух группи- ровок: К (Красные) и С (Синие), состоящих каждая из однородных бое- вых единиц в количествах NK и №. Эффективная скорострельность одной боевой единицы Красных равна Хк, Синих — Xе. Каждая боевая единица Красных может находиться в следующих состояниях: Ко — не разведана, Ki — разведана, но еще не обстреливается, К2 — обстреливается, но еще не поражена, К3 — поражена, но это еще не обнаружено; обстрел продолжается, К4 — поражена, это обнаружено, но обстрел еще не снят, Ко — поражена, обстрел снят. Аналогичные состояния боевой единицы Синих обозначим Со, Сь С2, Сз, с4, с6. После того, как обстрел с пораженной единицы снят, огонь пере- носится на любую другую из разведанных единиц, находящихся под обстрелом, т. е. в состояниях со второго по четвертое. Граф состояний элементов системы, разделенный на два подграфа К и С, показан на рис. 6.36. Обозначим, как всегда, Хок, Х|к, ..., Х6К, Хос, Xf ,..., Х5С — численности состояний; ток, ..., тьк, tnoc, mf, .... тъс — соответ- 338
ствующие средние численности; лг/, — интенсивности потоков событий, переводящих боевую единицу Красных (Синих) из состояния в состояние. Определим эти интенсивности, начиная с A,OiK- Будем счи- тать, что переход боевой единицы Красных из состояния Ко (не разве- дана) в состояние Kj (разведана) происходит под действием потока успешных разведок Синих (под потоком успешных разведок понимается поток событий, состоящих в обнаружении еще не разве- данной единицы). Очевидно, эта интенсивность зависит от интен- сивности и успешности разведыва- тельных действий Синих (полеты разведывательной авиации, поиск разведывательных групп и т. д.). Обозначим интенсивность потока успешных разведок Синих, при- ходящуюся на каждую еще не раз- веданную боевую единицу Крас- ных, через Хразв; аналогичное обо- значение для интенсивности успеш. ных разведок Красных будет Х£азв. Таким образом находим интенсив- ности потоков событий, переводя- щих одну боевую единицу Крас- ных (аналогично — Синих) из со- стояния «не разведана» в состоя- ние «разведана, но еще не обст- реливается»; A.QI = ^-разв ; ^01 =^разв- (9.1) Заметим, что обе интенсивно- сти А01к, %01с могут быть как зави- симы, так и независимы от общего состояния, в котором находится рис группировка (т. е. от численно- стей состояний). Это обусловлено тем, действует ли разведка автоно- мно, или же разведывательные средства выделяются из состава самой группировки и таким образом переводятся из боевых единиц во вспо- могательные. Может оказаться также, что интенсивность потока успешных раз- ведок зависит от того, сколько осталось в составе группы противника неразведанных единиц. Таким образом, в зависимости от условий боя, параметры Х£азв и ?-разв могут тем или иным образом зависеть от средних численностей состояний или же не зависеть от них. Мы не бу- дем уточнять, какой из этих случаев имеет место, а просто обозначим ^-разв — интенсивность потока успешных разведок Синих, которую испытывает на себе каждая еще не разведанная боевая единица Крас- ных (^разв — наоборот). Для подсчета Х£азв нужно определить, сколько раз за единицу времени в районе данной (произвольно выб- 839
ранной) неразведанной боевой единицы Красных появляется развед- чик Синих (например, самолет разведывательной авиации), и умножить это число на вероятность того, что единица будет обнаружена развед- чиком (^разв находится так же). Найдем интенсивность потока событий, переводящих единицу из состояния Ki в Кг. Соответствующее событие состоит в том, что разве- данная единица ставится под обстрел. Интенсивность потока событий можно определить, как величину, обратную среднему време- ни задержки в постановке под обстрел разведан- ной боевой единицы Красных. Это время зависит от степени совершен- ства и быстродействия системы управления Синих; обозначим его ^Ост- Тогда Ь12 = Шпост. (9.2) Аналогично ^2 = 1/7пост. (9.3) Найдем интенсивность потока событий, переводящего боевую еди- ницу из состояния К2 (обстреливается, но еще не поражена) в состоя- ние К3 (поражена). Это поток успешных (поражающих) выстрелов Си- них, приходящийся на одну боевую единицу Красных, находящуюся в состоянии К2- Из чего складывается этот поток? Со стороны С участ- вуют в обстреле все единицы, находящиеся в состояниях Со, Cj, С2; их число равно Каждая из них делает Xе успешных выстрелов в единицу времени. Согласно условию, эти выстрелы равномерно распределяются между всеми боевыми единицами Красных, находящимися в состояниях К2, Кз, К4. Их число равно ^2К + V + ХЛ значит на каждую из них приходится поток успешных выстрелов с ин- тенсивностью WCc±Xi2±^) %2К+*зк+-V Эту интенсивность, как мы знаем, надо еще помножить на функ- цию /?(Х2К 4- Х3К -|- Х4К), обращающуюся в нуль, когда Х2К 4* 4- Х3К 4- Х4К = 0, т. е. нет единиц Красных, которые можно было бы обстрелять (см. формулу (4.4) § 4). Пользуясь обозначением =• = р(х) (см. формулу (4.6) § 4), получаем интенсивность потока собы- тий, переводящего боевую единицу Красных из состояния К2 в Кз! ЛЗз - Xе (Хс0 4- Х1 + Хг) • Р (Хг + Хз 4- Х4). (9.4) 940
Аналогично найдем интенсивность потока событий, переводящее боевую единицу Синих из состояния С2 в С3: *23 =*к (Х£ + + Х$ ур (Xl 4- Хс3 + XJ). (9.5) Определим интенсивность потока событий, переводящего единицу из состояния К3 в К4; это интенсивность потока успешных конт- рольных разведок Синих, доставляющих им сведения о поражении обстреливаемых единиц. В общем случае интенсивность потока кон- трольных разведок не совпадает с интенсивностью потока разведок, на- правленных на обнаружение новых целей; они даже могут осущест- вляться разными силами. Обозначим интенсивность потока контроль- ных разведок Синих *£Онт (эта величина может быть подсчитана, как обратная среднему времени, отделяющему момент поражения цели от момента обнаружения его контрольной разведкой). Имеем *34=*конт (9.6) и аналогично *34-*конт- (9.7) Интенсивности *конт, *конт могут быть как зависимы, так и не- зависимы от средних численностей состояний. Остается определить интенсивность потока событий, переводящего единицу из К4 в К6. Эту интенсивность можно считать величиной, об- ратной среднему времени передачи распоряжения о снятии огня с еди- ницы после того, как ее поражение зарегистрировано разведкой Си- них. Обозначим это среднее время t сН (аналогично для Красных /£н). Получим: *45 = 1/?сн, (9.8) *45 = 1/?сн- (9.9) Пользуясь графом состояний (рис. 6.36), интенсивностями (9.1)— (9.8) и применяя принцип квазирегулярности, запишем уравнения ди- намики боя в виде: 1 К , л С К ----== — ~1 + ^разв dt tс пост = — Xc(m0c + m1c4-m2c)p (m2K+ m3K+m4K) m2K+ dt 'пост — Хконт «3 + *e (шо + m1) 4-Мг) X at X Р (/Пг + m3 4- «“) m2> 341
) I > dm4 ~dT С сн .К , <1 с „к Ш4 -f- А'конт dmoc di — —Лразв^О» (9.10) 1 t dmic 1 с । лк с —— — — —-------fit 1 4~ Аразв Шо? di /К * пост 4г = — V (ток + т/ 4- m2K) р (т2с -Ь msc + m4c) m2c 4- dt f пост dm 3С А К С , а к ( к , к , к\чу —" ™конт Ш3 4~ ™ (^0 4“ I 4“ ^2/ X dt X р (ml + ms 4- ml) ml, dtnf __ dt ~ —“ т^ 4' ^конт т% tK сн Уравнения для m6K, т5с отброшены, так как для любого мо- мента t т6“ = NK-—(m0K 4-mf 4-m2K 4-m3K Н-ш4")> 1 m5c=№ —(moc4-m1c4-m2c4-m3c4-m4c). J ’ К тому же, как правило, нас не интересуют численности единиц, пора- женных и не обстреливаемых (и тем самым выбывших из числа как ак- тивных, так и пассивных элементов системы). Дифференциальные уравнения (9.10) при любых значениях вхо- дящих в них параметров могут быть решены численно (на машине или вручную). Начальные условия зависят от тактической ситуации, кото- рую требуется исследовать. Например, если к началу боевых действий какая-то доля боевых единиц уже разведана (ак для Красных и ас для Синих), то начальные условия будут: / = 0, m0K=(VK(l—а1); т1к=№<ак; т2" = т3к = m4K = т5к = 0; moc=/Vc(l—ас); mlc = Ncac; т2Г: = т3с = m4c = mJ = 0. Рассмотренная нами модель боя В является более общей, чем ра- нее рассмотренные модели А и Б, которые вытекают из модели В как частные случаи. Действительно, если считать в начальный момент все единицы разведанными, а время, необходимое для обнаружения факта пораже- ния цели и для передачи информации об этом по всем звеньям системы управления, равным нулю — получится модель А (при этом три пер- 342
вые состояния сольются в одно: «единица не поражена», и три послед- ние — тоже в одно: «единица поражена»). Модель Б получится, если также считать в начальный момент все единицы разведанными, но вре- мя, необходимое для получения и передачи информации, положить равным бесконечности. Уравнения модели В, включающие, кроме чисто боевых действий, .еще и разведывательные, а также учитывающие степень совершенст- ва системы управления боем, позволяют решать задачи, связанные как бы с «ценой информации» в процессе развития боевых действий. Заметим дополнительно, что в уравнениях модели В, как и для мо- делей А и Б, можно легко учесть все дополнительные факторы, сопро- вождающие боевые действия (упреждающий удар, пополнение сил, темп мобилизации и т. д.). 10. УЧЕТ ВОССТАНОВЛЕНИЯ ЕДИНИЦ В ХОДЕ БОЕВЫХ ДЕЙСТВИЙ До сих пор, рассматривая уравнения динамики боя, мы предпола- гали, что пораженная боевая единица окончательно выбывает из строя. Вообще говоря, это не всегда так. В случае, когда продолжительность боевых действий велика по сравнению со временем, потребным на ре- монт единицы, может возникнуть речь об учете восстановле- ния единиц в ходе боевых дейст- вий. Та же задача возникает и в случаях, когда боевая деятель- ность единицы при ее «поражении» прекращается лишь временно (на- пример, из-за воздействия помех). Во всех этих случаях единица, временно выведенная из строя, может через некоторое (вообще го- воря, случайное) время снова вой- ти в строй. Учесть такое восстановление в к С Рис. 6.37 уравнениях динамики боя не пред- ставляет труда. Покажем, как это сделать, на простейшем примере, близком по схеме к модели А (в случае надобности аналогичным спо- собом можно учесть восстановление единиц в любой другой модели). Пусть в бою участвуют стороны К и С в составе NK и А'с боевых единиц; каждая из них может быть в одном из состояний: Ki (Ci) — функционирует нормально, К2 (С2) — повреждена, ремонтируется, К3 (С3) — поражена окончательно, ремонту не подлежит. Граф состояний, распадающийся на подграфы С и К, показан на рис. 6.37. Организация боя предполагается следующая. 343
1. Каждая боевая единица любой стороны может вести огонь по любой боевой единице противника. 2. Огонь прицельный, каждый выстрел может повредить только ту единицу, по которой направлен. 3. Огонь равномерно распределяется между всеми не окончатель- но пораженными единицами, как действующими, так и ремонтируе- мыми. 4. Поврежденная единица огня не ведет. 5. При окончательном поражении единицы огонь с нее немед- ленно снимается и переносится на другую, еще не пораженную. Все потоки событий, как всегда, будем считать пуассоновскими. Каждая боевая единица Красных производит поток выстрелов с ин- тенсивностью Хк, Синих — с интенсивностью Xе. Выстрел, направ- ленный по неповрежденной единице Красных, повреждает ее (перево- дит из Ki в К2) с вероятностью и окончательно поражает ее с ве- роятностью 3^. Выстрел, направленный по уже поврежденной еди- нице, поражает ее окончательно (переводит в состояние К3) с вероят- ностью в противном случае состояние единицы не меняется. Ана- логичные данные для боевой единицы Синих будут 3^, 3^, Среднее время ремонта (восстановления) поврежденной боевой единицы Красных равно /рем, Синих — /рем. Напишем уравнения динамики средних для такой системы. Вве- дем обычные обозначения численностей и средних численностей со- стояний: X? Х«, Хз, X?, Xt Х3С, т\, т^, т$, т^, т^, и выразим все интенсивности V через заданные параметры и численности состояний. Найдем интенсивность Х«2. Всего по стороне К в момент I стре- ляет XJ единиц Синих; каждая из них производит, в среднем, Xе вы- стрелов в единицу времени (в данном случае просто «выстрелов», а не «успешных выстрелов»). Эти выстрелы равномерно распределяются между всеми функционирующими и восстанавливаемыми единицами Красных. Обстрелянная неповрежденная единица с вероятностью 5^ повреждается, с вероятностью 3^ полностью выводится из строя. Очевидно, на каждую единицу в состоянии Ki приходится в единицу времени в среднем у xtK+x2« «повреждающих» выстрелов; эту интенсивность потока повреждающих выстрелов надо умножить на функцию + Х2К) (см. формулу (4.4) § 4), обращающуюся в нуль, когда нет ни одной единицы, которую можно обстреливать. Получим: «К А<с X 1е 2К rj , V к J у кх /1 Л K'2 = ~VTZVTR )’ (юл) Aik+X2k 344
где поправочный множитель ^?(Х,К + Х2К) для начальных стадий боя можно не учитывать (полагать равным единице). Аналогично получим интенсивность потока событий, переводящих единицу Красных из со- стояния Ki в К3 (поражена полностью): =-^^7 R (10'2> Х1к + Х2х Интенсивность потока событий, переводящего единицу Красных из К2 в К3: ^23 =—R (*!к + Х'Я- (Ю.З) Наконец, величина интенсивности потока событий (восстановле- ний), переводящего единицу из К2 в Кь обратна среднему времени ремонта: к 21 1 7к рем (Ю.4) Переходя в выражениях интенсивностей от функции R(x) к функ- . . R(x) ции р(х) = , получим: X.2I = 1 //рем> xt2=kcx^K2 кЪ=х,хс1Гз р(хихк9), р(х^х^), и аналогично для Синих: Й.21 — 1/^р-м > Х?2 = ХК хч F2p(X^+X§), ^з=г Xf/3p(X^4 ^з = ГХЖр(Х? + Х£). (10.5) (10.6) С учетом графа рис. 6.37 и интенсивностей (10.5), (10.6), пользуясь принципом квазирегулярности, напишем систему уравнений дина- 345
мики боя с восстановлением единиц: = —к- tnf (SP2K + 5%к) Р ("4“ + «V) miK + at + ^—т2к, (реи =--= —т2“—Xе mf @3К р (mf +«*) иг* 4- ас fK рем 4- Xе mjc 5%K р (т/ 4- m2K) т/, - V (3V + 3%с) р (mf + m2c) mf + ас -~—гп2с, ^рем —т2с—^К«1К @зс р(т!с+т2с) т2с+ /с рем 4- Хк SP2С р (Wjc 4“ nz2c) (10.7) dm<f dt Что касается т3к, т3с, то для любого момента t m3K =NK — (mf 4- m2K), m3c =№—(«!<: 4-m2c); к тому же, эти состояния нас, как правило, не интересуют. Система нелинейных дифференциальных уравнений (10.7) для лю- бых конкретных значений входящих в нее параметров может быть ре- шена численно (на машине или вручную). Начальные условия, как всегда, задаются исходя из тактических соображений. Например, если нас интересует поведение системы в ближайшее время после открытия боевых действий, то можно принять начальные условия: / = 0; m1K=№<; m2K = m3K = 0, /71^=^; m2c=m3c=0. Однако нас может заинтересовать и способность той или другой сторо- ны «выбираться» из трудного положения, когда в начальный момент значительное количество ее единиц повреждено. Отметим, что для начальных стадий боя, i огда средние чис- ленности неповрежденных и ремонтируемых единиц /п/4-/п2к, щ1с4-т2сеще достаточно велики, поправочные множители R (mLKJrm2K), R (mic + m2c) обращаются в единицу, а значит, р(т1к4-т2к) можно заменить на \!(т^ 4-m2K), а р (tnf 4- m2c) на llf/nf 4-т2с). При решении задачи мы для простоты предполагали, что огонь распределяется равномерно между всеми не окончательно по- раженными единицами — как поврежденными, так и неповрежденными. Однако это вовсе не обязательно: легко учесть и неравномер- ное распределение огня между теми и другими. Для этого достаточ- но умножить соответствующие интенсивности потоков выстрелов на 346
какие-то коэффициенты, большие единицы для тех элементов, которые обстреливаются предпочтительно, и меньшие единицы — для осталь- ных; эти коэффициенты могут быть как постоянными, так и перемен ными. С методикой учета неравномерности распределения огня мы по- знакомимся в следующем параграфе. 11. УРАВНЕНИЯ ДИНАМИКИ БОЯ ДЛЯ НЕОДНОРОДНЫХ ЕДИНИЦ. ФУНКЦИИ РАСПРЕДЕЛЕНИЯ ОГНЯ До сих пор мы рассматривали только группировки, состоящие из однородных боевых единиц. Не представляет труда написать уравне- ния динамики боя и для случая, когда боевые единицы, входящие в группировку, неоднородны. Продемонстрируем это снова на примере простейшей модели, близкой по форме организации к модели А, но от- личающейся от нее разнородностью единиц. Рис. 6.38 Пусть происходит бой между двумя группировками К и С, причем группировка К состоит из неоднородных боевых единиц типов k и х, а группировка С — из неоднородных боевых единиц типов сиу (рлс. 6.38). Количество боевых единиц каждого типа равно соответст- венно Nk, Nv-, Nc, Nv. Каждая боевая единица может быть в одном из двух состояний: не поражена, поражена. Стрельба ведется только по непораженным единицам (получение и учет информации мгновенны, как в модели А). Граф состояний единицы показан на рис. 6.39 — он распадается на четыре подграфа: k и х, с и у (по числу типов единиц). Как обычно обозначим численности состояний и средние численности состояний соответственно X/, X2ft, X/, Х2*, ХЛ Х2°, Xtv, X2v, тД m2*, mxK, m2K, mf, m2c, m^, tn^. Чтобы определить интенсивности потоков событий, переводящих единицы из состояния в состояние, нужно задаться каким-то п р а в и- 347
лом распределения огня между единицами различных типов. Это правило будет предписывать в каждый момент времени t какую-то долю имеющихся в нашем распоряжении боевых средств каждого типа направлять по единицам противника первого типа, а все остальные — по единицам второго типа. Введем обозначение для функций, описывающих это распределе- ние (условимся тип стреляющей единицы ставить у буквы первым ин- дексом, а обстреливаемой — вторым). Введем обозначения: c(t) — Доля непораженных боевых единиц типа k, огонь кото- рых в момент t направляется по боевым единицам типа с, ak, — доля непораженных боевых единиц типа k, огонь которых в момент t направляется по боевым единицам типа у. эе к Не поражена Поражена Рис. 6.39 Очевидно, что так как в любой момент времени огонь ведут все способные к этому единицы, = 1—(/)• Аналогично обозначим ac,k(t), av,*(0 долю непораженных боевых единиц типов х, с, у соответственно, огонь которых в момент t направляется по единицам типов с, k, k соответст- венно, и назовем четыре функции &k,c (t), 0Си f (/), (0> ^v,fe(0 функциями распределения огня. Кроме функций распределения огня, надо задаться также характе- ристиками эффективности огня различных единиц по различным целям. Обозначим: Хк, №, Xе, X? (Ц.1) интенсивности потоков выстрелов соответствующих боевых единиц. Кроме того, обозначим: ff'k,с—вероятность поражения боевой единицы типа с при одном выстреле по ней боевой единицы типа k, 348
Фь.?, &V..V, S^c,k\ Фг.и, 5\,а; 5%, x —аналогично. В этих обозначениях снова индекс стреляющей единицы—слева, обстреливаемой—сп рава. Умножая интенсивности потоков выстрелов на соответствующие вероятности поражения, получим эффективные скорострельности: . v — Ак 9^k, vl , с — Ак 9^ k, с', Ах. с — А* ,k — hc 9J c,k', ^.k = №9\.k-, Ax, v — Ax X , V,' Ac,z =^c9^ c,nj Ay, x — № &v> z, (H.2) Теперь можно найти интенсивности всех потоков событий для гра- фа рис. 6.39. Определим А12*. Для этого найдем среднее число успешных вы- стрелов, приходящееся на одну боевую единицу типа k за единицу вре- мени. Всего по единицам типа k за единицу времени приходится <%с,k^c,k X-l ~Ь , A Ay. k Xjv успешных выстрелов. Это число надо разделить на число X/ боевых единиц в состоянии и умножить на поправочный множитель 7?(X/). Отсюда, переходя от функции /?(х) к функции р(х) = , получим: а% = (ас,А Ас>а X® 4* av,A Av,& ХУ) p(Xf). (П.З) Аналогично А*2 = 1 («с.х Ас,х Xj 4-aViZ Av>z Xj) р(Х*), (11-4) A'js = (aA.AA,cXUax.,Az.fXr)p(xO, (П.5) А?2 = (cxa. v А^>т Xj -|-aziVAz>vXi) p(xy). (11-6) Эти выражения можно несколько упростить, если объединить функции распределения огня с эффективными скорострельностями и обозначить: Рй, Г — &k,C Рх , С = ®Х ,С Az ,с, Pc,A —^c,k ^c,k> Pv.A = ®v, А А-p,ft, (11.7) Вновь введенные функции (11-7) можно назвать функция- ми распределения эффективности. С учетом этих обозначений и формул (11.2) — (11.6) можно записать дифференциаль- ные уравнения для средних численностей состояний (уравнения дина- мики боя) в виде: 349
= —(₽г.*т/ +₽v * «V) /?(«/). dt dt == — (₽4, c mvk + Px, e nilx) R (mf), dt = — (3*,vmt* + Px.vmi'z) (П.8) Средние численности остальных состояний (обычно нас не инте- ресующие) могут быть найдены из условий: m«k —Nk—ntik-. nu*~NK— т.и; ) ) /11 94 tnic = Nc—mlc-, mJ = №—т^. J v ’ Заметим, что уравнения (11.8) для начальных стадий боя, когда поправочные множители /?(т/), R(mJ), R(mJ), Rimy) равны единице, являются линейными уравнениями (в общем случае с перемен- ными коэффициентами). Решение подобных уравнений (на машине или вручную) затруднений не представляет. Отметим, что, пользуясь подобными уравнениями (число разно- родных элементов в которых легко увеличить), можно не только при- ближенно описывать ход боевых действий при заданных функциях распределения огня, но и оптимизировать управление боем, т. е. на- ходить наивыгоднейший вид этих функций. В заключение заметим, что в уравнениях подобного типа можно рассматривать динамику изменения численностей не только боевых единиц, но и любых вспомогательных (радиолокационные станции, транспортные средства и т. п.). Разумеется, для всех таких единиц нужно полагать эффективные скорострельности равными нулю. 12. УРАВНЕНИЯ СМЕШАННОГО ТИПА До сих пор мы описывали процессы, протекающие в физических, системах, либо с помощью уравнений для вероятностей состояний (см. гл. 4 и 5), либо с помощью уравнений динамики средних (гл. 6), где неизвестными функциями являются средние численности состояний. Уравнения первого типа применялись тогда, когда система была срав- нительно проста и ее состояния — сравнительно немногочисленны. Уравнения второго типа были специально предназначены для описа ния процессов, происходящих в системах, состоящих из многочислен- ных элементов; для таких систем нам удавалось найти не вероятности состояний, а, в первую очередь, средние численности состояний. На практике встречаются ситуации, в которых приходится приме- нять уравнения смешанного типа. В этих уравнениях фигурируют как вероятности состояний, так и средние численности 350
состояний. Такой аппарат применяется, когда система S, в которой происходит процесс, состоит из элементов разного типа: немногочис- ленных (уникальных) и многочисленных (сопутствующих), причем со- стояния тех и других взаимообусловлены. В подобных случаях для элементов первого типа можно составить дифференциальные уравнения, в которых неизвестными функциями являются вероятности состояний; для элементов же второго типа — уравнения динамики средних, где неизвестные функции — средние численности состояний. Такие уравнения мы будем называть урав- нениями смешанного типа. В качестве примера рассмотрим систему S, состоящую из большо- го количества N однородных приборов (элементов) и одного стабили- затора напряжения С, который выполняет важную функцию обеспече- ния нормального режима работы всех приборов сразу. Как стабили- затор, так и отдельные приборы могут выходить из строя (отказывать). Интенсивность потока неисправностей стабилизатора зависит от числа х работающих приборов: Хе = ср(х). (12.1) Вышедший из строя стабилизатор немедленно начинает ремонти- роваться; среднее время ремонта стабилизатора зависит от числа одно- временно с ним находящихся в ремонте приборов у, (12.2) Интенсивность потока неиспрабностей каждого прибора при ра- ботающем стабилизаторе равна рс, при неработающем — р-. Отказав- ший прибор немедленно начинает ремонтироваться; среднее время ре- монта прибора зависит от того, ремонтируется ли стабилизатор и сколь- ко приборов ремонтируется одновременно. При не ремонтируемом ста- билизаторе это время равно fc(y), при ремонтируемом — f- (у), где у — число одновременно ремонтируемых приборов, a fa, f- — некоторые функции. Требуется описать процесс, протекающий в системе, с помощью уравнений смешанного типа, в которых неизвестными функциями будут: — вероятности состояний (для стабилизатора), — средние численности состояний (для приборов). Методика составления таких уравнений отличается от уже извест- ной нам методики составления уравнений динамики средних. В самом деле, при составлении уравнений для средних численностей состояний мы пользовались принципом квазирегулярности, основываясь на том, что значения случайной величины Xt — численности г-го состояния — близки к своему среднему значению mh группируются вокруг этого среднего значения. При наличии в системе «уникального» элемента уже нет оснований считать, что это так. В этом случае типичной будет дру- гая ситуация, когда распределение численностей состояний вспомога- тельного элемента имеет двухвершинный вид, как, например, показано на рис. 6.40. По оси абсцисс откладываются численности какого-то 351
состояния вспомогательного элемента, а по оси ординат — соответст- вующие вероятности. Если конкретно речь идет о численности Хх работающих элементов, то правая группа значения (см. рис 6.40) соответствует работе системы при исправном стабилиза- торе, а левая — при неисправном (разумеется, считая, что работа ста- билизатора благоприятна для приборов). Если распределение таково, как на рис. 6.40,’ то случайная величина иногда будет близка к сред- нему значению левой группы, иногда — к среднему правой группы, но практически никогда не будет близка к «полному» среднему значе- нию случайной величины, которое лежит где-то между обеимй груп- пами. В таких случаях принцип квазирегулярности неприменим. Посмотрим, нельзя ли чем-нибудь заменить этот принцип, чтобы все-таки решить поставленную задачу? Оказывается, можно, Действи- тельно, то, что мы довольно неопределенно называли «средним значе- М Рис. 6.40 нием одной группы» (в случае, когда распределение группируется в двух местах на отрезке от 0 до N) — это не что иное, как услов- ное математическое ожидание случайной величины Xi при условии, что стабилизатор работает — для одной группы, или при условии, что стабилизатор не работает — для другой. Напомним, что такое условное математическое ожидание. Обыч- ное математическое ожидание случайной величины Хг (безусловное) определяется как сумма М [XJ = Т kph, (12.3) *=о где ръ — вероятность того, что случайная величина Хх примет значе- ние k: ph — P(Xl=k), (fe=0, 1.... N). (12.4) С учетом (12.4) формулу (12.3) можно переписать в виде: ,v M[Xil= ? fe-P(X1=fe). (12.5) 4=0 Рассмотрим теперь какое-нибудь случайное событие С (в примене- нии к нашему случаю — событие, состоящее в том, что стабилизатор работает). Определим условное математическое ожидание случайной величины Xj при условии события С, заменив в формуле (12.5) ве- роятности — условными вероятностями: N k-P(Xl=k/C), (12.6) .4=0 362
где P(X1—k/C) —условная вероятность того, что случайная величина X, примет значение k, при условии, что имеет место событие С. Аналогично напишется определение и для условных математичес- ких ожиданий MtX^'C], М[Х2/С], М[Х2/С1 (случайная величина Х2 — число приборов в состоянии ремонта, С — событие, состоящее в том, что стабилизатор ремонтируется). Преобразуем формулу (12.6) к другому виду. Для этого восполь- зуемся выражением для условной вероятности любого события А при условии, что событие С имеет место: Р(Л/С)==н^’ (12’7) Тогда формула (12.6) примет вид: tJ N М(Хх!С\ = ^kP(C,X^k). (12.8) 4=0 k=0 Здесь Р(С, Xv —k) означает вероятность того, что имеют место оба события; и С, и Хг = k (т. е. стабилизатор работает и случайная ве- личина Xt приняла значение k). Чтобы упростить выражение (12.8) введем новую случайную вели- чину: (Xi, если имеет место событие С, с__г 1 | 0, если событие С не имеет места. С помощью этой случайной величины Xf условное математичес- кое ожидание ЛДХ^С] запишется следующим образом: MlXJC] =-М[Х/]. (12.9) Цействительно, для /г#=0 Р(Х1с=/г)=Р(С, X^fe); поэтому математическое ожидание случайной величины Х^ запишет- ся как N М[Х/1 = 2 k-P(C, Xt=k) 4=1 или, учитывая, что член суммы, соответствующий k = 0, равен нулю, N М[Х^]^ 3 k-P (С, X^k). 4=0 Аналогично, вводя в рассмотрение случайные величины ( 0, если событие С имеет место, X с = \ х (Xj, если событие С не имеет места (т. е. имеет место С), 12 Зак. 573 353
(Х9, если событие С имеет место, X с = 2 [0, если событие С не имеет места. ( 0, если событие С имеет место, 2 [Х2, если событие С не имеет места, получаем: М [Хх/С] = -1^Л4 М’ (12.ю) М[Хг/С] = -Л-М[ХгЧ, (12.11) < (Ь) М[Х2/С]=-^М[Х/]. (12.12) Заметим, что для любого момента времени t х^х^х- Х/ + Х/ = Х2;1 Х1с + Х/4-Х/+Х/=^ | Теперь перейдем к выводу дифференциальных уравнений для опи- сания процесса, протекающего в нашей системе. При этом мы будем исходить из того, что численности состояни й в случае, когда стабили- затор работает, приближенно рав- ны условным математическим ожи- даниям этих численностей при условии, что имеет место событие С; а когда он не работает — соответствующим условным мат е- матическим ожиданиям при усло- вии, что имеет место событие С. Прежде всего, опишем нашу систему при помощи графа. Этот граф (рис. 6.41) будет выглядеть несколько по-иному по сравнению с обычным случаем. Он распадает- ся на два подграфа. Первый (верх- ний) — это подграф состояний состояний: стабилизатора, который может быть в одном из двух С — работает, С — не работает (ремонтируется). Что же касается прибора, то для него мы учитываем возможность на- ходиться в одном из четырех состояний: Пхе — прибор работает при работающем стабилизаторе, П2С — прибор не работает (ремонтируется) при работающем стаби- лизаторе, П1е — прибор работает при неработающем стабилизаторе, П2е — прибор ремонтируется при неработающем стабилизаторе, 354
Состояние стабилизатора в момент I характеризуется одним из со бытий С = C(t), С = C(t) (до сих пор мы для краткости все время опус- кали ;)• Вероятности этих событий обозначим p(t) и p(t) — 1 — p(t). Как видно, это уже известные нам вероятности состояний стабилизатора. Численности состояний Пх^, П2£', Пх~, П/ мы уже ввели в рас- смотрение: это X/ = X/(/), Х2С — Х2С (t), Хх"с = Ххс ((), X] = X2e(i). Соответствующие математические ожидания обозначим: mS(t) = М [Хх« (01, т/(/)=М[Х2ЧОЬ т/(/)==М[Х/(/)]. Очевидно, для любого момента времени t + (12.15) Определим интенсивности потоков событий для графа рис. 6.41. Прежде всего, по условию; Хс- = ^ = Ф(Хх), (12.16) Х-=— =—— . (12.17) * рем Далее, прибор переходит из состояния Пхс в П/ или из состояния П2' в П2" не сам по себе, а только вместе и одновременно со стабили- затором (когда тот выходит из строя); поэтому ^1с,1с^^2с,2с’=3^сё^Ф (^1)- (12.18) Аналогично, (12.19) Т 2/ Что касается переходов прибора из П! , П/ в П2С, П2е и наобо- рот (по вертикальным стрелкам), то нетрудно установить соответст- вующие интенсивности: 2о= Н'е5 Из; (12 -20) Uc.xc=-~7-, (12.21) 1с (-^2/ U-.r =-----—. (12.22) 2c’ic f-(X2) ’ Теперь, согласно нашему видоизменению принципа квазирегуляр- ности, при составлении дифференциальных уравнений мы должны ваменить Хх, Х2 их условными математическими 12* 35S
ожиданиями; а именно, там, где идет речь о переходах из л е- вой части графа (в левую же или в правую) - условными ма- тематическими ожиданиями при условии, что стабилизатор исправен (условие С); а там, где переходы совершаются из правой част и— при условии С- Это означает, что в формулах (12.16), (12.18), (12.21) мы заменим Хх на M[XJC], Х2 на M[XJC\, а в формулах (12.17), (12.19), (12.22) Хх на MpQ/C], Х2 на М[Х2/ё]. Так как формулы (12.20) не содержат Хь Х2, то в них ничего за- менять не надо. Пользуясь формулами (12.9) — (12.12), находим условные мате- матические ожидания: M[Xi/C]=-L-rnf (/), р (0 M[X2/C]=-J-m/(/). о(0 М [Xi/C] =5^- т/ (0, р(0 M[X2/C]=^i-m/(/). р(0 (12.23) Итак, мы можем, наконец, выписать дифференциальные уравне- ния смешанного типа, приближенно описывающие нашу систему (ар- гумент t для краткости опускаем): di \ Р Р-\-- ф \ р / — 1тл с\ •р + ф — -р; I т2 I \ ^ / t -Ч \ р / dm/ /т-/\ —фМ- .^ + Fl + dr \ Р / 1 :—-—Wj' т2с\ dp dt ~ 1 ---Г-,/П2 > , । । t ф I — Гс \р ) \Р / dm2c I „ 1 358
(12.24) == —-----—*ГПъс-- Ц(. ПЦ' 4- dt mA ^(4-) \ p / Заметим, что из этой системы уравнений можно исключить два уравнения: одно из первых двух, пользуясь условием р + р = 1, и одно — из последующих четырех, пользуясь соотношением (12.15). Эти уравнения могут решаться при любых начальных условиях; например, если в начале стабилизатор и все приборы работают: ( = 0; р = 1; Р=0| tnAc = N\ т^с = тхс = = 0. В случае, если нам важно исследовать, скажем, как быстро систе- ма выходит из «затора», созданного случайным выходом из строя зна- чительного числа приборов (L) и стабилизатора, начальные условия нужно выбрать другими: ? = 0; р=0; р — lj mac=0; m-fsssN—L\ m2c = L. 13. НЕКОТОРЫЕ УТОЧНЕНИЯ МЕТОДА ДИНАМИКИ СРЕДНИХ До сих пор, рассматривая уравнения динамики средних, мы всюду пользовались принципом квазирегулярности. Напомним, в чем со- стоит этот принцип. Если интенсивности потоков событий, переводящих элементы системы из одного состояния в другое, определенным обра- зом зависели от численностей состояний, мы заменяли в выражениях этих зависимостей сами численности (случайные) их средними значе- ниями — математическими ожиданиями. То же самое, хотя и в несколь- 357
ко усложненном виде, мы делали в уравнениях смешанного типа, за- меняя аргументы, от которых зависели интенсивности, условными ма- тематическими ожиданиями. При этом точность и приемлемость само- го принципа квазирегулярности нами не обсуждалась. В действительности сам принцип представляет собой некоторое допущение, и при пользовании им мы неизбежно допускаем ка- кие-то ошибки. Мы уже упоминали о том, что эти ошибки сравнитель- но малы для случаев, когда число элементов в системе велико, а также не малы средние численности тех состояний, от которых зависят интен- сивности. В данном параграфе мы коснемся вопроса об ошибках мето- да динамики средних, связанных с принципом квазирегулярности и внесем в уравнения динамики сред- них некоторые уточнения, которые поз- волят, в первом приближении, оценить порядок этих ошибок. Для простоты мы рассмотрим слу- чай, когда элемент S имеет всего два состояния: и и от численности X, Рис. 6.42 состояния зависит только одна интенсивность Х12, а интенсив- ность Х21 постоянна: = const. Граф состояний элемента 8 дан на рис. 6.42. Для дальнейшего нам удобно будет ввести особое обозначение Ai2(Xj) для суммарной интенсивности потоков событий, пере- водящих элементы системы из состояния Si в #2, а интенсивность Х12 потока, действующего на о д и н элемент, выразить через эту сум- ма рную интенсивность: . _Ai2(Xi) -------—- (13.1) Оказывается, для средних численностей ml(Z), m2(i) состояний $lt S2 можно вывести, не пользуясь принципом квазирегулярности, со- вершенно точные дифференциальные уравнения, выражаю- dm, dm2 » « щие производные через математическое ожидание случайной величины Aj2(Xj). А именно: ^=-М[Л12(Х1)] + Х21щ2 (13.2) dt уравнение для т2 не выписываем, так как в данном случае dm2 d (N—mi) dmt\ dt ~ dt ~ ~dt ) ’ Покажем, как выводится уравнение (13.2). Для этого рассмотрим граф состояний уже не одного отдельного элемента, а системы в целом (рис. 6.43). Состояния системы So, S1( S2, .... Sw будем ну- меровать соответственно числу X, элементов, находящихся в состоя- нии $г. При большом числе элементов N число состояний чрезвычайно ве- лико, и составление и решение системы дифференциальных уравнений 358
для вероятностей состояний системы затруднительно; именно поэтому и обращаемся мы к методу динамики средних. Все же мы запишем уравнения Колмогорова для вероятностей состояний системы S (поскольку мы не собираемся их решать, — количество уравнений нам безразлично). Система уравнений имеет вид: = ^21 Ро + ^12 (Д)РГ, at ----------(N — k) Х21 ph — Л12 (k) pk 4- at 4~ (М — k 4- 1) Jv2i P*— i 4~ Л12 (k 4-1) p*_(-1 ; (13.3) ------A-12 (A/) PN 4" ^21 Pn—] , где pk(t) = P(X] = k) — вероятность того, что в момент t система будет в состоянии Sk (k = 0, 1, 2, ..., N). Рис. 6.43 Заметим, что первое и последнее уравнения (13.3) можно свести к общему виду, в котором записано если естественным образом по- ложить Л12(0) = 0; P_,=PN+}=V. (13.4) Мы знаем, что математическое ожидание дискретной случайной величины %1(0, возможные значения которой— целые числа от 0 до N, выражается формулой: N от1(0=Л4[Х1(0]=2 kph(t). (13.5) А=0 Поэтому производную от этого математического ожидания мы по- лучим, умножив k-e уравнение системы (13.3) на k и просуммировав от 0 до N: , n N ~тг~— 3 k(N— &)^2iPfe 3 ^A12(^)pft4- at k=o k=o N N 4" 2i (A1 — k 4~ 1) ^-21 Pk— । 4~ &A.12 (k 4- 1) Pk^-1 • (13.6) &=o k=0 359
Первые две суммы в этом выражении оставим как они есть, а третью и четвертую преобразуем. Рассмотрим третью сумму. Учитывая, что в этой сумме член, соответствующий k = 0, обращается в нуль, имеем: N N k (N — k4~ 1) ^21 Pk— t = У1 k(N—k-\-1) X21 Pk— t. (13.7) 4=0 4=1 Далее изменим индекс суммирования, положив k—1 —i: N N— I k(N— k -j- 1) Рй— 1 = (Z 4*1) (AZ i) ^21 Pi — 4=1 i= о N = S (t'4-1)(AZ —Z)X2lpM (13.8) i=0 Последнее равенство справедливо, так как при Z = N множитель (N — Z) обращается в нуль. Наконец, возвращаясь к обозначению k для индекса суммирования (напомним, что сумма не зависит от того, какой буквой обозначить этот индекс), получим выражение для третьей суммы: S k(N-k+\)\nPk-,= (k+V)(N-k)K21Pk. (13.9) 4=0 4=0 Аналогично преобразуем четвертую сумму; учитывая, что Рл,+ ) =Л12(0) = 0, имеем: N N—I i ^Aj2 (k -f-1) P44-1 = &Л12 (k 4* 1) Pk~\~ 1 = 4=0 4=0 N N = 5 (i— 1) л12 (Z) Pi = s (Z — 1) л12 (Z) Pl = 1=1 i=0 N = s (fe-l)A12(fc)pft. (13.10) 4=0 Подставим выражения (13.9) и (13.10) в формулу (13.6): —1 = — k(N k) л21 Ph -f- /?Л12 (/г) Ph 4- at 4=0 4=0 N N 4“ (k 4-1) (AZ —k) X21 pk 4- (k— 1) Л22 (k) Ph = 4=0 4=0 N N = X21 3 (N-k)Pk-S AM(k)ph. (13.11) 4=0 4=0 Здесь первая сумма — не что иное, как Л1[Х21, т. е. т2, а вторая — это AKAj^Xj)]. Таким образом, мы вывели совершенно точ- ное дифференциальное уравнение (13.2) для средней численности состояния St- Однако, это уравнение в своем точном виде для нас совершенно бесполезно. Дело в том, что в его правую часть входят не только неиз- 36Q
вестные функции т, и m2, но также и математическое ожидание M[A12(Xi)]. Но для того, чтобы знать это математическое ожидание, нам нужно знать большое число (N) вероятностей щг(0 (fe = 1, ..., N). Их, конечно, можно в принципе найти, решая систему (13.3); но мы как раз для того и применяем метод динамики средних, чтобы избежать решения большого числа уравнений для вероятностей состояний си- стемы. Возникает вопрос о том, как найти приближенно математическое ожидание М [Л12(Х1)]> не зная вероятностей состояний системы (k = 1, 2...N). Один из способов, позволяющих найти приближенное значение Л1[Л13(Х1)] — это принцип квазирегулярности, которым мы до сих пор пользовались. Он состоит по суще- ству в том, что мы приближенно за- меняем математическое ожидание фу нкции от случайной величины той же функцией от математического ожидания, т. е. полагаем: Л1 [Л12 (Хх)]~ ЛХ2 (М [Xj]) = Л12 (mt)- (13.12) После этого точное уравнение (13.2) превращается в приближен- ное уравнение — Л12 (rnx)-H2i т2, at или, если пользоваться интенсивностью в пересчете на один элемент: —А як —Х12 (тх) т1 -f- А.21 т2. at Таким образом, ошибки при применении принципа квазирегуляр- ности — те же, что ошибки от замены математического ожидания функции той же функцией от математического ожидания. Относительно ошибки, возникающей при такой замене, можно высказать следующие общие соображения. Эта ошибка мала, если функция Л12(х) почти линейна в диапазоне практически возможных зна- чений случайной величины ХР Если в этом диапазоне функция Л12(х) сильно отличается от линейной, ошибка может быть значительной. Если функция Л12(х) выпукла вверх, как это типично для задач ди- намики средних (рис. 6.44), то ошибка от применения формулы (13.12) будет всегда в большую сторону, т. е. Л12 (mi) > М [Л12 (X!)]. Для функции Л12(х), выпуклой вниз, ошибка, наоборот, будет в мень- шую сторону. Однако эти соображения не дают возможности оценить величину ошибки. Для того, чтобы хотя бы грубо оценить ошибку в приближенной формуле (13.12), можно применить следующий прием. Мы знаем, что 361
если интенсивности потоков событий, переводящих элементы из со- стояния в состояние, не зависят от самих численностей состояний (т. е. элементы переходят из состояния в состояние независимо Друг от дру- га), то численности состояний будут распределены по биномиальному закону (см. § 1). В частности, численность состояния будет рас- пределена по биномиальному закону с математическим ожиданием тх и средним квадратическим отклонением О] = где N — общее число элементов в системе. Мы знаем также (см. § 2), что если интенсивности потоков событий зависят от численностей состояний, то это, вообще говоря, не так. Однако для грубо приближенного учета случайности аргумента Х} в функции AJ2(X1) допустим, что и в этом случае закон распределения численности состояния будет биномиаль- ный, с математическим ожиданием гщ и средним квадратическим от- клонением о, = Это, конечно, будет неточно, новее же гораздо точнее, чем просто полагать численность не случайной и равной своему математическому ожиданию (что мы фактически дела- ем, пользуясь принципом квазирегулярности). Запишем это распределение вероятностей. Вероятность того, что численность состояния <8, будет равна k, выражается известной формулой: рк — СдН —1 (1 — 1 . (13.13) Таким образом (если считать, что Хг имеет биноминальное распре- деление) Л4[Л12(Х1)] выразится формулой: N Л4[Л1а(Х1)]= (13.14) При большом числе элементов вычисления по формуле (13.14) очень громоздки; чтобы избежать этого, можно воспользоваться пре- дельными свойствами биноминального распределения при большом числе опытов. Известно, что биномиальное распределение при большом числе опытов N в некоторых условиях приближается к нормальному, а в других — к распределению Пуассона (см. например [71). Первый случай будет иметь место тогда, когда вероятность события в каждом опыте не слишком мала и не слишком велика; об этом можно судить по тому, что весь интервал пц ± З04 укладывается на участке (О, М), т. е. пг1—Зо!>0; пг1 ф- Зох < /V. (13.15) Если оба эти условия выполнены, то среднее значение интенсив- ности М[Л12(Х1)] можно вычислить, приближенно заменяя дискрет- ную случайную величину Хг непрерывной, распределенной по нор- мальному закону, а сумму (13.14) — интегралом: М[Л12(х1)] = А12 (х) f (х) dx, (13.16) о 362
где 1 (х—т,У f(x)=--J—e . (13.17) а, У 2л Условие (13.15) при большом N может не выполняться в двух слу- чаях. 1. Когда среднее число элементов в состоянии %i слишком мало по сравнению с М; тогда Oj2 f 1 — — \ я» mt, (13.18) \ X / г. е. дисперсия величины приближенно равна ее математическому ожиданию, а это — признак того, что биномиальное распределение близко к пуассоновскому. 2. Когда среднее число пгг элементов в состоянии #i, напротив, близко к N и, значит, по пуассоновскому закону распределяется не а его дополнение до N, т. е. случайная величина Ух = N — Xi*>. Покажем, как вычислить приближенно значение Л1[Л12(Х1)] в том и другом случае. 1. Случайная величина распределена по закону Пуассона с ма- тематическим ожиданием /Ир Математическое ожидание ее функции Л12(Хх) равно N лцл^х^ 2 Л12(б)а, (13.19) k=0 где Для расчетов по формуле (13.19) могут быть применены таблицы пуассоновского распределения (выдержки из таких таблиц даны, на- пример, в приложении, табл. 2). 2. Случайная величина Fj — N — Хг распределена по закону Пуассона с математическим ожиданием N — mi. Математическое ожидание функции A12(Xi) будет выражаться формулой ^1А12(Хх)(= J Аи(М-^)рй*. (13.20) 4 = 0 где П * = е—(Л/— т,) ™ fel — вероятности распределения Пуассона, также определяемые по таблицам. ♦) В нашем случае Yt = Хг, но если число состояний больше, чем два, это будет уже не так, поэтому мы сохраним для случайной величины Л/ — Хх отдельное обозначение Yi 363
Предположим, что мы приближенно выразили таким образом в виде некоторой функции Л.12(т1у, эта функция будет за- даваться тремя разными формулами (13.16), (13.19) и (13.20) в зависи- мости от того, на какой части отрезка (0, N) находится т1. Конечно, можно было бы подставить соответствующее выражение в уравнение (13.2) для средней численности тх (в данном случае достаточно решить одно это уравнение): =-Л18(/п1) + Хйща, (13.21) at но оно окажется слишком сложным. Поэтому задачу имеет смысл при- ближенно решать в два приема. Сначала (в первом приближении) ре- шить уравнения динамики средних, полученные с помощью обычного принципа квазирегулярности. Затем, оценив в первом грубом прибли- жении среднюю численность состояния — величину тг — найти приближенное значение для Л4 [Л12 (Ai)| я» Л12 (тц) ==Л12* (t) (непременно для ряда значений величины /), пользуясь при этом той или другой из формул (13.16), (13.19), (13.20). Между полученными таким образом значениями Л12*(/) можно проинтерполировать проме- жуточные. Таким образом строится функция времени Л12*(/), которая подставляется в правую часть уравнения (13.2)! ^ = -А1,*(П4-Ч(^-щ1). (13.22) Получается линейное дифференциальное уравнение с пере- менными коэффициентами, решение которого затруднений не вызы- вает. В результате этого будет получена функция более точная, чем первое приближение. Сравнивая второе приближение с первым, можно приближенно оценить ошибки, возникающие от применения принципа квазирегулярности. Совершенно аналогично можно решить задачу уточнения уравне- ний и тогда, когда число состояний элемента больше двух и когда от численностей состояний зависит не одна интенсивность, а две или бо- лее. Вся разница в том, что придется оценивать математическое ожида- ние не одной функции, а нескольких. 364
Изложенный выше способ введения поправок к уравнениям дина- мики средних сравнительно трудоемок; однако для функций суммар- ной интенсивности некоторых специальных видов, часто встречающих- ся в уравнениях динамики средних, поправки могут быть учтены до- статочно просто. Пусть, например, в условиях простейшей задачи с графом состоя- ний элемента (см. рис. 6.42) суммарная интенсивность Л12(Х1) равна константе Хо при всех значениях Xi — 1, 2, ..., (а при Хг = 0, естест- венно, A12(Xj) = 0). Тогда, если mi велико, то Af[Aia(Xi)] « %0 с очень большой точностью. Для того, чтобы приближенно найти это матема- тическое ожидание при небольших значениях т1; примем для величи- ны Хг пуассоновское распределение с параметром Тогда получим: М [Л12 (Xj)] = 0ро +^oPi +••• +^оР« = — (Pi И* Рг ч- ••• + PN) = (1 -Ро) « Ml -е-"Ч (13.23) Обозначим функцию R (x] 1—e~Л через Rix), a —— через р(х). Приближенное уравнение для средней численности тг запишется тогда так: dmi SS3 - dt или dm! ~dt~ ~ ~ —% В (т^) М тй, —Хор (/n1)m14-X21m2« (13.24) Заметим, что менее точное уравнение, получаемое по принципу квазирегулярности, здесь имело бы вид: или ~ ’Ч В (mi) + М тг> at ~г =. —Хо р (mj) тг ?i21 /и2, at (13.25) где R(x) и р(х) функции, введенные в § 4. Изобразим, для сравнения, графики функций R(x) и R(x) (рис. 6.45) и функций р(х) и р(х) (рис. 6.46). Как видно из графиков, ошибка при замене правой части в урав- нениях (13.24) соответствующей правой частью в уравнениях (13.25) довольно существенна при небольших значениях тъ тогда как при больших mi она становится пренебрежимо малой. Таким образом, во всех задачах, где мы использовали функции R, р в качестве поправочных коэффициентов в правых частях уравне- ний динамики средних, более точные результаты будут получаться, если мы заменим R на R, р на р.
7 МЕТОДЫ УЧЁТА НАДЁЖНОСТИ ТЕХНИЧЕСКИХ УСТРОЙСТВ 1. ПРОБЛЕМА ОЦЕНКИ НАДЕЖНОСТИ Подавляющее большинство операций, подлежащих количествен- ному исследованию, в современном обществе выполняется с примене- нием тех или других технических устройств. Оценка эффективности таких операций и выработка рациональных решений по их организации требуют учета надежности применяемых технических устройств. Под «надежностью» в широком смысле слова понимается способ- ность технического устройства к бесперебойной (безотказной) работе в течение заданного промежутка времени в определенных условиях. Этот промежуток времени обычно обусловлен временем выполнения некоторой задачи, которая осуществляется техническим устройст- вом и является частью общей задачи операции. В настоящее время, в связи с возрастающей сложностью техничес- ких устройств и широким внедрением автоматизации во все области практики, проблема надежности становится одной из узловых проблем техники и организации управления. Обеспечение надежной работы всех элементов оборудования — задача первостепенной важности. Борьба за надежность требует специального рассмотрения и коли- чественного анализа явлений, связанных со случайными отказами ап- паратуры. За последние годы теория надежности превратилась в спе- циальную науку, широко применяющую вероятностные методы ис- следования. В теории надежности принято различать два типа отказов: вне- запные и постепенные. Под внезапным отказом устройства разумеется мгновенный выход из строя, означающий невозможность его применения. Внезапный от- каз возникает в какой-то, вообще говоря, случайный момент времени. Примерами внезапных отказов могут служить: перегорание электро- или радиолампы, обрыв проводника, пробой конденсатора и т. п. Под постепенным разумеется отказ устройства, связанный с по- степенным ухудшением («сползанием») его характеристик. Для устра- нения таких отказов требуется регулировка прибора. Постепенные отказы можно условно рассматривать как внезапные, если условиться считать, что какие-то отклонения параметров устрой- ства от номинала являются еще допустимыми, а большие — недопус- тимыми; как только параметры выходят за эти пределы, устройство считается отказавшим. Однако назначение таких пределов в ряде слу- 260
чаев затруднительно. Правильнее будет рассматривать параметры ус- тройства как случайные функции времени, связать с ними какой-то показатель эффективности устройства (например, вероятность реше- ния задачи или математическое ожидание производительности) и этот показатель вычислять с учетом «сползания» характеристик. Такой под- ход требует внимательного изучения структуры и работы конкретного технического устройства и применения сравнительно сложного мате- матического аппарата. В данной главе мы будем рассматривать толь- ко внезапные отказы. Надежность технического устройства или, как мы будем говорить, системы зависит от состава и количества образующих систему эле- ментов (узлов), от способа их объединения в систему и от характерис* тик каждого отдельного элемента. Деление технических устройств на «системы» и образующие их «элементы» носит условный характер и зависит от постановки задачи и целей исследования. Одно и то же устройство, например радиолока- ционный прицел истребителя, может рассматриваться и как «система», состоящая из элементов: радиоламп, конденсаторов, реле ит. д., и как «элемент» более сложной системы — оборудования самолета. В свою очередь, самолет-истребитель является «элементом» системы ПВО. В дальнейшем мы будем называть «элементом» любое техническое устройство, не подлежащее дальнейшему расчленению, надежность которого считается заданной или определяется экспериментально. Сое- диняя такие элементы различным образом в «системы», мы будем ре- шать задачу определения надежности системы по надежностям ее эле- ментов. 2. НАДЕЖНОСТЬ ЭЛЕМЕНТА. ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ ВРЕМЕНИ БЕЗОТКАЗНОЙ РАБОТЫ. СРЕДНЕЕ ВРЕМЯ БЕЗОТКАЗНОЙ РАБОТЫ Оценка надежности системы и элементов требует введения коли- чественных характеристик. Рассмотрим здесь некоторые из этих ха- рактеристик. Для краткости будем определять их применительно к «элементу»; однако те же определения будут относиться и к «системе»'. Надежностью элемента (в узком смысле слова) называется вероятность того, что данный элемент в данных условиях будет работать безотказно в течение времени /. Эту вероятность мы будем обозначать p(t). Функция p(f) называется иногда «законом надежности». Естественно, с увеличением времени функция p(t) убывает (рис. 7.1) При t ~ 0 естественно предположить p(t) = 1. Ненадежностью элемента называется вероятность q(t) того, что элемент откажет (выйдет из строя) в течение времени t. Оче- видно, q(f) = l — p(t). (2.1) 367
Рассмотрим время Т безотказной работы элемента как случайную величину. Функция распределения F(t) этой случайной величины определяется как F (t) = P(T<t). (2.2) Очевидно, F(t) — вероятность того, что за время t элемент отка- жет — представляет собой не что иное, как ненадежность элемента: F(t)=q(t), (2.3) а его надежность дополняет Л(() до единицы: р (0 = 1-F(0. (2.4) Таким образом, ненадежность q(t) обладает свойствами функции распределения неотрицательной случайной величины. Она равна ну- лю при I = 0, не убывает при возрастании I и стремится к единице при (оо (рис. 7.2). На практике обычно вместо функции распределения F(t) поль- зуются ее производной — плотностью распределения или плот- ностью вероятности: f(0 = ^(0 = 9'(0. (2.5) График плотности f(t) показан на рис. 7.3. Площадь, ограничен- ная кривой /(/), равна единице. Величина f(t)dt — элемент вероятности — истолковывается как вероятность того, что время Т примет значение, лежащее в пределах элементарного участка ((, t + dt). В литературе по надежности функцию /(() часто называют «плот- ностью отказов». Во избежание недоразумений, связанных с нечеткой терминологией, мы будем называть /(() более точно: плотностью рас- пределения времени безотказной работы. Плотность /(() может быть приближенно определена из опыта, для чего ставится следующий эксперимент: наблюдается работа боль- шого числа N однородных элементов; каждый из них работает до мо- мента отказа. Время, в течение которого работал элемент, регистри- руется. Полученные значения времени: (1, ^2’ 368
обрабатываются обычными методами математической статистики: стро- ится гистограмма (рис. 7.4) и выравнивается с помощью какой-нибудь плавной кривой, обладающей свойствами плотности. Ордината гистограммы на каждом элементарном участке времени А/ представляет собой не что иное, как среднее число отказов за едини- цу времени, приходящееся на один испытанный элемент. Тот же смысл можно приписать и функции fit). Приближенно плотность fit) опреде- ляется по формуле fit) (<,/+ДО (2 6) где m(t, t + Д/) — число элементов, отказавших на участке времени от t до t + Д/ (время отсчитывается от момента включения); N — об- щее число элементов; Д/— длина элементарного участка времени. Пример. Было испытано N = 1000 ламп на длительность без- отказной работы. Результаты испытаний приведены в табл. 2.1. Таблица 2.1 Длительность работы в часах (от—до) 0—10 10—20 20—30 30—40 40—50 50—60 60—80 80—100 100—150 150—200 Число ламп т (i '-МО 151 102 77 61 79 120 200 69 91 50 Найти приближенно плотность /(/) для каждого участка времени, построить гистограмму и выровнять (от руки) плавной кривой. Решение. На первом участке (0—10 час) имеем: на втором 151 1000-10 «=0,0151, 102 1000-10 » 0,0102 / (0 «= и т. д. Значения плотности fit) приведены в табл. 2.2. 369
Таблица 2.2 Длительность работ»1, в чавах (от—до) 0—10 10—20 20—30 30—40 40—50 50—60 60—80 80—100 100—150 150—200 Плотность (О 0.0151 0,0102 0,007/ 0,0061 0,0079 0,0120 0,0100 0,0038 0,0017 0,0010 Гистограмма и выравнивающая кривая приведены на рис. 7.5. Отметим, что плотность f(t), изображенная на рис. 7.5, имеет мак- симум при I = 0, т. е. максимальная частота отказов приходится на начальный период работы элемента. Такой характер кривой /(0 не- редко наблюдается на практике, особенно при работе с электро- и ра- диодеталями, т. к. они часто имеют тенденцию отказывать немедленно или вскоре после включения. Иногда это повышение плотности в точке t = 0 сказывается настолько резко, что заметную долю элементов мож- но считать отказавшими точно в момент включения. При этом время безотказной работы Т превращается из непрерывной в смешанную случайную величину, у которой одно значение (I — 0) обладает отличной от нуля вероятностью р0, а для других существует только какая-то плотность распределения. Функция распределения такой случайной величины показана на рис. 7.6 — в точке t = 0 она имеет скачок, равный р0, а при t > 0 — непрерывна. Дифференцируя функцию Fit) при t > 0, получим кривую «плот- ности» fit) (рис. 7.7). Она характерна тем, что ограничивает площадь, равную уже не единице, al — р0. При обработке экспериментальных данных в таком случае отбирают в отдельную группу элементы, отка- завшие при включении, и отношение их числа то к общему числу N испытанных элементов считают за приближенное значение р0: а для остальных данных строится обычная гистограмма (при этом час- тоты находятся делением числа наблюдений в разряде на общее число наблюдений N). 370
В качестве характеристики надежности элемента часто приме- няется среднее время безотказной работы, т. е. математическое ожидание величины Т: В случае, если величина Т непрерывна (т. е. ее функция распре- деления F(t) не имеет скачка при t ~ 0) (2.7) о Рис. 7.9 Рис. 7.8 В случае, когда Т — смешанная случайная величина, и отдель- ное значение t = 0 имеет вероятность р0, 00 о (2.8) Величина t может быть выражена не через плотность распреде- ления /(0, а непосредственно через надежность p(f). Действительно, СО оо оо t = 5 if (0 dt = tq' (t) dt = — § tp' (t) dt. О 0 0 371
Интегрируя по частям, имеем: t = — tp (/) р (t) dt. (2.9) о о Первый член в правой части выражения (2.9) равен нулю, так как для случайной величины Т, у которой существует математическое ожи дание, разность 1 — F(t) = p(t) при I -> оо должна убывать быстрее, чем растет t. Поэтому Г=$р(О<#. (2.10) о Эта формула имеет простую геометрическую интерпретацию: среднее время безотказной работы элемента равно полной площади S, ограниченной кривой надежности и осями координат (рис. 7.8). Очевидно, в случае, когда Т — смешанная случайная величина (значение i = 0 имеет вероятность р0), это правило остается в силе; вся разница в том, что кривая p(t) будет начинаться не от 1, а от 1 — р0 (рис. 7.9). 3. ЭКСПОНЕНЦИАЛЬНЫЙ ЗАКОН НАДЕЖНОСТИ. ИНТЕНСИВНОСТЬ ОТКАЗОВ Наиболее удобным для аналитического описания является так называемый экспоненциальный (или показательный) закон надежности, который выражается формулой p(0=e-w, (3.1) где X >• 0 — постоянный параметр. График экспоненциального закона надежности показан на рис. 7.10. Для этого закона функция распределения времени без- отказной работы имеет вид- F(f) = q(t) = l—e~M, (3.2) а плотность— (t>0). (3.3) Это есть уже известный нам показательный закон распределе- ния, по кото'рому распределено расстояние между соседними события- ми в простейшем потоке с интенсивностью X (см. § 4 гл. 4). Пфи рассмотрении вопросов надежности часто бывает удобно представлять себе дело так, словно на элемент действует прос- тейший поток отказов с интенсивностью X; элемент отказывает в момент, когда приходит первое событие этого потока. Образ «потока отказов» приобретает реальный смысл, если отка- завший элемент немедленно заменяется новым (восстанавливается). 372
Последовательность случайных моментов времени, в которые проис ходят отказы (рис. 7.11), представляет собой простейший поток собы тий, а интервалы между событиями — независимые случайные вели- чины, распределенные по показательному закону (3.3). Понятие «интенсивности отказов» может быть введено не только для экспоненциального, но и для любого другого закона надежности о плотностью /(/); вся разница будет в том, что при неэкспоненциаль- ном законе p(t) интенсивность отказов А, будет уже не постоянной ве- личиной, а перемени ной. Рис. 7.10 Рас. 7.11 Интенсивностью (или иначе «опасностью») отказов назы- вается отношение плотности распределения времени безотказной ра- боты элемента к его надежности: (з.4) р (О Поясним физический смысл этой характеристики. Пусть одно- временно испытывается большое число N однородных элементов, каждый — до момента своего отказа. Обозначим n(t) — число элемен- тов, оказавшихся исправными к моменту t, a m(t, t 4- А/), как и и раньше, — число элементов, отказавших на малом участке времени (/, I + А/). На единицу времени придется среднее число отказов m(t, t+M) Ы Разделим эту величину не на общее число испытываемых элемен- тов N, а на число исправных к моменту t элементов п(1). Нетрудно убедиться, что при большом N это отношение будет при- ближенно равно интенсивности отказов А,(/): (3.5) v ’ n(i) М Действительно, при большом N п. (t) яб Np (t) и т (t, < +ДО _т (О < + Д0' п (О М ~ N М p(t) 373
Но согласно формуле (2.6) m(t, 1±Ы) ~ г, NM ’’ откуда т (t, / + &о /(0 N &tp (0 ~ Р (/) ' '* В работах по надежности приближенное выражение (3.5) часто рассматривают как определение интенсивности отказов, т. е. опреде- ляют ее как среднее число отказов в единицу времени, приходящееся на один работающий элемент. Характеристике %(() можно дать еще одно истолкование: это есть условная плотность вероятности отказа элемента в данный момент времени t, при условии, что до момента t он работал безотказно. Дей- ствительно, рассмотрим элемент вероятности K(t)dt — вероятность того, что за время ((, t + dt) элемент перейдет из состояния «работает» в состояние «не работает», при условии, что до момента t он работал. В самом деле, безусловная вероятность отказа элемента на участке ((, t + dt) равна f(t)dt. Это — вероятность совмещения двух событий: А — элемент работал исправно до момента t. В — элемент отказал на участке времени (t, t Ч- dt). По правилу умножения вероятностей: f (t) dt=P (АВ) — Р(А)Р (В/А). Учитывая, что P(A)=p(t), получим: Р(В1А) — Н^ = Ь(/) dt- p(t) а величина Щ) есть не что иное, как условная плотность вероятнос- ти перехода из состояния «работает» в состояние «отказал» для момен- та t. Если известна интенсивность отказов Ut), то можно выразить через нее надежность p(t). Учитывая, что f(f) — —p'(t), запишем фор мулу (3.4) в виде: Ь(П = -^ = —[Jnp(01z. Интегрируя, получим: I \np(t)=* —^X(t)dt, о откуда t — ( К (Г) л p(t)—e 5 . (3.6) Таким образом надежность выражается через интенсивность от- казов. 374
В частном случае, когда Х(0 = X » const, формула (3.6) дает: р(0=е~«, (3.7) т. е. уже известный нам экспоненциальный закон надежности. Пользуясь образом «потока отказов», можно истолковать не толь- ко формулу (3.7), но и более общую формулу (3.6). Представим себе (совершенно условно!), что на элемент с произвольным законом на- дежности p(t) действует поток отказов с переменной интенсивностью Х,((). Тогда формула (3.6) для р(() выражает вероятность того, что на участке времени (0, f) не появится ни одного отказа. Таким образом, как при экспоненциальном, так и при любом дру- гом законе надежности работу элемента, начиная е момента включе- ния t = 0, можно представлять себе так, что на элемент дейст- вует пуассоновский поток отка- зов; для экспоненциального за- кона надежности это будет поток с постоянной интенсивностью X, а для неэкспоненциального — с переменной интенсивностью Х((). Заметим, что этот образ годится только в том случае, когда отказавший элемент н е заменяется новым. Если, как мы это делали раньше, не- медленно заменять отказавший элемент новым, поток отказов уже не будет пуассоновским. Действительно, интенсивность его будет зависеть не просто от времени t, протекшего с начала всего процесса, а и от времени т, протекшего со случайного момента вклю- чения именно данного элемента; значит, поток событий имеет последействие и пуассоновским не является. Если же на протяжении всего исследуемого процесса данный эле- мент не заменяется и может отказать не более одного раза, то при описании процесса, зависящего от его функционирования, можно пользоваться схемой марковского случайного процесса, но при переменной, а не постоянной интенсивности потока отказов. Если неэкспоненциальный закон надежности сравнительно мало отличается от экспоненциального, то можно, в целях упрощения, при- ближенно заменить его экспоненциальным (рис. 7.12). Параметр X этого закона выбирается так, чтобы сохранить неизменным математи- ческое ожидание времени безотказной работы, равное, как мы знаем, площади, ограниченной кривой р(() и осями координат. Для этого нужно положить параметр А. показательного закона равным t где Г— площадь, ограниченная кривой надежности p(t). Таким об- разом, если мы хотим характеризовать надежность элемента некото- 375
рой средней интенсивностью отказов, нужно в качестве этой интенсив- ности взять величину, обратную среднему времени безотказной рабо- ты элемента. _ Выше мы определяли величину t как площадь, ограниченную кри- вой p(t). Однако, если требуется знать только среднее время без- отказной работы элемента, проще найти его непосредственно по ста- тистическому материалу как среднее арифметическое всех наблюденных значений случайной величины Т — времени работы элемента до его отказа. Такой способ может быть применен и в случае, когда число опытов невелико и не позволяет достаточно точно построить кривую p(t). Пример 1. Надежность элемента p(t) убывает со временем по линейному закону (рис. 7.13). Найти интенсивность отказов "Mt) и среднее время безотказ- ной работы элемента t. Решение. По формуле (3.4) на участке (О, /0) имеем: МО--»— р (О р (О Согласно заданному закону надежности 4 Р(О = 1—7" (О</<<о), ‘о . Р' (0= — График функции Х(/) показан на рис. 7 14. При t -+ tn оо. Среднее время безотказной работы_ равно площади, ограниченной кривой p(t} и осями координат (см. рис. 7.13): /= /0/2. Пример 2. Интенсивность отказов элемента а(/) меняется по закону, пред- ставленному на рис. 7 15 Найти закон надежности p(t). Решение. На участке (0,1) X. (0 = 3—2t. 376
По формуле (3.6) Вычислим p(t) на участке t > 1. В общей формуле (3.6) разобьем проме- жуток интегрирования на два: от 0 до 1 и от 1 до t: I i i i t С X (О dt = \l.(t) dt + (t) dt= J (3—21) dt+ Jd/ = 2 + < —1 = 1 + h oooo i p (0 = e~(1+*>. Puc. 7.15 Puc. 7.16 График закона надежности показан на рис. 7.16. Заштрихованная пло- щадь изображает среднее время безотказной работы: I оо 7 = je-<3'-(2> df+J e-“+z)dl. о 1 Что касается первого, то он вычислен приближенно (численно)! ye-(3Z-P)d<;5s 0,370, о 377
откуда F«0,3704-0,135 = 0,505. Пример 3. Плотность распределения времени безотказной работы элемен- та постоянна на участке (tlt tt) и равна нулю вне этого участка (рис. 7.17) Найти интенсивность отказов Х(/). Решение. Имеем: где t» откуда график интенсивности отказов показан на рис. 7.18: при X (I) — оо. 4. ОПРЕДЕЛЕНИЕ НАДЕЖНОСТИ СИСТЕМЫ ПО НАДЕЖНОСТИ ЕЕ ЭЛЕМЕНТОВ. НАДЕЖНОСТЬ НЕРЕЗЕРВИРОВАННОЙ СИСТЕМЫ Пусть некоторая техническая система S составлена из п элемен- тов узлов): Эъ Э2, ..... Эп. Допустим, что надежности элементов нам известны. Возникает вопрос об определении надежности системы. Она зависит от того, ка- ким образом элементы объединены в систему, какова функция каждо- го из них и в какой мере исправная работа каждого элемента необхо- дима для работы системы в целом. В ряде систем недостаточная надежность элементов повышается за счет их дублирования (резервирования). Резервирование состоит в том, что наряду с элементом Эг в систему вводится запасной (резерв- ный) элемент Э/, на который система переключается в случае отказа основного элемента. Число резервных элементов может быть и более одного. Самым простым случаем в расчетном смысле является проб- тая система (или система без резервирования). В такой систе- ме отказ любого элемента равносилен отказу системы в целом По аналогии с цепочкой последовательно соединенных проводников, об- рыв каждого из которых равносилен размыканию всей цепи, мы будем называть такое соединение элементов «последовательным» (рис. 7.19). Следует оговориться, что «последовательным» такое соединение эле- ментов является только в смысле надежности, физи- чески же они могут быть соединены как угодно. Выразим надежность простой системы через надежности ее эле- ментов. Пусть имеется некоторый промежуток времени (0, т), в тече- ние которого требуется обеспечить безотказную работу системы. Тог- 378
да, если надежность системы характеризуется законом надежности P(t), нам важно знать значение этой надежности при t = т, т. е. Р(т). Это не функция, а определенное число; отбросим аргумент т и обозна- чим надежность системы просто Р. Аналогично обозначим надежности отдельных элементов plt р2, рп. Для безотказной работы простой системы в течение времени т нужно, чтобы работал безотказно каждый из ее элементов. Обозначим: S — событие, состоящее в безотказной работе системы за время т; Э1, Э2, ..., Эп — события, состоящие в безотказной работе соответст- вующих элементов. Событие S есть произведение (совмещение) событий /ГЧ /74 /74 а а а . ' vy- ‘‘ “"V Т-” •“Ь ’=,2> •••» '-’п- 3=Э1-Э2. ... .Эп. Рис. 7.19 Предположим, что элементы Э1( Э2, Эп отказывают неза- висимо друг от друга (или, как мы будем говорить для краткости, «независимы по отказам», а совсем кратко «независимы»). Тогда по правилу умножения вероятностей для независимых событий Р (S) ==Р(Эг) Р (Э2) ... Р(Э„), или в других обозначениях, P = Pi-p2- ... -Рп, (4.1) а короче п /’=;Пр(, . (4.2) т. е. надежность простой системы, составленной из независимых эле- ментов, равна произведению надежностей ее элементов. В частном случае, когда все элементы обладают одинаковой на- дежностью Р1=Р2= - ==Рп=Р. формула (4.2) принимает вид: Р = р". (4.3) Пример 1. Простая система состоит из 10 независимых элемен- тов, надежность каждого из которых равна р — 0,95. Определить надежность системы. Решение. По формуле (4.3). Р = 0,9510 « 0,6. Из примера видно, как резко падает надежность простой системы при увеличении числа элементов. Если число элементов п велико, то для обеспечения хотя бы приемлемой надежности Р системы каждый элемент должен обладать очень высокой надежностью. Поставим вопрос: какой надежностью р должен обладать отдель- ный элемент для того, чтобы система, составленная из п таких элемен- тов, обладала заданной надежностью 5s? 379
Полагая в формуле (4.3) Р — получим! р = (4.4) Пример 2. Простая система состоит из 1000 одинаково надежных, независимых элементов. Какой надежностью должен обладать каждый из них для того, чтобы надежность системы была не меньше 0,9? Решение. По формуле (4.4): р = °yr3a= °yr0,9; 1g р =—!—1g 0,9, р яг 0,9999. Выразим интенсивность отказов простой системы Л(/) через ин- тенсивности отказов Хг(() отдельных ее элементов. Имеем: {г 1 *) —Л (t) dt) о J {t —dt о ...» п). Подставим эти выражения в формулу (4.2); получим: = ехр t t t <\j\(t)dt + <\)K2(t)dt+ ... +$ХП(/)Л 0 0 о t = ехр{-$[М0 + 4(0 + - + 4(0] Л) о или, короче, | t 1 fin exp j — § Л (/) dt I — exp (— § У (t) dt l 0 ) i о <=i откуда I t n \\(f)dt = $ 2 \ (0. о о (=1 (4.5) Дифференцируя (4.5) no t, получим: n A (0 = .2^(0, (4.6) z,— i *) Здесь exp(x) = e*. 38G
т. е. при « последовательному! соединении независимых элементов интен- сивности отказов складываются. Это и естественно, так как для простой системы отказ элемента равносилен отказу системы, значит, все потоки отказов отдельных элементов складываются в один поток отказов системы с интенсив- ностью, равной сумме интенсивностей отдельных потоков. Рис. 7.20 Пример 3. Простая система S состоит из трех независимых эле- ментов Э1; Э2, Э3 (рис. 7.20), плотности распределения времени безот- казной работы которых заданы формулами: h (0=^1, МО =20 Гз (0=2 (1-0 при 0</<1 (рис. 7.21 — 7.23). Найти интенсивность отказов системы. Решение. Определяем ненадежность каждого элемента: 71(0—О 98(0=2<-^ при о <; z < 1. Отсюда надежности элементов: Pi (0 = 1-0 р2 (0 = 1 -t\ Рз + при OC/Cl. 381
Интенсивности отказов элементов: МЛ = 7ZZT’ при 0</<1. Х8 (/) = 2(1—0 _ 2 1— 2/ + /а==1 — t' Складывая, имеем: Л(0=^Ю-|-Ч(04-^(П = 1.2/ 2 _ 3+5/ "1 — t ' 1—/а +1 —/ ~ 1— /2 ’ 5. НАДЕЖНОСТЬ РЕЗЕРВИРОВАННОЙ СИСТЕМЫ («ГОРЯЧИЙ РЕЗЕРВ») Одним из путей повышения надежности системы является введе- ние в нее дублирующих (резервных) элементов. Резервные элементы включаются в систему как бы «параллельно» тем, надежность кото- рых недостаточна. Рассмотрим самый простой пример резервированной системы: два «параллельно» включенных элемента Э) и Э2 (рис. 7.24). Внача- ле работает «основной» элемент Эг; если он отказал, система автомати- чески переключается на «резервный» элемент Э2. Предположим, что элементы и Э2 независимы по отказам и что их надежности (вероят- ности безотказной работы) за интересующее нас время I = т равны соответственно pi и р2. Предположим также, что надежность второго элемента не зависит от того, включался ли этот элемент в работу за вре- мя т и когда включался. Такая картина наблюдается, например, если элемент Э2 независимо от того, работает он или нет, держится под ра- бочим напряжением (так называемый «горячий резерв»). Определим при этих условиях надежность резервированной си- стемы S. Перейдем к вероятности противоположного события — отка- за системы S. Обозначим отказ системы S. Чтобы событие S произош- ло, необходимо, чтобы отказали оба элемента: и первый и второй: S = Эг Э2. Отсюда по правилу умножения вероятностей независимых событий: Р(5)=Р(Э1)Р(Эа). Обозначая ненадежность системы Q, а ненадежности элементов 71( q2, получим: Q — 71 7а» (5.1) 382
т. е. при «.параллельном'» соединении независимых элементов их нена- дежности перемножаются. Переходя в формуле (5.1) от ненадежностей к надежностям, имеем: I—Р=(1 —рх)(1—ра), откуда (5.2) Р = 1—(1—Р1)(1—ра). Рис. 7.25 При произвольном числе п дублирующих друг друга независимых элементов надежность блока из таких элементов (рис. 7.25) вычисля- ется по формуле Р = 1 _(1 _Р1) (1 _Ра) ... (1 _Рп)> (5.3) или, короче, Р = 1- П (5.4) I — 1 В частном случае, когда надежности всех элементов одинаковы: Pi = p2= ... =Р, формула (5.4) принимает вид; Р = (1-р)\ (5.5) Пример 1. Предохранительное устройство, обеспечивающее безопасность работы с материальной частью, состоит из трех дублирующих друг друга предо- хранителей. Надежность каждого из них р = 0,9. Предохранителе независимы в смысле надежности. Найти надежность всего устройства. Решение. По формуле (5.5) р = 1 _ (I _ о,9)3 = 0,999. До сих пор, говоря о «переключении» на резервный элемент, мы предполагали, что либо для этого не требуется специального пере- ключающего устройства (как в случае с предохранителями), либо ;на- 383
дежность переключающего устройства равна единице. Если это не так, то легко учесть его неполную надежность. Предположим, что блок состоит из двух «параллельно» включен- ных элементов 3j и Э2 (рис. 7.26). В случае, когда элемент 3, выходит из строя, переключающее устройство П переключает систему на дру- гой, резервный элемент Э2. Надежности элементов Э1( Э2 и переклю- чателя П равны соответственно ръ р2 и р„. Определим надежность все- го блока. Для этого объединим переключатель П и элемент 3, в одну «последовательную» цепь с надежностью Рг =РаРг- Рассматривая эту цепочку как один параллельно включенный условный элемент 3/, найдем по формуле (5.2) надежность блока: Р = 1 —(1 —Pi) (1 —Рг) = 1 —(1 — Pi) (1 —рп р2). (5.6) Таким образом, неполная надежность переключателя может быть учтена простым умножением надежности резервного элемента на на- дежность переключателя. Если резервных элементов не один, а больше: Э2..Эп и каждый из них снабжен своим переключателем с надежностью соответственно р<2>. Рп3>’ •••» Р^’ то в Ф°РмУле (5-3) нужно умножить надежность каждого резервного элемента на надежность переключателя: P = l — (I— pi)(I— рп(2)Рг)(1— РП(3,Р3) ... (1— Рп(п)Рп)- (5.7) Может оказаться, что переключение на любой резервный элемент осуществляется одним и тем же переключателем П (рис. 7.27). Тогда переключатель П вместе со всем блоком резервных элементов может рассматриваться как один условный элемент Э2' с надежностью р2, равной Рг =рп[1 -(1— Ра)(1— Рз) (Д—Рп)}, (5.8) 384
а надежность всего блока вычислится по формуле /’ = 1-(1-р1)(1-р2'). (5.9) Пример 2. Определить надежность блока, состоящего из основного эле- мента Э4 с надежностью рг = 0,9 н трех резервных элементов: Э2, Э3, Э4, имею- щих ту же надежность: Рг = Рз = Pt = 0,9. Переключение на резервные элементы в случае отказа любого из элементов осу- ществляется с помощью одного и того же переключателя, имеющего надежность рп = 0,95 (рис. 7.28) Найти надежность блока. Решение. Объединим переключатель с резервными элементами Э2, Э3, Э44 в условный элемент Э2' с надежностью р2'=рп [1-(1-р2)(1-р3)(1-р4)] =0,95 (1-0,13)« 0,949. Надежность всего блока: Р=1—(1—0,9) (1—0,949) «0,995. Заметим, что в данном примере сравнительно низкая надежность переклю- чателя практически обесценивает большое количество (три!) резервных элемен- тов. Значительно большую надежность системы мы получили бы, если бы каж- дый элемент был снабжен своим переключателем: Р'=1—(1—0,9) (1— 0,95-0,9)3« 0,9997. До сих пор мы рассматривали системы, дублирующие один ос- новной элемент. В общем случае в резервированных системах могут применяться как «последовательные», так и «параллельные» соедине- ния элементов, причем как правило, дублируются наименее надежные элементы. При оценке надежности такой системы нужно расчленить ее на ряд «подсистем», не имеющих общих элементов, найти надежность каждой из них и, рассматривая подсистемы как условные элементы, оценить надежность системы в целом. 13 Зак. 573 385
Пример 3 Определить надежность системы, состоящей из элементов Эи Э2, , Э7 с надежностями plt р2, ., (рис. 7.29) Решение. Подсистема I — «последовательно» соединенные элементы Э, и Э2; надежность: I = Р1 Рг Подсистема 11 —«параллельно» соединенные элементы Э3 и Э4; надежность! Р[[==1_(1_р3)(1_р4). Подсистема III — «последовательно» включенные I и II; надежность; рш= р: рп- Подсистема IV — «параллельно» включенные Э6 и Эр, надежность: Рiv = 1—(1—Ре) О—Р?) • Подсистема V — «последовательно» включенные Э5 и IV; надежность: PV = Ps РIV • Вся система — «параллельно» включенные III и V; надежность: P=1-(1-PIII)(1-PV). 6. НАДЕЖНОСТЬ РЕЗЕРВИРОВАННОЙ СИСТЕМЫ («ХОЛОДНЫЙ» И «ОБЛЕГЧЕННЫЙ» РЕЗЕРВ) До сих по мы рассматривали только случай, когда надежность каждого дублирующего элемента не зависит от того, когда включился в работу этот элемент. Этот случай, который мы условно назвали «го- рячим резервированием», самый простой из всех возможных. Гораздо сложнее случай, когда резервный элемент до своего включения в рабо- ту вообще не может отказывать («холодное» резервирование) или мо- жет отказывать, но с другой, меньшей плотностью вероятности, чем после включения («облегченное» резервирование). При рассмотрении задач, связанных с холодным или облегчен- ным резервированием, нам недостаточно будет вводить надежности системы и элементов для одного, заранее фиксированного, значения времени т; необходимо будет проанализировать весь случайный про- цесс функционирования системы. Рассмотрим несколько задач, относящихся к холодному и облег- ченному резервированию. Задача 1. Общий случай расчета надежности резервированной си- стемы («облегченный» или «холодный» резерв). Система (блок) состоит из «параллельно» включенных элементов Э, и Э2 (основного и ре- зервного). Интенсивность потока отказов первого элемента МО; при отказе первого элемента происходит автоматическое и безотказное переключение на резервный (рп = 1). Интенсивность потока отказов резервного элемента до его включения в работу /.2(0 (элемент рабо- тает в «облегченном» режиме). После его включения в работу, в мо- мент отказа первого элемента, интенсивность мгновенно подскакивает (рис. 7.30) и становится равной интенсивности Х2, которую естествен- 386
но предполагать зависящей не только от текущего времени t, но и от того срока /ъ в течение которого элемент работал в облегченном режиме: Х2=Ла Требуется найти надежность системы P(t). Рассмотрим совокупность двух случайных величин: 7\ — момент отказа основного элемента, Т2 — момент отказа резервного элемента. Событие А — безотказная работа системы до момента t — состоит в том, что хотя бы одна из величин Тг, Т2 примет значение, большее, чем t (хотя бы один элемент будет работать к моменту /). Вероятность противоположного события — отказа системы до момента t — будет Найдем совместную плотность распределения случайных величин Tj и Т2, обозначая ее t2). Случайные величины Тъ Т2 зависимы, и f (G> ti) — fl (G) f (G I G)i (6.1) где A(G) — безусловная плотность распределения величины 7\, /(/2//i) — условная плотность распределения величины Т2 (при усло- вии, что величина Т} приняла значение /j). Найдем обе плотности. По формуле (3.4) § 3 1i (G) — G (G) Pi (G)» где p^G) — надежность элемента Э, , в силу формулы (3.6) равная Pi (G) = exp и —$ ^i(0 dt о Отсюда {G —5 МО dt о (6.2) 13* 387
Найдем условную плотность Условная интенсивность отказов резервного элемента при условии, что будет: // // х _ / ~2^ при ^2<^’ ,R о. 22 1 I 12(^G) ПРИ *a>G- При этой интенсивности найдем условную плотность распределе- ния времени безотказной работы резервного элемента: Таким образом, совместная плотность распределения системы случайных величин 7\, Тг найдена: %1 (/х) Ха (Z2)exp I — — 5 A,2(/)d/l при 10 о J (^1) (h/ti) exp I ^2 -J W)dt—^ о 0 t, - (6.5) при (2 > fx. Зная эту совместную плотность, можно найти вероятность отка- за системы до момента t: P(A) = P(T1<t, = о о 388
откуда искомая надежность системы*. I I (6.6) о о При вычислении по формулам (6.5) — (6.6) необходимо иметь в виду, что выражение функции Д/ь t2) неодинаково по одну и другую сторону от прямой t2 ~ ti — биссектрисы первого координатного уг- ла (рис. 7.31). Области интегрирования на рис. 7.31 отмечены разной штриховкой. В области I функция f(tlt t2) выражается первой из фор- мул (6.5), в области II — второй; следовательно, Р (/) = 1 | ^1 (Л) ^2 (^г) X I (D —§ ^(tjdt — § K2(t)dt\dtldt2 + о о J + 5S ^"2 (^2^1) (II) хехр G б «2 ] — $ (/) dt — $ Х2 (0 dt— $ Х2 dt dtr dt2. о о t, ) (6.7) При заданном конкретном виде функций X1(Z), h2(t), ^^t/t^ ин- теграл (6.7) может быть вычислен, в простейших случаях аналити- чески, чаще — численно. Заметим, что найденное нами решение задачи оценки надежности для случая «облегченного» резерва относится и к случаю «холодного» резерва — при этом Х2(^) = 0, так что в формуле (6.7) остается только один интеграл — второй, да и тот тоже упростится. Мы видим, что в случае даже одного резервного элемента, рабо- тающего в облегченном (или холодном) резерве задача оценки надеж- ности системы довольно сложна. Если же число резервных элементов более одного, задача еще больше усложняется. Однако задача может быть сильно упрощена, если предположить, что потоки неисправностей, действующие на все элементы (основной и резервные), представляют собой простейшие потоки, интенсивность каждого из которых постоянна (это допущение равносильно тому, что закон надежности каждого элемента — экспоненциальный, а включе- ние элемента в работу меняет только параметр этого закона). При та- ком допущении надежность системы S может быть найдена путем реше- ния дифференциальных уравнений для вероятностей ее состояний. Задача 2. Система с холодным резервом и простейшими пото- ками отказов. Резервированная система (блок) $ состоит из основного элемента Э, и двух резервных: Э2, Э3. При отка- зе элемента Э5 в работу включается Э2, при отказе Э2 — Э3 (рис. 7.32). До включения каждый из резервных элементов находится 38В
л «холодном» резерве и отказать не может. Интенсивность потока от- казов основного элемента интенсивность потока отказов каждого из резервных элементов, когда они работают, одинакова и равна Х2. Все потоки отказов простейшие. Требуется определить надежность системы S. Представим процесс, протекающий в системе S, как марковский случайный процесс (см. гл. 4) с непрерывным временем и с дискрет- ными состояниями: — работает основной элемент Эъ S2 — работает резервный элемент Э2, S3 — работает резервный элемент Э3, — не работает ни один элемент. Рис. 7.33 Граф состояний системы показан на рис. 7.33. Так как восстанов- ления элементов не происходит, все стрелки на графе ведут в одну сторону. Система уравнений Колмогорова для вероятностей состояний будет: dPi 1 г, "Т7 = Ра + Pi. di . (6-8) ~~ — -----^2 Рз + ^2 Pi’ at dpt__\ — ^2 Рз- at К ним надо прибавить нормировочное условие: Pt 4~ Рг 4“ Рз + Pt= 1 • (6.9) Из первого уравнения выражаем как функцию t: Pi(t)~e~Kit (6.10) (начальное условие, при котором мы проинтегрировали это уравне- ние, рх(0) = 1). Подставляя (6.10) во второе уравнение, получим: ^ = -Х2/72 + М-Л< (6.П) di Проинтегрируем это уравнение с начальным условием р2(0) = 0; получим: р2 (t) = е~к'1 - -r-Ц- . (6.12) Ло — Л2 — Л] 390
Эту функцию подставим в третье уравнение (6.8); получим: +^Ге~К'1 - (6.13) С*Г 111 Aj Уравнение (6.13) нужно проинтегрировать тоже при начальном условии р3(0) = 0; получим: р3 (/)= Хз е~~А» '-----е-^_ Л М Л (б.14) 3 (X2-Xt)2 (Х2-Х1)2 Х2-Х, 1 ’ Для нахождения функции р4Д) не нужно интегрировать послед- нее уравнение (6.8) — ее можно найти из условия (6.9): Pi (0 = 1 - р (0 = 1 - (А (0+Pi (t) + р3 (0) = I 2 == 1 — 2 е-М t _____ (Х2—X-J2 V—2Xi Х2 Х2/ (Х2— Л1)2 Л2— Рис. 7.34 индексами: первый и нулю — если не Задача 3. Система с облегченным ре- зервом и простейшими потоками отка- зов. Резервированная система (блок) S со- __ стоит из основного элемента Эг и трех резервных: Э2, Э3, Э4 (рис. 7.34). Основ- ной элемент подвергается п ростейшему потоку отказов с интенсивное тью каж- дый из резервных до своего включения подвергается потоку отказов с интенсив- ностью Х2; после включения резервного элемента эта интенсивность мгновенно подскакивает до значения Х2. При отказе основного элемента 3j включается в работу резервный Э2, при отказе Э2 — Э3 и т. д. Требуется определить надежность системы. Будем нумеровать состояния системы дву равен единице, если основной элемент работа* работает; второй равен числу исправных резервных элементов: <$1з — основной элемент исправен (работает), все три резервных исправны; S12 — основной элемент исправен (работает), из трех резервных один отказал, два исправны; <$п — основной элемент исправен (работает), из трех резервных два отказали, один исправен; Slo — основной элемент исправен (работает), все три резервных отказали; S03 — основной элемент отказал, работает один из резервных, остальные два исправны; S02 — основной элемент отказал, работает один из резервных, из остальных резервных один исправен, другой отказал, S01 — основной элемент отказал, работает один из резервных, остальные два резервных отказали; SQo — все элементы отказали. 391
Граф состояний системы показан на рис. 7.35. Система уравнений Колмогорова для вероятностей состояний имеет вид: dt ~7Г' — ----(2^2 + ^1) Р12 4~ 3^2 Р18» at = ----(^2 4" М Р11 + 2^2 Р12» at = Р10 + ^2 Р11» at ~~ = — (^2 + 2^г) Роз 4" Ч Р1з» at ~~~ — (^з 4" ^г) Ро2 4" Р12 4~ (^2 4- 2^г) Роз» ~~ = Х2 р01 Хг ри 4- (A.J -|- ^г) Рог, at ~~ — Рю 4- ^2 Pol- di К этим уравнениям нужно добавить условие: Ргз 4- Р1г 4" Pii 4" Pio 4" Роз 4- Рог 4" Рох 4- Роо = 1, позволяющее отбросить любое из уравнений (6.15). (6.15) Рис. 7.35 Интегрирование системы (6.15) может быть осуществлено в сле- дующем порядке: из первого уравнения находим Pi3(0: р13 (0 =е~ (3^+ 4 (6.16) Это выражение подставляется во второе уравнение, которое те- перь содержит только одну неизвестную функцию Pi2(0; находим ее, подставляем в третье уравнение, и так далее. На каждом шаге такого 882
процесса новые функции мы выражаем через уже известные, пока, на- конец, не доходим до рОо» которую выражаем через все остальные: РОО (0 = 1 (Р13 (0 + Р12 (0 + Рп (0 + Рю (0 + + Роз (О+Роа (0 + Poi (О)* После того, как вычисления произведены и функции Рхз(0»".,Роо(0 найдены, можно найти надежность системы P(t). Очевидно, она равна сумме вероятностей всех состояний, при которых система работает: Р (t) — Рю (О + Рю (0 + Рп (0 + Рю (0 + + Роз (0 + Рог (0 + Poi (0> или, что то же, P(t) = l-pw(t). (6.17) 7. НАДЕЖНОСТЬ СИСТЕМЫ С ВОССТАНОВЛЕНИЕМ До сих пор, рассматривая задачи надежности, мы исходили из того, что отказавший элемент выходит из строя окончательно и ника- кого восстановления его функций не производится. Представляет ин- терес исследование задач надежности в предположении, что отказав- шие элементы восстанавливаются — мгновенно заменяются новыми или ремонтируются. При решении такого рода задач мы будем предполагать, что все потоки событий, переводящие систему из состояния в состояние, — простейшие (иначе мы с такими задачами не справимся). Предварительно сделаем следующее замечание: все процессы, связанные с надежностью систем, которые мы рассматривали до сих пор, были существенно нестационарными; так как восстановления элементов не было, естественно, что при t -* оо надежность системы стремилась к нулю, и «предельным режимом» системы просто было «не работает». В задачах с восстановлением нас будут интересовать не только переходные процессы в системе, но и установившиеся режимы, дости- гаемые при t -> сю. В данном параграфе мы рассмотрим несколько за- дач из области надежности систем с восстановлением. Задача 1 (задача о запасных элементах)? Работает простая система, состоящая из одного элемента Э, кото- рый подвергается простейшему потоку отказов с интенсивностью X. При отказе элемент мгновенно заменяется новым с такими же харак- теристиками. В нашем распоряжении имеется N запасных элементов, находящихся в «холодном» резерве. Определить вероятность того, что этого числа запасных элементов нам хватит для обеспечения рабо- ты системы в течение времени / (другими словами, найти надежность P(t) системы с восстановлением). 80S
Решение. Нетрудно заметить, что поставленная задача эквива- лентна задаче оценки надежности резервированной системы с N ре- зервными элементами, работающими в холодном резерве и, как тако- вая, может быть решена методами, предложенными выше. Но мы решим ее несколько иным, более простым методом. Рассмотрим на оси 0/ «поток восстановлений», т. е. последователь- ность моментов времени, в которые выходят из строя и мгновенно вос- станавливаются элементы (рис. 7.36). Очевидно, это — простейший поток с интенсивностью X. Надежность системы Р(1) есть вероятность того, что к моменту t система будет работать. Для этого нужно, чтобы на участке (0, /) отказало не более N элементов (один основной и N — 1 запасных). Мы знаем (см. § 4 гл. 4), что число событий простейшего потока, попадающих на участок длиной /, распределено по закону Пуассона: где а = М, т. е. (/п = 0, 1, ...). (7.1) ml Найдем вероятность того, что число точек (событий), попадающих на участок (0, t), будет не больше N. Эта вероятность и будет надеж- но стью системы Р (t) = Ро Pi Д- ... -рРн, или, короче, РЦ)=^Рт. (7.2) т = О Подставляя (7.1) в (7.2), получим: P(Z)=2^pe-w, (7.3) или, вынося е~за знак суммы, Р(0=е-«2^- (7-4) 0 т' 894
Вычисления по формулам (7.3) или (7.4) удобно производить, пользуясь таблицами пуассоновского распределения Рт (или вероят- m — 1 ностей Rm = 1 — 2 Рп, которые несколько удобнее табулируются). п—0 В приложении (табл. 2) приведены выдержки из таблиц пуассо- новского распределения (вероятности Рт). Пример 1 Рассматривается работа элемента с восстановлением (задача 1); интенсивность потока отказов X = 2 (отказа в час). В нашем распоряжении N = 6 запасных элементов. Определить надежность системы P(t) в функции времени до т = 5 час (максимальное время работы). Решение. Воспользуемся табл. 2 приложения. Первый столбец таблицы, где Р7 отлично от нуля — это столбец, соответствующий а = 1, т. е. t = 0,5. Пола- гая t = 0,5 и складывая все вероятности для т > 6 (из них отлична от нуля толь- ко Р7), получаем: Р(0,5) = 1 — 0,0001 = 0,9999. Для 1=1 (а = 2) имеем: Р(1) = 1 — (0,0037 + 0,0009 + 0,0002) = 1 — 0,0048 = 0,9952 ж 0,995. Для 1=2 (а = 4): Р(2) = 1 — (0,0595 + 0,0298 + 0,0132 + 0,0053 + 0,0019 + 0,0006 + 4- 0,0002 + 0,0001) = 1 — 0,1106 « 0,889. Для t = 3 (а = 6) уже удобнее не переходить к противоположному собы- тию, а вычислять вероятность того, что число отказов будет меньше семи: Р(3) = 0,0025 + 0,0149 4- 0,0466 4- 0,0892 4- 0,1339 4- 0,1606 4- 0,1606 х » 0,608. Для t = 4 (а = 8): Р(4)=0,0003 4- 0,0027 4- 0,0107 4- 0,0286 4- 0,0572 4- 0,0916 4- 0,1221 х «0,313. Для / = 5 (а = 10): Р(5) = 0,0000 4- 0,0005 4- 0,0023 4- 0,0076 4- 0,0189+ 0,0378 + 0,0631 ~ ж 0,130 Наносим полученные значения на график (рис. 7.37). Задача 2. Система состоит не из одного, как в задаче 1, а из не- скольких элементов; среди них Hj элементов группы 1, м2 элементов группы 2, tih элементов группы k. Каждый из элементов любой группы, независимо от других, мо- жет отказывать; интенсивность потока отказов для элементов разных групп равна соответственно: Х2........ 395
// Все потоки отказов — простейшие. Отказавший элемент немед- ленно заменяется новым. В запасе имеется Nlt > элементов соответствующих групп. Отсутствие запасного элемента при очеред- ном отказе означает отказ устройства. Требуется определить надеж- ность системы P(t). Решение. Так как отсутствие запасного элемента любой группы равносильно отказу устройства, будем рассматривать группы как «последовательно» включенные элементы; тогда надежность системы будет равна произведению надежностей всех групп. Надежность i-й группы определяется как в задаче 1: Ni , Р(<>(/) = е~М У (7.5) ml т— О Перемножая эти надежности, получим надежность системы: /э^)=Р<|>(/)-Я2>(/). ••• или, короче, k P(t) = П Р(‘>(/). (7.6) i = 1 Заметим, что, пользуясь выведенными формулами, можно не толь- ко оценивать надежность системы при заданном числе за- пасных элементов, но и определять, сколько запасных элементов нужно иметь в распоряжении для того, чтобы система при заданном I имела определенную надежность. Пример 2. Определить число запасных элементов Л1, которое надо иметь в распоряжении для того, чтобы система, состоящая из одного основного эле- мента и N запасных с интенсивностью потока отказов X = 0,5, имела при / =8 надежность не меньше 0,95. Решение. Имеем а == kt = 4. В столбце табл. 2 приложения, соответствую- щем а = 4, складываем все вероятности, начиная с последней, до тех пор, пока сумма не дойдет до 1 — 0,95 = 0,05. Получаем: 0,0001 4- 0,0002 + 0,0006 + 0,0019 + 0,0053 + 0,0132 + 0,0298 = 0,0511. Итак, вероятность того, что число отказавших элементов будет больше се- ми, равна 0,0511, т. е. Л1 = 7 не удовлетворяет нашему требованию; если же взять N = 8, то вероятность нехватки элементов будет меньше 0,05: 0,0001 + 0,0002 + 0,0006 + 0,0019 + 0,0053 + 0,0132 = 0,0213. Отсюда, число запасных элементов, удовлетворяющее условию задачи, М=8 Во всех рассмотренных выше задачах восстановление элемента происходило мгновенно; теперь мы рассмотрим задачу, где оно задер- живается. Задача 3 (система из одного элемента с задержанным восстанов- лением). Система состоит из одного элемента Эь находящегося под дейст- вием простейшего потока отказов с интенсивностью X. Отказавший эле- мент немедленно начинает восстанавливаться (ремонтироваться). По- ток восстановлений — простейший, с интенсивностью ц. Запас средств для ремонта неограничен. Требуется определить: 396
— обобщенную надежность системы P(t) — вероятность того, что в момент t система будет работать; — предельное значение обобщенной надежности р — вероятность того, что в произвольный, достаточно удаленный от начала момент си- стема будет работать; — вероятность P(t) того, что до определенного момента система будет работать вообще безотказно (т. е. не будет ни одного перерыва в работе для восстановления). Решение. Состояния системы (в данном случае элемента) будут: So — работает, Sj — восстанавливается. Г раф состояний показан на рис. 7.38. Сравнивая граф состояний 7.38 с графом состояний одноканальной системы массового обслужи- Рис. 7.38 Рис. 7.39 вания с отказами (см. § 3 гл. 5, рис. 5.1), мы видим, что они совпадают; значит, совпадают и вероятности состояний, т. е. д>(0 = гг~+гг~е~1К+,х)'’ А. + ц А, + ц (7 7) Pi (t) = 1 —ро(О = (1 —е-^+м.)'). Обобщенная надежность системы — вероятность того, что в мо- мент t она будет работать: /’(/WoW-(7.8) л+ц При / оо эта надежность стремится к предельному значению: Р — —-— т. е. равна относительной доле интенсивности потока восстановлений в суммарной интенсивности потока восстановлений и отказов. Вероятность P(t) того, что до момента t не произойдет ни одного отказа, определим следующим образом. Предположим, что восстанов- лений отказавшего элемента нет, т. е. граф состояний имеет вид, по- казанный на рис. 7.39. Искомая вероятность P(f} будет равна вероят- ности p0(t) того, что система с графом состояний, показанным на рис. 7.39, будет к моменту t в состоянии So; эта вероятность полу- чится решением дифференциального уравнения dpe _ rfT- W7
откуда р0(/) = е-^. Таким образом, P(/)=e~w. (7.9) Задача 4 (система из нескольких элементов с задержанным восста- новлением). Система S состоит из п, элементов, каждый из которых находится под действием простейшего потока отказов с интенсивностью X. При отказе любого элемента система выключается и начинается восста- новление элемента. При неработающей системе элементы отказывать не могут. Интенсивность потока восстановлений равна ц. Все потоки— простейшие. Найти: — обобщенную надежность системы P(t) (вероятность того, что в момент t система будет работать); — предельную обобщенную надежность системы р\ — вероятность Pit) того, что до момента t отказов вообще не бу- дет. Рис. 7.40 Решение. Система по-прежнему может быть только в двух состоя ниях: So — работает, S i— выключена, восстанавливается один элемент*’. Граф состояний показан на рис. 7.40. Как видно, он отличается от графа на рис. 7.38 только тем, что вместо X стоит пк. Отсюда, на ос- нове решения предыдущей задачи, P(t) + (7-Ю) Р = ^~, (7-Н) ПЛ + ц P(/) = e-"w. (7.12) Иную картину мы получим, если предположим, что во время вос- становления одного элемента другие продолжают работать и могут выходить из строя. Задача 5. Система S состоит из п элементов, каждый из которых находится под действием потока отказов (неисправностей) с интен- сивностью к. При отказе элемента он немедленно начинает восстанав- *) Одновременный выход из строя двух или более элементов не рассматривается в силу ординарности потока отказов. 398
\ ливаться, остальные же элементы продолжают работать (активно или в горячем резерве). Интенсивность потока восстановлений элемента (независимо от''числа одновременно восстанавливаемых элементов) равна р. \ Найти: 1 — вероятность Р(1) того, что в момент t все элементы будут ис- правны; — предельную вероятность р того же события; — среднее число исправно работающих элементов для предель- ного режима (при t -> сю). Решение. Будем нумеровать состояния системы по числу неисправ- ных элементов: So — все элементы исправны; 5] — один элемент восстанавливается, остальные исправны; Sb — k элементов восстанавливаются, остальные исправны; Sn — все п элементов восстанавливаются. Рис. 7.41 Граф состояний системы показан на рис. 7.41. Сравнивая его с гра- фом состояний замкнутой СМО в случае, когда число т рабочих, об- служивающих станки, равно числу п станков (см. § 8 гл. 5), видим, что они совпадают. Следовательно, для обоих графов совпадают и диффе- ренциальные уравнения для вероятностей состояний, и предельные вероятности. Дифференциальные уравнения имеют вид: + at — —Цл— 1) X _|_ р] 2|лр2> at —~ ж? — Ци — щ X Рь 1) Xpfe— ] (k -j-1) 1, dt (7-13) = — nppn + 'Kpn_l, at плюс условие P1 + P2+ +Pn ~ 899
Искомая вероятность Р(/) есть не что иное, как p0(ty которую по- лучим, интегрируя систему уравнений (7.13) при начальных условиях: / = 0; р0 = 1; р1 = ..,=рп = 0. / Предельные вероятности состояний находим /по формулам § 8 гл. 5, полагая т = п, Х/р, = р: / __________________1_______________ 1 . 1+СП1 р+...+СПГ рг +-.. +cn"p« (1 -hP)" Рг = РГРо, Искомая предельная вероятность р будет равна предельной вероят- ности Ро- Среднее число исправно работающих элементов и будет равно чис- лу элементов п, умноженному на вероятность того, что отдельный эле- мент работает исправно. Эта вероятность для предельного режима равна откуда — Пц. п и = —. + ' +р 1 Рассмотренные задачи и примеры показывают, что математиче- ский аппарат, применяемый для анализа надежности технических устройств, в сущности, совпадает с аппаратом теории массового обслу- живания, и исследование процессов, протекающих в системах с нена- дежными элементами, при известных условиях может быть проведено методами теории непрерывных марковских цепей. Для этого нужно, чтобы потоки событий, переводящие элементы из состояния в состоя- ние, были (точно или приближенно) пуассоновскими. Эти потоки не- обязательно должны быть стационарными, но во всяком случае таки- ми, чтобы интенсивности потоков событий не зависели от слу- чайных моментов переходов системы из состояния в состояние. Для наиболее простого, стационарного случая это означает, что, в част- ности, все законы надежности должны быть экспоненциальными, а за- коны распределения времени, восстановления — тоже показательны- ми или близкими к показательным. 8. УЧЕТ ЗАВИСИМОСТИ ОТКАЗОВ ПРИ ОЦЕНКЕ НАДЕЖНОСТИ ТЕХНИЧЕСКИХ УСТРОЙСТВ До снх пор, анализируя надежность технических устройств (си- стем), составленных из элементов, мы предполагали, что отказы этих элементов происходят независимо друг от друга. Это допущение не 400
всегда справедливо: в ряде случаев отказы элементов могут быть з а - в и с и м ы м и\ Зависимостщмежду отказами может быть двух типов. 1. Отказ какого-либо элемента меняет режим работы системы (например, может возникнуть короткое замыкание или резкие колебания Спряжения; или же выход из строя одного эле- мента, являющегося регулятором, меняет режим работы других). 2. На всю совокупность элементов действует какой-то один случайный фактор (температура, вибрация и т. д.), одно- временно влияющий на надежность всех элементов или части из них. Остановимся вкратце на способах учета обоих типов зависимости. Рис. 7.42 Рис. 7.43 Пусть имеется налицо зависимость отказов первого типа — вы- ход из строя одного элемента влияет на режим работы и, значит, на надежность остальных. Очевидно, если мы имеем дело с простой (не- резервированной) системой при отсутствии восстановления, то зави- симость первого типа не может сказаться на надежности системы. Если же система резервирована (или происходит восстановление), зависи- мость такого типа должна учитываться. Пример 1. Система состоит из двух элементов: основного Э1 и резервного Э2, работающего в «горячем резерве» (рис. 7.42). При отказе основного элемента система автоматически переключается на резервный. Интенсивность потока от- казов обоих элементов в нормальном рабочем состоянии одинакова и равна X Выход из строя основного элемента влияет на режим работы резервного так, что интенсивность отказов 7. увеличивается на величину f(t — где — мо- мент отказа основного элемента. Таким образом, условная интенсивность от- казов резервного элемента при условии, что основной отказал в момент равна: X при i <^ti, + — Zj) при Z>Zj. Требуется определить надежность системы P(t). Решение Данная задача сводится к уже решенной ранее. Действительно, полагая (t) = Х2 (t) = X; Х2 (/Д1) = Х-|-/(t—ti), мы приходим к той схеме, которая рассматривалась в задаче 1 § 6. Первый тип зависимости отказов (влияние отказов одних элемен- тов на надежность других) наблюдается и тогда, когда некоторые элементы (регуляторы) предназначены для поддержания нормального режима работы других. Пример 2. Система $ состоит из двух «параллельно» включенных элемен- тов: основного Э1 и резервного Э2, находящегося в облегченном резерве (рис. 7.43). 401 Ц (f / ^i) =
Регулятор Эр предназначен для того, чтобы поддерживать нормальный режим работы обоих элементов: 3, и Э2 В нормальном режиме интенсивности отказов работающего и неработающего (исправного) элементов рав/ы соответственно X] и Х2. При отказе регулятора эти интенсивности мгнове/но увеличиваются и становятся равными Aj и А2. Интенсивность потока отказов самого регулятора равна Ар Все потоки событий — простейшие. Определит^ надежность системы Решение. При постоянных интенсивностях отказрв процесс, происходя щий в системе — марковский Будем нумеровать состояния системы тремя индексами: первый равен ну- лю, если исправен регулятор, и равен единице, если он вышел из строя Второй индекс равен нулю, если исправен основной элемент Э1Г и единице, если он вы- шел нз строя Третий индекс — то же для резервного элемента Э2. Состояния системы (рис. 7.44); Sooo — все три элемента исправны, £„10 — регулятор исправен, элемент Эт вышел из строя, работает Э2; Sooi — регулятор исправен, элемент 3] исправен, работает, 3, вышел из строя; Sou — регулятор исправен, оба элемента 3, и Э2 вышли из строя; Зию — регулятор вышел из строя; оба элемента 3, и Э2 исправны, из них работает; 5цо — регулятор вышел из строя, элемент 3, вышел из строя, работает Э2; S10i — регулятор вышел из строя, элемент Эг работает, Э2 вышел из строя; Sm — все три элемента вышли из строя. Составив по этому графу систему дифференциальных уравнений (предо- ставляем это сделать читателю) и решив эти уравнения при начальных условиях: £=0; Рооо— 1; Р.ю= • •- = Pin = 0> получим вероятности состояний. Надежность системы P(t) выразится как сумма вероятностей всех состояний, кроме S011 и 5щ, в которых не работает ни один из элементов Эг и Э2: Р(/)=)—Рои (0—Pin (1) (8.1) Остановимся теперь на втором типе зависимости между отказа- ми. Этот тип зависимости обусловлен наличием каких-то случайных факторов, влияющих одновременно на работу всех элементов. Будем считать, что эти факторы определяют тот или иной режим рабо- 403
ты с и с т е м,ы. Рассмотрим сначала самый простой случай, когда режим работы системы не меняется в ходе ее эксплуатации, а остается постоянным. Так, например, можно считать, что метеорологические условия не меняются или мало меняются в процессе полета ракеты класса «Земля — Земля». Пусть возможны несколько режимов работы: ^1» ^2> •••> Rk с вероятностями, равными соответственно Р («О, Р (R2), .... Р (Rk). Имеется некоторая система 5, надежность которой зависит от режима, при котором она работает. Обозначим условную надежность системы при <-м режиме (Rt): P(t/Rt) (i = 1, .... k). Найдем теперь полную (безусловную) надежность системы Р(/). По формуле полной вероятности: Pit) = Р (Pj) Р (t/RJ 4- Р (R2) Р (t/R,) +... + Р (Rh) Р (t/R^, или, короче, k Р (Г) = У? Р (Rt) Р (t/RJ. (8.2) i= i Пример 3. Система 5 состоит из двух «последовательно» соединенных эле- ментов 9t иЭ, и может работать в одном из трех режимов: Rlt Ra, Ra, вероятно- сти которых P(«t) = 0,4; Р (Я2) = 0,3; Р(/?з) = 0,3. При режиме R± интенсивности потоков отказов элементов Э, и Э2 равны 0,1 и 0,2 (отказов в час), при режиме R2 они равны 0,3 и 0,4, при режиме R3 — 0,4 и 0,5 Определить надежность системы и вычислить ее для t = 2 час Решение. При «последовательном» соединении элементов интенсивности отказов складываются. Находим условные надежности системы при трех режи- Р (t/Rt) =е—(0'1+0,2) * =е—0,3(, Р(^/?2) = е-(°’3+0’4)^=е“-0'7^ р (///?3)=е~(0’4+0'5> * = е-0’9 *. Отсюда Р(0 = 0,4 е-0,3 (4-0,3e-0>7z4-0,3 Полагая 1 = 2, получим: Р (2) = 0,4 е~016 —0,Зе-1’44-0,Зе-1’8 = = 0,4-0,549 — 0,3.0,2474-0,3-0,165= 0,343. Аналогично рассмотренной дискретной схеме нескольких режимов можно определить надежность системы, если режим работы характе- ризуется некоторой непрерывной случайной величиной R (скажем, 403
температурой), имеющей известную плотность распределения f(r). Тогда в формуле (8.2) вместо суммы будет фигурировать интеграл: /’(/)=$ P(t/r)f(r) dr, (8.3) (R) где P(tlf) — условная надежность системы при условии, что R — г, f(r) — плотность распределения параметра R. Интеграл распространяется на всю область (R) возможных зна- чений параметра R. Пример. 4 Система .V состоит из двух элементов Э2, включенных «па- раллельно»; резервный элемент Э2 находится в «горячем» резерве. Интенсивность потока отказов каждого элемента постоянна во времени, но зависит от режима работы системы — температуры 0; эта зависимость выражается формулой X (0) =Ло-+-а0. Плотность распределения температуры 0 постоянна на интервале от до &2: f {&} — I/C&2— $1) при Определить надежность системы. Решение. Определяем условную надежность системы при заданном значе- нии 0=0: Р (//О) — 1 — (1 _е-<х'»+а®>/)2- По формуле (8.3) P(t)= = f е-(К“+ай>9г]---------!— d&= ---------С [2 е-(Х0+аО)!_е-2(Х0+а#)/1 d#=a J 02— О] d2—OiJ 01 01 = . 1 Г2е—(Xs+aOi)f_2е— (A-o+aOs) ___Le—2(Х„4-аО1): , а(02— / [ 2 "г I _2 (Х,+аОг)/1 ^2 J ‘ Заметим, что неучет зависимости отказов, если она имеется и су- щественна, может привести к большим ошибкам, особенно, если си- стема состоит из многих элементов. Пример 5. Система S состоит из 50 однородных элементов, соединенных «последовательно», и может работать в одном из двух режимов: — нормальном, 7?2 — ненормальном. Вероятности этих режимов равны соответственно: P(/?i)=0,9; />№)=0,1. В нормальном режиме надежность каждого элемента (за определенное вре- мя т) равна р = 0,998, в ненормальном р' «= 0,9. Определить полную надеж- ность системы 5 и сравнить с той, которая получилась бы, если бы элементы выходили из строя независимо. 404
РешеииелУсловная надежность системы при первом режиме: ( Pftj = 0,9985«« 0,904; при втором. РКг = 0,9^« 0,004. Полная надежность системы: Р» 0,9-0,904 + 0,-1.0,004 = 0,814. Подсчитаем гу же надежность, считая отказы элементов независимыми и приписывая каждому из них надежность, равную р=0,9р+0,1р'=0,988. Перемножая надежности 50 элементов, получим: р=0,9885оя= 0,551. Как видно из примера, пренебрежение зависимостью отказов при «последовательном» соединении элементов может привести к сущест- венному занижению надежности. При «параллельном» соединении эле- ментов тот же неучет зависимости приводит не к занижению надеж- ности, а, наоборот, к ее завышению. Пример 6. Резервированная система состоит из основного элемента Э, и трех резервных: Э2, Э3, Э4, работающих в «горячем» резерве. Система может работать в одном из двух режимов: Rr — нормальном и /?., — ненормальном с вероятностями P(R^ = 0,7 и P(jR2) = 0,3. Надежность всех элементов одинакова; в нормальном режиме она равна р •= 0,99, в ненормальном р = 0,4. Определить полную надежность системы Р и сравнить ее с той Р, которая получится, если считать отказы независимыми. Решение. Условная надежность системы при каждом режиме: Pr=1-_(1_0,99)4» 1,000, РКг = 1— (1— 0,4)4» 0,870. Полная надежность системы: Р « 0,7.1,000+0,3.0,870 « 0,961. Если считать отказы элементов независимыми и приписать каждому из них надежность р = 0,7-0,99 + 0,3-0*,4 = 0,813, го надежность системы будет другая: р=1—(1—р)*»0,999, ®. е. значительно выше, чем истинная надежность 0,961. Завышение надежности резервированного блока, которое получает- ся при пренебрежении зависимостью отказов, тем больше, чем больше число резервных элементов. Если техническая система состоит из элементов, соединенных как «последовательно», так и «параллельно» (например, если дублированы только наиболее важные узлы), то пренебрежение зависимостью от- казов может приводить как к завышению, так и к занижению надеж- ности. Наконец, рассмотрим случай, когда в процессе работы системы режим может меняться случайным образом. 405
Пример 7. Система 5, состоящая из двух «последовательно» соединенных элементов, может работать в одном из двух режимов: и Т?2 Переход системы из режима в режим R2 происходит под действием простейшего потока собы- тий с интенсивностью Х12; обратный переход — под действием простейшего по- тока событий с интенсивностью Х21 В режиме интенсивность потока отказов первого элемента равна %/1’, второго — в режиме R2 эти интенсивности равны Ц2>, Ц2> Все потоки — простейшие. Определить надежность систе- мы P(t). Решение. Состояния системы будут: 51И — режим Rlt оба элемента н. пр гпы; Sih — режим Rlt хотя бы один »ле’,,ент неисправен; S2B — режим jR2, оба элемента nci ,авны; S2H—режим jR2, хогя бы ол« 3/емент неисправен. Рис. 7.45 Граф состояний системы показан на рис. 7.'45 Стрелки, переводящие си- стему из состояния S1H в S2H и обратно, не показаны, так как, если система не исправна, нам все равно, какой режим имеет место Уравнения Колмогорова для вероятностей состояний будут: dt — — (Ц1> + Ц!> + ^12) Р1и+Ч1 Р<2я> di = — (M2> + 42> + ^2i) ?2и + ^12 Р1И' (8.4) Другие вероятности нас в данном случае не интересуют, так как они соот- ветствуют неисправной (неработающей) системе. Если мы знаем, в каком режиме (R^ или 7?а) система начинает работу, то уравнения (8.4) будут интегрироваться при вполне определенных начальных условиях. Например, если система начинает работу в режиме начальные ус- ловия будут: ^=0, Р1и=1. Р2И = 0. (8.5) Проинтегрируем систему (8.4), например, при численных значениях па- раметров: х12=1, Х21=3, Ц1>=1, Ц!>=2, Ц2> = 2, Ц2> = 4. 406
Уравнения (8.4) примут вид: dpiu ----------‘*р1и + 3р2и> dPtn ,, —Р1и 9рги. (8.6) Прежде всего найдем, при каких X пара функций Се и, De м может удовлетворять уравнениям. Подстановка такой пары в систему (8.6) дает: _ХС=—4С 4-30,1 —ХО=С—90 J или (Ь-4)С+ЗО = 0,| С + (Л—9)0=0. I [ ’ Чтобы система уравнений (8.7) имела какое-нибудь решение (С, О) , кроме нулевого, необходимо и достаточно, чтобы был равен нулю определитель из коэф- фициентов этой системы: (X—4) (X—9) —1.3 = 0 или V —13X4-33 = 0. Решая это уравнение, находим два значения X: Xj = 6,5—/6,5а—33» 3,459, Х2 = 6,54-Уб,5а—33» 9,541. При значении X = Xt решение системы (8.7) дается формулой Л__1 D<'> =------ С( ° = 0,180С(1), 3 при X = Х2 — формулой Р(2> = ^—С(2>= — 1,847С<2). 3 Отсюда вытекает, что общий вид решения системы дифференциальных урав- нений (8.7) — это пара функций: р1и(О=С(‘> е-зл59/4-С(2> е—9,541 р2И (<) = 0,180С‘1> е—3,459 1 —1,847С<2) е~9,5411. Начальным условиям мы можем удовлетворить соответствующим выбором произвольных постоянных С(1> и с(2). Для того чтобы выполнялось условие Р1и(0) = 1> Ргп (°) в °- нужно, чтобы было С<п 4-С<2) = 1, 0,180С(1> — 1,847С<2) = 0. Из второго уравнения С(2) = 0,097С(1\ подставляя это в первое, получаем: С(1)= 1/1,097 = 0,912; С(2) = 0,088. 407
Окончательно, Р1и (Л =0,912 е“3,459'4-0,088е~9-541 f, Р2и(0 = °>164 (е-3,459 t _е- 9,54 1 ty Надежность системы, очевидно, будет равна сумме вероятностей исправной работы: Р(1> (0 = Pil,’(0 + Р2и)(0= 1 >076 е~3,459 0,076 е—9,541 \ где верхний индекс (1) показывает, что они вычислены для определенного на- чального режима Pt. Аналогично, для начального режима R2: р<2) (0=0,493 (е“3,459 ' —е"9,541 ') , р$(0 = 0,089 е**3’459'40,911 е-9,541 Р(2> (0=р<2> (0 4р<2и> (0 = 0,582 е ~3,459'40,418 е"9,54и. Если начальный режим работы системы в точности неизвестен, а известны только вероятности режимов Ri и R2 в начале процесса, надежность системы мо- жет быть подсчитана по формуле полной вероятности: Р (0 = Р (Р4 Р<1 > (04Р (Р2) Р<2> (0, где P(Pi), P(R2) — вероятности того, что в нача льный момент имеют место режи- мы Pi и Р2 соответственно.
8 МОДЕЛИРОВАНИЕ ОПЕРАЦИЙ МЕТОДОМ СТАТИСТИЧЕСКИХ ИСПЫТАНИЙ 1. МЕТОД СТАТИСТИЧЕСКИХ ИСПЫТАНИИ (МОНТЕ-КАРЛО) В ряде предшествующих глав мы познакомились с методами по- строения некоторых математических моделей, дающих возможность установить аналитическую (формульную) связь между заданными условиями операции (в том числе принятым нами решением) и резуль- татом (исходом) операции, характеризующимся одним или несколь- кими параметрами — показателями эффективности. Если в ход опе- рации вмешиваются случайные факторы, то она представляет собой случайный процесс, а показатель эффективности — ве- роятность какого-то события или же математическое ожидание какой- то случайной величины. Иногда удается построить аналитическую мо- дель случайного процесса (например, систему дифференциальных уравнений для вероятностей состояний или алгебраических уравнений для предельных вероятностей состояний) и связать заданные условия операции с ее исходом аналитическими зависимостями. Однако это удается далеко не всегда, — главным образом, в тех случаях, когда случайный процесс, протекающий в рассматриваемой системе, мар- ковский или близок к марковскому. На практике далеко не все случайные процессы, наблюдаемые в операциях, являются марковскими или близкими к ним. Например, в реальных системах массового обслуживания поток заявок отнюдь не всегда бывает пуассоновским; еще реже наблюдается показатель- ное (или близкое к нему) распределение времени обслуживания. Для произвольных же потоков событий, переводящих систему из состояния в состояние, аналитические решения получены только для отдельных частных случаев, а в общем случае удовлетворительных методов мате- матического описания соответствующих процессов не существует. В тех случаях, когда построение аналитической модели явления по той или другой причине трудно осуществимо, применяется другой метод моделирования, известный под названием метода стати- стических испытаний или, иначе, метода Монте- Карло. В настоящее время при моделировании операций и вообще слу- чайных процессов метод Монте-Карло применяется очень широко. Такое широкое распространение метода связано, главным образом, 4Q9
с появлением ЭЦВМ, позволяющих в обозримые сроки выполнять мас- совые расчеты по этому методу (без машин весьма трудоемкие). Од- нако в принципе метод Монте-Карло может применяться и без помощи ЭЦВМ. В данном параграфе мы изложим существо метода, безотно- сительно к способу его осуществления. Идея метода Монте-Карло чрезвычайно проста и состоит она в сле- дующем. Вместо того, чтобы описывать случайное явление с помощью аналитических зависимостей, производится «розыгрыш» — модели- рование случайного явления с помощью некоторой процедуры, даю- щей случайный результат. Так же как в жизни конкрет- ное осуществление процесса складывается каждый раз по-иному, так же и в результате «розыгрыша» мы получаем один экземпляр — одну «реализацию» случайного явления. Произведя такой «розыгрыш» очень большое число раз, мы получим статистический материал — множест- во реализаций случайного явления, — который можно обработать обычными методами математической статистики. Нередко такой прием оказывается проще, чем попытки по- строить аналитическую модель явления и исследовать зависимость между его параметрами на этой модели. Для сложных операций, в ко- торых участвует большое число элементов (машин, систем, людей, коллективов) и в которых случайные факторы сложным образом взаимодействуют между собой, метод статистических испытаний, как правило, оказывается проще аналитического. В сущности, методом «розыгрыша» может быть решена любая вероятностная задача; однако оправданным он становится только в слу- чае, когда процедура «розыгрыша» проще, а не сложнее применения аналитических, вычислительных методов. Рассмотрим элементарный пример. Решается задача: по некото- рой цели Ц производится четыре независимых выстрела, каждый из которых попадает в нее с вероятностью р = 0,5. Для поражения (уничтожения) цели одного попадания недостаточно, требуется не менее двух попаданий. Определить вероятность поражения цели. Поставленную вероятностную задачу можно решить двумя спо- собами: а) аналитически и б) «розыгрышем». Сначала решим задачу аналитически. Вероятность поражения цели W вычислим через вероятность противоположного события — непоражения цели. Вероятность непоражения цели равна сумме ве- роятностей ни одного попадания и ровно одного попадания; вероят- ность ни одного попадания равна 0,54; вероятность ровно одного попа- дания равна С41-0,51-0,53 = 4 • 0,54, следовательно, W = 1 — (0,54 + 4 • 0,54) « 0,688. Теперь попробуем решить ту же задачу «розыгрышем». Будем моделировать процедуру стрельбы с помощью другой, тоже случай- ной, процедуры. Вместо четырех выстрелов по цели будем бросать че- тыре монеты: появление герба будет условно означать «попадание», а решки — «промах». Если из четырех брошенных монет не менее двух упадут гербом, это будет значить, что цель «поражена». «Опытом» или «розыгрышем» в нашем случае будет бросание четырех монет; «резуль- 410
гатом» или «исходом» этого опыта — «поражение» или «непоражение» цели. Повторим такой «опыт», состоящий в бросании четырех монет, очень много раз подряд. Тогда, согласно теореме Бернулли, частота «поражения» цели почти наверняка будет мало отличаться от вероят- ности этого события W; значит, если мы бросим четыре монеты боль- шое число раз N и разделим число «поражений» цели на N, мы почти наверняка получим число, близкое к W, т. е. к 0,688. В данном примере определение вероятности W розыгрышем было несравненно труднее, чем аналитическим расчетом. Однако далеко не всегда это бывает так. Очень часто оказывается, что получение ве- роятности события (или среднего — значения случайной величины) ана- и литическим, расчетным путем на- / — столько сложно и громоздко, что | .ЛТПППППТТЬк проще оказывается розыгрыш. Рассмотрим пример такой зада- у ) чи. Пусть производится бомбо- 11 ^4—У метание по некоторой цели Ц f \ (рис. 8.1); зона разрушительного ( J действия бомбы имеет вид кру- J га радиуса г. Сбрасывается п бомб. —'' Для поражения цели (вывода ее рис g t из строя) нужно покрыть разру- шениями не менее k % площади цели. Требуется найти вероятность поражения цели W. Несмотря на видимую простоту постановки задачи, ее аналити- ческое решение чрезвычайно сложно. Гораздо проще будет решить задачу «розыгрышем». Для этого надо будет «разыграть» координаты п точек попадания (как это сделать — будет рассказано в дальнейшем); вокруг каждой точки попадания описать круг радиуса г и подсчитать общую пораженную площадь цели (на рис. 8.1 она заштрихована). Если эта площадь оказалась больше k% площади цели, считать, что цель «поражена», если меньше k% — «не поражена». Такой «опыт», со- стоящий в «бросании» п бомб, нужно повторить очень много раз, отме- чая каждый раз условным знаком (например, «+») опыт, в котором цель была «поражена». При большом числе «опытов» N вероятность поражения цели W может быть приближенно оценена как частота «по- ражения» цели: , (1.1) N где М — число «опытов», отмеченных плюсом. Оказывается, что даже для рассмотренной нами сравнительно эле- ментарной задачи процедура «розыгрыша» (получение вероятности методом Монте-Карло) будет значительно проще, чем нахождение той же вероятности аналитическим, расчетным методом. Пример яв- ляется хорошим образцом типично «монте-карловской» задачи. 411
Заметим, что методом статистических испытаний (Монте-Карло) можно находить не только вероятности событий, но и средние значения (математические ожидания) случайных величин. При этом мы будем пользоваться уже не теоремой Бернулли, а законом больших чисел (теоремой Чебышева). Согласно этой теореме при большом числе неза- висимых опытов среднее арифметическое наблюденных значений слу- чайной величины почти наверняка мало отличается от ее математиче- ского ожидания. Так, если в условиях последнего примера (бомбометание по це- ли Ц)нам требуется найти не вероятность поражения, а математиче- ское ожидание площади разрушений Sp: Al|Sp| = sp, то его можно определить приближенно как среднее арифметическое площадей разрушений в большом числе N разыгранных «опытов». (1-2) математи- где Spi — значение площади разрушений в г-м «опыте». Аналогичным способом могут быть найдены не только ческие ожидания, но и дисперсии интересующих нас случайных вели- чин. Не забудем, что дисперсия случайной величины есть не что иное, как математическое ожидание квадрата центрирован- ной случайной величины; оно может быть приближенно найдено как среднее арифметическое этих квадратов в отдельных «опытах». Так, в нашем примере дисперсия площади разрушений может быть прибли- женно найдена по формуле 2 (Sp<-V О (Spi - м [(Sp -У’]=-------- или, что проще, через второй начальный момент: N D [Sp] = Ж [Sp*] - sj ж --Sp2. (1.3) Таким образом, метод Монте-Карло в исследовании операций есть метод математического моделирования случайных явлений, в кото- ром сама случайность непосредственно включается в процесс моделиро- вания и представляет собой его существенный элемент. Каждый раз, когда в ход операции вмешивается тот или другой случайный фактор, его влияние имитируется с помощью специально организованного «ро- зыгрыша» или «жребия». Таким образом строится одна реализа- ция случайного явления, представляющая собой как бы результат 412
одного «опыта». При большом числе реализаций интересующие нас характеристики случайного явления (вероятности, математические ожидания) находятся так же, как они находятся из опыта: вероятно- сти — как частоты событий, математические ожидания — как средние арифметические значений соответствующих случайных величин. Моделирование случайных явлений методом Монте-Карло имеет общие черты с процессом набора опыта отдельными людьми и челове- ческими коллективами. И тут, и там каждая отдельная реализация случайна; устойчивые закономерности обнаруживаются лишь при многократном наблюдении явления, при обширном опыте. Большое число реализаций, требующееся при применении метода Монте-Карло, делает его вообще громоздким и трудоемким. Прежде чем пускать в ход метод Монте-Карло, всегда имеет смысл попытаться решить задачу аналитически, и только если это не удается, прибе- гать к статистическому моделированию. Полезным оказывается хо- тя бы приближенное предварительное аналитическое решение задачи — это помогает выявить основные факторы, от которых зависит резуль- тат, и наметить план дальнейшей работы. Моделирование случайных явлений методом Монте-Карло часто производится с целью проверить правомочность в данном случае того или другого математического аппарата, всегда основанного на некото- рых допущениях. Пусть, например, рассматривая систему массового обслуживания, мы приближенно заменили не-пуассоновский поток заявок пуассоновским и непоказательное время обслуживания—пока- зательным. Моделирование того же процесса методом Монте-Карло покажет, допустимы ли эти упрощения, к каким ошибкам они приво- дят, и позволит ввести в расчетные формулы соответствующие по- правки. 2. ЕДИНИЧНЫЙ ЖРЕБИЙ Основным элементом, из совокупности которых складывается монте-карловская модель, является одна случайная реа- лизация моделируемого явления, например: один «обстрел» це- ли, один «день работы» транспорта, одна «эпидемия» и т. п. Реализация представляет собой как бы один случай осуществле- ния моделируемого Случайного явления (процесса) со всеми присущи- ми ему случайностями. Она разыгрывается с помощью специально разработанной процедуры или алгоритма, в котором важную роль играет собственно «розыгрыш» или «бросание жребия». Каждый раз, когда в ход моделируемого процесса вмешивается случайность, ее влияние учитывается не расчетом, а бросанием жребия. Предположим, что в ходе моделируемого процесса наступил мо- мент, когда его дальнейшее развитие (а значит, и результат) зависит от того, появилось ли на данном этапе событие А или не появилось? Например: произошло ли попадание в цель? Обнаружен ли неко- торый объект? Исправна ли аппаратура? Появилась ли заявка на обслуживание? и т. д. 413
Тогда нужно «бросанием жребия» решить вопрос: появилось со- бытие А или не появилось? Для этого нужно привести в действие не- который случайный механизм розыгрыша (скажем, бросить игральную кость, или несколько монет, или выбрать число из таблицы случайных чисел) и условиться о том, какой результат жребия означает появление, а какой—непоявление события А. Ниже мы увидим, что розыгрыш всегда может быть организован так, чтобы событие А имело любую наперед заданную вероятность. Кроме событий, появляющихся случайным образом, на ход и ис- ход операции могут также влиять разные случайные величины (на пример, время обслуживания заявки каналом СМО; координаты точ- ки попадания снаряда; время, в течение которого выполняется рейс автомашины; число вышедших из строя узлов и т. д.). С помощью жре- бия можно разыграть значение любой случайной величины или сово- купность значений нескольких случайных величин. Условимся называть единичным жребием любой эле- ментарный опыт, в котором решается один из вопросов: 1. Произошло или не произошло событие Л? 2. Какое из возможных событий Alt А2, ..., Ah произошло? 3. Какое значение приняла случайная величина X? 4. Какую совокупность значений приняла система случайных величин Хх, Х2, ..., Xfe? Каждая реализация случайного явления методом Монте-Карло состоит из цепочки единичных жребиев, перемежающихся обычными расчетами. Расчетами учитывается влияние исхода единичного жре- бия на ход операции (в частности, на условия, в которых будет осу- ществляться следующий единичный жребий). Рассмотрим способы организации всех разновидностей единич- ного жребия. Как уже было сказано выше, при любой организации еди- ничного жребия должен быть пущен в ход какой-то механизм случай- ного выбора (бросание монет, костей, вынимание жетона из вращаю- щегося барабана, числа из набора чисел, и т. д.). Такие механизмы могут быть самыми разнообразными, однако любой из них может быть заменен стандартным механизмом, позволяющим решить одну-единст- венную задачу: получить случайную величину, распределенную с по- стоянной плотностью от 0 до 1. Условимся для краткости называть такую случайную величину «случайное число от 0 до 1» и обозначать Р (от английского random — случайный). Покажем, что любая задача единичного жребия может быть ре- шена с помощью стандартного механизма, дающего число R. 1. Появилось или нет событие А? Пусть вероятность события А равна р: Р(А)=р. Выберем с помощью стандартного механизма случайное число Р, и будем считать, что если оно меньше р, событие А произошло, если больше р — не произошло*1. *) Получение R, в точности равного р, будем считать практически невозможным И14
Действительно, если R — случайное число от 0 до 1, то р P(R<p)^f(r)dr, О где / (г) = 1 при 0 < г < 1, или р Р (R <р) = ^dr = Р (Д). о 2. Какое из нескольких возможных событий появилось? - Пусть имеется полная группа несовместных событий: с вероятностями До Дг> •••> ^k Pi, Рг, Pk- Рис. 8.2 Так как события несовместны и образуют полную группу, то Pi + Pi + ••• + Pk — !• Разделим весь интервал от 0 до 1 на k участков длиной ръ р2, pk (рис. 8.2). Если случайное число R, выданное стандартным механиз- мом, попало, например, на участок р3, это означает, что появилось событие Д3. 3. Какое значение приняла случайная величина? Пусть нам требуется «разыграть» значение случайной величи- ны X, имеющей известный закон распределения. Случай, когда вели- чина X дискретна (т. е. имеет отдельные значения хъ х2,.... хк с вероят- ностями plt р2...ph) рассматривать не будем, так как он сводится к предыдущему пункту 2. Действительно, если обозначить Д, собы- тие, состоящее в том, что величина X приняла значение хг, то розы- грыш значения слачуйной величины X сводится к решению вопроса: какое из событий Дп Д2, Дй появилось? 415
чайную величину X и найдем ее вероятность Рассмотрим случай, когда случайная величина X непре- рывна и имеет заданную непре- рывную функцию распределения F(x) (рис. 8.3). Докажем следующее утвер- ждение: если взять на оси орди- нат случайное число R (от 0 dot) и найти то значение X, при котором F(X) = R (см. стрел- ки на рис. 8.3), то полученная случайная величина X будет иметь функцию распределения Р(х). Действительно, возьмем слу- функцию распределения, т. е. Р(Х<х). Из рис. 8.3 видно, что для того чтобы выполнялось неравенство X < х, величина R должна принять значение, меньшее, чем F(x): P(X<x)=P[r<F(x)}. Но случайное число R имеет постоянную плотность распределе- ния f(r), равную 1 на отрезке (0, 1); значит, F W F W P(X<Zx)= f(r)dr=t= I • dr --= F (х), о о (2.1) что и требовалось доказать. Таким образом, розыгрыш значения случайной величины X с за- данной функцией распределения F(x) сводится к следующей процеду- ре. Получить случайное число R от 0 до 1 и в качестве значения X взять'. X=F~l(R), где F 1 — функция, обратная по отношению к F. 4. Какую совокупность значений примет система случайных величин? Пусть имеется система случайных величин: Х1( Ха, ..., Хп (2.2) с совместной плотностью распределения f(xu х2, ..., хп). 416 Если случайные величины независимы, то f(xlt х2, .... xn)=(l(x1)f2(x2) ...fn(xn), и розыгрыш совокупности значений системы (2.2) сводится к тому, чтобы разыграть каждую из них в отдельности, т. е. организовать п единичных жребиев типа, описанного в п. 3. Если случайные величины (2.2) зависимы, то f(xv х2, ...,xn)=f1(x1)f(x2/x1)f(x3/x1x2)..., где каждая последующая плотность распределения берется услов- ная, при условии, что предыдущие случайные величины приняли определенные значения. При розыгрыше последовательности значений случайных величин (2.2) получается сначала значение Xj случайной Рис. 8.4 величины Хх; это значение берется в качестве аргумента в условной плотности ((x2/xi); разыгрывается значение х2 случайной величины Х2, оба значения хъ х2 берутся в качестве аргументов в условной плот- ности f(x3/xlt х2) и т. д. Рассмотрим несколько примеров на организацию единичного жребия. Пример 1. Летательный аппарат, совершающий полет над территорией противника, после стрельбы по нему может оказаться в одном из следующих состояний: А, — невредим, продолжает полет; Д2 — поврежден, продолжает полет; 43 — совершил вынужденную посадку; Д4 — сбит. Вероятности этих четырех событий заданы: р1==Р (Д1) = 0,4; р2=Р(Д2) = 0,1; р3 = Р (Д3) = 0,15; р4=Р(Д4) = 0,35. Построить процедуру единичного жребия для розыгрыша результата об- стрела Решение. Делим участок (0, 1) на четыре части, как показано на рнс. 8.4. При попадании случайного числа R на участок от 0 до 0,4 считать, что произош- ло событие Ai, на участок от 0,4 до 0,5 — событие Д2 и т. д. Пример 2 Случайная величина X распределена по показательному зако- ну с плотностью: f(x) = Xe~u (х>0). Построить процедуру единичного жребия для получения значения X. Решение. По заданной плотности f(x) находим функцию распределения: F (х) = J f (х) dx = j Хе-''х dx = 1 —е~(х > 0). о о График функции Г(х) дан на рис 8.5 Графически значение случайной ве- личины X можно разыграть так: взять случайное число от 0 до 1 на оси ординат 14 Зак. 573 417
и иайти соответствующее ему значение абсциссы X (см. стрелки на рис. 8.5). Это же можно сделать не графически, а расчетом, если написать: /?=!— е-ХЛ (2.3) и решить это уравнение относительно X (т. е. найти обратную по отношению к F функцию). Имеем: е-м=1—й; — А,Х = 1п(1 — R), откуда Х= — у- 1п(1-К). (2.4) Формулу (2.4) можно упростить; вспомним, что если R — случайное чис- ло от 0 до 1, то (1 — R) — также случайное число от 0 до 1; поэтому вместо (2.4) можно взять Х=—4-1п/?. (2.5) Л Таким образом, процедура розыгрыша сводится к следующему: взять слу- чайное число от 0 до 1, прологарифмировать его при натуральном основании, из- менить знак и разделить на X. Пример 3. Построить процедуру розыгрыша значения случайной величи- ны X, плотность распределения которой f (x) = i/a cos х при—л/2<х <л/2 (2.6) (рис. 8.6). Решение. Находим функцию распределения: F (х) = j" l/2 cos xdx — 1/^ (sin x-f-l). л —2 График функции распределения дан на рис. 8.7. Там же показана процедура ро- зыгрыша значения случайной величины X Аналитически это выражается так-’ R = l/i (sinX + 1), откуда обратная функция Х = arc sin (27? — 1). 418
Таким образом, для розыгрыша значения случайной величины X с плот- ностью (2.6) нужно: взять случайное число от 0 до 1, удвоить его, вычесть еди- ницу и от результата взять арксинус. Заметим, что в рассмотренных нами примерах 2 и 3 функция рас- пределения F случайной величины X легко допускала получение в яв- ном виде обратной функции F-1; на практике это далеко не всегда бы- вает так. Если явного выражения для обратной функции получить не удается, можно, как показано на рис. 8.3, определить эту обратную функцию по графику; если же расчет производится не вручную, а на ЭЦВМ, можно воспользоваться приемом, предложенным Н. П. Бус- ленко [15]; он состоит в том, что функция распределения F(x) заме- няется функцией F*(x), составленной из отрезков прямых (рис. 8.8); это можно сделать с любой заданной степенью точности. На каждом из таких линейных участков обратная функция находится без труда. Пример 4. Имеется система зависимых случайных величин: Хг и Х$. Слу- чайная величина Х± распределена по закону прямоугольного треугольника на участке от 0 до 1 (рис. 8.9): (1(х1) = 2х1 при0<х1<1. Случайная величина Л2 распределена с постоянной плотностью на участ- ке длиной 2, с центром в точке xlt где Xj — значение, принятое случайной вели- чиной Хг (рис 8.10) Организовать процедуру единичного жребия для розыгры- ша пары значений случайных величин Xit Х2. Решение. Разыграем сначала значение величины Х^, для этого построим ее функцию распределения: 14* 419
F (*i) = О При Xj <£0, x| при 0<xt< 1, 1 при *i> 1. (2.7) (рис. 8.11). Величину X, получим как обратную функцию по отношению к (2.7) от случайного числа R: Я=Х12; X^VR. (2.8) После того, как разыграно значение Xlt оно уже не случайно; обозначим его xt. При известном значении xt строим условную функцию распределения F(x2/*i) случайной величины Х2 (рис. 8.12). Выражение этой функции распреде- ления будет: Возьмем новое случайное число R' от 0 до I и найдем от него функцию, об- ратную (2.9): R’=i/2(X2— xi + l), X2 = 2JR'4-x1 —1. (2.10) Таким образом, процедура розыгрыша сводится к следующему: берется случайное число R от 0 до 1 и из него извлекается корень; полученное значение V R есть разыгранное значение первой случайной величины Xt = хг. Далее бе- рется еще одно случайное число R от 0 до 1, удваивается, к нему прибавляется ранее полученное хг и вычитается единица; получается разыгранное значение второй случайной величины Х2 3. РОЗЫГРЫШ ЗНАЧЕНИЯ НОРМАЛЬНО РАСПРЕДЕЛЕННОЙ СЛУЧАЙНОЙ ВЕЛИЧИНЫ Остановимся специально на одной очень часто встречающейся задаче: розыгрыш значения случайной величины X, распределенной по нормальному закону (короче — «нормальной») с матема- тическим ожиданием тх и средним квадратическим отклонением ах. Плотность распределения случайной величины X имеет вид: (*-тх)а ----'V ох у 2л Согласно общему правилу надо было бы поступить так: построить функцию распределения F(x) и найти для нее обратную функцию F~\ 420 (3.1)
затем этому преобразованию подвергнуть случайное число /? от 0 до 1. Однако удобнее поступить иначе: перейти от случайной величины X к другой, так называемой «нормированной» случайной величине: Z = , (3.2) °х разыграть значение этой случайной величины, а затем уже по ней най- ти X. Это удобно потому, что математическое ожидание величины Z равно нулю, а ее среднее квадратическое отклонение — единице: тг—0, ог = 1, и придется только один раз и навсегда найти обратную функцию. Действительно, обозначим плотность распределения нормиро- ванной величины Z Нормированная функция распределения будет: г —— Лн(г)= |~е Чг = 0,5 + Ф(г), (3.4) — оо где ф(2) = —1— f е~“dz t/~2n J I — функция Лапласа. График функции FH(z) дан на рис. 8.13. Там же стрелками показа- но получение случайного числа X с плотностью (3.3). Аналитически это записывается в виде: R =0,5Д-Ф (Z), /=Ф-1(Д—0,5), (3.5) где Ф"1 — функция, обратная функции Лапласа Ф. Разыграв значение нормированной случайной величины Z, перей- дем от нее к величине X по формуле X = axZ4-mx. (3.6) Таким образом, значение нормальной случайной величины X с характеристиками тх, ох разыгрывается по формуле Х = аяФ-‘ (R—0,5) + тх, (3.7) т. е. нужно взять случайное число R от 0 до 1, вычесть из него 0,5, взять от результата обратную функцию Лапласа, умножить на <ух и прибавить тх. 421
В случае, когда розыгрыш нормальной случайной величины осу- ществляется не вручную, а на машине, обычно применяется другой способ, основанный на центральной предельной теореме теории ве- роятностей. Согласно этой теореме, при сложении достаточно боль- шого числа независимых случайных величин, сравнимых по своим дисперсиям, получается случайная величина, распределенная прибли- женно по нормальному закону, причем этот закон тем ближе к нормаль- ному, чем больше случайных величин складывается. Опыт показывает, нормального распределения доста- точно сравнительно небольшого числа слагаемых. Например, при сложении всего шести случайных чисел от 0 до 1 получается случай- ная величина, которая с точно- стью, достаточной для большин- ства прикладных задач, может считаться нормальной. Отсюда возникает такой спо- соб розыгрыша нормально распре- деленной случайной величины X: сложить шесть случайных чисел от 0 до 1; пронормировать эту сумму, т. е. получить нормированную величину Z, а затем от нее пе- рейти к X по формуле (3.6). Проделаем соответствующие преобразования. Обозначим V = Rx + R2 + R3 + + R6 + Re, где Rl....Re — шесть независимых экземпляров случайного числа от 0 до 1. Найдем математическое ожидание, дисперсию и среднее квад- ратическое отклонение случайной величины V. По теореме сложения математических ожиданий: М [V] =т„ =тч +тГ2 +... ф- тГв, где тГ1, ..., тг, — математические ожидания величин Rlt .... Ry Очевидно, они все одинаковы и равны 0,5, отсюда т0 = 6-0,5 =3. Дисперсию случайной величины V найдем по теореме сложения дисперсий: + ••• + -Ог6. где Dri... Drt —дисперсии величин Rlt ..., Re. Известно, что дис- персия случайной величины R, распределенной с постоянной плот- ностью на участке (а, Р), равна D (Р—«)2 . г 12 422
в нашем случае это будет DT = 1/12, откуда 0^ = 6-1/12 = 1/2, а среднее квадратическое отклонение o0=/o;=i//2. Пронормируем величину V, т. е. перейдем от нее к величине Z в У~.т» = (v—3) /2; (3.8) далее от величины Z перейдем к нужной нам величине X по формуле x = °xZ + mx. (3.9) Подставляя в эту формулу вместо Z его выражение (3.8), а в (3.8), в свою очередь, вместо V его выражение (=1 получим окончательно: А = оа/2 (2Яг-зК/пх. (3.10) Таким образом, чтобы разыграть значение нормальной случай- ной величины X с математическим ожиданием тх и средним квадрати- ческим отклонением <ух, нужно: взять шесть случайных чисел от 0 до 1, сложить их, из суммы вычесть 3, результат умножить на ахУ2 и при- бавить тх. Теперь предположим, что нам нужно разыграть значение не од- ной, а нескольких нормально распределенных случайных величин. Если случайные величины независимы, задача просто сводится к осу- ществлению нескольких жребиев по вышеописанной процедуре. Если же величины зависимы, то при каждом следующем розыгрыше надо брать не просто закон распределения очередной случайной величины, а ее условный закон распределения (при условии, что предыду- щие случайные величины приняли именно те значения, которые полу- чены розыгрышем). Пример. Система двух случайных величин (X, Y) распределена по нор- мальному закону с характеристиками: I Му 9 °Х > ®У 9 ? 9 где г — коэффициент корреляции. Построить процедуру розыгрыша пары зна- чений X, Y. Решение. Разыгрываем сперва значение одной из случайных величин, на- пример X, согласно процедуре, описанной выше для одной нормально распреде- ленной случайной величины с характеристиками тх и ах. Значение другой слу- чайной величины Y разыгрываем уже по условному закону распределения*) о ма- ) См., например, [7]. 423
тематическим ожиданием и средним квадратическим отклонением? (ЗД1) ау|л = ау]/’Т:Г^2’ где х — значение, принятое случайной величиной X в результате предыдущего жребия. Заметим, что от х в формулах (3.11) зависит только математическое ожида- ние условного закона, но не его среднее квадратическое отклонение, которое при любом х остается равным <зу^/~ 1 — г2 4. ПОЛУЧЕНИЕ СЛУЧАЙНОГО ЧИСЛА R ОТ О ДО 1 Если метод Монте-Карло осуществляется вручную (без помощи машин), то для получения случайного числа от 0 до 1 чаще всего при- меняются так называемые таблицы случайных чисел. Эти таблицы приводятся во многих руководствах по математической статистике и вычислительной технике (см. например, {18, 19]). Табли- цы содержат чередующиеся в случайном порядке цифры 0, 1, 2, ..., 9. При составлении таблиц приняты меры к тому, чтобы каждая из этих цифр встречалась примерно одинаково часто и независимо от других. Пользуясь таблицей случайных чисел, можно легко разыграть случайное число R от 0 до 1 с любым числом десятичных знаков после запятой. Пусть, например, требуется получить число R. с четырьмя знаками после запятой. Обратимся к таблице случайных чисел и возьмем оттуда любую группу из четырех рядом стоящих знаков, например 7643. Будем считать, что наше слу- чайное число приняло значение 0,7643. Следующий раз, когда придется бросать единичный жребий, возьмем следующие четыре цифры Пусть они, например, будут 3312 — значит, следующее случайное число будет 0,3312, и т д. Можно брать цифры, стоящие не рядом, а через одну; или же в начале и в конце столб- ца, или строки — словом, любым способом, лишь бы принцип выбора не был никак связан со значениями самих цифр. Для розыгрыша случайного числа R вручную можно применять не только таблицы случайных чисел, но и другие датчики, например диск, проградуированный в мелких делениях, размеченных числами от 0 до 1 (рис. 8.14). В центре диска закреплена хорошо уравновешен- ная стрелка, приводимая во вращение, например, электромотором, включаемым нажатием кнопки. После отпускания кнопки стрелка останавливается в случайном положении, и конец ее указывает слу- чайное число R. Если метод Монте-Карло осуществляется не вручную, а на ЭЦВМ, то для выбора случайного числа от 0 до 1 могут применяться как фи- зические датчики случайных чисел, так и вычислительные алгорит- мы для получения так называемых «псевдослучайных» чисел. Остановимся, прежде всего, на физических датчиках. Как прави- ло, они основаны на преобразовании случайных сигналов (шумов), 424
либо естественного, либо искусственного происхождения. Пусть имеет ся случайный шум (т. е. случайным образом меняющееся напряжение U(t) (рис. 8.15), который мы сравниваем с некоторым постоянным уровнем и0. Такой шум может быть положен в основу правила выра- ботки случайного числа от 0 до 1. Предположим, что ЭЦВМ работает в двоичном коде; тогда случайное число от 0 до 1 представляет собой двоичную правильную дробь, в которой на каждом месте одинаково вероятны знаки 0 или 1. Условимся считать, что очередной двоичный знак случайного числа будет 0, если за некоторый промежуток времени Т шум (/(/) превысил уровень и0 четное число раз, и 1 — если нечет- ное. Теперь предположим, что п таких датчиков работают одновремен- но и посылают случайные знаки 0 и 1 в п двоичных разрядов регистра некоторого числа R. Тогда, если интервал времени Т взять достаточ- но большим так, чтобы на нем укладывалось достаточно много коле- баний шума U(t), то четное и нечетное числа превышений уровня и0 будут встречаться в среднем одинаково часто, и n-разрядное двоичное число будет распределено приблизительно равномерно на участке 0,1. Можно предложить и другие принципы формирования случайных чисел на основе того или другого физического случайного процесса; все они требуют оборудования ЭЦВМ специальными датчиками слу- чайных чисел. Для неспециализированной ЭЦВМ, только эпизодичес- ки привлекаемой к моделированию операций методом Монте-Карло, это оборудование себя не оправдывает. Гораздо чаще при моделиро- вании методом Монте-Карло пользуются так называемыми псевдо- случайными числами. Так называются числа, вырабаты- ваемые (вычисляемые) самой машиной по некоторому правилу (алго- ритму), построенному так, чтобы знаки 0 и 1 встречались в среднем одинаково часто, и, кроме того, чтобы зависимость как между отдель- ными знаками, так и между сформированными из них многозначны- ми числами практически отсутствовала. Для получения псевдослу- чайных чисел пользуются разными приемами. Например, можно пе- ремножить два произвольных n-значных двоичных числа а± и а2 и из произведения взять п средних знаков — это будет число а3; затем пе- ремножить а2 и а3 и повторить процедуру и т. д. Существуют способы получения псевдослучайных чисел, основанные не на перемножении 425
чисел, а на их сдвиге друг относительно друга на несколько разрядов; после сдвига производится сложение и затем выбор из суммы п сред- них знаков, и т. д. Различные способы получения псевдослучайных чисел подробно описываются в специальных руководствах (см., на- пример, [15, 27]). Следует заметить, что псевдослучайные числа, строго говоря, слу- чайными не являются (вся их последовательность может быть пред- сказана на основе исходного материала). В частности, любой алгоритм вычисления псевдослучайных чисел является циклическим, т. е. через какое-то большое число Ц выработанных таким способом чисел они неизбежно начнут повторяться. Однако, если при модели- ровании операции нам придется воспользоваться количеством розы- грышей, меньшим, чем Ц, такая цикличность никакого значения не имеет. В настоящее время при моделировании операций методом Монте- Карло на ЭЦВМ обычно пользуются псевдослучайными числами, вы- бирая один из хорошо обследованных и проверенных алгоритмов, обеспечивающий достаточную длину цикла, приемлемую равномер- ность и независимость чисел при сравнительной простоте их вычисле- ния. К достоинствам псевдослучайных чисел относится то, что они до- пускают возможность вторичного контрольного просчета той же са- мой реализации случайного процесса; другие способы формирования случайных чисел (физические датчики) этой возможности не допускают. 5. ПРИМЕРЫ МОДЕЛИРОВАНИЯ СЛУЧАЙНЫХ ПРОЦЕССОВ МЕТОДОМ МОНТЕ-КАРЛО В данном параграфе будут рассмотрены некоторые примеры прак- тических задач, которые, в силу своей сравнительной сложности, не- доступны для аналитического решения и требуют моделирования мето дом Монте-Карло. В каждом примере мы построим схему моделиро- вания, т. е. последовательность расчетов и единичных жребиев, а так- же способ обработки реализаций. Пример 1. Техническое устройство состоит из трех узлов: У1; У2 и У8 Исправная работа узлов У, и У2 безусловно необходима для работы устройства; узел У3 предназначен для поддержания нормального режима работы узлов У] и У2. Устройство должно работать в течение времени т. Время безотказной ра- боты каждого узла случайно; для узлов Уъ У2, У8 оно имеет плотность распре- деления соответственно /8(0- В нашем распоряжении имеются два за- пасных экземпляра узла У, и три запасных экземпляра узла У2. При выходе из строя (отказе) узла Yj техническое устройство останавливается на случайное время, распределенное с плотностью <Pj(O, после чего узел заменяется запасным (если они еще не все израсходованы)^ работа устройства возобновляется. При отказе узла У2 устройство также останавливается на случайное время, распреде- ленное с плотностью <p2(0, узел заменяется запасным (если такие еще имеются в наличии), после чего работа устройства возобновляется. Если одновременно не работают узлы Уг и У2, работа устройства возобновляется только после того, как закончена замена последнего узла. Если вышел из строя (отказал) узел У8, его не заменяют, но закон распределения времени безотказной работы узлов У2 и У2 меняется: если до выхода из строя узла У8 узел yt проработал время 11: то 42в
условная плотность распределения оставшегося времени безотказной работы узла У, будет узла У2 —/2(<Д2) Требуется найти следующие характеристики работы устройства: — вероятность исправной работы устройства pa(t) как функцию времени; — вероятность того, что окончательный отказ устройства раньше времени т произойдет по причине нехватки запасных узлов Ух; — среднее время /р работы системы, т. е. среднее время, которое устройст- во будет проводить в работающем состоянии; — среднее число запасных узлов Уь которое будет израсходовано, а также среднее число у2 израсходованных Решение Так как законы распре- деления, фигурирующие в задаче, от- личны от показательных, применять для описания явления схему марковс- ких процессов мы не можем. Строим схему моделирования случайного про- цесса методом Монте-Карло Прежде всего, определяем розыгрышем время безотказной работы узла У3 (который не восстанавливается) Для этого нахо- дим функцию распределения Кз(0 = //з (О dt, о запасных узлов У2. берем случайное число R от 0 до 1 и подвергаем его преобразованию F3 1(/?) (рис. 8.16)*) Если в результате этого розыгрыша значение Т3 оказалось меньше т, то фиксируем Тя как момент отказа узла У 3; если же оказалось, что Т3 > т, счи- таем, что за время т узел У 3 не отказал Предположим, имел место первый (более сложный) вариант, и узел У3 отказал в момент Т3 < т. Рассмотрим четыре параллельные оси Ot с одним отсчетом времени (рис. 8 17) На оси (1) мы будем отмечать состояние первого узла (жирной ли- нией — «работает», тонкой — «отказал»). На оси (2) также отмечаются состоя- ния второго узла, на оси (3) — третьего, на оси (4) — состояние системы в целом («работает», «не работает»). Так как момент отказа Т3 узла У8 нам известен, то мы можем сразу же за- полнить ось (3). После этого будем заполнять (1) и (2). Сначала разыграем время Ti, в течение которого будет работать основной узел yt — для этого мы восполь- зуемся функцией распределения /Ч(П=р1 (t)dt. (5.1) О Далее, разыграем время т1( в течение которого этот узел будет заменен за- пасным Для этого мы воспользуемся функцией распределения t Ф1 (Z) = J<P1 (/) d/. о (5-2) Если в момент 1\ + Tj окончания этой замены третий узел еще работает (У, + Ti < Т3), ю снова разыгрываем значение времени работы первого запас- ного узла Т/ с помощью функции (5.1) и, после этого — опять время замены это- *)Е~1— функция, обратная F3. 427
го узла Tj , с помощью функции (5.2). Предположим, что момент окончания этой замены (как показано на рис 8 17) оказался после момента Тл 7\ + Ti+7’j' 4-Ti' >Т3. (5.3) Тогда при розыгрыше нового значения времени безотказной работы узла мы должны будем воспользоваться уже не функцией (5.1) а новой условной функцией распределения Лг(</0)= fZi(«/O)d<, <5.4) о полагая, что до момента отказа узла У 3 новый узел У, не работал (1, = 0). Пусть это разыгранное значение равно Т," Предположим, что, как показано на рис 8 17 7’i + 't1 + 7’1' 4-Ti' Н-Т/ <т. (5.5) Это значит, что в момент, отмеченный иа рисунке звездочкой, узел Уг вышел из строя, заменить его уже нечем (всего два запасных узла) и, значит, в этот-момент окончательно отказало все устройство Очевидно дальше этой точки вести ро- зыгрыш ие нужно. Займемся осью (2) , на которой будет отражаться состояние второго узла У2. Для этой оси проведем вторую, аналогичную первой, серию розыгрышей, с той разницей, что функции распределения, которыми преобразуется случай- ное число R , будут другие: F2(0 = Г (0 dt, о Ф2 (П-= (фг о F ? (^Дг) = j* tz dt. (5.6) (5.7) (5.8) Пусть по истечении времени второй замены т2' мы разыграли значение Т2” времени работы второго запасного узла У2, и оно оказалось таким, что момент Т3 выхода из строя третьего узла пришелся на период работы второго узла Так как при выходе из строя третьего узла условия работы второго узла ухудшаются, нужно в величину Т2" «внести поправку» на время безотказной работы данного 428
экземпляр'^ У27 учесть, что он уже проработал время /2, а остаток времени Т2’ после момента Т3 разыграть заново, уже по измененному (условному) закону распределения (5 8) __ Полученное таким образом значение Tt" нужно прибавить к уже прошедше- му времени /2. После этого разыгрывается время замены т2" этого узла (по закону (5.7)) и, наконец, время Т2’" безотказной работы последнего (третьего) запасного узла У2; так как узел У3 уже отказал, то при этом мы пользуемся законом (5.8) при 12 = 0. Если разыгранное значение времени, в сумме со всеми ранее отложенны- ми на оси (2) временами, кончается правее точки, отмеченной звездочкой, то, значит, причиной отказа устройства в данном случае была нехватка запасных узлов У2 Если серия интервалов, отложенных на оси (2), кончается левее точки, отмеченной звездочкой — значит, в данной реализации причиной отказа устрой- ства послужила нехватка запасных узлов У2. Xitth Рис. 8.18 Рис. 8.19 Наконец, заполним последнюю ось (4), на которой отражается работа ус- тройства в целом. Согласно условию устройство работает только в те моменты, когда работают два узла У, и У2 одновременно Поэтому на оси (4) мы отмечаем жирной линией только те участки времени, для которых жирные участки осей (1) и (2) совпадают. Таким образом, разыграна одна реализация нашего случайного процесса. Разумеется, если моделирование производится на ЭЦВМ, никаких графиков, осей и участков строить не нужно; розыгрыш обеспечивается приведением в дей- ствие машинного расчетного алгоритма, который сочетает единичные жребии — розыгрыши со сравнением между собой моментов осуществления разных событий (что произошло раньше — восстановление первого (второго) узла или выход из строя третьего?). Предположим, что тем или другим способом нами получено большое коли- чество (ЛГ) реализаций случайного процесса. Тогда, пользуясь предельными тео- ремами теории вероятностей и заменяя искомые вероятности частотами, а мате- матические ожидания средними арифметическими, мы сможем приближенно от- ветить иа все поставленные в задаче вопросы Вероятность ри(1) исправной работы устройства в момент t можно подсчи- тать следующим образом: для каждой (t-й) реализации ввести в рассмотрение случайную функцию времени Xi(t), которая равна нулю, когда устройство не работает, и единице — когда работает. Возможный вид отдельной реализации случайной функции Xt(t) показан на рис. 8.18 Вероятность исправной работы устройства в момент t есть не что иное, как математическое ожидание случайной функции X(t) или, приближенно, среднее арифметическое реализаций Xi(l): (5.9) Возможный вид вероятности рИ(1) показан на рис. 8 19. Убывание функции ри(1) связано с тем, что с течением времени увеличивается вероятность отказа третьего узла и, кроме того, повышаются шансы на то, что запасных узлов не хватит. 429
Найдем вероятность того, что отказ устройства произойдет по причине нехватки запасных узлов УР Рассмотрим событие А, состоящее в том, что от- каз устройства раньше времени т произойдет по этой причине. Свяж€м с каждой реализацией случайную величину Уг, равную единице, если в этой реализации событие А произошло, и нулю — если не произошло. При большом числе реа- лизаций N вероятность Р(А) события А приближенно равна его частоте, а по- следняя есть не что иное, как отношение суммы всех случайных величин Y, к чис- лу реализаций N: I N i=i Определим среднее время <р, которое устройство будет проводить в рабо. тающем состоянии Для этого надо для каждой реализации определить ее рабо чее время —сумму длин всех рабочих участков оси (4) до момента т—и най- ти их среднее арифметическое: (5-п) i=i Наконец, среднее число уг запасных узлов Уь которое будет израсходова- но, найдется как среднее арифметическое чисел израсходованных узлов дл я всех реализаций: 1 N У1~~^ ^у\П > (5J2) Z= 1 где y^ — число запасных узлов Уп израсходованных в <-й реализации. Аналогично определяется N У^~^^У2г)- (5.13) z=i Таким образом, мы построили схему моделирования процесса методом Монте-Карло. Отметим одну характерную особенность метода. В примере 1 мы поставили задачу определения всего пяти величин: Ри(0» ^И)> ^р> У1 и Уз- Однако объем расчетов почти не увеличился бы, если бы мы захотели кроме этих пяти величин определить еще и целый ряд других, например вероятность того, что оба узла Ух и У2 будут стоять (не работать) одновременно, или среднее отношение рабочих времен первого и второго узлов, или дисперсию времени исправной работы устройства, или любую другую вероятностную характеристи- ку процесса. Действительно, при моделировании методом Монте-Кар- ло львиную долю времени занимает само моделирование реализаци! и только ничтожную долю — их обработка. Поэтому, организуя моде- лирование операции на ЭВМ методом Монте-Карло, всегда имеет смысл позаботиться о том, чтобы «вывести» из машины побольше све- дений о каждой реализации и подсчитать побольше характерных па- раметров, не ограничиваясь подсчетом одного-единственного показа- теля эффективности. 430
Пример 2. Рассмотрим задачу, подобную той, которая уже упоминалась в § 1. Производится стрельба п ракетами по площадной цели сложной конфигу- рации (рис. ^20). Зона разрушений от одной ракеты представляет собой круг радиуса г В результате п выстрелов будет поражена какая-то часть Sn площа- ди цели (см. заштрихованную область на рис. 8.20) Ц, составляющая какую-то долю полной площади цели: 5ц Чтобы избежать ненужных перекрытий зон поражения, прицеливание п ракета- ми производится не по одной точке, а по п различным точкам: Оъ О2, • Оп За- даны характеристики рассеивания ракет: средние квадратические отклонения по осям Ох и От/, равные ож, ау. Систематические ошибки отсутствуют, коордит наты X, Y каждой точки попадания независимы друг от друга и от координа- других точек попадания. Требуется при заданном расположении точек прицели- вания Оп О2, ..., Оп вычислить следующие характеристики эффективности опе- рации: — среднюю долю пораженной площади цели: т„=М[(/]; — дисперсию доли пораженной площади цели! Da=D[l/]; — вероятность того, что будет поражено не менее заданной доли к площа- ди цели: Р — математическое ожидание г0 числа ракет, которые не причинили цели никакого ущерба (попали мимо). Решение. Если не делать никаких упрощающих предположений о форме цели и зоны поражения, аналитическое решение поставленной задачи чрезвы- чайно сложно и практически неосуществимо; проще будет решать ее методом Монте-Карло. Каждая реализация будет представлять собой «обстрел» цели п ракетами, в котором точки попадания ракет разыграны по жребию. Моделиро- вание каждой реализации будет состоять из п единичных жребиев, плюс расчет пораженной площади Sn В каждом единичном жребии разыгрывается точка попадания одной (/-й) ракеты, т. е две случайные величины Xj, Y j, распределенные по нормальному закону с характеристиками тх .> ту ,> ®х> где тх^, ту'—координаты точки О; (коэффициент корреляции равен нулю, так как величины Xj, Yj по условию независимы). Предположим, что моделирование производится на ЭЦВМ. Тогда наибо- лее удобным способом розыгрыша пары нормальных величин Ху, Yj будет опи- санное в § 3 сложение нескольких независимых случайных чисел от 0 до 1 с по- следующей перенормировкой. При таком способе координаты /-й точки попада- ния могут быть разыграны по формулам: — / 6 \ Ху=аж/2 /?*-3 +тж , \*==J / ; / 12 \ K; = 0j,/2 2 . \Л=7 / 1 (5.14) 431
где Rlt R2, ..., R12 — 12 отдельных независимых экземпляров случайного числа от 0 до 1*) . / Предположим, что этот этап моделирования выполнен, и мы получили п точек попадания в данной реализации Теперь надо подсчитать пораженную площадь Sn для данной (»-й) реализации. Для этого нужно вокруг каждой точ- ки попадания описать круг радиуса г и подсчитать площадь той части цели, ко- торая накрыта хотя бы одним из кругов. Если бы розыгрыш производился вруч- ную, можно было бы определить эту площадь планиметрированием. При модели- ровании на машине поступают иначе: вся цель разделяется на большое число элементарных площадок dS (рис. 8.21) и для каждой из иих определяется, ка- ково ее расстояние ру от точки попадания /-й ракеты (/ = 1, .., п) Если хотя бы для одной из точек попадания это расстояние оказалось меньше г (радиуса поражения), то площадка ds считается пораженной, после чего производится суммирование (интегрирование) пораженных площадок dsn по всей цели: Sn—5 dsn. ц Рис. 8.20 Рис. 8.21 Деля полученное в t-й реализации чим долю пораженной площади в данной значение на площадь цели, реализации: полу- = SnU) Зц . Попутно с величиной 1/(<> для каждой реализации вычисляем —коли- чество ракет, расстояние от точек попадания которых до цели превышает ' (в дан- ной реализации эти ракеты не причинили ущерба цели). Имея эти данные для большого числа реализаций <V, мы можем ответить на все поставленные вопросы. Средняя доля пораженной площади: 1 N Дисперсия доли пораженной площади: 1 N *) Разумеется, для розыгрыша координат каждой новой точки попадания нужно взять новые 12 случайных чисел. 433
Вероятность того, что доля пораженной площади будет не меньше и, опре- деляется следующим образом: с каждой реализацией связывается число X;, рав- ное единицу, если в данной реализации t/(Z) > и, и нулю, если < и. Тогда 1 N P(U>u)^~ 3 Xi- ™ i=l Математическое ожидание г0 числа ракет, не причинивших ущерба цели, найдется по формуле 1 N где Г(д} — число ракет, ие причинивших ущерба цели в г-й реализации. 6. ОПРЕДЕЛЕНИЕ ХАРАКТЕРИСТИК СТАЦИОНАРНОГО СЛУЧАЙНОГО ПРОЦЕССА МЕТОДОМ МОНТЕ-КАРЛО ПО ОДНОЙ РЕАЛИЗАЦИИ При статистическом моделировании операций нередко приходится встречаться со случаем, когда моделируемый случайный процесс явля- ется стационарными протекает неограниченно долго, имея не зависящие от времени вероятностные характеристики. Рис. 8.22 В качестве примера рассмотрим работу n-канальной системы мас- сового обслуживания с т местами в очереди, граф состояний которой показан на рис. 8.22. Предположим, что поток заявок, переводящий систему из состояния в состояние (слева направо), — стационарный, но не пуассоновский, например поток Пальма с произвольным законом распределения /(/) интервала времени Т между заявками. Время об- служивания одной заявки тоже распределено не по показательному закону, а по произвольному закону <р(/). Так как процесс, протекаю- щий в системе, не-марковский (потоки событий — не-пуассоновские), то его не удается описать с помощью стандартного математического аппарата марковских случайных процессов — обыкновенных диффе- ренциальных уравнений для вероятностей состояний и алгебраических уравнений — для предельных вероятностей состояний. И вообще, по- пытка описать данный случайный процесс с помощью аналитических зависимостей привела бы к чересчур громоздкому аппарату, не оп- равдывающему себя на практике. Единственным практически пригод- ным методом исследования подобных не-марковских систем является моделирование процесса методом Монте-Карло. Если речь идет об изучении начального , нестационарного периода функционирования системы, то моделирование производится обычным 483
способом — разыгрывается множество реализаций процесса, ' и нуж- ные нам вероятностные характеристики, например, вероятность от- каза, среднее число занятых каналов, среднее число заявок в очереди и др., находятся обработкой «опытного» материала как статистиче- ские средние по множеству реализаций. Однако, когда речь идет об изучении не переходного, начального периода, а стационарного, установившегося режима, достигаемого при t-+ со, обстановка меняется. Дело в том, что при моделировании стационарных случайных процессов обычно можно пользоваться не множеством реализаций, а одной достаточно длинной реализацией. При этом интересующие нас вероятностные характеристики слу- чайного процесса могут быть получены не как средние по множеству реализаций, а как средние по времени для одной до- статочной длинной реализации. Рис. 8.23 Строго говоря, одной стационарности процесса для этого недоста- точно. Процесс должен обладать еще так называемым эргодичес- ким свойством. В элементарном истолковании это свойство состоит в том, что предельный режим, устанавливающийся в системе через некоторое время ее работы, не зависит от того, каковы были на- чальные условия и первоначальный период работы системы — каждая отдельная реализация является как бы «полномочным представите- лем» всего класса реализаций. Это значит, что какую бы мы реализа- цию ни выбрали, при /-> оо мы получим процесс с одними и теми же характеристиками. Можно привести пример процесса стационарного, но не обладаю- щего эргодическим свойством. Пусть, например, рассматривается си- стема с графом состояний, показанным на рис. 8.23. Все потоки собы- тий, переводящих систему из состояния в состояние, считаем стацио- нарными. Пусть в начальный момент t = 0 система находится в со- стоянии So; из него она может перейти либо в состояние либо в S8. Перейдя в состояние S1( система начнет «циркулировать» по состояниям Sj и S2. Благодаря стационарности потоков событий, вызывающих эту циркуляцию, через достаточное время вероятности рг(/) и р2(/) состояний Sx и S2 станут постоянными, а процесс циркуляции—ста- ционарным: Pi (0Pi — const; рг (t)-+p2 — const. 484
Если же из состояния So система перешла не в S4, а в 83, то она будет циркулировать не по состояниям Sn S2, а по состояниям S3, S4; вероятности этих состояний тоже будут стремиться к постоянным: Рз (/)-> Рз == const; р4 (/)-> р4 = const, но уже к другим, чем р4 и р2. Таким образом, в приведенном примере процесс, протекающий в системе, будет стационарным, но не эргодическим, и его вероятностные характеристики существенно зависят от началь- ного периода (начального поведения системы). Ясно, что моделирова- ние такого процесса с помощью одной (хотя бы и очень длинной) реа- лизации недостаточно для получения его вероятностных характерис- тик. К счастью, эргодические случайные процессы на практике встре- чаются чаще, чем неэргодические и, как правило, моделирование одной реализации дает возможность получить все вероятностные характе- ристики. В частности, эргодическими оказываются процессы, проте- кающие в системах, граф состояний которых относится к схеме «гибе- ли и размножения», как показано, например, на рис. 8.22. Здесь си- стема может через какое-то число шагов перейти из каждого состояния в каждое другое и «расщепления» процесса, подобного происходящему в системе с графом рис. 8.23, не происходит. Если система имеет бесконечное множество возможных состояний, то, мы знаем, даже при стационарности всех потоков событий, предель- ного режима при / оо может не существовать — мы это видели нд примере системы массового обслуживания с неограниченной очередью (см. § 6 гл. 5), где при t ->оо очередь при х > 1 растет неограниченно. Однако, если предельный режим существует, то при моделировании процесса методом Монте-Карло можно ограничиться одной реализа- цией. Доказать существование предельного режима мы, строго говоря, можем только для марковской системы, а моделирование методом Монте-Карло применяется, как правило, к системам не-марковским. Однако с помощью косвенных рассуждений часто и в этом случае уда- ется убедиться в существовании предельного режима. Для пояснения изложенного рассмотрим пример, относящийся к моделированию методом Монте-Карло работы не-марковской систе- мы массового обслуживания с очередью. Пример. Имеется двухканальная (и = 2) СМО с очередью. Число мест в очереди т = 3; заявка, пришедшая в момент, когда все три ме- ста в очереди заняты, получает отказ и покидает систему. Поток зая- вок — пальмовский, т. е. интервалы времени между заявками пред- ставляют собой независимые случайные величины, распределенные по одному и тому же (непоказательному) закону f(t) (рис. 8.24). Время обслуживания одной заявки — также случайная величина, распре- деленная по непоказательному закону ф(/) (рис. 8.25), отличному от f(t), но одинаковому для всех заявок. 435
Требуется, моделируя работу СМО методом Монте-Карло и рас- полагая только одной длинной реализацией, оценить приближенно предельные характеристики системы (при /->оо): — вероятности состояний (вероятности того, что будут заняты 0,1, 2 канала; вероятности того, что в очереди будут находиться 0, 1, 2, 3 заявки); — среднее число занятых каналов; — среднее время ожидания заявки в очереди; дисперсию време- ни ожидания заявки в очереди; — вероятность отказа (того, что заявка покинет СМО необслу- женной). Рис. 8.24 Рис. 8.25 Построить схему моделирования и схему обработки его резуль- татов. Решение. Граф состояний системы имеет вид, показанный на рис. 8.26. Число состояний конечно; из каждого состояния можно перейти в каждое; потоки событий, переводящие систему из состоя- ния в состояние, стационарны (хотя и непуассоновские); из этого заключаем, что система обладает эргодическим свойством и модели- рование по одной реализации возможно. Очереди нет Очередь есть Рис. 8.26 Предположим для простоты, что в начальный момент (t — 0) си- стема находится в состоянии So (свободна)*'. Начнем моделирование с того, что разыграем на оси 0/ поток заявок, т. е. ряд случайных то- чек 4, /2, ta, ... — моментов прихода соответствующих заявок — пер- вой, второй и т. п. (рис. 8.27). Розыгрыш потока заявок производится следующим образом. Строится функция распределения случайной ве- личины Т — интервала между заявками: f = (6.1) о *) Это не имеет значения, так как предельный режим не зависит от начального состояния 436
и разыгрывается значение случайной величины 7\, как это описано в § 2; для этого берется функция, обратная F, от случайного числа R от 0 до 1: T\—F~'(R). Расстояние 7\ откладывается от начала координат; получается момент 4 прихода первой заявки. Затем процедура розыгрыша повто- ряется (разумеется, уже при другом /?) и новое значение Т2 отклады- вается от т1( получается момент /2 прихода второй заявки, и т. д.’* Таким образом мы построим цепочку моментов прихода заявок (рис. 8.27). Разумеется, эту цепочку надо сделать достаточно длинной, разыграв, во всяком случае, не менее нескольких сот значений случай- ной величины Т. Рис 8.27 Изобразим процедуру моделирования с помощью наглядной схе- мы (рис. 8.28). Вверху мы поместим ось времени (0) с отмеченными на ней моментами поступления заявок. Ниже ее мы поместим еще пять осей: (1), (2), (3), (4), (5). На осях (1) и (2) мы будем изображать состоя- ния первого и второго каналов (жирная черта — «занят», тонкая — «свободен»). На осях (3), (4), (5) мы будем изображать состояния пер- вого, второго и третьего мест в очереди (жирная черта — «занято», тонкая— «свободно»). Все пять осей имеют тот же отсчет времени, что и ось (0). До момента — прихода первой заявки — все каналы и все места в очереди свободны. В момент приходит первая заявка и зани- *) При моделировании на машине удобнее не строить цепочку приходов заявок заранее, а «подавать» их на СМО по одной, по мере прихода; в целях удобства объяснения мы предположим, что заявки разыгрываются заранее 437
мает первый канал. Сколько времени он будет занят — решается розыгрышем. Для этого мы подвергнем случайное число R (разумеет- ся, новое) преобразованию где Ф — функция распределения времени обслуживания: O(0 = jj<p(0^. (6.2) о Первое разыгранное значение времени обслуживания т обозначаем тг и откладываем на оси (1) от точки с абсциссой tlt отмечая его жирной линией (рис. 8.28). В момент прихода /2 второй заявки первый канал еще занят; заявка занимает второй канал. Разыграем еще одно значе- ние т, обозначим его т2 и отложим жирной линией на оси (2) от точки с абсциссой /2. Заявка ta, пришедшая в момент, когда оба канала заняты, стано- вится в очередь, занимает в ней первое место (ось (3)) и ждет до того момента, когда освободится один из каналов. В нашем случае раньше освобождается канал (2) — в этот момент точка с оси (3) перескаки- вает на ось (2) — и снова разыгрывается время обслуживания т3 этой заявки. На оси (2) строится новый жирный участок, а ось (3) продол- жается тонкой линией — место в очереди свободно. Не будем продолжать подробное описание процедуры розыгрыша реализации — она достаточно ясна из рис. 8.28. На этом рисунке против каждого участка занятости канала (места в очереди) для удоб- ства обработки проставлен номер заявки, занимающей это место; мож- но проследить, как заявка «путешествует» с последних мест в очереди на первые, затем — на обслуживание. Заявка, получившая отказ, от- мечается звездочкой (она покидает СМО необслуженной). Предположим , что моделирование реализации продолжено нами достаточно долго (настолько долго, что влияние начальных условий уже перестает сказываться). Посмотрим, как по этой реализации опре- делить интересующие нас вероятностные характеристики работы СМО. Вероятности р0, plt р2 того, что будут заняты 0, 1, 2 канала*), найдем следующим образом. Разделим всю ось О/ на участки соответственно числу занятых каналов. Участки времени, на которых не занят ни один канал, отметим цифрой 0, один канал — цифрой 1, два канала — цифрой 2. На большом участке времени Т сложим длины всех участ- ков, помеченных нулем — получим То; сумма длин всех участков, помеченных единицей, будет Тъ двойкой — Т2. Очевидно, То+ 7\+ Т2 = Т. При большом Т вероятности рп, рх и р2 будут приближенно равны отношениям соответствующих времен к общему времени: Ро^То/Т; р^Л/Т; р2= Т21Т. (6.3) *> Обозначение р2 введено потому, что эта вероятность не совпадает с ранее (см. гл 5) введенной вероятностью р2, а равна р2 — р2 + р3 + р, + рь 438
Заметим, что участок Т целесообразно отсчитывать не с самого начала процесса, где еще сказывается влияние начальных условий, а от более удаленного по времени момента О', где влияние начальных условий уже практически перестает сказываться. Найдем вероятности р0, ри р2, р3 того, что в очереди будут стоять О, 1, 2, 3 заявки. Снова разобьем большой участок оси времени Т на части, помеченные 0, 1, 2, 3, на которых в очереди находится соответ- ственно 0,1, 2, 3 заявки. Складывая длины всех одинаково помеченных участков и деля суммы tt на Т, получим: р0~Т0/Т- pt^tjT- pz^T2/T- ps^fs/T. (6.4) Среднее число занятых каналов г получится обычным способом как математическое ожидание дискретной случайной величины Z — числа занятых каналов: г= l-p'+Z-pt^ р^2р2. (6.5) Среднее время ожидания заявки в очереди /ож находим следующим образом: рассмотрим ряд заявок, поступивших на большом участке времени Тв моменты tk+l, tk + i, .... tk + N, и для каждой из них непосредственно подсчитаем время ожидания в очереди <k^, равное нулю, если (k + г)-я заявка была сразу при- нята к обслуживанию (или получила отказ), и сумме времен ожида- ния этой заявки на разных осях ((3), (4) и (5)), если она стояла в очере- ди. Среднее время ожидания заявки в очереди приближенно найдется как среднее арифметическое этих времен: (6.6) N /=о Если нас интересует не просто среднее время ожидания, а уе- ло в н о е среднее время, вычисленное при условии, что заявка была ' принята к обслуживанию, то среднее арифметическое времен ожидания вычисляется не для всех заявок, а только для тех, которые были обслу- жены. Дисперсия времени ожидания найдется аналогичным образом, как среднее арифметическое квадратов времен ожидания минус квадрат среднего времени ожидания: С iT’oml «j 2 (^+°)2-/о2ж- (6.7) N i=o Наконец, вероятность отказа найдется на большом участке вре- мени Т как отношение числа N* заявок, помеченных звездочкой (по- лучивших отказ), к общему числу W заявок, поступивших за это время: (6.8) 4N
7. ОЦЕНКА ТОЧНОСТИ ХАРАКТЕРИСТИК, ПОЛУЧЕННЫХ МЕТОДОМ МОНТЕ-КАРЛО. НЕОБХОДИМОЕ ЧИСЛО РЕАЛИЗАЦИЙ Метод Монте-Карло основан на предельных теоремах теории ве- роятностей, утверждающих, что при большом числе опытов N час- тота события приближается к его вероятности, а среднее арифмети- ческое наблюденных значений случайной величины — к ее математи- ческому ожиданию. Пользуясь методом Монте-Карло, мы, произведя большое число опытов (реализаций), приближенно заменяем вероят- ность события его частотой, а математическое ожидание — средним арифметическим. Естественно встает вопрос — насколько велика будет ошибка, возникающая от такой приближенной замены? И каково должно быть число реализаций N для того, чтобы эта ошибка с практической досто- верностью не вышла за данные пределы? Другими словами, возникает вопрос об оценке точности характеристик случайного явления, полученных методом Монте-Карло. При ответе на эти вопросы мы будем базироваться на цент- ральной предельной теореме теории вероятностей. Согласно этой теореме, при большом числе опытов N их средний резуль- тат (частота Р* события А или среднее арифметическое X наблюден- ных значений случайной величины X) распределяется приближенно по нормальному закону. Приведем относящиеся сюда формулы. /. Закон распределения частоты события при большом числе опы- тов. Если производится большое число N независимых опытов, в каж- дом из которых событие А появляется с вероятностью р, то частота события А М. Р*=—А (7.1) N (где Ма — число появлений события А в N опытах) распределяется приближенно по нормальному закону, с математическим ожиданием Шр*=р (7.2) и средним квадратическим отклонением <’» - • <7-3> 2. Закон распределения среднего арифметического при большом числе опытов. Если производится большое число N независимых опытов, в ко торых случайная величина X принимает значения: Х2...XNt (7.4) 440
то среднее арифметическое этих значений: (7.5) N i= I распределяется приближенно по нормальному закону, с математи ческим ожиданием т- = тх (7.6) и средним квадратическим отклонением = (7.7) Vn где тх, ох — математическое ожидание и среднее квадратическое от- клонение случайной величины X. Основываясь на этих законах распределения и формулах, мы можем поставить и решить несколько задач, относящихся к точности метода Монте-Карло. Задача 1. Произведено N независимых опытов (реализаций), в каждом из которых событие А появляется с вероятностью р. В ре- зультате этих опытов получена частота Р* события А. Найти вероят- ность того, что частота Р* отличается от вероятности р не больше чем на заданную величину е > 0. Решение. Считая число М достаточно большим для того, чтобы полагать частоту Р* распределенной по нормальному закону с харак- теристиками (7.2), (7.3), получим: Р(|Р*-р|<е)=2ф(-^^\ (7.8) \Кр(1-р) / где Ф — функция Лапласа*). Пример 1 Произведено N = 1000 независимых опытов в каждом из ко горых событие А появлялось с вероятностью р = 0,3 Найти вероятность того, что полученная при этом частота Р* события А отличается от вероятности мень- ше чем на 8 = 0,02 Решение По формуле (7.8) имеем: „ /0,02-31,6\ „ Р( 1 Р* — 0,3 | < 0,02) = 2Ф —-| = 2Ф (1,38) «0,83. \ 0,459 / Итак, если вероятность р события А нам известна, мы можем оце- нить точность определения этой вероятности по частоте Р* и зависи- мость этой точности от числа опытов N. Беда в том, что вероятность р нам неизвестна: ведь и сами-то опыты мы производили для того, чтобы ее найти. Однако для оценки точности метода Монте-Карло нам не очень существенно знать точное значение самой вероятности р — в правую часть формулы (7.8) ее можно подставить ориентировочным значением, взяв вместо р, например, частоту Р* события А в данной серии опытов. ) Значения функции Лапласа см. в табл. 1 приложения 441
Таким образом, мы решили прямую задачу оценки точности на- хождения вероятностей методом Монте-Карло: если известно число опытов N и ориентировочное значение вероятности р, мы можем найти вероятность того, что частота Р* отклонится от вероятности не боль- ше чем на заданную величину е. Поставим теперь обратную задачу: сколько опытов N нужно произвести для того, чтобы с практической уверенностью ожидать, что частота отклонится от вероятности не больше чем на заданную ве- личину? Задача 2. Производится ряд независимых опытов, в каждом из которых событие А появляется с вероятностью р. Каково должно быть число опытов (реализаций) для того, чтобы с заданной, достаточно вы- сокой вероятностью Q можно было ожидать, что частота Р* события А отклонится от его вероятности р меньше, чем на е? Решение. Зададимся каким-нибудь достаточно близким к едини- це значением вероятности Q — назовем его «уровнем доверия». Если вероятность того, что частота и вероятность расходятся меньше чем на е, будет Q или больше, будем считать задачу решенной. На прак- тике уровень доверия Q выбирается каким-нибудь круглым значением, близким к единице, например, 0,95 или 0,99 или 0,995 и т. д., в зави- симости от важности задачи, которую мы преследуем. Предположим, что вероятность Q задана. Приравняем этому значению Q правую часть равенства (7.8): 2Ф (—eHL \ = Q (7.9) \/р (1- Р) / и разрешим уравнение (7.9) относительно ЛГ: (|>/. = — Q, еУ^ = О-' f . (7.Ю) \ Ур(1 — р / 2 Vp (1 — р) \ 2 ' где Ф-1 — функция, обратная функции Лапласа. Отсюда получаем формулу для числа опытов N: Если по формуле (7.11) N оказывается не целым, его надо округ- лить в большую сторону до ближайшего целого. Для вычислений по формуле (7.11) удобно иметь в распоряжении таблицу значений функции (Ф_1(-^(?)]2. В табл. 7.1 приведены значения этой функции для некоторых, наиболее типичных значений уровня до- верия Q. Таблица 7,1 Q 0,80 0,85 0,90 0,95 0,96 0,97 0,98 0,99 0,995 0,999 0,9995 0,9999 1,64 2,08 2,71 3,84 4,21 4,49 5,43 6,61 7,90 10,9 12,25 15,2 443
Пример 2. Производится ряд независимых опытов (реализаций), в Каждом из которых регистрируется появление или непоявление события А, вероятность которого р = 0,2 Сколько опытов нужно произвести для того, чтобы частота Р* события А с вероятностью (уровнем доверия) Q = 0,95 отличалась от р не больше чем на е = 0,01? Решение. Число опытов N вычисляем по формуле (7.11). По табл. 7.1 для Q = 0,95 находим Г 1 ( 1 \12 Ф (У *?) =3,84. Подставляя в формулу (7.11) получим: 0,2-0,8 = —----—-3,84 sk 6140. 0,012 г. е. для надежного (Q = 0,95) определения вероятности р = 0,2 по частоте с ошибкой не более 0,01 (т. е. в пределах 0,19 4- 0,21) требуется осуществить более 6000 реализаций*). Задача 3. Производится Л/ независимых опытов, в каждом из ко- торых наблюдается значение случайной величины X, имеющей мате- матическое ожидание тх и среднее квадратическое отклонение ах. Вычисляется среднее арифметическое наблюденных значений случай- ной величины X: Х=^-2Х/( (7.12) Найти вероятность того, что среднее арифметическое X отклонит- ся от математического ожидания тх меньше чем на заданную вели- чину е: Р(|Х—mj<e). Решение. На основании центральной предельной теоремы, счи- тая число опытов большим, можно утверждать, что случайная величи- на X распределена нормально, с характеристиками (7.6) и (7.7). От- сюда Р(| Х-—<е) —2Ф j или Р(| X —тх| <е) = 2Ф (7.13) По формуле (7.13) может быть оценена точность определения мате- матического ожидания по среднему арифметическому. Пример 3. Производится /V = 1600 независимых опытов, в которых на- блюдаются значения случайной величины X с характеристиками тх = 2 и ох=1 Найти вероятность того, что среднее арифметическое наблюденных *1 Значение вероятности р, входящее в формулу (7.11), на практике можно брать ориентировочно, по частоте события в первой серии реализаций, уточ- няя его по мепе накопления материала 443
значений случайной величины X будет отличаться от ее математического ожидания меньше чем на 0,05, т. е. будет заключено в интервале 1,95-2-2,05. Решение. По формуле (7.13), пользуясь табл. 1 приложения, находим: / 0,05-40 \ Р (I X—тх | < 0,05) = 2Ф ( —---- 1 = 2Ф (2) « 0,954. Заметим, что для оценки точности определения математического ожидания пгх методом Монте-Карло не требуется заранее знать само- го математического ожидания случайной величины, зато существенно знать ее среднее квадратическое отклонение <тж, которое входит в пра- вую часть формулы (7.13). Обычно на практике, приступая к моделированию случайного явления методом Монте-Карло, мы не знаем ни математического ожи- дания, ни среднего квадратического отклонения интересующей нас случайной величины. Однако для приближенной оценки точности моделирования можно в первом приближении вместо <гх воспользо- ваться ее статистической оценкой, полученной в самой серии из N реа- лизаций: 1/”т ’ (7Л4> где X — среднее арифметическое. Если точность окажется недостаточ- ной, следует продолжить испытания, внося в среднее квадратическое соответствующие поправки по мере увеличения числа реализаций. Задача 4. Производится ряд независимых опытов над случайной величиной X. Сколько надо сделать опытов, чтобы с заданной вероят- ностью (уровнем доверия) Q ожидать, что среднее арифметическое X наблюденных значений случайной величины отклонится от ее матема- тического ожидания не больше, чем на е? Решение. Положим правую часть формулы (7.13) равной уровни доверия Q: 2Ф(~"а“)==^ (7.15) и разрешим уравнение (7.15) относительно N. Получим: М = (2*УГф-^_М12, \ в I L ' к 2 /] (7.16) где ф- —функция, данная в табл. 7.1. Пример 4. Производятся опыты над случайной величиной X с целью при- ближенно определить ее математическое ожидание тх. Среднее квадратическое отклонение случайной величины X, оцененное предварительно (по первой серии экспериментов) по формуле (7.14), приближенно равно ож«0,1. Какое число опытов N нужно для того, чтобы (с уровнем доверия Q = 0,99) среднее арифме- тическое X наблюденных значений случайной величины X отличалось от ее ма- тематического ожидания не больше, чем на в •= 0,01? 444
Решение. Пользуясь табл. 7.1, для (? = 0,99 находим: Г , / 1 \12 / 0Х \2 Ф~ (уС) =6,61; ( — j =100. Отсюда по формуле (7.16) N= 100-6,61 = 661. В заключение остановимся кратко на оценке точности определе- ния характеристик стационарной случайной функции по одной реа лизации (см. § 6). Так как здесь нет множества реализаций, а есть толь- ко одна длинная реализация, возникают естественные вопросы: — Какова ошибка определения характеристик случайного про- цесса по одной реализации длины Т? — Какова должна быть длина реализации Т для того, чтобы с дан- ным уровнем доверия Q ошибка не превзошла данного е? Точное решение этих задач не просто и требует тонких рассужде- ний. Грубо-приближенно на эти вопросы можно ответить, сведя их к вопросам, уже решенным для множества реализаций, если условно приравнять по точности одну длинную реализацию продолжительно- сти Т множеству реализаций длины Т той же общей продолжительно- сти: T = NT', где длина реализации Т определяется как такое время, для которого корреляция между значениями исследуемой случайной функции X(t) становится пренебрежимо малой. На практике при моделировании случайного процесса по одной реализации часто возникает вопрос: пора ли уже остановиться? Стали ли уже устойчивыми вероятностные характеристики процесса? В таких случаях вместо кропотливой оценки точности моделирования можно воспользоваться следующим грубым приемом: резко изменить началь- ные условия, при которых производится моделирование (например, предположить, что в начальный момент не «все каналы свободны», а «все каналы заняты») и повторить моделирование при измененных на- чальных условиях. Если при этом на достаточно удаленных от начала участках времени получатся практически те же вероятностные харак- теристики процесса, это хорошее свидетельство в пользу того, что им можно доверять.
9 ИГРОВЫЕ МЕТОДЫ ОБОСНОВАНИЯ РЕШЕНИИ 1. ЗАДАЧИ ТЕОРИИ ИГР И СТАТИСТИЧЕСКИХ РЕШЕНИЙ Во многих задачах исследования операций нам приходится стал- киваться с проблемой принятия решения в условиях неопределенности. Неопределенными могут быть как условия выполнения операции, так и сознательные действия противников или других лиц, от которых зависит успех операции. Кроме того, неопределенность в той или дру- гой степени может относиться также и к целям (задачам) опера- ции, успех которой далеко не всегда может быть исчерпывающим об- разом охарактеризован одним-единственным числом — показателем эффективности. Разумеется, когда речь идет о неопределенной в каком-то смысле ситуации, рекомендации, вытекающие из научного исследования, не могут быть столь же четкими и однозначными, как в случаях полной определенности. Однако и при отсутствии полной определенности ко- личественный анализ ситуации все же может принести пользу и помочь при выборе решения. Разработаны специальные математические методы, предназначен- ные для обоснования решений в условиях неопределенности. В неко- торых, наиболее простых случаях эти методы дают возможность фак- тически найти и выбрать оптимальное решение. В более сложных слу- чаях эти методы доставляют вспомогательный материал, позволяющий глубже разобраться в сложной ситуации и оценить каждое из возмож- ных решений с различных (иногда противоречивых) точек зрения, взвесить его преимущества и недостатки и в конечном счете принять решение, если не единственно правильное, то, по крайней мере, до конца продуманное. Необходимо учитывать, что при выборе решения в условиях не- определенности всегда неизбежен элемент произвола и, значит, риска. Недостаточность информации всегда опасна, и за нее приходится пла- тить. Однако в условиях сложной ситуации всегда полезно представить варианты решения и их возможные последствия в такой форме, чтобы сделать произвол выбора менее грубым, а риск — минимальным. В ряде случаев задача о принятии решения в условиях неопреде- ленности ставится в таком виде: какой ценой можно заплатить за не- достающую информацию, чтобы экономический эффект всей операции был максимальным? 446
Задачами о принятии решений в условиях неопределенности за- нимается теория игр «статистических решений. В данной главе излагаются некоторые элементарные сведения из этой области. Для более подробного ознакомления могут быть реко- мендованы работы [24, 25, 29]. 2. ПРЕДМЕТ ТЕОРИИ ИГР. ОСНОВНЫЕ ПОНЯТИЯ При решении ряда практических задач исследования операций (в области экономики, военного дела и т. д.) приходится анализировать ситуации, в которых сталкиваются две (или более) враждующие сто- роны, преследующие различные цели, причем результат любого ме- роприятия каждой из сторон зависит от того, какой образ действий выберет противник. Такие ситуации мы будем называть конфликт- ными ситуациями. Примеры конфликтных ситуаций весьма многообразны. Любая ситуация, складывающаяся в ходе военных действий, принадлежит к конфликтным: каждое решение в этой области должно приниматься с учетом сознательного противодействия разумного противника. К той же категории принадлежат и ситуации, возникающие^при выборе системы вооружения, способов его боевого применения и вообще при планировании боевых операций. Ряд ситуаций в области экономики (особенно при наличии капиталистической конкуренции) также при- надлежит к конфликтным; в роли борющихся сторон выступают тор- говые фирмы, промышленные предприятия, тресты, монополии и т. д. Встречаются конфликтные ситуации также в судопроизводстве, спор- те и в других областях человеческой деятельности. Необходимость анализировать такие ситуации вызвала к жизни специальный математический аппарат — теорию игр. Теория игр есть математическая теория конфликтных с и- т у а ц и й. Задача этой теории — выработка рекомендаций по рацио- нальному образу действий участников конфликта. Каждая непосредственно взятая из практики конфликтная си- туация очень сложна, и ее анализ затруднен наличием многих прив- ходящих, несущественных факторов. Чтобы сделать возможным мате- матический анализ ситуации, надо отвлечься от этих второстепенных факторов и построить упрощенную, схематизированную модель ситуа- ции. Такую модель мы будем называть игрой. От реальной конфликтной ситуации игра отличается тем, что ве- дется по вполне определенным правилам. Человечество издавна пользуется такими формализованными моделями конфликтов — «иг- рами» в буквальном смысле слова (шашки, шахматы, карточные игры и т. д.). Все эти игры носят характер соревнования, происходящего по известным правилам и заканчивающегося «победой» (выигрышем) того или другого игрока. Такие формализованные игры представляют собой наиболее удоб- ный материал для иллюстрации и усвоения основных понятий теории игр. Это отразилось и на ее терминологии: стороны, участвующие 447
в конфликте, условно именуются «игроками», исход конфликта — «выигрышем» и т д. В игре могут сталкиваться интересы двух или более противников; в первом случае игра называется «парной», во втором — «множест- венной». Участники множественной игры могут образовывать коали- ции (постоянные или временные). Множественная игра с двумя по- стоянными коалициями обращается в парную. Наибольшее практиче- ское значение имеют парные игры; мы ограничимся рассмотрением только таких игр. Пусть имеется парная игра И, в которой участвуют два’игрока А и В с противоположными интересами Под «игрой» будем понимать мероприятие, состоящее из ряда действий или «ходов» сторон А и В. Чтобы игра могла быть подвергнута математическому анализу, долж- ны быть четко сформ улированы правила и г р ы, т. е. система условий, регламентирующая: — возможные варианты действий игроков, — объем информации каждой стороны о поведении другой, — результат (исход) игры, к которому приводит каждая данная совокупность ходов. Этот результат (выигрыш или проигрыш) вообще не всегда имеет количественное выражение, но обычно можно, хотя бы условно, вы- разить его числом (например, в шахматной игре выигрышу приписать значение 1, проигрышу — 0, ничьей — 1/2). Игра называется игрой с нулевой суммой, если один игрок выигрывает ровно столько, сколько проигрывает другой, т. е. сумма выигрышей сторон равна нулю. В игре с нулевой суммой инте- ресы противников прямо противоположны. Здесь мы будем рассмат- ривать только такие игры. Обозначим а выигрыш игрока А, а b — выигрыш игрока В в игре с нулевой суммой. Так как а = —Ь, то при анализе такой игры нет необходимости рассматривать оба эти числа—достаточно рассматри- вать выигрыш одного из игроков; пусть это будет, скажем, А. В даль- нейшем мы, для удобства изложения, сторону А будем условно имено- вать «мы», а сторону В — «противник»*’. Развитие игры во времени мы будем представлять состоящим из ряда последовательных этапов или «ходов». Ходом в теории игр называется выбор одного из предусмотренных правилами игры дейст- вий и его осуществление Ходы бывают личные и случайные. Личным хо- дом называется сознательный выбор игроком одного из возможных вариантов действий и его осуществление (пример — любой ход в шах- матной игре). Случайным ходом называется выбор из ряда возможностей, осуществляемый не решением игрока, а каким-либо механизмом случайного выбора (бросание монеты, выбор карты из перетасованной колоды и т. п.). Для каждого случайного хода пра-- вила игры определяют распределение вероятностей возможных исходов. *) Это формальное условие, очевидно, не дает никаких реальных преимуществ игроку А. 449
Некоторые игры состоят только из случайных ходов (так назы- ваемые чисто азартные игры) или только из личных ходов (шахматы, шашки). Большинство карточных игр содержит как личные, так и случайные ходы. Теория игр занимается анализом только тех игр, которые содер- жат личные ходы; ее задача — дать указания игрокам при выборе их личных ходов, т. е. рекомендовать им определенные «стратегии». Стратегией игрока называется совокупность правил, оп- ределяющих выбор варианта действий при каждом личном ходе этого игрока в зависимости от ситуации, сложившейся в процессе игры. Понятие стратегии — одно из основных в теории игр; остановимся на нем несколько подробнее. Обычно, принимая участие в игре, игрок не следует каким-то жестким, фиксированным правилам: выбор (ре- шение) при каждом личном ходе принимается им в ходе игры, в зави- симости от сложившейся конкретной ситуации. Однако теоретически дело не изменится, если мы представим себе, что все эти решения при- няты игроком заранее («если сложится такая-то ситуация, я поступлю так-то»). В принципе (если не практически) это возможно для любой игры. Если такая система решений будет принята, это будет означать, что игрок выбрал определенную стратегию. Теперь он может и не участвовать в игре лично, а заменить свое участие списком правил, которые за него будет применять незаинтересованное лицо (судья). Стратегия может быть также задана машине-автомату в виде програм- мы (именно так играют в шахматы электронные вычислительные ма- шины). В зависимости от числа возможных стратегий игры делятся на «конечные» и «бесконечные». Игра называется конечной, если у каждого игрока имеется только конечное число стратегий, и бесконечной, если хотя бы у одного из игроков имеется бесконечное число стратегий. Целью теории игр является выработка рекомендаций для разум- ного поведения игроков в конфликтной ситуации, т. е. определение «оптимальной стратегии» для каждого из них. Оптимальной стратегией игрока называется такая стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш (или, что то же, минимально возможный средний проигрыш). При выборе этой стратегии основой рассуждений является предположение, что против- ник по меньшей мере так же разумен, как и мы сами, и делает все для того, чтобы помешать нам добиться своей цели. В теории игр все рекомендации вырабатываются исходя именно из этих принципов; следовательно, в ней не учитываются просчеты и ошибки игроков, неизбежные в каждой конфликтной ситуации, а так- же элементы азарта и риска. Теория игр, как и всякая математическая модель сложного явле- ния, имеет свои ограничения. Важнейшим из них является то, что выигрыш искусственно сводится к одному-единственному числу. В большинстве конфликтных ситуаций при выборе разумной страте- гии приходится принимать во внимание не один, а несколько числовых 15 Зак. 573 449
параметров — показателей эффективности. Стратегия, оптимальная по одному показателю, необязательно будет оптимальной по другим. Сознавая эти ограничения и поэтому не придерживаясь слепо реко- мендаций, полученных игровыми методами, можно все же разумно использовать математический аппарат теории игр для выработки, если не в точности оптимальной, то, во всяком случае «приемлемой» стратегии. 3. ПЛАТЕЖНАЯ МАТРИЦА Рассмотрим конечную игру, в которой игрок А («мы») имеет т стра- тегий, а игрок В («противник») — п стратегий. Такая игра называется игрой т х п. Будем обозначать наши стратегии А1г А 2.Ат; стратегии противника — В1( В2, .... Вп. Предположим, что каждая сторона вы- брала определенную стратегию: мы выбрали Аь противник — В<. Ес- ли игра состоит только из личных ходов, то выбор стратегий Аг, Bj однозначно определяет исход игры — наш выигрыш (положительный или отрицательный); обозначим его ai}. Если игра содержит кроме личных случайные ходы, то выигрыш при паре стратегий Л;, Bj есть величина случайная, зависящая от ис- ходов всех случайных ходов. В этом случае естественной оценкой ожи- даемого выигрыша является математическое ожидание случайного выигрыша. Мы будем обозначать одним и тем же знаком atj как сам выигрыш (в игре без случайных ходов), так и его математи- ческое ожидание (в игре со случайными ходами). Предположим, что нам известны значения at} при каждой паре стратегий. Эти значения можно записать в виде прямоугольной табли- цы (матрицы), строки которой соответствуют нашим стратегиям (Аг), а столбцы — стратегиям противника (Bj): в. п, Вп л, а11 а1п Д2 а21 а22 а2П- Ат ат1 ат2 атп Такая таблица называется платежной матрицей или просто матрицей игры. Заметим, что построение платежной матрицы, особенно для игр с большим количеством стратегий, может само по себе представлять весьма непростую задачу. Например, для шахматной игры число воз- 450
можных стратегий так велико, что построение платежной матрицы (даже с привлечением вычислительных машин) является пока практи- чески неосуществимым. Однако в принципе любая конечная игра мо- жет быть приведена к матричной форме. Рассмотрим несколько элементарных примеров игр и построим для них платежные матрицы. Пример 1. Игра «поиск», Имеется два игрока А и В; игрок А прячется, а В его ищет. В рас- поряжении А имеется два убежища (I и II), любое из которых он может выбрать по своему усмотрению. Условия игры таковы: если В найдет А в том убежище, где А спрятался, то А платит ему штраф 1 руб ; если В не найдет А (т. е. будет искать в другом убежище), то он сам должен заплатить А такой же штаф. Требуется построить пла- тежную матрицу. Решение. Игра состоит всего из двух ходов, оба — личные. У нас (А) две стратегии: Ai— прятаться в убежище 1, А2— прятаться в убежище II. У противника (В) тоже две стратегии: Вг — искать в убежище I, В2— искать в убежище II. Перед нами -г игра 2x2. Ее матрица имеет вид: Ai в, At —1 1 а, 1 —1 На примере Этой игры, как она ни элементарна, можно уяснить себе некоторые важные идеи теории игр. Предположим сначала, что данная игра выполняется только один раз (играется единственная «партия»). Тогда, очевидно, нет смысла говорить о преимуществах тех или других стратегий — каждый из игроков может с равным основанием принять любую из них. Однако при многократном повторении игры положение меняется. Действительно, допустим, что мы (игрок А) выбрали какую-то стратегию (скажем, Aj) и придерживаемся ее. Тогда, уже по резуль- татам первых нескольких партий, противник догадается о нашей стра- тегии, начнет всегда искать в убежище I и выигрывать. То же будет, если мы выберем стратегию А2. Нам явно невыгодно придерживаться одной какой-то стратегии; чтобы не оказаться в проигрыше, мы долж- ны чередовать их. Однако, если мы будем чередовать убежища I и 11 в какой-то определенной последовательности (скажем, через одну пар- тию), противник тоже догадается об этом и ответит наихудшим для 15* 451
нас образом. Очевидно, надежным способом, гарантирующим нас от верного проигрыша, будет такая организация выбора в каждой пар- тии, когда мы сами его наперед не знаем. Например, можно бросить монету, и, если выпадет герб, выбрать убежище I, а если решка — убежище II. Печальное положение, в котором оказался игрок А (чтобы не про- игрывать, выбирать убежище случайным образом), очевидно, присуще не только ему, но и его противнику В, для которого справедливы все вышеприведенные рассуждения. Оптимальной стратегией каждого оказывается «смешанная» стратегия, в которой две возможные страте- гии игрока чередуются случайным образом, с одинаковыми вероят- ностями. Таким образом, мы путем интуитивных рассуждений подошли к одному из существенных понятий теории игр — к понятию сме- шанной стратегии.— т. е. такой, в которой отдельные «чистые» стретегии чередуются случайным образом с какими-то ве- роятностями. В данном примере из соображений симметрии ясно, что стратегии Aj и А2 должны применяться с одинаковыми вероятностя- ми; в более сложных примерах решение может быть далеко не три- виальным. Пример 2. Игра три пальца». Игроки А и В одновременно и независимо друг от друга показы- вают один, два или три пальца. Выигрыш или проигрыш решает об- щее число показанных пальцев. Выигрыш (в рублях) равен этому чис- лу; если оно четное — выигрывает А, а В ему платит; если нечетное — наоборот. Требуется построить платежную матрицу. Решение. У каждого игрока по три стратегии: показывать один, два или три пальца. Матрица игры 3x3 имеет вид: Al fit В„ в„ 2 —3 4 л2 —3 4 —5 Аз 4 —5 6 Проанализируем ситуацию. Очевидно, на любую нашу стратегию противник может ответить наихудшим для нас образом. Например, если мы выбирем Аи он ответит нам В2, и мы проиграем 3 руб. На стра- тегию Л 2 он нам ответит В3, и мы проиграем 5 руб.; на стратегию А 3 — В2, и мы снова проиграем 5 руб. Очевидно, некоторое преимущество имеет стратегия Аг (при ней проигрыш минимален), но и она для нас явно невыгодна, так как всегда ведет к проигрышу. 452
Однако попробуем стать на точку зрения второго игрока (В). Его положение тоже не из блестящих. Если он выберет Вь мы ответим ему 43, и он отдаст нам 4 руб; если В2 — мы ответим Д2 и снова получим 4 руб; также и на В3 у нас есть ответ А3, приводящий к еще худшему результату: В проиграет 6 руб. Выходит, игра невыгодна ни тому, ни другому из игроков: каждый из них, выбрав какую-то определенную стратегию, осужден на про- игрыш! Это наводит на мысль, что и здесь выход — в применении сме- шанных стратегий; действительно, так оно и есть, но в данном примере дело обстоит не так просто, как в предыдущем, и чтобы найти оптималь- ные стратегии сторон, нужно научиться решать игры. В дальнейшем мы вернемся к этому примеру и найдем его решение. Пример 3. Игра «вооружение и самолет». В нашем распоряжении имеются три вида вооружения: Alt Л2, Аз', У противника —три вида самолетов: В1, В2, В3. Наша задача — поразить самолет; задача про- тивника — сохранить его непораженным. Наш личный ход — выбор типа вооружения; личный ход противника — выбор самолета для бое- вых действий. В данной игре имеется еще и случайный ход — при- менение вооружения. Вооружением As самолеты Въ В2, В3 поражаются соответственно с вероятностями 0,5, 0,6, 0,8; вооружением А2 — с ве- роятностями 0,9, 0,7, 0,8; вооружением Л3—с вероятностями 0,7, 0,5, 0,6. Построить матрицу игры и проанализировать ситуацию. Решение. Матрица игры 3x3 имеет вид: в. Ai В1 в, в, Ai 0,5 0,6 0,8 0,9 0,7 0,8 А3 0,7 0,5 0,6 где выигрыш — вероятность поражения самолета (мы стремимся его максимизировать, а противник — минимизировать). Над этой игрой стоит подумать, так как она обладает некоторыми особыми свойствами, незаметными на первый взгляд. Станем сперва на точку зрения игрока А и переберем одну за дру- гой все его стратегии. На Аг противник ответит нам Вг , и мы выиграем 0,5; на А2 — В2, и мы выиграем 0,7; на А3 — снова В2, и мы выиграем 0,5. Очевидно, некоторое преимущество над другими имеет стратегия А2 — при ней мы выиграем больше, а именно 0,7. Станем теперь на точку зрения противника; не забудем, что он хочет отдать поменьше! Пусть он выбирает В± — мы отвечаем ему А2, и он отдает 0,9; на В2 мы отвечаем ему А2, и он отдает 0,7; на В3 — 43 ,и он отдает 0,8. Естественно, он предпочтет В2, чтобы отдать толь- ко 0,7. 453
Мы видим, что в данном примере стратегии А2 и В2 с выигрышем 0,7 являются наивыгоднейшими сразу для обеих сторон; игроку А выгоднее всего выбирать стратегию А2> игроку В —страте- гию В2, и максимальный выигрыш А совпадает с минимальным про- игрышем В. Достигнуто как бы положение равновесия: если А выберет стратегию А2, то В не может найти лучшего выхода, чем В2, и наобо- рот: если В выберет стратегию В2, то А не может найти лучшего выхо- да, чем А2. В дальнейшем мы увидим, что пара стратегий, обладающих таким свойством, являются оптимальными стратегиями сторон и образуют так называемое решение игры. 4. НИЖНЯЯ И ВЕРХНЯЯ ЦЕНА ИГРЫ, ПРИНЦИП МИНИМАКСА Рассмотрим игру mXnc матрицей BJ Ai В, 41 а11 а12 а1п 42 а21 а2П А-т ат1 #7П2 атп Буквой i будем обозначать номер нашей стратегии, буквой j — номер стратегии противника. Отбросим вопрос о смешанных стратегиях и будем рассматривать пока только чистые. Поставим задачу: определить наилучшую среди наших стратегий Аъ А2, Ат. Проанализируем последова- тельно каждую из них, начиная с Аг и кончая Ат. Выбирая А(, мы должны рассчитывать, что противник ответит на нее той из стратегий В}-, для которой наш выигрыш минимален. Найдем минимальное из чисел atj в z-й строке и обозначим его а;: a(=mino„ (4.1) i (знак min обозначает минимальное значение данного параметра при / всех возможных /). Выпишем числа at (минимумы строк) рядом с матрицей справа в виде добавочного столбца: 454
Ai B, s, Bn “i 4, a11 QI2 al n at A., a21 °22 a2 ... ami am2 amn am pf 01 02 3» (Максимумы столбцов) Выбирая какую-то стратегию Лг, мы должны рассчитывать на то, что в результате разумных действий противника мы выиграем только at. Естественно, действуя наиболее осторожно (т. е. избегая всякого риска), мы должны предпочесть другим ту стратегию, для которой чис- ло аг максимально. Обозначим это максимальное значение а: а = тахссг, или. принимая, во внимание формулу (4.1), а = max min a j. (4.3) Величина а называется нижней ценой игры, иначе — максиминным выигрышем или максимином. Та стратегия игро- ка А, которая соответствует максимину а, называется максимин- ной стратегией. Очевидно, если мы будем придерживаться максиминной страте- гии, го нам при любом поведении противника гарантирован выигрыш, во всяком случае, не меньший а. Поэтому величина а и называется «нижней ценой игры». Это — тот гарантированный минимум, который мы можем себе обспечить, придерживаясь своей наиболее осторожной («перестраховочной») стратегии. Очевидно, аналогичное рассуждение можно провести и за против- ника В. Он заинтересован в том, чтобы обратить наш выигрыш в мини- мум; значит, он должен просмотреть все свои стратегии, выделяя для каждой из них максимальное значение выигрыша. Выпишем внизу матрицы (4,2) максимальные значения atj по столбцам: = max atj 456
и найдем их них минимальное: 0 =minfo или 0 = min max atj. (4.4) i i Величина 0 называется верхней ценой игры, иначе минимаксным выигрышем или минимаксом. Соответствующая выигрышу 0 стратегия противника называется его минимакс- ной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, противник гарантирован, что в любом случае он проиграет не больше 0. Принцип осторожности, диктующий игрокам выбор соответст- вующих стратегий (максиминной и минимаксной), является в теории игр основным и называется принципом минимакса. Он вы- текает из предположения о разумности каждого игрока, стремящегося достигнуть цели, противоположной цели противника. Наиболее «осто- рожные» максиминную и минимаксную стратегии часто обозначают общим термином «минимаксные стратегии». Определим нижнюю и верхнюю цены игры, а также минимаксные стратегии, для трех примеров, рассмотренных в предыдущем парагра- фе. Пример 1. {Игра «поиск»). Определяя минимумы строк аг и мак- симумы столбцов 0;, получим В] А1 В1 а1 —1 +1 —1' ^2 +1 —1 —1 1 1 Так как величины аг и 0, постоянны и равны соответственно —1 и 4-1 , нижняя и верхняя цены игры также равны —1 и 4-1: а = —1, р = +1. Любая стратегия игрока А является его максиминной, а игрока В — его минимаксной стратегией. Вывод тривиален: придерживаясь любой из своих стратегий, игрок А может гарантировать, что он про- играет не более 1 руб.; то же может гарантировать и игрок В при лю- бой своей стратегии. Пример 2. {Игра три пальца»). Выписывая минимумы строк и максимумы столбцов, найдем нижнюю цену игры а = —3 и верх- нюю 0 = 4 (выделены в таблице жирным шрифтом). Наша макси- минная стратегия At (применяя ее систематически, мы гарантируем, 458
Si B2 В, 41 2 —3 4 -3 Л2 —3 4 —5 —5 А, 4 —5 6 -5 Р; 4 4 6 что выиграем не меньше—3, т. е. проиграем не больше 3). Минимакс- ная стратегия противника — любая из стратегий В1 и В2, применяя их систематически, он может гарантировать, что не отдаст более 4. Если мы отступим от своей максиминной стратегии (например, выберем Л2), то противник может нас «наказать» за это, применив В3 и сведя наш выигрыш к—5; равным образом и отступление противника от его минимаксной стратегии может быть «наказано» увеличением его про- игрыша до 6. Обратим внимание на то, что минимаксные стратегии в данном слу- чае не устойчивы. Действительно, пусть, например, противник выбрал одну из своих минимаксных стратегий Вг и придерживается ее. Узнав об этом, мы перейдем к стратегии Ая и будем выигрывать 4. На это противник ответит стратегией В2 и будет выигрывать 5; на это мы, в свою очередь, ответим стратегией А2 и будем выигрывать 4, и т. д. Таким образом, положение, при котором оба игрока пользуются своими минимаксными стратегиями, является неустойчивым и может быть нарушено поступившими сведениями о стратегии, которую при- меняет противная сторона. Однако такая неустойчивость наблюдает- ся не всегда; в этом мы убедимся на следующем примере. Пример 3. {Игра «вооружение и самолет»). Определяем минимумы строк и максимумы столбцов: Ai л, л, А‘ “г Аг 0,5 0,6 0,8 0,5 а2 0,9 0,7 0,8 | 0,7 4» 0,7 0,5 0,6 | 0,6 Р) 0,9 0,7 0,8 | 497
В данном случае нижняя цена игры равна верх- ней: а = Ц = 0,7. Минимаксные стратегии Л2 и S2 являются устойчивыми: если один из игроков придерживается своей минимаксной (максимин- ной) стратегии, то другой игрок никак не может улучшить свое поло- жение, отступая от своей. Таким образом, мы видим, что существуют игры, для которых ниж- няя цена равна верхней: а = |э. Эти игры занимают особое место в теории игр и называются и г - рами с седловой точкой. В матрице такой игры сущест- вует элемент, являющийся одновременно минимальным в своей строке и максимальным в своем столбце', такой элемент называется «седловой точкой» (по аналогии с седловой точкой на поверхности, где дости- гается минимум по одной координате и максимум по другой). Общее значение нижней и верхней цены игры а = |3 = v называется чистой ценой игры. Седловой точке соответствует пара минимаксных стратегий; эти стратегии называются оптимальными, а их совокупность — решением игры. Решение игры обладает следующим свойством: если один из игроков придерживается своей оптимальной стратегии, то для другого не может быть выгодным отклоняться от своей опти- мальной (такое отклонение либо оставит положение неизменным, либо ухудшит его). Действительно, пусть в игре с седловой точкой игрок А придер- живается своей оптимальной стратегии, а игрок В — своей. До тех пор, пока это так — выигрыш остается постоянным и равным цене игры v. Теперь допустим, что В допустил отклонение от своей опти- мальной стратегии. Так как элемент v является минимальным в своей строке, такое отклонение не может быть выгодным для В; равным об- разом и для А, если В придерживается своей оптимальной стратегии, не может быть выгодно отклонение от своей. Мы видим, что для игры с седловой точкой минимаксные страте- гии обладают устойчивостью. Пара оптимальных стратегий в игре с седловой точкой является как бы положением рав- новесия: отклонение от оптимальной стратегии вызывает такое изменение выигрыша, которое невыгодно для отклоняющегося игро- ка и вынуждает его вернуться к своей оптимальной стратегии. Чистая цена игры v в игре с седловой точкой является тем значе- нием выигрыша, которое в игре против разумного противника игрок А не может увеличить, а игрок В — уменьшить. Заметим, что в платежной матрице может быть не одна седловая точка, а несколько. Например, в матрице 468
Ai /3 1 В, в: в» о, а1 Л, 2 2 1 1 2 Х2 0 1 1 1 1 0 ^3 1 1 1 1 2 1 1 2 1 i 2 1 Р/ 2 2 1 1 2 j имеется шесть седловых точек, с общим значением выигрыша а = р = = v = 1 и соответствующими парами оптимальных стратегий: /IjBg, АгВ^ А3В3, A3Bit AtB3, Л464. Нетрудно доказать (мы этого делать не будем), что если в матрице игры несколько седловых точек, то все они дают одно и то же значение выигрыша. Рис. 9.1 Пример. Сторона А — средства ПВО — обороняет от воздушного налета участок территории, располагая двумя орудиями № 1 и № 2, зоны действия ко- торых S(, S2 не перекрываются (рис. 9.1). Каждое орудие может обстрелять толь- ко самолет, проходящий через его зону действия, но для этого оно должно зара- нее (до входа цели в зону) следить за ней и вырабатывать прицельные данные Если цель обстреляна, она поражается с вероятностью р = 1 Сторона В рас- полагает двумя самолетами, каждый из которых может быть направлен в лю- бую зону В момент, когда сторона А осуществляет целераспределение (назначает, какому орудию по какой цели стрелять), движение самолета-цели № 1 направ- лено в зону действия орудия № 1, а цели № 2 — в зону действия S2 орудия № 2- Однако после принятия решения по целераспределению каждая цель может 459
сманеврировать, применив «обманный маневр» (см. пунктирные стрелки на рис 9 1). Задача стороны А — обратить в максимум, а стороны В — обратить в минимум число пораженных целей Найти решение игры (оптимальные страте- гии сторон) Решение. У стороны А (средства ПВО) четыре возможные стратегии Ai — каждое орудие следит за направляющейся в его зону целью, Л2 — орудия следят за целями «крест-накрест» (каждое — за целью на- правляющейся к соседу), А3 — оба орудия следят за целью № 1, А4 — оба орудия следят за целью № 2 У стороны В (самолеты-цели) тоже четыре стратегии: Bj —. обе цели не меняют направления, В2 — обе цели применяют обманный маневр. В3 — первая цель применяет обманный маневр, а вторая нет, Вг — вторая цель применяет обманный маневр, а первая нет. Получается игра 4X4, матрица которой дана в таблице: В2 в3 М В, 1/ “| л, tt 2 О 1 1 О А2 X О 2 1 1 О А3 t\ 1 1 1 1 1 А4 /\ 1 1 » 1 1 2 2 1 1 Находя минимумы строк и максимумы столбцов, убеждаемся, что нижняя цена игры равна верхней цене игры: а=р=у=1; значит, игра имеет седловую точку и решение в чистых стратегиях, приводящее к чистой цене игры у = 1 В данном случае седловых точек не одна, а целых четыре Каждой из них со ответствует пара оптимальных стратегий, дающая решение игры Цена игры v = 1 означает, что при оптимальном поведении сторон самолеты будут не- избежно терять один самолет, и никакие ухищрения не помогут им терять меньше, а средствам ПВО — сбить больше одного самолета Достигается это состояние равновесия, когда обе стороны пользуются своими оптимальными стратегиями: орудия следят оба за одним и тем же самолетом (любым), а само- леты направляются после целераспределения в одну и ту же зону (любую) Класс игр, имеющих седловую точку, весьма интересен как с тео- ретической, так и с практической точки зрения. К нему принадлежат, в частности, все так называемые «игры с полной информацией». Игрой с полной информацией называется такая игра, в которой каждый игрок при каждом личном ходе знает резуль- таты всех предыдущих ходов — как личных, так и случайных. При- мерами игр с полной информацией могут служить: щашки, шахматы, известная игра в «крестики и нолики» и др. 460
В теории игр доказывается, что каждая игра с полной информа- цией имеет седловую точку и следовательно, решение в чистых стра- тегиях. Другими словами, в каждой игре с полной информацией су- ществует пара оптимальных стратегий той и другой стороны, дающая устойчивый выигрыш, равный чистой цене игры. Если игра с полной информацией состоит только из личных ходов, то при применении каждой стороной своей оптимальной стратегии игра должна кончать- ся всегда вполне определенным исходом, равным цене игры V. В качестве примера приведем следующую игру с полной инфор- мацией. Два игрока поочередно кладут одинаковые монеты на круглый стол, выбирая произвольно положение монеты (взаимное перекрытие монет не допускается). Выигрывает тот, кто положит последнюю моне- ту (когда места для других уже не останется). Нетрудно убедиться, что исход этой игры предрешен, и существует определенная стратегия, обеспечивающая достоверный выигрыш тому из игроков, кто кладет монету первым. А именно, он должен первый раз положить монету в центр стола, а далее на каждый ход противника отвечать симметрич- ным ходом. Очевидно, как бы ни вел себя противник, ему не избежать проигрыша. Поэтому игра имеет смысл только для лиц, не знающих ее решения. Точно так же дело обстоит с шахматами и другими игра- ми с полной информацией; любая из этих игр обладает седловой точ- кой и, значит, решением, указывающим каждому игроку его опти- мальную стратегию, так что игра имеет смысл только до тех пор, пока неизвестно решение. Решение шахматной игры не найдено (и в обозри- мом будущем вряд ли будет найдено) только потому, что число страте- гий (комбинаций ходов) в шахматах слишком велико, чтобы можно было построить платежную матрицу и найти в ней седловую точку. 5. РЕШЕНИЕ ИГРЫ В СМЕШАННЫХ СТРАТЕГИЯХ Среди конечных игр, имеющих практическое значение, не так уж часто встречаются игры с седловой точкой; более типичным является случай, когда нижняя и верхняя цены игры различны. Ана- лизируя матрицы таких игр, мы пришли к выводу, что если каждому игроку предоставить выбор одной-единсгвенной чистой стратегии, то в расчете на разумного противника этот выбор должен определяться принципом минимакса. При этом игрок А гарантирует себе выигрыш, равный нижней цене игры а. Возникает вопрос: нельзя ли гарантиро- вать выигрыш, больший а, если применять не одну-единственную, «чистую» стратегию, а чередовать случайным образом несколько стра- тегий? Такие стратегии, состоящие в случайном чередовании чистых стратегий, называются в теории игр смешанными. При пользо- вании смешанной стратегией перед каждой партией игры пускается в ход какой-то механизм случайного выбора (бросание монеты, иг- ральной кости или вычисление машиной случайного числа от 0 до 1), обеспечивающий появление каждой стратегии с некоторой вероят- ностью, и затем принимается та стратегии на которую пал жребий 461
Смешанные стратегии представляют собой математическую модель изменчивой, гибкой тактики, при которой противник не знает, и не может узнать заранее, с какой обстановкой ему придется встретиться. Таким случайным чередованием приемов (разумеется, без четко опре- деленных вероятностей) часто пользуются в карточных играх. Введем специальное обозначение для смешанных стратегий. Пусть имеется игра И, в которой у нас (Л) т стратегий: Лу, Л2, ..., Лт, а у противника (В) — п стратегий: Въ В2, , Вп. Будем обозначать 5л=(р1, р2, рт) нашу смешанную стратегию, в которой стратегии Аг, Л2, ..., Ат при- меняются с вероятностями Pi, р2, ..., Рт, причем Pi + p2 + ... + рт =1. Аналогичное обозначение для смешанной стратегии противника будет SB=(q, q2, .... qn), где P! + p2+ ... + pn = l. Очевидно, каждая чистая стратегия является частным случаем смешанной : все стратегии, кроме данной, имеют вероятности, равные нулю, а данная — единице. Оказывается, если допустить не только чистые, но и смешанные стратегии, то можно для каждой конечной игры найти решение, т. е. пару устойчивых оптимальных стратегий игроков. Решением игры называется пара оптимальных стратегий Sa> Sb, в общем случае смешанных, обладающих следующим свой- ством: если один из игроков придерживается своей оптимальной стра- тегии, то другому не может, быть выгодно отступать от своей. Выигрыш, соответствующий решению, называется ценой и г - р ы ; мы будем (как раньше — чистую цену) обозначать ее v. Существует так называемая основная теорема тео- рии игр, состоящая в следующем. Каждая конечная игра имеет по крайней мере одно решение, воз- можно, в области смешанных стратегий. Мы не будем останавливаться на строгом доказательстве этой тео- ремы, тем более, что в дальнейшем существование решения игры будет достаточно очевидно из других соображений. Из основной теоремы следует, что каждая конечная игра имеет це- ну. Цена игры v всегда лежит между нижней ценой игры а и верхней ценой игры |3: а v р. Действительно, а есть максимальный гарантированный выигрыш, который мы можем себе обеспечить, применяя только свои чистые стра- тегии. Так как смешанные стратегии содержат в качестве частного случая все чистые, то, допуская кроме чистых еще и смешанные стра- тегии, мы, во всяком случае, не ухудшим своих возможностей; значит, v а. 462
что Аналогично, рассматривая возможности противника, докажем, откуда а v 0. Предположим, что в игре тхп нами найдено решение, состоящее из двух оптимальных стратегий: = (Р1, Р2> •••> Рт); Sb*= (ft, q2.qn). В общем случае, некоторые из чисел р1г р2, рт; qlt qs, qn могут быть равными нулю, т. е. не все стратегии, доступные игроку, входят в его оптимальную смешанную стратегию. Будем называть активными стратегиями игрока те, которые входят в его оптималь- ную смешанную стратегию с отличными от нуля вероятностями. Для решения игр существенное значение имеет следующая теорема об активных стратегиях. Если один из игроков придерживается своей оптимальной смешан- ной стратегии, то выигрыш остается неизменным и равным цене игры v, независимо от того, что делает другой игрок, если только тот не вя- ходит за пределы своих активных стратегий (т. е. пользуется любой из них в чистом виде или смешивает их в любых пропорциях). Докажем эту теорему. Пусть имеется решение игры тхп в сме- шанных стратегиях, в котором некоторые стратегии являются активны- ми, а другие нет. Перенумеруем стратегии так, чтобы активными были первые k стратегий игрока А и первые I стратегий игрока В. Решение будет иметь вид: 5л* = (р!, р2,.... ph, о,.... 0), (p! + p2+-- + p* = 1); *$B* = (ft> q2, qi, 0, ..., 0), Qz Аг qi — 1)’ и его применение приводит к выигрышу, равному цене игры v. Утверждается, что если мы (Л) будем придерживаться своей стра- тегии Зд, то противник (В) может применять свои стратегии Вь В2, , Вг (но не В/ + 1, ..., Вп) в любых пропорциях; выигрыш при этом останется постоянным и равным V. Обозначим Vj, v2, ..., vt выигрыш, образующийся, если мы поль- зуемся оптимальной стратегией Зд, а противник — чистыми страте- гиями Blt В2, . Вг. Из определения решения игры следует, что од- носторонее отклонение противника от его оптимальной стратегии не может быть ему выгодно; поэтому vx^v; v2^v; ...; vt v. Посмотрим, может ли хотя бы одна из величин v2, .... vt оказаться действительно больше V. Оказывается, нет. Действи- тельно, выразим выигрыш v при оптимальных стратегиях Зд, Зв через выигрыши vx, v2, .... v;. Так как в смешанной стратегии Зв 463
чистые стратегии Blt Ва, . . . , Bi применяются с вероятностями <71, <?2.qt, то средний выигрыш будет: i W (5.1) 7=i причем <7i 4~ <7г + • • • + Яi= 1 • Очевидно, что если из величин vb v2, .... vL хотя бы одна бы- ла больше v, то и их среднее взвешенное значение (5.1) было бы боль- ше v, что противоречит условию. Таким образом, доказана теорема, которую мы будем широко применять при решении игр. 6. УПРОЩЕНИЕ ИГР Если игра т х п не имеет седловой точки, то отыскание ее реше- ния, особеннно при больших тип, представляет собой довольно тру- доемкую задачу. Иногда эту задачу удается упростить, если предвари- тельно «редуцировать» игру, т. е. сократить число стратегий путем вычеркивания некоторых излишних. Излишние стратегии бывают двух родов: дублирующие и заведомо невыгодные. Рассмотрим, например игру И с матрицей: Ai в, в, в„ В4 Л1 1 2 4 3 л2 0 2 3 2 А3 1 2 4 3 Л4 4 3 1 0 Из матрицы видно, что стратегия А3 в точности повторяет («дуб- лирует») стратегию Д4; поэтому любую из этих двух стратегий можно вычеркнуть. Далее, сравнивая почленно строки Аг и Д2, видим, что все элементы строки Д2 меньше (или равны) соответствующих элемен- тов строки Д4. Значит, стратегия Д2 для нас, желающих выиграть, заведомо невыгодна. Вычеркивая А3 и Д2,приведем матрицу к более простому виду: 1 А1 £1 В, в, В4 A1 1 1 2 4 3 л4 4 3 1 0 464
Далее замечаем, что для противника стратегия В8 заведомо не- выгодна; вычеркиваем и ее, и матрица приведена к виду: в] в, в2 в4 я, ] 1 2 3 4 3 0 Таким образом, игра 4x4 сведена к игре 2x3. Иногда удается упростить игру искусственным введением вместо чистых стратегий — смешанных. Пусть, например, имеется игра 3x4 с матрицей: А1 Bt В2 в, В4 л, 0 5 5 2 /42 5 0 2 5 Аа 6 5 1 1 Рассматривая матрицу, замечаем, что, в силу симметрии элемен- тов столбцов В± и В2; Ва и В4, а также строк Аг и Д2, эти стратегии, если входят в решение, то только с одинаковыми вероятностями: Pi = Ръ 71 = 72, 7з = 7«- Отсюда возникает идея: заранее объединить стратегии Вх и В2 в одну смешанную стратегию В12, состоящую напо- ловину из Въ наполовину из В2; так же поступить со стратегиями Ва и Bit т. е. объединить их в одну смешанную стратегию Bai, в кото- рую Ва и Bi входят с одинаковыми вероятностями 1/2. Приводим матрицу к виду: Л' в» в»« Ai 2,5 3,5 А3 2,5 3,5 Аа 5 1 Теперь видно, что если противник пользуется стратегиями В1г, Bat, стратегии Ау и Аг дублируют друг друга; вычеркивая какую- либо из них (или объединяя Аг и Аа в одну Л1а), приводим матрицу к виду 2X2: 405
Ai #1Й Л12 2,5 3,5 л3 5 1 Таким образом, игра 3X4 сведена к игре 2X2. Приступая к решению любой игры тХ п, необходимо прежде всего выполнить следующие процедуры: — посмотреть, нет ли в матрице седловой точки: если есть, реше- ние уже найдено; — если седловой точки нет, сравнить между собой почленно столбцы и строки с целью вычеркивания дублирующих и заведомо невыгодных стратегий; — посмотреть, нельзя ли уменьшить число стратегий путем замены некоторых групп чистых — смешанными. 7. ИГРА 2X2 Наиболее простым случаем конечной игры является игра 2x2, где у каждого игрока две стратегии. Рассмотрим игру 2x2 с матрицей: В' At Bi Ai аи а12 а21 а22 Здесь могут встретиться два случая: 1) игра имеет седловую точку; 2) игра не имеет седловой точки. В первом случае решение очевидно: это — пара стратегий, пере- секающихся в седловой точке. Нетрудно доказать, что если игра 2x2 имеет седловую точку, то в этой игре всегда какая-нибудь из стратегий может быть отброшена как заведомо невыгодная или дублирующая. Не будем этого доказывать. Предоставим читателю доказать это поло- жение или убедиться в его справедливости на ряде произвольно вы- бранных примеров. Рассмотрим второй случай: предположим, что в матрице 2x2 сед- ловой точки нет. При этом нижняя цена игры не равна верхней: а =/= 0. Решение должно быть в смешанных стратегиях. Найдем это решение, т. е. пару оптимальных смешанных стратегий: Sa* = (Pi, р2); = (7i, 72). Сначала определим оптимальную смешанную стратегию 5л*. Со- гласно теореме об активных стратегиях (см. § 5), если мы будем при- 466
держиваться этой стретегии, то, независимо от образа действий против- ника (если он только не выходит за пределы своих активных стратегий), выигрыш будет оставаться равным цене игры v. В игре 2x2 обе страте- гии противника являются активными (иначе игра имела бы седловую точку). Значит, если мы придерживаемся своей оптимальной страте- гии S^* — (л, р2)> то противник может, не меняя выигрыша, приме- нять любую из своих чистых стратегий. Отсюда имеем два уравнения: аи Pl + а21 Pi = v> 1 (7 1) а12 Pl 4~ а22 Pi=V’ I из которых, принимая во внимание условие р, 4- р2 = 1, получим: Р __ ______а22--а21_____ аН + °22--°1 2 —а21 а11---°12 Pi = 1 - Pl а11 "Г а22------fl12----- °»1 (7.2) Цену игры v найдем, подставляя значения ръ р2 в любое из урав- нений (7.1): (722 Оц----Д12 fl21 &Ц ---Й12---- (7.3) Аналогично находится оптимальная стратегия противника: из уравнений Sfi* =(7i, q3) аи Qi + аи Qi — v> 1 (7 4) а21 91 4~ а22 Qi = v> J откуда д а22—а12 °11 4“а22 а12 °21 (7.5) 9г ’ 1 91- Пример 1. Найти решение игры «поиск» (см. пример 1 §2). Решение. Игр? 2x2 с матрицей Ai В. в, А, —1 1 а2 1 —1 не имеет седловой точки: а = —1,0 = 4-1. Ищем решение в смешан- ных стратегиях. По формулам (7.2), (7.3), (7.5) получаем: Pi^li, р2 = 1/2; v =0; 9i=x/2; 9г=1/2'- 5д*=(1/г, l/2); S5* = 0/8, Ц2). 467
Следовательно, оптимальная стратегия каждого игрока состоит в том, чтобы случайным образом чередовать свои чистые стратегии, пользуясь каждой из них с вероятностью 1/2; при этом средний выи- грыш будет равен нулю (этот вывод уже был получен нами из интуи- тивных соображений). В следующем примере мы рассмотрим игру, ре- шение которой не является столь очевидным. Пример 2. Игра «Два бомбардировщика и истребитель'». Сторона А посылает в район расположения противника В два бомбардировщика I и II; I летит спереди, il — сзади. Один из бомбар- дировщиков (заранее неизвестно, какой) должен нести бомбу; другой выполняет только функцию сопровождения. В районе противника бомбардировщики подвергаются нападению истребителя стороны В (рис. 9.2). Оба бомбардировщика вооружены пушками. Если истреби- тель атакует задний бомбардировщик, то по нему ведут огонь пушки только этого бомбардировщика, поражающие истребитель с вероят- ностью 0,3. Если же истребитель атакует передний бомбардировщик, по нему ведут огонь пушки как переднего, так и заднего бомбардиров- щика; совместно они поражают его с вероятностью 1 — (1 — 0,3)2 == 0,51. Если истребитель не сбит ответным огнем бомбардировщиков, то он поражает выбранную им цель с вероятностью 0,8. Задача бомбардировщиков — донести бомбу до цели; задача ис- требителя — воспрепятствовать этому. Требуется найти оптимальные стратегии сторон: — Для стороны А — какой бомбардировщик сделать носителем? — Для стороны В — какой бомбардировщик атаковать? Решение. Составим матрицу игры, для чего найдем средний вы- игрыш при каждой комбинации стратегий. Выигрыш — вероятность непоражения носителя. 1. A±B± — носитель I, атакуется 1. Носитель не будет поражен, если бомбардировщики собьют истреби- тель, или же если они его не собьют, но и он не поразит свою цель. Ве- роятность того, что оба бомбардировщика вместе поразят истребитель, равна 0,51, поэтому ап = 0,51 + (1 — 0,51 )(1 — 0,8) = 0,608. 2. А2Ва — носитель II, атакуется I; a2i — !• 3. AtB2 — носитель 1, атакуется II; Ou = 1. 4. А2В2— носитель II, атакуется П; ааа = 0,3 + 0,7 • 0,2 = 0,44. 468
Матрица игры с добавочным столбцом и строкой: А‘ Bi в, a j Л. 0,608 1 0,608 Ла 1 0,44 0,44 t 1 Рис. 9.2 Бомбардировщики Г п Нижняя —цена игры а = 0,608, верхняя Р = 1. Игра не имеет седловой точки; решение достигается в смешанных стратегиях. По формулам (7.2), (7.3), (7.5) находим (с точностью до третьего знака после запятой): Pi = =------°'-44~1---- = 0,588; 0,608 + 0,44 — 1 — 1 Pz = 1 — Pi = 0,412; 0,44-0,608—1.1 v —-----------------= 0,608 + 0,44 — 1—1 = 0,768; ^==0,588;<72=0,412. (В данном случае qy =ръ q2= =р2ъсилу того, что а12—а21.) Итак, оптимальные стра- тегии сторон и цена игры най- дены: Зд* = (0,588, 0,412). Sb* = (0,588, 0,412), v = 0,768, т. е. наша оптимальная стратегия состоит в том, чтобы в 58,8% всех случаев (с вероятностью 0,588) делать носителем I, а в 41,2% случаев — II. Аналогично противник должен с вероятностью 0,588 атаковать первый бомбардировщик, а с вероятностью 0,412 — второй. При этом сторона А будет выполнять свою задачу — доносить бомбы до цели — с вероятностью 0,768, что больше нижней цены игры 0,608 и меньше верхней цены игры 1. Решению игры 2x2 можно дать удобную геометрическую интер претацию Пусть имеется игра 2x2 с матрицей: А, в, Лх а11 а12 л2 а21 аМ 469
Возьмем участок оси абсцисс длиной единица (рис. 9.3). Левый конец участка (точка с абсциссой х = 0) будет изображать стратегию Alt правый конец участка (х = 1) — стратегию Л2; все промежуточ- ные точки участка будут изображать смешанные стратегии игрока А, причем вероятность рг стратегии Аг будет равна расстоянию от точки Sa до правого конца участка, а вероятность р2 стратегии Л2 — рас- стоянию до левого конца. Проведем через точки Ак и Л2 два перпенди- куляра к оси абсцисс: ось I — I и ось II — 11. На оси I — I будем откладывать выигрыш при стратегии Лъ а на оси II — II — выигрыши при стратегии Л2. Рис. 9.5 Пусть противник применяет стратегию Вх; она дает на осях I—I и II — II соответственно точки с ординатами ап и а21. Проведем через эти точки прямую ВхВх- Очевидно, при любой смешанной стра- тегии Вл = (plt р2) наш выигрыш выразится точкой /И на прямой B3Blt соответствующей точке Sa на оси абсцисс, делящей отрезок в отноше- нии р2 : рх. Прямую ВхВх условно будем называть «стратегией Bj». Очевидно, точно таким же способом может быть построена и стра- тегия В2 (рис. 9.4). Нам нужно найти оптимальную стратегию 5л*, т. е. такую, при которой наш минимальный выигрыш (при наихудшем для нас поведе- 470
нии В) обращался бы в максимум. Для этого построим нижнюю границу выигрыша при стратегиях В1г В2, т. е. ломаную BrNB2, отмеченную на рис. 9.4 жирной линией. На этой границе будет лежать минимальный выигрыш игрока А при любой его смешанной стратегии; точка Л/, в которой этот выигрыш достигает максимума, и определяет решение и цену игры. Нетрудно убедиться, что ордината точки N есть не что иное, как цена игры v, ее абсцисса равна р2, а рас- стояние до правого конца отрезка равно plt т. е. расстояния от точки 5л* до концов отрезка равны вероятностям р2 и pt стратегий А2 и А) в оптимальной смешанной стратегии игрока А. В нашем случае решение игры определялось точкой пересечения стратегий Blt В2; это не всегда будет так. На рис. 9.5 показан случай, когда оптимальной стратегией игрока А является чистая стратегия А2, Рис. 9.6 Рис. 9.7 хотя это и не соответствует точке пересечения стратегий. Здесь страте- гия А2 игрока А явно (при любой стратегии противника) выгоднее стратегии А^ На рис. 9.6 показан случай, когда заведомо невыгодная стратегия имеется у противника. Геометрическая интерпретация дает возможность наглядно изо- бразить также нижнюю цену игры а и верхнюю |3 (рис. 9.7). На том же графике можно дать и геометрическую интерпретацию оптимальных стратегий противника В. Действительно, нетрудно убедиться, что до- ля стратегии В± в оптимальной смешанной стратегии Sb* = (71, q2) равна отношению длины отрезка КВ2 к сумме длин отрезков КВ2 и К.В1 на оси I — I: или, что то же, LB2-]-LBi на оси II — II. 471
Оптимальную стратегию Sb*=(7i, q^) можно найти и другим, не- посредственным способом, если поменять местами игроков А и В, а ьместо максимума нижней границы выигрыша рассмотреть минимум верхней границы (рис. 9.8). На рис. 9.9 дана геометрическая интерпретация решения игры «два бомбардировщика и истребитель» (пример 2). 8. ИГРЫ 2Хп И отХ2 Мы убедились, что любая игра 2x2 может быть решена элемен- тарными приемами. Совершенно аналогично может быть решена лю- бая игра 2 X п, где у нас (А) имеются всего две стратегии, а у против- ника (В)произвольное число (п). Итак, пусть имеется матрица игры 2 X п: она состоит из двух строк и п столбцов. Аналогично случаю 2X2 дадим задаче геометри- ческую интерпретацию; п стратегий противника изобразятся п пря- мыми (рис. 9.10). Построим нижнюю границу выигрыша (ломаную и найдем на ней точку N с максимальной ординатой; эта ор- дината и будет ценой игры v, а абсцисса точки N будет равна вероят- ности р2 стратегии А2 в оптимальной смешанной стратегии игрока А: Sa* = (Pi, р2). Зная, какие стратегии пересекаются в точке N, можно указать активные стратегии противника. В нашем случае (рис. 9.10) оптималь- ная смешанная стратегия противника =(0,^, 0,<74) состоит из смеси двух активных стратегий В2, Bit пересекающихся в точке N. Стратегия В8 является заведомо невыгодной, а стратегия Bi — невыгодной при оптимальной стратегии 5д*. Вероятности qt и qt относятся как длины отрезков и KBt на рис. 9.10. Если А бу- 472
дет пользоваться своей оптимальной стратегией Sa*, то выигрыш не изменится, какой бы из своих активных стратегий ни пользовался В, однако он изменится, если В перейдет к стратегиям Вг или В3. Можно доказать, что у любой конечной игры тхп существует реше- ние, в котором число активных стратегий каждой стороны не превос- ходит наименьшего из чисел тип. Из этого, в частности, следует, что у игры 2 X п всегда имеется решение, в котором с каждой стороны участвует не более двух актив- ных стратегий. Стоит только найти эти стратегии — и игра 2Хя превращается в игру 2x2, которая решается элемен- тарно. Отсюда вытекает такой практический прием решения игры 2 X п: строится геометри- ческая интерпретация' (рис. 9.10), ищется пара стратегий, пересекающихся в точке N (если в ней пересекается более двух стратегий, берется любая па- ра) — эти стратегии представ- ляют собой активные стратегии игрока В, и игра 2 х п сведена к игре 2x2. Очевидно, так же может быть решена и игра т X 2, с той разницей, что строится не нижняя, а верхняя граница выигрыша, и на ней ищется не макси- мум, а минимум (рис. 9.11). Пример 1. Игра «самолеты и зенитные орудия-». Сторона А (самолеты) нападает на объект, сторона В (зенитные орудия) обороняет его. У стороны А два самолета, у стороны В — три зенитных орудия. Каждый самолет является носителем мощного по- ражающего средства: для поражения объекта достаточно, чтобы к не- му прорвался хотя бы один самолет. Самолеты могут выбирать для подхода к объекту любое из трех направлений: 1, П или Ш, не меняя его в дальнейшем (рис. 9.12). Противник (В) может разместить любое из своих орудий на любом направлении; каждое из орудий прострели- вает только область пространства, относящуюся к данному направле- нию, и не простреливает соседних направлений. Каждое орудие может обстрелять только один самолет; обстрелянный самолет поражается с полной достоверностью. Сторона А не знает, где размещены орудия; сторона В не знает, откуда прилетят самолеты. Задача стороны А — поразить объект, стороны В — не допустить поражения. Найти реше- ние игры. Решение. Если в качестве стратегий рассматривать все возможные способы выбора направлений самолетами и расстановки орудий, коли- 473
чество стратегий будет очень велико — 9 с одной стороны и 27 с дру- гой. Однако можно ограничиться гораздо меньшим числом стратегий, если заранее их «смешать» и рассмотреть для А только две стратегии: Д1 — послать по одному самолету на два разных (любых' на- правления; Д2 — послать оба самолета по одному (любому) направлению, а для противника — три стратегии: Bi (1+1 + 1) — поставить по одному орудию на каждое на- правление; В2 (2+1 -(-.О) — поставить два орудия на одно (любое) на- правление, одно — на другое, а третье оставить незащищенным; (3+04-0) — поставить все три орудия на одно (любое) на- правление, а два других оставить незащищенными. При этом предполагается, что выбор каждого из направлений про- изводится случайным образом и с одинаковой вероятностью. Составим матрицу игры. Выигрыш А в данном случае — вероят- ность поражения объекта, иначе — вероятность того, что к объекту прорвется хотя бы один самолет. Рассмотрим выигрыши для всех комбинаций стратегий. 1. AiB} — самолеты летят по разным направлениям, орудия рас- ставлены по одному (1 + 1 + 1). Выигрыш Оц - вероятность того, что хотя бы один самолет прорвется к объекту — в данном случае ра- вен нулю: йп = 0. 2. А2Вг — самолеты летят по одному и тому же направлению, ору- дия расставлены по одному (1 + 1 + 1). Очевидно, при этом один из самолетов, не будучи обстрелянным, наверняка прорвется к объек- ту: = 1. 3. Д1В2 — самолеты летят по одному; противник ставит два ору- дия на одно направление, одно — на другое и оставляет незащищен- ным третье (2 + 1 +0). Для того чтобы прорваться к объекту, хотя бы один из самолетов должен выбрать незащищенное направление. Ве- роятность этого события найдем через вероятность противоположного события: «оба самолета выберут защищенное направление». Вероят- 474
ность этого события равна 2/3 • У2 = 1/3, откуда вероятность интере сующего нас события: щ2 = 1 — V8 = 2/3. 4. А2В2 — самолеты летят вместе; орудия поставлены по схеме (14-2 + 0). Снова найдем вероятность того, что оба самолета будут поражены. Для этого они должны выбрать направление, защищенное двумя орудиями; вероятность этого 1/3, вероятность противоположного события: а22 = 1 — ’73 = 2/3. 5. АаВ3 — самолеты летят порознь, орудия поставлены все три на одно направление (3 + 0 + 0). Очевидно, в этом случае оба самоле- та сбиты не могут быть, и п13 = 1. 6. Д2В3 — самолеты летят вместе, орудия поставлены все три на одно направление (3 + 0 + 0). Для того чтобы оба самолета были поражены, они должны выбрать то направление, на котором стоят все три орудия. Вероятность этого 1/3. Вероятность того, что хотя бы один самолет прорвется к объекту, будет а23 — 2/3. Составляем матрицу игры: В/ Л В. в, В, + 0 2/3 1 0 а2 1 2/3 2/3 2/3 Р/ 1 2/3 1 Из матрицы видно, что нижняя цена игры равна верхней: а = £ = v = 2/3; значит, игра имеет седловую точку и решается в чис- тых стратегиях: сторона А (самолеты) должна всегда пользоваться стратегией Д2 (лететь вместе), а сторона В должна всегда расставлять орудия по схеме (1 + 2 + 0), т. е. ставить два орудия на одно какое- то направление, одно орудие — на другое, и одно направление остав- лять вообще незащищенным. На рис. 9.13 дана геометрическая интерпретация игры. Пример 2'(вариант той же игры). Условия те же, но для стороны А возможны не три, а четыре направления подхода к объекту, а сто- рона В располагает четырьмя орудиями. Решение. У нас по-прежнему две возможные стратегии: Ах — посылать самолеты порознь, А 2 — посылать самолеты вместе. У противника пять возможных стратегий: Вх (1 + 1 + 1 + 1) — ставить по одному орудию на каждое направление; В2 (2+1 +1 +0) — ставить два орудия на одно направление, по одному — на два других и одно оставить незащищенным; В3 (2+2 + 0 + 0) — ставить по два орудия на два направления, а два оставить незащищенными; В4 (3+1 +0 + 0) — ставить три орудия на одно направление, одно — на другое, и два оставить незащищенными; 473
Д (4 + 0 + 0 4- 0) —ставить все четыре орудия на одно направ- ление, а остальные три оставить незащищенными. Стратегии В4 и В5 можно заранее отбросить как заведомо невыгод- ные. Действительно, если по одному направлению летят не более чем два самолета и каждый из них поражается с вероятностью единица одним орудием — ставить на одно направление более двух орудий из- лишне. Рассуждая, как в предыдущем примере, построим матрицу игры. В1 Ai в, Bs В, Ai 0 1/2 5/6 ! 1/2 Д2 1 3/4 1/2 1/2 (V 1 3/4 5/6 Рис. 9.13 Рис. 9.14 Эта игра 2x3 не имеет седловой точки (а = V2, р == 3/4). Ищем решение в смешанных стратегиях. Выделяем активные стратегии про- тивника: это Bi и В3 (рис. 9.14). После этого игра сводится к игре 2x2: Решая эту игру, находим оптимальные стратегии сторон: Р1=3/8; р2=5/8; v = 5/8; (?1=1/4, </3=3/4; 5л* = (3/8, 5/g); SB* = е/4> 0, 3/4). 476
Таким образом, можно сформулировать следующие рекомендации сторонам Лий: сторона А должна с вероятностью % посылать самолеты порознь, а с вероятностью 5/8 — вместе; сторона В должна с вероятностью применять расстановку орудий (1 + 1+14-1), а с вероятностью 3/4 — расстановку (2 + 2 + 0 + 0). При этом вы- игрыш — вероятность поражения объекта — равен v = %, "что боль- ше нижней цены игры и меньше верхней. Пример 3. Игра «распределение сил в наступлении и обороне». Сторона А, располагающая тремя батальонами пехоты, стремится захватить некоторый объект В; сторона В, располагающая четырьмя батальонами пехоты, стремится воспрепятствовать этому. Каждый из наступающих батальонов может быть направлен к объекту по любой Рис. 9.15 из двух дорог: I и II (рис. 9.15). Сторона В также может расположить любой из своих батальонов на любой из дорог. Если на дороге силы сто- роны В встречаются с превосходящими силами стороны А, последние оттесняют оборону, проходят к объекту и занимают его; если’же на дороге оборона численно превышает нападение, атака отбивается, си- лы стороны А отходят и больше не возобновляют нападение. Если на дороге встречаются силы одинаковой численности, сторона А с ве- роятностью 0,4 побеждает и проходит к объекту, а с вероятностью 0,6 атака оказывается отбитой. Требуется дать рекомендации сторонам по количеству баталь- онов, которое следует направить на каждую из дорог. Решение. Выигрыш А в данном случае — вероятность занятия объекта. Рассмотрим следующие стратегии нападения (Д): Дг(2 + 1) — направить два батальона по одной из дорог (любой) и один — по другой; Д2(3 + 0) — направить все три батальона по одной из дорог (лю- бой). Стратегии обороны (В) будут: Bi (2 + 2) — направить по два батальона на каждую из дорог; Вг (3 + 1) — направить три батальона на одну из дорог (любую), а один — на другую; В3 (4 + 0) — направить все четыре батальона на одну из дорог (любую , а другую дорогу оставить незащищенной. Составим матрицу игры. Найдем выигрыш для всех комбинаций стратегий. 471
1. Д1В1- На одной дороге встречаются один батальон нападения с двумя батальонами обороны; атака на этой дороге отбивается. На дру- гой дороге встречаются два батальона нападения с двумя обороны; со- гласно условию нападение побеждает с вероятностью 0,4: аи = 0,4. 2. Д2^1- При этом на одной из дорог с полной достоверностью бу- дет перевес сил нападения, и а21 = 1. 3. AiBs- Так как выбор любой дороги для каждой стороны равно- вероятен, то с вероятностью 1/2, на одной дороге встретятся два ба- тальона А с тремя В, на другой — один батальон А с одним В; на пер- вой дороге атака будет отбита, на другой — произойдет занятие объек- та с вероятностью 0,4. С той же вероятностью 1/2 встретятся на одной дороге один батальон А с тремя В, на другой—два батальона А с одним В, и объект будет занят с полной достоверностью. Применяя формулу полной вероятности, находим: а12 = 1/2 • 0,4 + 1/2 • 1 = 0,7. 4. А2В2. С вероятностью 1/2 на одной дороге встретятся три ба- тальона А с тремя В, на другой — столкновения не будет; в этом слу- чае вероятность занятия объекта 0,4. С той же вероятностью 1/2 три батальона А встретятся только с одним батальоном В, пройдут и зай- мут объект. По формуле полной вероятности: а22 = 1/2 • 0,4 + 1/2 • 1 = 0,7. 5. Так как силы А идут по двум дорогам, а силы В располо- жены только на одной из дорог, сторона А с достоверностью займет объект: а13 = 1. 6. Д2В8.С вероятностью 1/2 силы А пойдут по той дороге, где нет обороны, и займут объект; с вероятностью 1/2 они будут отбиты пре- восходящими силами обороны; отсюда а28 = 1/2.14-1/2-0 = 0,5. Матрица игры 2x3 имеет вид: Ai Bi (2+2) В2 (3+ 1) в. (4 + 0) Ai (24-1) о,4 0,7 1 ^2 (3 + 0) 1 0,7 0,5 Нижняя цена игры а = 0,5, верхняя цена игры Р = 0,7; игра не Имеет седловой точки. Ищем решение в смешанных стратегиях. Гео- метрическая интерпретация игры дана на рис. 9.16. Нижняя граница выигрыша достигает максимума в точках N' и N" на всем участке меж- ду ними; этот максимум есть цена игры v = 0,7. В данном случае ре- шение игры получилось неоднозначным: сторона А может применить любую из своих смешанных стратегий, соответствующих точкам оси 478
абсцисс от К' но К”- Таким образом, у стороны А существует несчет- ное множество оптимальных стратегий. Найдем абсциссы точек N' и N". Они будут равны соответственно р2 и р2” — границам, в которых заключена вероятность стратегии А2 в оптимальной смешанной стра- тегии игрока А. Из чертежа имеем: 0,7—0,4 _ 1—0,7 Р/ 1—Рг' откуда р2 — 0,5. Аналогично получаем 1—0,7 _ 0,7—0,5 Рг" “ 1-р," ’ откуда р2" = 0,6. Итак, в качестве оптимальной смешанной стратегии сторона А может применять любую <5м*(р1, Рг)> в лежат: первая — между 0,4 и 0,5; вто- рая соответственно между 0,6 и 0,5. Разумеется, крайние значения Pj и р2 тоже дают оптимальные стратегии игрока А: Sz*==(0,5, 0,5), SS = (0,4, 0,6). Таким образом, оптимальная стра- тегия игрока А найдена: она состоит в том, чтобы с вероятностью, принимаю- щей любое значение между 0,4 и 0,5, на- правлять два батальона по одной из до- рог (любой), а оставшийся батальон — по другой дороге; во всех же остальных случаях посылать все три батальона по одной из дорог (любой). которой вероятности р± и р2 Что касается оптимальной стратегии противника (В), то, как вид- но из рис. 9.16, она сводится к применению одной единственной чистой стратегии, а именно й2: SB*=(0, 1,0), т. е. обороняющийся всегда должен выставлять три батальона на одну дорогу (любую), а один батальон — на другую дорогу. Цена игры, т. е. устойчивый выигрыш стороны А при этом будет равен верхней цене игры 0,7*) *) Из рис 9.16 можно сделать заключение, что активными стратегиями стороны В, кроме В2, являются еще и В] и В3 (так как соответствующие линии стра- тегий пересекаются в точках N' и У"). Однако нетрудно убедиться, что так как линия В2В2 параллельна оси абсцисс, фактическая доля стратегий Bj и В3 в оп- тимальной смешанной стратегии обороны должна быть равна нулю. 479
9 РЕШЕНИЕ ИГР mXn До сих пор мы рассматривали только элементарные игры 2 X п и т X 2, для.которых существует простая геометрическая интерпре- тация, позволяющая решать эти игры с помощью простейших приемов. В случае игр 3 X п (или tn X 3) подобная геометрическая интер- претация также может быть построена, но вместо плоской она стано- вится пространственной и гораздо менее наглядной. В случае же игры т X п, где т > 3, п > 3, от геометрической интерпретации прихо- дится отказаться и в силу вступают чисто расчетные методы решения игр. В общем случае, при больших т и п, решение игры т X п пред- ставляет собой довольно трудоемкую задачу, но принципиальных трудностей оно не содержит. Легко показать, что решение любой ко- нечной игры т X п может быть сведено к уже известной нам зада- че линейного программирования (гл. 2). Действительно, рассмотрим игру т X п ст стратегиями Alt А2, .... Ат игрока Ann стратегиями Въ В2.. Вп игрока В. Задана матрица игры (at}). Требуется найти решение игры, т. е. две оптимальные смешанные стратегии игроков А и В: Sa* = (Pi, Рг, .... Рт); 5в*=(<71, р2, ..., рп), где Р1, Рг, ••;Рт, P1I Р2>”Ч<?П (Р1 + Рг4" ••• + Рт ~ 4- ••• = 1) — вероятности применения чистых стратегий (некоторые из них, соответствующие неактивным стратегиям, могут быть равными нулю). Найдем сначала оптимальную стратегию Зд*. Эта стратегия долж- на обеспечить нам выигрыш, не меньший v, при любом поведении про- тивника, и выигрыш, равный v, при его оптимальном поведении (т. е. при стратегии Зв*). Цена игры v нам пока неизвестна. Не нарушая общности, можно предположить ее равной некоторому положительному числу v > 0. Действительно, для того чтобы выполнялось условие v > 0, достаточ- но, чтобы все элементы матрицы (ati) были неотрицательными. Этого всегда можно добиться, прибавляя ко всем элементам матрицы (atj) одну и ту же достаточно большую положительную величину М; при этом цена игры увеличится на М, а решение не изменится. Итак, будем считать v > 0. Предположим, что мы (Л) применяем свою оптимальную страте- гию Зд*, а противник (В) свою чистую стратегию Bj. Тогда наш сред- ний выигрыш будет равен: «;=Piav + p2a2>+ ... + pmamJ(j = l, ..., п). Наша оптимальная стратегия Зд* обладает тем свойством, что при любом поведении противника обеспечивает нам выигрыш, не мень- 480 ший, чем цена игры v; значит, любое из чисел а; не можетбыть мень- ше v. Получаем ряд условий: Р1 Щ1+р2 «21 4~ Р1 «12 4" Рг «22 4“ • •• 4- Pm^ml^"^’ ... +Ртатг>У, (9.1) Р1 «1 п 4“ Рг «2п 4“ ••• 4~ Рт^тп ' Разделим неравенства (9.1) на положительную величин) v и вве- дем обозначения: Х1=^, х2=^, ..., хп = ^. (9.2) Тогда условия (9.1) запишутся в виде: а11 Х1 4- а21 х2 + ••• 4“ «ml хт5^ 1» 1 «12 Х1 4“ а22 х2 4- ... 4" ат2 хт~^ Ь I (9.3) а1п Х1 4~«2п Х2 4~ ••• 4~ «mnX-m 2^ I > где Xj, х2, ..., хт — неотрицательные переменные. В силу (9.2) и того, что Р1 + р2+ ... 4-Рт=)> переменные xlt х2, ..., хт удовлет- воряют условию Xi 4- хг 4* 4~ хт= • (9-4) V Мы хотим сделать свой гарантированный выигрыш макси- мально возможным; очевидно, при этом правая часть (9.4) принимает минимальное значение. Таким образом, задача решения игры свелась к следующей математической задаче. Определить неотрицательные значения переменных хь х2, ..., хт так, чтобы они удовлетворяли линейным ограничениям (9,3) и при этом их линейная функция L = xi 4- х2 4- ... 4- хт (9-5) обращалась в минимум. Перед нами — типичная задача линейного програм- мирования. Таким образом, решая задачу линейного программирования, мы можем найти оптимальную стратегию Зд* игрока А. Найдем теперь оптимальную стратегию SB* игрока В. Все будет аналогично решению игры для игрока А, с той разницей, что игрок В стремится не максимизировать, а минимизировать выигрыш, а зна- чит, не минимизировать, а максимизировать величину 1/v. Вместо усло- вий (9.3) должны будут соблюдаться условия: аи У14- ai2 У г 4~ «21 У1 4~«22 У2 4- • •• 4~ ain Уп 1 > ... + «2п уп 1, (9-6) ani У1 4'ап2 Уг 4- ••• 4~апп#п^=1> ) 16 Зак. Б73 481
гд.е уи yv ..., yn—неотрицательные переменные, равные й=<?1Д !/2=Q2/v> •••> yn=qn^- Требуется так выбрать переменные уъ у2, .... уп, чтобы они удов- летворяли условиям (9.6) и обращали в максимум линейную функцию L = У1••• -\-Уп~~ (9.7) V Вместо того чтобы максимизировать функцию (9.7), можно, как мы знаем, минимизировать функцию L'= —L= —z/i —... — уп = — —. (9.8) V Таким образом, мы свели задачу решения любой конечной игры тх« к паре задач линейного программирования; методы решения та- ких задач нам уже хорошо известны (см. гл. 2). Попутно заметим, что из сведения задачи решения игры к задаче линейного программирования вытекают соображения по поводу су- ществования решения игры тхп. Действительно, пусть задача о нахождении оптимальной страте- гии Sa* = (pi, р2, ..., рт) игрока А сведена к задаче линейного про- граммирования с условиями-неравенствами (9.3) и минимизируемой функцией (9.5). Всегда ли существует ее решение? Мы знаем (см. гл. 2), что решение задачи линейного программирования может и не сущест- вовать; оно отсутствует, если: 1) условия (равенства или неравенства) вообще не имеют допу- стимых неотрицательных решений; 2) допустимые решения существуют, но среди них нет оптималь- ного, так как минимизируемая функция не ограничена снизу. Посмотрим, как обстоит дело в нашем случае. Нетрудно убедить- ся, что допустимое решение ЗЛП в нашем случае всегда существует. Действительно, сделаем элементы матрицы (а;;-) строго положитель- ными (для этого достаточно прибавить к каждому из них достаточно большое число М) и обозначим наименьший элемент матрицы (ао-) че- рез р: р. = min minaj. i / Положим теперь лу = 1/р, х2 = х3 = ... = хт = 0. Нетрудно видеть, что эта система значений переменных хъ х2. хт представ- ляет собой допустимое решение ЗЛП — все они неотрицательны, и их совокупность удовлетворяет условиям (9.3). Теперь убедимся, что линейная функция (9.5) не может быть не ограничена снизу. Действительно, все xlt х2, .... хт неотрицательны, а коэффициенты при них в выражении (9.5) положительны, значит, функция L в формуле (9.5) тоже неотрицательна, значит, она ограни- чена снизу (нулем) и решение задачи линейного программирования (а следовательно, и игры т X п) существует. 482
Пример 1. Найти методом линейного программирования решение игры «три пальца» из примера 2 § 4 Решение. Матрица игры имеет вид: /1, в. В, ь а. 2 —3 4 А? —3 4 -5 А, 4 -5 6 (9.9) Прибавляя ко всем элементам матрицы одно и то же число М = 5, сделаем их неотрицательными: *1 7 Bi to В Ai 7 2 9 А2 Q 9 0 л. 9 0 11 (9.10) При этом цена игры увеличится на 5, а решение не изменится. Обозначим новую цену игры v = v + 5. Найдем оптимальную смешанную стратегию ~ (Рь Рг> Рз) игрока А. Условия (9.3) примут вид: 9х3> 1, 2xj + 9х2 > 1, 9xj -|" 11*з 1 • • Минимизируемая линейная функция £ = х1+х24-х3. Перейдем от условий-неравенств (9.11) к условиям-равенствам: У1 = — 1— (—7X1 — 2*2— 9х3), Уг—~ 1 — (— 2xj—9х2), Рз= —1—( —9X1 —11х3). (9.Н) (9.12) Заполним симплекс-таблицу (табл. 9.1). Так как свободные члены отри- Таблица 9.1 Свободный член Г1 Х2 х3 У1 -1 -7 -2 -9 Уг -1 -2 -9 О Уз -1 -9 О -11 16* 483
Таблица 9.2 Уз~*~^ Свободный член X X 2 X 3 Ух -1 9 11 -7 81 И -2 О -9 _ 9 11 Уг -1 О -2 О -9 О О О Уз -1 1 11 -9 9 11 О О М1 11 Таблица 9.3 Свободный член X Л 2 Уз У1 2 11 2 9 4 11 4 9 -2 _ 2 9 __9 11 о Уг -1 2 9 -2 2 9 Й _1_ ~9 О о х3 _1_ 11 О 9 11 О О О __1_ 11 о Таблица 9. ч Свободный член Л?! Уг Уз У1 4 §9 80 99 _2 9 _9. 11 ^2 1 9 2 9 __1_ 9 0 т3. . 1 11 9 11 0 11 484
цательны, то, полагая хг = х2 = х3 = 0, мы не получим опорного решения. Применяя аппарат симплекс-метода (см гл. 2, § 7), находим опорное решение (дабл 9.2, 9.3, 9.4) Табл 9.4 дает опорное решение ОЗЛП: Х1 ~ Уг = Уз ~ 0; J/i==4/99> хг = 1!г< х3 = 1/ц. Надо проверить, является ли оно оптимальным, т. е. обращает ли в мини- мум выражение (9.12) Пользуясь табл. 9.4, выразим L через новые свободные переменные хг, у2, у3: Ь — х1-\-х2~\~*3==*1 + (1/9 2/зх1 *Т1/9</2) + (1/11— 9111х1 ~ — 2%9 — (4/ээХ1 — 1/зУз — 1/п Уз) Таблица 9.5 Свободный член X 1 у2 Уз L 20 99 -1 5*99 4 99 !_ 20 _1 9 1 90 1 11 9 220 У1 4 99 1 20 /80'' \99, 99 80 _2 9 _ 11 40 9 11 80 х2 1 9 1_ 90 2 9 -1L 40 __1_ 9 11 180 0 9 40 X. □ _1_ 11 9 220 9^ 11 80 0 9 40 11 729 880 и запишем свободный член и коэффициенты при хъ у2, у3 в верхней строке табл. 9.5. Из того, что коэффициент при положителен, видно, что увеличение Xi уменьшает L, т. е. минимум еще не достигнут. Производим замену ху у^ (табл. 9.5, 9.6). Таблица 9.6 Свободный член У> у2 Уз L 1 5 20 - __L ю _1_ 20 X, 1 20 99 80 11 40 _81_ 80 х2 1, 10 _ П_ 40 _ 1 20 9 40 х3 1 20 _8| 80 9 40 59 80 16В Зак. 57 3 485
Из табл. 9.6 видно, что функция li принимает минимальное значе- ние Lmin = 1/5 при z/j = у2= = О, *1 = 1/го> *2 = 171о> Хз = 1/2в. Отсюда v' = 1/Lmin=5, т. е. цена игры с матрицей (9.10) v'=5. Следовательно, цена исходной игры с матрицей (9.9): v = v'—5 = 0. Это значение выигрыша достигается при Xl = 1/20, *2 = 1/10, Хз = 1/20, т. е. для вероятностей стратегий Pi—Xiv' = 1/<; ps = xa v' = l/2; P3=*8v'=1/4. Таким образом, найдено решение игры —оптимальная стратегия игрока А I S/ = (l/4, Чь, Vi) и цена игры v = 0. Оптимальная стратегия игрока В может быть найдена точно таким же спо- собом, если составить условия, аналогичные (9.7), но не по столбцам, а по стро- кам, заменив в них знаки > на <, а величину L обращать не в минимум, а в максимум Однако в данном случае в этом надобности нет: из симметрии строк и столбцов матрицы ясно, что оптимальная стратегия игрока В должна быть та- кой же, как и оптимальная стратегия игрока А: ‘/a. Vi). Таким образом, в игре «три пальца» оптимальная стратегия каждого из игроков состоит в том, чтобы с вероятностью 1/4 показывать один палец, с ве- роятностью 1/2 — два пальца и с вероятностью 1/4 — три пальца При этом средний выигрыш каждого игрока будет равен нулю (v = 0) В этом примере все три стратегии каждого игрока были активны- ми. Такая игра, в которой все стратегии активны, называется пол- ностью усредненной. В следующем примере мы рассмотрим пример не полностью усредненной игры. Пример 2. Игра «вооружение — помехи-». Сторона А располагает тремя видами вооружения 41( Л2, А3, а сторона В — тремя видами помех Bv, Вг, В3 Вероятность решения боевой задачи стороной А прн различных видах вооружения и помех задана матрицей: Bi . в> в, <41 0,8 0,2 0,4 0,4 0,5 0,6 А:, 0,1 0,7 0,3 486
Сторона А стремится решить боевую задачу, сторона В — воспрепятство- вать этому Найти оптимальные стратегии сторон. Решение. Избавляясь от дробей, перепишем матрицу в виде: В2 В. л. 8 2 4 Д2 4 5 6 А„ 1 7 3 и обозначим цену новой игры с такой матрицей v'= 10v. Запишем условия (9.3): 4~ 4хг 4- ха > 1, 2X1 ”1” 8Хд 4* 7х3 1 , 4xi4-6x24-3x3> 1, откуда (переходя к условиям-равенствам) У1 = — 1—(—8xj— 4xs — х3), (/2== — 1—(—2xj—5х2—7х3), 1,’з = — 1 — (—4Х! —6х2 —Зх3). (9.13) Требуется найти неотрицательные значения хх, х2, х3, ylt yit у3, удовлет- воряющие условиям (9.13) и обращающие в минимум линейную функцию: L = 1/v — Х!4-х24-х3. Решаем задачу симплекс-методом (опуская подробности, приведем сразу оптимальное решение, табл 9.7). Таблииа 9 7 Свободный член У) Хз у2 L 7 32 _ з. 32 __1_ 32 _2 8 X, 1 32 32 23 32 2 8 Уз 2 4 4 17 4 -1 т2 3 16 J_ 16 27 16 _2 4 Из табл 9 7 видно, что минимум L достигнут и равен Лт1п = 7/32. Это зна- чение достигается при (/1 = Х3= (/2 = 0; Х1 = 1/32. Уэ = 1/4> х2 = 3/10- 16 В* 487
Отсюда находйм вероятности plt р%, р3, с которыми игрок А должен применять свои стратегии А3, А2, А 3: P1=x1V', p2 = x2v’, p3 = x3v’ и цену игры: v' = 1/4nin- В данном случае v' = 32/,; р^1/^-32/,»1/,; P2 = 3/io-32/7 = 77: рз=0-32/7-0. Таким образом, оптимальная стратегия игрока А найдена: ’/7. 0), т. е., мы должны пользоваться с вероятностью 1/7 первым видом вооружения, с вероятностью 6/7 — вторым, а третий вид вооружения не применять вовсе. При этом вероятность выполнения боевой задачи будет максимальна: v = v'/jo = 32/70 «0,457. Теперь найдем оптимальную стратегию Sв* противника. В общем случае для этого надо поступать так, как сказано выше: решать задачу для противника так, как мы ее решали для себя, с заменой столбцов матрицы на строки, знаков > на < и минимума на максимум Однако в данном случае в этом надобности нет: нам помогает то обстоятельство, что нам уже известны активные стратегии игрока А, и их только две: Аг и Д2. Игра, таким образом, обратилась в игру 2X3, кото- рую можно решить элементарно. Опуская подробности, приведем только реше- ние: SB* = (7„ 4/„ 0), т. е. оптимальная стратегия противника состоит в том, чтобы с вероятностью 3/7 пользоваться помехами Вг, с вероятностью 4/7 — помехами В2, а третий вид по- мех (В3) не применять вовсе В заключение заметим, что продемонстрированный в данном пара- графе общий метод решения игр т X п — сведение к задаче линейно- го программирования — не всегда оказывается самым простым. Часто игру — особенно с небольшими т и п — удается решить проще, если заранее угадать, какие стратегии являются активными. Например, если матрица игры — квадратная (т = п), то можно попробовать — не является ли игра полностью усредненной? В этом случае все стра- тегии обеих сторон являются активными, а неравенства (9.3) обра- щаются в равенства. Если, решив эту систему уравнений, мы получим положительные значения xlt х2......... то, складывая их, найдем ве- личину 1/v: Х1 + х2+ ... •4-xra=l/v, откуда цена игры: v=----------*-------, Х1А~Х3+ ... + хт а вероятности pt, р2, ..., рт в оптимальной стратегии Sa* найдутся как Р1 = Х1У, p2=x2v..pm = xmv. 488
10. РЕШЕНИЕ КОНЕЧНЫХ ИГР МЕТОДОМ ИТЕРАЦИЙ В практических задачах часто нет необходимости находить точ- ное решение игры; достаточно бывает найти приближенное решение, обеспечивающее средний выигрыш, близкий к цене игры. Ориентировочно цену игры v можно определить непосредственно из матрицы, зная нижнюю цену игры а и верхнюю р. Если аир близ- ки, то практически нет надобности заниматься поисками точного реше- ния, а достаточно будет в качестве оптимальных взять чистые мини- максные стратегии. В тех же случаях, когда а и Р не близки, прибли- женное решение игры можно получить, пользуясь методом ите- раций. Идея этого метода сводится к следующему. Разыгрывается «мыс- ленный эксперимент», в котором стороны А и В применяют друг про- тив друга свои стратегии. Эксперимент состоит из последовательнос- ти отдельных «партий» данной игры. Начинается он с того, что один из игроков (скажем А или «мы» ) выбирает произвольно одну из своих стратегий, например А(. Противник (В) на это отвечает той из своих стратегий В}, которая наименее выгодна для нас, т. е. обращает выи- грыш при стратегии At в минимум. На этот ход мы отвечаем той своей стратегией Ah, которая дает максимальный выигрыш при стратегии противника Bj. Далее — снова очередь противника. Он отвечает на нашу пару ходов Дг и Ak топ своей стратегией В„ которая дает наи- меньший средний выигрыш на одну партию при этих двух стратегиях, и т. д. На каждом шаге итерационного процесса каждый игрок отвечает на очередной ход другого той своей стратегией, которая является оп- тимальной относительно всех предыдущих ходов противника, рас- сматриваемых как некая «смешанная стратегия», в которую чистые стратегии входят в пропорциях, определяемых частотой их примене- ния. Такой метод постррения оптимальных стратегий представляет со- бой некоторую модель практического «взаимного обучения» игроков, когда каждый из них на опыте «прощупывает» способ поведения про- тивника и старается отвечать на него нанлучшим для себя образом. Можно доказать, что процесс итерации сходится; если такую че- редующуюся последовательность партий продолжать достаточно дол- го, то средний выигрыш, приходящийся на одну партию, будет стре- миться к цене игры v, а частоты Рх*, Р2*, .... Рт*', Qi*> <2г*, •••> Qn*. с которыми применялись стратегии Alf А2, ..., Ат; Вь В2, ..., Вп в этом «розыгрыше», будут приближаться к вероятностям ри р2...рт; qit q2,...,qn в оптимальных смешанных стратегиях: 5д* = (р1, р2.рт)', Sb* = (ft, q^ •••> <7n)- Расчеты показывают, что сходимость метода — очень медленная, однако для быстродействующих ЭЦВМ это не является серьезным препятствием. Преимущество метода итераций состоит в том, что его сложность сравнительно мало возрастает с увеличением размера таб- лицы тхл, тогда как сложность решения задачи линейного програм- мирования резко растет при увеличении тип. 489
Продемонстрируем применение итерационного метода на примере игры «три пальца», решенной нами точно в предыдущем параграфе. Тот факт, что мы знаем решение игры и ее цену (v = 5), поможет нам оценить точность метода итераций. Пример. Решить методом итераций игру с матрицей Bi в, В, Л. 7 2 9 Л2 2 9 0 ла 9 0 11 Решение. В табл. 10.1 приведены первые 30 шагов процесса ите- раций. В первом столбце дан номер партии (пары выборов) k, во втором— номер i выбранной в данной партии стратегии игрока А. В последую- щих трех столбцах — «накопленный выигрыш» за первые k партий при тех стратегиях, которые применяли оба игрока в предыдущих партиях, при стратегии At игрока А в данной партии и при страте- гиях Въ В2, Ва игрока В в данной партии. Из этих накопленных выи- грышей подчеркнут минимальный (если таких минимальных выигры- шей несколько, то подчеркиваются они все). Подчеркнутое число опре- деляет собой наивыгоднейшую стратегию игрока В в данной партии — она соответствует номеру той стратегии Bj, для которой достигается минимум накопленного выигрыша (если таких минимумов несколько, берется любой из них, например, случайным розыгрышем). Таким об- разом проставляется в следующем столбце номер оптимальной ответ- ной стратегии противника /. В последующих трех столбцах приводится накопленный выигрыш за k партий соответственно при стратегиях А1г А2, А3 игрока А. Из этих значений надчеркнуто максимальное; оно определяет собой выбор стратегии игрока А в следующей партии (сле- дующей строке таблицы). В дальнейших столбцах табл. 10.1 поме- щаются такие данные: v—минимальный накопленный выигрыш, деленный на число - партий k; v — максимальный накопленный выигрыш, деленный на число партий k-, v-Ь v v* = =—----их среднее арифметическое (помещено в таблице между 2 v и V). Величина v* может служить (лучше чем v и 7) приближенным значением цены игры. Подсчитывая число случаев применения игроком каждой страте- гии и деля его на число партий k, получим приближенные значения 490
Таблица 10.1 - 4 l В В, В 1 -41 4, <4з _у V* V 1 3 9 0 11 2 2 “9 0 0 4.5 9 2 2 11 '9 11 2 4 ""18 0 4,5 6,75 9 3 2 13 18 11 3 13 18 11 3,67 i,84 6 1 2 15 27 11 3 22 18 “22 2,75 4,13 5,50 5 1 22 29 20 3 31 18 ~33 4,00 5,30 6,60 0 1 31 29 31 2 33 27 “33 4,84 5,17 5,50 7 1 38 31 40 2 35 "36 33 4,43 4,79 5,14 s 2 40 40 40 2 37 “45 33 5,00 5,30 5,61 9 2 42 49 40 3 46 45 44 4,45 4,78 5,11 10 1 49 51 49 1 53 47 “53 4,90 5,10 5,30 11 3 58 51 60 2 55 "56 53 4,64 4,87 5,09 12 2 60 60 60 2 57 "65 53 5,00 5,20 5,41 13 2 62 69 60 3 66 65 64 4,61 4,84 5,07 14 I 69 71 69 1 73 67 "Тз 4,93 5,07 5,21 15 3 78 71 80 2 75 "76 73 4,74 4,90 5,06 16 2 80 80 80 2 ‘ 77 "85 73 5,00 5,16 5,31 17 2 82 89 80 3 86 85 84 4,71 4,89 5,07 1? 1 89 91 89 1 93 87 “93 4,95 5,06 5,17 19 3 98 91 100 2 95 “96 93 4,79 4,93 5,06 20 2 100 100 100 2 97 105 93 5,00 5,15 5,31 21 2 102 109 100 3 106 105 104 4,76 4,90 5,04 22 1 109 111 109 1 113 107 нз 4,97 5,05 5,14 23 3 118 111 120 2 115 ТТб 113 4,83 4,94 5,04 24 2 120 120 120 2 117 125 113 5,00 5,10 5,20 25 2 122 129 120 3 126 125 124 4,80 4,92 5,04 26 1 129 131 129 1 133 127 Тзз 4,96 5,04 5,11 27 3 133 131 140 2 135 136 133 4,86 4,95 5,04 28 2 140 140 140 2 137 145 133 5,00 5,10 5,09 29 2 142 149 140 3 146 145 144 4,84 4,94 5,04 10 1 149 151 149 1 153 147 153 4,97 5,04 5,10
вероятностей, с которыми применяются стратегии в оптимальной смеси SZ = (pi, р2, РзУ, sb* = (?i, р2, р3). Как видно из табл. 10.1, величина v* незначительно колеблется около цены игры v = 5 (цена исходной игры была 0, мы прибавили ко всем элементам матрицы по 5). Подсчитывая по табл. 10.1 частоты применения стратегий А1Г А2, А3 в первых 30 партиях, получим: рг=8/зо« о,267; Р2* = 18/30 = 0,5; Р3* =’/30 «0,233. Они оказались довольно близкими к известным нам из решения игр ы вероятностям: P1_i/4 = 0,25; р2 = 1/2=0,5; Рз =1/4 = 0,25*>. Аналогично для игрока В находим частоты стратегий Въ В2, В3 в первых 30 партиях: Qi^e/3O = 0)2; Q2*=18/3O = 0,5; Q3* = 9/30 = 0,3. Это уже сильнее отличается от решения игры, согласно которому: <71 = 0,25; ^2 = 0,5; <?3=0,25. Но для нас ведь важны не точные значения вероятностей q1t q2,_qs, а выигрыш, который нам обеспечивается применением смешанных стра- тегий. Если противник будет пользоваться смешанной стратегией Ss* =(0,2; 0,5; 0,3), то наш выигрыш (его проигрыш) будет не больше 5,10 (последняя стро- ка в табл. 10.1), что лишь немного отличается от цены игры 5,0. За- метим, что, ставя практическую игровую задачу, мы обычно делаем упрощения и допущения, которые делают излишней погоню за большой точностью решения, так что ориентировочное решение игры, получае- мое методом итераций (даже при небольшом числе «партий»), часто мо- жет оказаться достаточным. Сделаем по поводу табл. 10.1 еще одно замечание. В ней встречают- ся строки (например, восьмая, двенадцатая, двадцатая и т. д.), где все три значения выигрышей подчеркнуты; это означает, что достиг- нуто «положение равновесия», при котором любое поведение противника дает нам один и тот же выигрыш, а именно, цену игры V. Обратим внимание на то, что для этих строк действительно величина v достигает точно значения v. По таким признакам можно находить приближенное значение цены игры: если в каких-то последо- вательных столбцах при всех стратегиях противной стороны обеспе- чивается приблизительно один и тот же выигрыш, это означает, что он может быть принят за приближенное значение цены игры. Знание приближенного значения цены игры важно для того, чтобы во время остановить процесс итераций. *) Точное совпадение Р2* = р2 — 0,5 является, конечно, случайным. 4??
Как же найти практически оптимальные стратегии после того, как процесс итераций прекращен? Вернемся к табл. 10.1 и рассмотрим в ней столбец V. Найдем в этом столбце максимальный элемент. В нашем слу- чае это оказался vmax = 5 (случайно равный цене игры, но, приступая к итерациям, мы ведь ее не знаем!). Из этого мы заключаем, что, при- меняя смешанную стратегию, соответствующую этой строке, мы обес- печиваем себе выигрыш, не меньший 5. Подсчитаем частоты стратегий для 20-й строки. Стратегия применялась нами 5 раз из 20, стратегия А з — тоже 5 раз, стратегия Л2 — Ю Раз> откуда берем вероятности стратегий: Р1=0,25, р.2 = 0,5, р3 = 0,25, что, как и следовало ожидать, совпадает (в данном случае точно, а не приближенно) с оптимальной стратегией игрока А в решении игры. Сделаем то же для игрока В. Рассмотрим столбец v и найдем в нем ми- нимальное число vmln. Это будет 5,04, достигаемое, например, в 29-й строке. Это значит, что если игрок В будет применять смешанную стратегию, соответствующую всему «прошлому» для этой строки: = 5/29 = 0,172; q2 = 15/29 = 0,517; q3 = 9/29 = 0,311, то он мо- жет гарантировать, что проиграет не больше чем 5,04. Это—лучше, чем значение 5,10, достигаемое v в самой последней строке. Таким образом, даже при небольшом числе итераций (k = 30) цена игры и решение находятся с удовлетворительной точностью. 11. ФИЗИЧЕСКАЯ СМЕСЬ СТРАТЕГИЙ Решая задачи теории игр, мы неоднократно приходили к выводам, рекомендующим игрокам применять не чистые, а смешанные страте- гии. Рассмотрим вопрос о фактическом осуществлении смешанных стра- тегий на практике. Основная область, где применяется теория игр — конфликтные ситуации, связанные с боевыми действиями, где обдуманное противо- действие разумного противника не подлежит сомнению и всегда долж- но включаться в модель операции. Задачи исследования операций, связанные с боевыми действиями, можно условно разделить на два класса: — «технические» и «так- тические» задачи. В «технических» задачах речь идет о выборе ра- циональных конструктивных параметров применяемых образцов бое- вой техники. В «тактических» задачах речь идет о методах боевого при- менения уже имеющихся технических средств с заданными параметра- ми; это — более подвижные, более «злободневные» решения. Значи- тельная часть из них будет приниматься и обосновываться в ходе са- мих боевых действий. Рассмотрим вопрос о применении смешанных стратегий в тех и других задачах. 493
Что касается «тактических» задач, — здесь применимость сме- шанных стратегий сомнений не вызывает: они означают гибкую, под- вижную, всегда неожиданную для противника тактику. Целесообраз- ность такой тактики была очевидна всегда; игровыми методами можно только обосновать пропорции разных тактических приемов. В «технических» задачах дело обстоит несколько иначе. Пусть, например, речь идет о том, чтобы выбрать из нескольких возможных вариантов и осуществить новый образец вооружения. Вряд ли будет целесообразно предоставить этот выбор случайности, например под- бросить монету и, если выпадет герб, выбрать первый вариант, а если цифра — второй. Это нецелесообразно хотя бы потому, что суть сме- шанной стратегии в том, что конкретная ее реализация всегда остает- ся тайной для противника, а когда речь идет о долговременном реше- нии, у противника, как правило, будет время и возможность собрать информацию о принятой стратегии и поступить соответственно ей. В подобных задачах игровые принципы могут применяться иначе: в виде так называемой «физической смеси стратегий». Физичес- кой смесью стратегий называется такая их смесь, при ко- торой одновременно (в одной или нескольких операциях) применяют- ся несколько стратегий в определенных пропорциях; например, не- сколько образцов вооружения, обладающих разными свойствами. Ес- ли применяемые образцы резко различны по своим характеристикам, то, пользуясь физической смесью стратегий, мы можем заметно уве- личить свой выигрыш по сравнению с тем случаем, когда применяется лишь одна стратегия. Пропорции, в которых должны смешиваться разные образцы, могут быть обоснованы исходя из принципов тео- рии игр. В качестве примеров физической смеси стратегий можно привести: — применение в пушках-автоматах патронной ленты, укомплек- тованной снарядами разных типов (бронебойные, зажигательные, фу- гасные); — расстановка в полосе ПВО венитных комплексов с различными характеристиками; — применение в боевых действиях однотипных самолетов-истре- бителей с различным вооружением и т. д. Строго говоря, физически смешанная стратегия является не сме- шанной, а чистой; ее параметрами являются пропорции, в кото- рых смешиваются отдельные образцы. Однако поставленная так иг- ровая задача оказывается, как правило, весьма сложной (хотя бы по- тому, что число стратегий в данном случае бесконечно). В первом при- ближении можно решить задачу об установлении этих пропорций ис- ходя из теории конечных игр и заменяя оптимальную смешанную стра» тегию физической смесью. Такое приближенное решение игры более всего подходит в случае, когда обстановка боевого применения об- разцов-вооружения заранее не вполне ясна; при этом наличие на воо- ружении одновременно нескольких образцов с разными характеристи- ками в какой-то мере обеспечивает их применение в боевых действиях в тех пропорциях в среднем, в каких они имеются в наличии. 404
Пример, В нашем распоряжении имеются разработанные четыре образца зенитных управляемых ракет: <41, Д2, Л4, предназначенные для стрельбы по самолетам; известны типы самолетов противника Вх, В2, S3, В4, В5, которые он может применять, однако неизвестно заранее — в какой пропорции. Вероят- ность поражения самолета противника при применении каждого типа вооруже- ния задана матрицей: в, А' в, в, в, Ва в. Л, 0,2 0,4 0,6 0,4 0,7 А, 0,3 0,4 0,6 0,5 0,8 ^3 0,4 0,5 0,6 0,5 0,8 <4Х 0,7 0, ’ 0,5 0,2 0,1 Требуется, исходя из принципов теории игр, обосновать пропорции, в ко- торых надо заказывать вооружение различных типов. Решение. Замечаем, что стратегия А, заведомо невыгодна по сравнению с Л2; стратегия же Л2 заведомо невыгодна по сравнению о Л8; игра сводится к игре 2X5 с матрицей: В; в, в, в. в, Аз 0,4 0,5 0,6 0,5 0,8 Aj 0,7 0,3 0,5 0,2 0,1 Далее, замечаем, что стратегия В3 для противника явно невыгодна по сравне- нию с В2, а Ва — по сравнению с S4. Остается игра 2X3 с матрицей: в, j в, Аз 0,4 0,5 0,8 4а 0,7 0,2 0,1 Построим геометрическую интер- претацию игры (рис. 9.17). Из графика видно, что активными стратегиями проти- вника являются Вг и В4; игра сведена к игре 2X2: Рис. 9.17 495
Аг в» °,4 0,5 Д4 0,7 0,2 Находим решение игры: «Л* = (°. °- Рз, Р«), где _________0,2—0,7_________5_ 1 Ps- 0,44-0,2—0,5—0,7 = 6s Р«=1 —Рэ=7’ 0,2-0,4—0,5.0,7 9 v —-------------------- = — ==0.45. 0,44-0,2—0,5—0,7 20 Таким образом, исходя из принципов теории игр, принимаем рекоменда- ции; не заказывать вовсе образцов А} и Д2, а образцы А 3, Д4 заказывать в про- порции 5:1 Прн этом средняя вероятность поражения самолета противника (при массовом применении образцов вооружения) будем максимальна (не ниже 0,45). 12. ЭЛЕМЕНТЫ ТЕОРИИ СТАТИСТИЧЕСКИХ РЕШЕНИЙ В задачах теории игр, рассматривая операции, проводимые в ус- ловиях неопределенности, мы связывали эту неопределенность с неиз- вестным для нас поведением противника и исходили из того, что этот противник является «разумным и злонамеренным» и предпринимает те и именно те действия, которые для нас наименее выгодны. Однако при исследовании операций приходится встречаться не только с таким видом неопределенности. Очень часто неопределенность, сопровождающая операцию, связана не с сознательным противодей- ствием противника, а просто с нашей недостаточной осведомленностью об условиях, в которых будет проводиться операция. Так, например, могут быть заранее неизвестны: погода в некотором районе, покупа- тельский спрос на определенного вида продукцию, объем перевозок, который придется выполнять железной дороге, и т. д. Во всех такого рода случаях условия выполнения операции зави- сят не от сознательно противодействующего нам противника, а от объективной действительности, которую в теории решений принято называть «природой». Соответствующие ситуации часто называются «играми с природой». «Природа» в теории статистических решений рассматривается как некая незаинтересованная инстанция, «поведе- ние» которой неизвестно, но, во всяком случае, не содержит элемента сознательного противодействия нашим планам. Рассмотрим такого рода ситуацию. Пусть у нас (сторона Д) имеет- ся т возможных стратегий: А1Г А2, .... Ат> что касается обстановки, то о ней можно сделать п предположений П1( П2, .... Пп — рассмотрим их как «стратегии природы». Наш выигрыш при каждой паре стра- тегий At, tlj задан матрицей (табл. 12.1): 496
Таблица 12.1 Лг \ п. П, п. Пп л, «и а12 Дг а21 а22 . .. ... ... ... Ат amt G/n2 атп Требуется выбрать такую стратегию игрока А (чистую или сме- шанную), которая является предпочтительной (более выгодной) по сравнению с другими. С первого взгляда может показаться, что поставленная задача про- ще игровой, так как она не содержит противодействия. Действительно, принимающему решение в игре с природой легче в том отношении, что он, скорее всего, получит в этой игре больший выигрыш, чем в игре против сознательного противника; однако ему труднее принять обо- снованное решение, которое даст хороший выигрыш. Дело в том, что в игровой конфликтной ситуации предположение о диаметральной про- тивоположности интересов противника нашим в некотором смысле как бы снимает неопределенность. Если же такого предположения сде- лать нельзя, неопределенность сказывается в гораздо более сильной степени. Наиболее простым случаем выбора решения в условиях неопре- деленности является случай, когда какая-то из стратегий игрока А. превосходит другие («доминирует» над ними) как, например, показано в табл. 12.2. Таблица 12.2 Аг п, Пе п, п4 Д1 1 2 3 5 Дг 7 4 4 5 Дз 3 4 4 1 \ 7 4 2 2 В этой таблице выигрыш при стратегии Д2 при любом состоянии природы П; не меньше, чем выигрыш при любой другой стратегии; значит, стратегия Аг является предпочтительной («доминирует» над всеми другими), и ею рекомендуется пользоваться. Если в даже в матрице нет доминирующей стратегии, все же сле- дует просмотреть ее под углом зрения стратегий, заведомо невыгодных 497
для игрока, худших, чем по крайней мере одна из остальных, или дуб- лирующих, которые надо отбросить. Например, в табл. 12.3 можно от- бросить стратегии Аи А2, заведомо невыгодные по сравнению с Д4, и стратегию А& — по сравнению с А3, в результате чего матрица све- дется к матрице 2x5 (см. табл. 12.4). Таблица 12.3 nJ Л. 1 п. и п, п4 п6 А, 5 3 4 2 1 Дг 5 3 2 1 1 Дз 1 2 5 4 3 Д4 7 6 7 3 1 Дз 1 2 3 4 3 Таблица 12.4 \ п. II J П, П, п. П, Л. | 1 2 5 5 3 д4 1 7 6 7 3 1 Обратим внимание на следующее: в игре против разумного против- ника мы бы отбросили за него стратегию П3 как невыгодную по срав- нению с П4, а П4 — по сравнению с П5; в «игре против природы» этого делать нельзя, так как «природа» не выбирает свою стратегию (состоя- ние) так, чтобы как можно больше нам «навредить». В дальнейшем мы будет предполагать, что анализ матрицы и от- брасывание заведомо невыгодных и дублирующих стратегий уже про- изведены. Чем же нам руководствоваться в деле принятия решения в ситуа- ции неопределенности, если ни одна стратегия не доминирует над дру- гими? Ясно, что мы должны исходить из матрицы выигрышей Однако иногда картина ситуации, которую дает матрица выигрышей, содержит своего рода «искажения». Поясним, что мы имеем в виду. Предположим, что выигрыш при стратегии At и состоянии природы П>, больше, чем при стратегии Ak и состоянии природы Пг: aii > аМ’ Но первый выигрыш может быть больше второго не за счет того, что мы выбрали более удачную стратегию, а просто за счет того, что состояние природы П, «выгоднее» для нас, чем состояние Пг. Напри- 498
мер, для какой-нибудь экономической операции состояние «отсутствие стихийных бедствий» вообще более благоприятно, чем состояния «наводнение», «землетрясение» и т. п. Представляется желательным ввести такие показатели, которые не просто давали бы выигрыш в каж- дой ситуации, а описывали бы «удачность» или «неудачность» приме- нения данной стратегии в данной ситуации, с учетом того, насколько вообще эта ситуация благоприятна для нас. С этой целью в теории решений вводится важное понятие «риска». Риском игрока при пользовании стратегией At в условиях П j называется разность между выигрышем, который он получил бы, е с л и б ы з н а л П7, и в ы и г р ы ш е м, который он получит в тех же условиях, приме- няя стратегию At. Обозначим rtj риск игрока при его стратегии At в условиях Пу. Выразим риск rti через элементы матрицы выигрышей (ао). Очевидно, если бы игрок знал заранее состояние природы (условия) Пу, он вы- брал бы ту стратегию, которой соответствует максимальный выигрыш в данном столбце, короче, «максимум столб- ца»— обозначим его, как и ранее, Ру. Согласно определению риска, = (12.1) где |1у = тахагу. Из этого определения следует, что риск не может быть отрица- тельным: О; > 0. При вычислении риска, соответствующего каждой стратегии в дан- ных условиях, учитывается общая благоприятность или неблагоприят- ность для нас данного состояния природы: величина Ру служит как бы мерилом благоприятности состояния. Матрица рисков (гг;) дает зачастую более наглядную картину не- определенной ситуации, чем матрица выигрышей Пример 1. Планируется операция в заранее неясных условиях, касающихся, например, рыночной конъюнктуры. Относительно этих условий можно сделать различные предположения: Пц П2, П8, П4. Выгодность операции (ожидаемая прибыль) при наших страте- гиях (Д{) для различных условий (Пу) задана матрицей выигры- шей (aj7) (табл. 12.5). Таблица 12.5 п. rij П2 п. п4 At 1 4 5 9 Л2 3 8 4 3 Лз 4 6 6 2 489
Построить матрицу рисков (г0-). Решение. Каждый элемент матрицы вычитаем из максимального в данном столбце значения (в первом столбце это = 4, в остальных (э2 — 8, Рз = 6, р4 = 9. Получаем матрицу рисков (табл. 12.6). Таблица 12.6 п. п, П, П, At 3 4 1 0 1 0 2 6 Л3 0 2 0 7 При взгляде на эту матрицу нам становятся яснее некоторые черты данной «игры с природой». Так, в матрице с выигрышей (atj) (см. табл. 12.5) во второй строке первый и последний элементы были равны друг другу: а21 = ам = 3. Однако эти выигрыши совсем неравноценны друг другу в смысле того, насколько удачно выбрана стратегия: при состоянии природы П] мы могли выиграть самое большее всего 4, и выбор стратегии Л2 почти совершенно хорош; а вот при состоянии П4 мы могли, выбрав стратегию Alt выиграть на целых 6 единиц больше, т. е. выбор страте- гии А2 очень плох. Это отражается элементами матрицы рисков: Г 21 = К = 6. То, что мы делали до сих пор — всего лишь различные способы группировки исходных данных; что касается критериев для принятия решений, мы их рассмотрим в следующем параграфе. 13. КРИТЕРИЙ, ОСНОВАННЫЙ НА ИЗВЕСТНЫХ ВЕРОЯТНОСТЯХ УСЛОВИЙ. КРИТЕРИИ ВАЛЬДА, ГУРВИЦА, СЭВИДЖА Наиболее просто решается задача о выборе решения в условиях неопределенности, когда нам хотя и неизвестны условия выполнения операции (состояние природы) Пь П2.Пп, но известны их вероят- ности: С2=Р(П2); ...; (?П = Р(ПП) (И \ 2 <3; = 1 . /= । / В этом случае в качестве показателя эффективности, который мы стремимся обратить в максимум, естественно взять среднее зна- чение, или математическое ожидание выигрыша, 500
с учетом вероятностей всех возможных условий. Обозначим это сред- нее значение для i-й стратегии игрока через йг: at — Qi ап -\-Qiai2 + ••• ~^Qnain> или, короче, (13-1) ;= I Очевидно, at есть не что иное, как взвешенное сред- нее выигрышей Z-й строки, взятых с весами Q1( Q2, Qn- В качест- ве оптимальной стратегии естественно выбрать ту из стратегий А* — А1, для которой величина at обращается в максимум. С помощью такого приема задача о выборе решения в условиях неопределенности превращается в задачу о выборе решения в условиях определенности, только принятое решение является оптимальным не в каждом отдельном случае, а в среднем. Пример 1. Планируется операция в заранее неизвестных метеорологичес- ких условиях; варианты этих условий: П1т П2, П3, П4. Согласно материалам метеосводок за много лет частоты (вероятности) этих вариантов равны соот- ветственно: Qj = 0,1; (?2 <= 0,2; <?3 «= 0,5; = 0,2 Возможные варианты организации операции в различных метеоусловиях приносят различную выгоду. Значения «дохода» для каждого решения в разных условиях приведены в табл. 13.1 Таблица 13.1 n. П, П, n4 al 1 4 5 9 5,2» A 2 3 8 4 3 4,5 4 6 6 2 5,0 Qi °,’ 0,2 0,5 0,2 В последней строке даны вероятности условий. Средние выигрыши ai приведены в последнем столбце. Из него видно, что оптимальной стратегией игрока является его стратегия Л* = А1г дающая средний выигрыш at = 5,2 (отмечен звездочкой). При выборе оптимальной стратегии в неизвестных условиях с из- вестными вероятностями можно пользоваться не только средним выи- грышем п ai— 2 Qi ati> i=i 501
но и средним риском ri = 2 Q}rt}, <= । который, разумеется, нужно обратить не в максимум, а в мини- мум. Покажем, что стратегия, максимизирующая средний выигрыш аг, совпадает со стратегией, минимизирующей средний риск гг. Вычислим оба эти показателя и сложим их: _ __ п п 2 Qj аи + 2 —atj) — 1 i= 1 n n n n = 2 Q3ai}- 2Q;% + 2 = 2 (13.2) /= I ;= 1 /= 1 ;= 1 Эта сумма (среднее взвешенное значение максимумов столбцов) для данной матрицы есть величина постоянная; Обозначим ее С: п 2Q^j=c. i=i Тогда аг г t = C, откуда средний риск равен 7t = C~at. (13.3) Очевидно, эта величина обращается в минимум тогда же, когда at — в максимум, следовательно, стратегия, выбранная из условий минимального среднего риска, совпадает со стратегией, выбранной из условий максимального среднего выигрыша. Заметим, что в случае, когда известны вероятности состояний при- роды Q2, .... Qn, при решении игры с природой всегда можно обой- тись одними чистыми стратегиями, не применяя сме- шанных. Действительно, если мы будем применять какую-то смешан- ную стратегию = (Ри Pit •••» Ртп)> т. е. стратегию с вероятностью стратегию А2 с вероятностью р2 и т. д., то наш средний выигрыш, осредненный и по условиям (состоя- ниям природы) и по нашим стратегиям, будет: a:=Pia1 + p2a2+ ... +ртат- Это — взвешенное среднее выигрышей а£1 соответствующих на- шим чистым стратегиям. Но ясно, что любое среднее не может превос- 502
ходить максимальной из осредняемых величин: а^таха;. Поэтому применение смешанной стратегии Sa с любыми вероят- ностями ръ р2, ... не может быть выгоднее для игрока, чем применение чистой стратегии А*. Вероятности условий (состояний природы) Qx, Q2..... Qn могут быть определены из статистических данных, связанных с многократ- ным выполнением подобных операций или просто с проведением на- блюдений над состояниями природы. Например, если железной дороге за данный промежуток времени предстоит выполнить не вполне из- вестный объем перевозок, то данные о распределении условий могут быть взяты из опыта прошлых лет. Если, как в предыдущем примере, успех операции зависит от метеоусловий, данные о них могут быть взя- ты из статистики метеосводок. Однако часто встречаются случаи, когда, приступая к выполнению операции, мы не имеем представления о вероятностях состояний при- роды; все наши сведения сводятся к перечню вариантов состояний, а оценить их вероятности мы не можем. Так, например, вряд ли нам удастся разумно оценить вероятность того, что в течение ближайших k лет будет предложено и реализовано важное техническое изобрете- ние. Разумеется, в подобных случаях вероятности условий (состояний природы) могут быть оценены субъективно: некоторые из них пред- ставляются нам более, а другие — менее правдоподобными. Для того чтобы наши субъективные представления о большей или меньшей «правдоподобности» той или другой гипотезы превратить в численные оценки, могут применяться различные технические приемы. Так, если мы не можем предпочесть ни одной гипотезы, если они все для нас рав- ноправны, то естественно назначить их вероятности равными друг дру- гу: Qi — Q2— ••• —Qn — Это — так называемый «принцип недостаточного основания» Лапласа. Другой часто встречающийся случай — когда мы имеем представление о том, какие условия более вероятны, а какие — менее, т. е. можем рас- положить имеющиеся гипотезы в порядке убывания их правдоподоб- ности: всего правдоподобнее первая гипотеза (ГЦ), затем вторая (П2) и т. д.; менее всего правдоподобна п-я гипотеза (Пп). Однако, насколь- ко одна из них вероятнее другой —мы не знаем. В этом случае можно, например, назначить вероятности гипотез пропорциональными членам убывающей арифметической прогрессии: Qi: Q2: ... :Qn = n:(n—1) ИЛИ, учитывая, ЧТО Q! + Q2+ — + Qn=l> Q = (i = 1, 2. и). n(n+l) V 1, 503
Иногда удается, исходя из опыта и здравого смысла, оценить и бо- лее тонкие различия между степенями правдоподобия гипотез. Подобные методы субъективной оценки «вероятности-правдоподоб- ности» разных гипотез о состоянии природы могут иногда помочь при выборе решения. Однако нельзя забывать, что «оптимальное решени », выбранное на основе субъективных вероятностей, неизбежно окажется тоже субъективным. Степень субъективности решения можно умень- шить, если вместо вероятностей Qx, Q2.Qn, назначенных произволь- но одним лицом, ввести средние из таких вероятностей, назначенных, независимо друг от друга, группой квалифицированных лиц («экспер- тов»). Методопроса экспертов вообще широко применяется в современ- ной науке, когда речь идет об оценке неопределенной ситуации (на- пример, в футурологии). Опыт применения подобных методов учит, что зачастую оценки экспертов (принятые независимо одним от дру- гого) оказываются далеко не столь разноречивыми, как это можно было предположить заранее, и вывести из них некоторые предпосылки для принятия разумного решения вполне возможно. Выше мы осветили вопрос о выборе решения на основе объектив- но вычисленных или субъективно назначенных вероятностей состоя- ний природы. Этот подход в теории решений — не единственный. Кро- ме него существуют еще несколько «критериев» или подходов к выбору оптимального решения в условиях неопределенности. Остановимся на некоторых из них. 1. Максиминный критерий Вальда Согласно этому критерию в качестве оптимальной выбирается та стратегия игрока А, при которой минимальный выигрыш максимален, т. е. стратегия, гарантирующая при любых усло- виях выигрыш, не меньший, чем максимин: W' = max rninatj. (13.4) i i Если руководствоваться этим критерием, надо всегда ориентиро- ваться на худшие условия и выбирать ту стратегию, для кото- рой в худших условиях выигрыш максимален. Пользуясь таким кри- терием в играх с природой, мы как бы ставим взамен этой безличной и незаинтересованной инстанции активного и злонамеренного против- ника. Очевидно, такой подход может быть продиктован только крайним пессимизмом в оценке обстановки — «всегда надо рассчитывать на худшее!» — , но как один из возможных подходов заслуживает рас- смотрения. 2. Критерий минимаксного риска Сэвиджа Этот критерий рекомендует в условиях неопределенности выбирать ту стратегию, при которой величина риска принимает наименьшее зна- чение в самой неблагоприятной ситуации (когда риск максимален): S = min max/-;,. (13.5) 504
Сущность этого критерия в том, чтобы любыми путями избежать большого риска при принятии решения. Критерий Сэвиджа, так же как и критерий Вальда — это крите- рий крайнего пессимизма, но только пессимизм здесь понимается по- другому: худшим объявляется не минимальный выигрыш, а максималь- ная потеря выигрыша по сравнению с тем, чего можно было бы достичь в данных условиях (максимальный риск). 3. Критерий пессимизма-оптимизма Гурвица Этот критерий рекомендует в условиях неопределенности при вы- боре решения не руководствоваться ни крайним пессимизмом (всегда рассчитывай на худшее!) ни крайним, легкомысленным оптимизмом (все обойдется наилучшим образом!) Критерий Гурвица имеет вид: 5^ = max Ixminaj4-(1—х)шахам, (13.6) ' I / i > где х — коэффициент, выбираемый между нулем и единицей. Проанализируем структуру выражения (13.6). При х = 1 кри- терий Гурвица превращается в пессимистический критерий Вальда, а при х = 0 — в критерий «крайнего оптимизма», рекомендующий вы- бирать ту стратегию, для которой в наилучших условиях выигрыш максимален. При 0 < х < 1 получается нечто среднее между край- ним пессимизмом и крайним оптимизмом (коэффициент х выражает как бы «меру пессимизма» исследователя). Этот коэффициент выбирает- ся из субъективных соображений — чем опаснее ситуация, чем боль- ше мы хотим в ней «подстраховаться», тем ближе к единице выби- рается х. При желании можно построить критерий, аналогичный критерию оптимизма-пессимизма Гурвица исходя не из выигрыша, а из риска, как в критерии Сэвиджа, но мы на этом не будем останавливаться. Несмотря на то, что выбор критерия, как и выбор параметра в кри- терии Гурвица, являются субъективным, все же может оказаться по лезным просмотреть ситуацию с точки зрения этих критериев. Если рекомендации, вытекающие из различных критериев, совпадают — тем лучше, можно смело выбирать рекомендуемое ими решение. Если же, как это часто бывает, рекомендации противоречат друг другу — всегда имеет смысл задуматься над этим и принять окончательное решение с учетом его сильных и слабых сторон. Анализ матрицы игры с приро- дой под углом зрения разных критериев часто дает лучшее представ- ление о ситуации, о достоинствах и недостатках каждого решения, чем непосредственное рассмотрение матрицы, особенно, когда ее размеры велики. Пример 2. Рассматривается игра с природой 4X3 с четырьмя стратегиями игрока: Alt А2, А3, и тремя вариантами условий (состояний природы): Пт, па, П3. Матрица выигрышей дана в табл. 13.2. 505
Таблица 13.2 nt п, Па Л1 0,20 0,30 0,15 * 0,75 0,20 0,35 ^3 0,25 0,80 0,25 А4 0,85 0,05 0,45 Найти оптимальное решение (стратегию), пользуясь критериями Вальда, Сэвиджа и критерием Гурвица при х = 0,6. Решение. 1. Критерий Вальда. В каждой строке матрицы берем наименьший выигрыш (табл. 13.3). Из величин а; максимальная (отмечена звездочкой) равна 0,25, следова- тельно, по критерию Вальда оптимальной является стратегия А3. 2. Критерий Сзвиджа. Строим матрицу рисков и помещаем в правом добавочном столбце макси- мальный риск в каждой строке уг (табл. 13.4). Минимальным из значений у/ является 0,60 (отмечено звездочкой); следо- вательно, по критерию Сэвиджа, оптимальной является любая из стратегий ^з- Таблица 13.3 Xt п, П П; ai А 0,20 0,30 0,15 0,15 Аг 0,75 0,20 ,35 0,2( ^3 0,25 0,80 0,25 0,25* л4 и,85 0,05 0,45 0,05 3. Критерий Гурвица (х = 0,6). Записываем в правых трех столбцах матрицы (табл. 13 5) «пессимистичес- кую» оценку выигрыша а,, «оптимистическую» со; и их среднее взвешенное по формуле (13.6): /г; = 0,6аг4-0,4<вь Максимальное значение ht (отмечено звездочкой) соответствует стратегии А3. Следовательно, по критерию Гурвица с легким перевесом в сторону песси- мизма (х == 0,6) оптимальной стратегией является А3. Таким образом, все три критерия согласно говорят в пользу стратегии А3> которую мы имеем все осно- вания выбрать. 506
Таблица 13.4 At Н, п, 1 vt Al 0,65 0,50 0,30 | 0,65 Al 1 о.,о 0,60 0,10 1 0,60* Д* лз 0,60 0 0,20 | 0,60* 0 0,75 0 | 0,75 Таблица 13.5 Ai — 1 П, п3 «1 “1 hi -4i | 0,20 0,30 0,15 0,15 0,30 0,21 Д2 0,75 0,20 0,35 0,20 0,75 0,42 Al 0,25 0,80 0,25 0,25 0,80 0,47* As 0,85 0,05 0,45 0,05 0,85 0,37 Таблица 13.6 . П 1 н, п, Пз п4 Ai 2 3 4 5 А2 । 5 4 1 2 Аз 7 2 8 1 Таблица 13.7 п’ п. П, 1 «< л; | 2 3 4 5 2* Аз 1 5 4 1 2 1 Л, | 7 2 8 1 1 507
Таблица 13,8 __ /1 1 п* Щ И, V, Л] 5 1 4 0 5 42 2 0 7 3 7 ^3 0 2 0 4 4* Таблица 13.9 Л П, П, П4 । а, “1 hi 4, 1 2 3 4 5 2 5 3,5 4г 1 5 4 1 2 1 5 3,0 4 7 2 8 1 1 8 4,5* Пример 3. Рассматривается игра против природы 3X4 с матрицей выигры- шей, помещенной в табл. 13.6. Выбрать оптимальную стратегию по критериям Вальда, Сэвиджа и Гурви- ца при х = 0,5 Решение 1. Критерий Вальда (табл. 13.7). Оптимальная стратегия 2. Критерий Сэвиджа (табл. 13.8). Оптимальная стратегия Д3. 3. Критерий Гурвйца (х = 0,5) (табл. 13.9). Оптимальная стратегия 43. Таким образом, критерии Сэвиджа и Гурвица говорят в пользу стратегии Аа, тогда как критерий Вальда рекомендует Если у принимающего решение нет особых оснований становится на точку зрения крайнего пессимизма, можно остановиться на стратегии 43. В заключение заметим следующее. Все три критерия — Вальда, Сэвиджа и Гурвица — были сформулированы нами для чистых стратегий; но совершенно таким же образом можно сформировать их и для смешанных стратегий. Например, согласно критерию Сэвиджа следует выбирать ту смешанную стратегию ^л = (л, рг, .... рт), для которой достигается min max(p1ru+p2r2j+ ... + (Рг Р2..Ртп) ' (минимум берется по всем ръ р2, • > 0, Pi + Рг, + + Рт — 0* Найти этот минимакс (или максимин в критерии Вальда) можно обыч- ными методами линейного программирования. Могут быть случаи, когда применение смешанных стратегий при пользовании критериями Вальда, Сэвиджа, Гурвица даст преимущест- во по сравнению с тем решением, где применяются одни чистые страте- 508
гии, однако мы будем рассматривать эти критерии только для чистых стратегий. Одна из причин этого — в том, что мы хотим избежать сложных вычислений, когда их результат может быть сведен на нет недостатком сведений о ситуации (незнание вероятностей условий). Другая, более важная причина — в том, что основное содержание тео- рии статистических решений (мы коснемся его в следующем парагра- фе) — это планирование получения и использования дополнительной информации о состоянии природы, которую можно добыть путем эксперимента. Исследования показывают, что в типичных случаях, когда речь идет о получении сколько-нибудь значительного количества дополнительной информации, критерии, не пользующиеся вероятнос- тями состояний (Вальда и др.), становятся практически равносильны- ми критерию, основанному на вероятностях состояний. Но мы знаем, что при пользовании таким критерием применение смешанных страте- гий не имеет смысла; стало быть, если мы можем получить сколько- нибудь много дополнительной информации, применение смешанных стратегий теряет смысл (каким бы из критериев выбора решения мы ни пользовались). Если же мы не можем, производя эксперименты, добывать новую информацию, то различные критерии могут давать противоречащие друг другу рекомендации, как мы видели в примере 3. 14. ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ В этом параграфе мы коснемся очень важного в теории статисти- ческих решений вопроса о том, как нам могут помочь в принятии ре- шения эксперименты, предпринятые с целью выяснения действительной обстановки? Этот вопрос является центральным в теории, как показы- вает само название: ведь слово «статистический» как раз и употреб- ляется, когда речь идет о выводах из экспериментов, об их планирова- нии и обработке. Соответствующую теорию можно развивать как исходя из извест- ных вероятностей состояний природы, так и из критериев, подобных критерию Вальда; мы будем здесь рассматривать теорию, исходящую из известных вероятностей состояний природы, как более простую. Рассмотрим следующий вопрос. Нам предстоит предпринять неко- торую операцию в недостаточно выясненных условиях. Имеет ли смысл для уточнения условий в нашей неопределенной ситуации предпри- нимать некоторый эксперимент %? Естественно, этот вопрос возникает только тогда, когда затраты на эксперимент существенны и сравнимы с тем увеличением выигрыша, которое мы можем получить, узнав об- становку более точно. Если же затраты на эксперимент пренебрежимо малы, ответ на этот вопрос всегда положителен. Рассмотрим сначала случай «идеального» эксперимента приво- дящего к совершенно точному знанию того состояния природы П7-, которое имеет место в данной ситуации. Пусть задана матрица выи- грышей (i = 1, ..., т; j = 1, .... п), а, кроме того, известны ве- 509
роятности Qt, Q2, .... Qn различных условий Пц П2, Пп. Пусть затраты на проведение эксперимента 8 равны С. Сравним наш средний выигрыш без проведения эксперимента $ и средний выигрыш с прове- дением этого эксперимента. Как мы видели в § 13, если не проводить дополнительно никакого эксперимента, то нужно в качестве решения выбрать ту стратегию А* — A it для которой достигается максимальный средний выигрыш: max {Qt aa+Q2 а12 + ... +Qn^n}, (14.1) i Это и будет наш выигрыш без проведения эксперимента 8. Теперь предположим, что мы произвели эксперимент $ и выяснили, какое из состояний Пь П2, .... Пп является действительным состоянием природы. Если это оказалось Пъ то мы должны применять ту страте- гию Ла, для которой достигается тахап =р1( i и наш выигрыш будет равен если действительное состояние приро- ды оказалось П2, наш выигрыш будет Р2, и т. д. Вообще, при действи- тельном состоянии природы П;- наш выигрыш будет равен максималь- ному выигрышу в /-м столбце: шах ai} =р7. / Но нам нужно заранее решить, будем ли мы производить экспери- мент 8 или нет; нам неизвестно, какое из состояний П;- на самом деле имеет место и каков будет наш выигрыш (3Поэтому осредним этот выигрыш с весами, равными вероятностям Qf. Q1P1 + Q2P2 + ••• +QnPa- С учетом стоимости эксперимента (которую нужно вычесть из выигрыша) наш средний выигрыш с применением идеального экспери- мента 8 равняется Q1P1+Q2P2+ - +Qn₽n-C- (14.2) Итак, мы должны проводить эксперимент, если величина (14.2) больше, чем (14.1); если же, наоборот, величина (14.1) больше, то экспе- римент $ нам не нужен. Можно несколько видоизменить это правило, сделав его более простым. Мы видели, что эксперимент $ нам полезен (т. е. «по средст- вам»), если max(Q1ail+Q2a/2+ ... +Qnain\< ‘ < <?г Pi + Q2 ₽2 + ... +QnP„-C. (14.3) Перенесем С в левую часть, а «максимум» из левой части в правую, переменив знак перед суммой и заменяя «максимум» на «минимум»; условие (14.3) перепишется в виде: C<min{Q1(₽1—art)4-Q8(P2—а/2)+ ... +Qn(₽n—ain)} 510
или, короче {п А 2 <2>(Р>—ао)|. ! = 1 ) (14.4) Но — atj есть не что иное, как риск а сумма в правой части — средний ожидаемый риск: п ri~ 2 Qi rii- i= 1 Поэтому правило решения о выполнении эксперимента $ приобре- тает следующий вид. Эксперимент % нужно проводить, если затраты на его осуществле- ние меньше минимального среднего риска: Cdninr£, (14.5) В противном случае следует воздержаться от эксперимента, и приме- нить ту стратегию А*, для которой достигается этот минимум сред- него риска. Пример 1. Рассматривается игра с природой 3X4, условия которой при- ведены в табл. 14.1 (такую матрицу мы уже рассматривали в § 13). Таблица 14.1 Ai П, П, П. 4i I 1 4 5 9 42 1 3 8 4 3 4g 1 4 6 6 2 Вероятности состояний природы Пь Па, П3, П4 равны соответственно: Qi = 0,1, Q, = 0,2, Q3 = 0,5, Qi = 0,2. • Таблица 14.2 А/ п п. п2 п„ п, Г/ 4j 3 4 1 0 1.6 42 1 0 2 6 2,3 4з 0 2 0 7 1,8 Определить, является ли целесообразным «идеальный» эксперимент, стои- мость которого (в тех же единицах, в которых выражен выигрыш) равна 2. Решение. Переходим от матрицы выигрышей к матрице рисков (табл. 14.2). В правом дополнительном столбце проставлены значения среднего риска. Минимальное из этих значений равно 1,6; следовательно, проведение экспери- мента со стоимостью 2 единицы нецелесообразно. 5П
Выше мы рассмотрели случай «идеального» эксперимента S, в ре- зультате которого обстановка полностью выясняется. Теперь рассмотрим случай не идеального эксперимента %, кото- рый не приводит к выяснению в точности состояния природы П;, а лишь дает какие-то косвенные свидетельства в пользу тех или других со- стояний. В наиболее общем виде мы можем предположить, что экспе- римент $ приводит к появлению одного из k несовместных событий Bi, В2, ... Bft, причем вероятности этих событий (исходов эксперимента) зависят от условий, в которых он проводится: Пъ П2, ... или Пп. Обозначим ус- ловную вероятность появления события Bt в условиях П7 через Р(Вг/П;), (/ = 1, 2.... п- 1 = \, 2....k) и будем считать, что все эти условные вероятности нам известны. После осуществления эксперимента %, давшего исход В[г нам придется пересмотреть вероятности условий: состояния природы Пь П2..... Пп будут характеризоваться не прежними (априорными) ве- роятностями Qv Q2. Qn. а новыми, «апостериорными» вероятностями состояний: Qin Qzn •••» Qni> т. е. условными вероятностями состояний П„ П2, .... Пп при условии, что эксперимент дал результат В,. Эти апостериорные вероятности подсчитываются по известной формуле Бейеса: ~ Qj Р (Bi/Tlf) Qji=—-----------------> (/ = 1..... «) (14.6) s Qip UW) = i (с этим как раз и связано то, что соответствующий подход к принятию решения в ситуации неопределенности называется бейесовским). Поскольку априорные вероятности состояний природы Qb Q2,..., Qn заменяются новыми, апостериорными Qu, Q2l, ..., Qn;, то, значит, и оптимальная стратегия А* в общем случае заменится новой опти- мальной стратегией А*г, вычисленной с учетом апостериорных вероят- ностей (при условии события В,). Пример 2. В условиях примера 1 с априорными вероятностями условий Qi=0.1, Q2 = 0,2, Q3 = 0,5, Q4=0,2 производится эксперимент служащий для уточнения обстановки. Этот экс- перимент, вообще говоря, может иметь три возможных исхода: Si, Вг, 83. Условные вероятности этих исходов Р(В;/П;-) для разных состояний при- роды Пх, П2, П3, Па приведены в матрице условных вероятностей (табл 14.3). 512
Таблица 14.3 —_ 11 Ill 11, Г1„ П. й; | 0,2 0,9 0,4 0,3 0,1 0,1 0,5 0,3 й3 0,7 0 0,1 0,4 Известно, что в эксперименте $ имел место исход В^. Вычислить апосте- риорные вероятности (5р. Указать новую оптимальную стратегию At*. Решение. По формуле (14 6) имеем; 0,1.0,2 Оц =---------------’--1-------------о «0,043 1 0,1-0,2 + 0,2-0,9+0,5-0,44-0,2-0,3 0,18 ~ 0,20 Q,t = ——«0,392; Q31 =-+——« 0,435; 21 0,46 0,46 ~ 0,06 Таблица 14.4 п. П1 п, п, п4 | Ч” 1 1 1 4 5 8 | 4,96 А*2 3 8 4 3 5,20* 1 ’ 6 6 2 5,09 Q/i 0,043 0,392 0,435 0,130 Вычислим средние выигрыши а(1) при каждой стратегии с учетом найден- ных апостериорных вероятностей (табл. 14.4). В последней строке таблицы помещены апостериорные вероятности, в правом, дополнительном столбце — средние выигрыши при новых значениях вероятностей состояний, вычисленные по формуле e/^ = Qil «ii + Qai a^+Qai агз + 9« aU- Значения Qtr даны в нижней строке таблицы. Таким образом, с учетом результата Sj опыта г&, оптимальной стратегией будет уже не Д1; а +• Конечно, для того чтобы заранее решить, стоит ли нам проводить эксперимент % или нет, нужно заранее произвести подобные расчеты не только для одного исхода Въ но и для всех остальных. Про- должим рассмотрение примеров. Пример 3. В условиях примеров 1 и 2 выработать правило реше- ния, которое указывало бы, при каком исходе эксперимента какую стратегию выбирать. Выяснить, насколько средний выигрыш при выполнении эксперимен- та $ больше среднего выигрыша без выполнения этого эксперимента. 513
Решение. Вычислим остальные апостериорные вероятности всех состояний природы (?;3 (/= 1, 2, 3, 4) при условии, что эксперимент дал исходы й2> В3 соответственно Вычисления будем производить по той же формуле (14.6): я 0,1-0,1 О,» ----------------------------—— ~ 0 029 0,1-0,1+0,2-0,1+0,5.0,54-0,2-0,3 ’ ~ 0,02 „ ~ 0,25 ~ 0 06 g ________________0,1-0,7_____________ 13~ 0,1-0,7 + 0,2-0+0,5-0,1+0,2-0,4 ~0,35, я- 0 я °.О5 , - 0,08 ^ = ^=0; Q-=^=°-25= ^=t^=0’40- Сведем все новые (апостериорные) вероятности состояний природы при каждом из исходов йх, й2, й3 в табл. 14.5. Таблица 14.5 П1 п2 п3 В1 0,043 0,392 0,435 0,130 в2 0,029 0,059 0,735 0,177 В3 0,350 0 0,250 0,400 Таблица 14.6 п. п2 п3 п4 -(2) ai 1 4 5 9 5,53* а2 3 8 4 3 | 4,03 4.з 4 6 6 2 5,23 Q/2 0,029 0,059 0,735 0,177 Таблица 14.7 п. п. п, п3 п< -<3) а1 1 4 5 9 5,20* 3 8 4 3 3,25 4з 4 6 6 2 3,70 ё/з 0,350 0 0,250 0,400 514
Теперь для каждого из событий Й2, й3 (для мы уже это сделали) найдем средний выигрыш, осредняя его с весами, равными новым, апостериорным ве- роятностям Оптимальную стратегию отмечаем звездочкой. Результаты расчетов для событий й2 и й3 соответственно приводятся в табл. 14.6 и 14.7. В нижней строке каждой таблицы приведены апостериорные вероятности состояний, а в правом столбце — средние выигрыши. Теперь, на основе сабл 14.4, 14.6, и 14.7 мы можем сформулировать пра- вило решения: Если эксперимент $ дал результат —применять стратегию Д2; если он дал не йх (т. е Bz или В3)~п ри мен ять стратегию Ах При этом, если эксперимент дал исход й2, наш средний вы- игрыш будет равен 5,20; если Й2—5,53, а если й3, то 5,20. Среднее значение среднего выигрыша при данном правиле решения может быть вычислено так: найдем полную вероятность события йх: Р(Вх) = <?1Р(Й!/П1) +<?2Р(Й1/П2) + Q3P(BM + <?4Р(Й!/П4) = 0,1.0,2 4- 4- 0,2-0,9 4- 0,5-0,4 4- 0,2-0,3 = 0,46; Аналогично находим вероятности событий й2 и й3: Р(й2) = Qi/Wnx) 4- Q2P(fi2/n2) 4- (?3Р(йг/П3) 4- <Э4Р(Й2/П4) = 0,1-0,1 4- 4- 0,2-0,1 4- 0,5-0,5 4- 0,2-0,3 = 0,34; P(BS) = Q1P(Bs/nl) + (?2Р(Й3/П2) 4- <?3Р(Й3/П3) 4- <?4/Wn4) = 0,1 0,7 4- 4- 0,2-0 4- 0,5-0,1 4- 0,2-0,4 = 0,20. Полный средний выигрыш при данном правиле решения будет: а* = 0,46-5,20 4- 0,34-5,53 4- 0,20-5,20 = 5,345. Сравним этот выигрыш с тем, который мы получили бы при отсутствии эксперимента (см. пример 1 § 13) Там мы получили a* v 5,20. Таким образом, выполнение эксперимента увеличило наш средний выигрыш на 5,345 — 5,20 = = 0,145 Отсюда следует вывод: если стоимость эксперимента меньше чем 0,145, то выполнение его целесообразно, если же она превышает 0,145 — нецелесооб- разно Расчеты целесообразности проведения эксперимента, разумеется, могут производиться исходя не из среднего выигрыша, а из среднего риска; при этом будут получаться те же самые результаты. Аналогичным образом можно заранее подсчитать, выгодно ли нам несколько раз провести эксперимент S. Действительно, пусть, скажем, есть возможность произвести два независимых повторения эксперимента %, характеризующегося условными вероятностя- ми исходов: Р(В1/П}) (/ = 1,2,..., п; / = 1,2,..., k) при условии дан- ного состояния природы П/. Это равносильно проведению одного сложного эксперимента $ с исходами Bis (Z = 1, 2,..., k', s = 1,2,..., k), где Bls обозначено событие, состоящее в том, что первый эксперимент дал Bt, а второй — Bs. Условные вероятности этих исходов по правилу умножения вероятностей независимых событий будут: Р (В;,/П7-) = Р (Вг/П;) Р (В^П)). Таким образом задача сводится к ра- нее рассмотренной, только в эксперименте будет уже не k возмож- ных исходов, a k2. Так обстоит дело, когда повторное проведение экспериментов пла- нируется заранее. Однако, когда речь идет о проведении ряда испытаний для уточнения сведений о действительных условиях в рассматриваемой ситуации, выгоднее не назначать число испытаний заранее, а решать после каждого испытания — стоит ли нам проводить следующее. Оказывается, что такой метод в ря- де случаев дает заметную экономию в средствах, затрачиваемых на эксперимент.
10 МЕТОД СЕТЕВОГО ПЛАНИРОВАНИЯ 1. ЗАДАЧА ПЛАНИРОВАНИЯ КОМПЛЕКСА РАБОТ При исследовании операций на практике часто приходится встре- чаться с задачей рационального планирования сложных, комплекс- ных работ. Примерами таких работ могут быть: — строительство большого промышленного объекта, — перевооружение армии или отдельных видов вооруженных сил, — развертывание системы медицинских или профилактических мероприятий, — выполнение комплексной научно-исследовательской темы с участием ряда организаций и т. д. Характерным для каждого такого комплекса работ является то, что он состоит из ряда отдельных, элементарных работ или «звеньев», которые не просто выполняются независимо друг от друга, а взаим- но обусловливают друг друга, так что выполнение некоторых работ не может быть начато раньше, чем завершены неко- торые другие. Так, например, при строительстве промышленного предприятия рытье котлована не может быть начато раньше, чем будут доставлены и смонтированы соответствующие агрегаты; укладка фун- дамента не может быть начата раньше, чем будут доставлены необхо- димые материалы, для чего, в свою очередь, требуется завершение строительства подъездных путей; для всех этапов строительства необ- ходимо наличие соответствующей технической документации, и т. д. Планирование любого такого комплекса работ должно произво- диться с учетом следующих существенных элементов: — времени, потребного на выполнение всего комплекса работ и его отдельных звеньев; — стоимости всего комплекса работ и его отдельных звеньев; — сырьевых, энергетических и людских ресурсов. Рациональное планирование комплекса работ требует, в частнос- ти, ответа на следующие вопросы: — Как распределить имеющиеся материальные средства и трудо- вые ресурсы между звеньями комплекса? — В какие моменты начинать и когда заканчивать отдельные звенья? — Какие могут возникнуть препятствия к своевременному завер- шению комплекса работ и как их устранять? и т. д. 516
При планировании сравнительно небольших по объему (количест- ву звеньев) комплексов работ ответ на'такие вопросы обычно дает ру- ководитель, причем без специальных математических расчетов, просто на основе опыта и здравого смысла. Однако, когда речь идет об очень сложных, дорогостоящих комплексах работ, состоящих из большого числа звеньев, сложным образом обусловливающих друг друга,такие приемы становятся недопустимыми. В этих случаях возникает необ- ходимость в специальных расчетах, позволяющих обоснованно отве- тить на поставленные выше вопросы и ряд других. Одним из математических методов, широко применяемых при ре- шении такого рода задач, является метод сетевого плани- рования или, как его часто называют, СПУ (сетевое планирование управления). Метод сетевого планирования позволяет решать как прямые, так и обратные задачи исследования операций. Прямые задачи отвечают на вопрос: что будет, если мы примем данную схему организации опе- рации? Обратные отвечают на вопрос: как нужно организовать (спла- нировать) операцию, чтобы она обладала, в каком-то смысле, макси- мальной эффективностью? Обратные задачи, как правило, гораздо сложнее прямых. Чтобы решать обратные задачи, нужно прежде всего научиться решать пря- мые. Естественно, с такого рода задач мы и начнем. Основным материалом для сетевого планирования является спи- сок или перечень работ (звеньев) комплекса, в котором указаны не чолько работы, но и их взаимная обусловленность (окончание каких работ требуется для начала выполнения каждой работы). Будем назы- вать такой список структурной таблицей комплекса работ. Условимся обозначать работы а1г а2, ... В структурной таблице для каждой работы at должно быть указано, выполнения каких работ Таблица 1.1 п/п Работа Опирается на работы 1 ai — 2 ^2 ^1» ^3 3 а3 — 4 а4 5 «ъ — 6 — 7 d<j Oj, ае, а10 8 Oft ^2 9 а9 «3- О4, «6 10 «10 11 «11 о?> oi2 12 «12 О1( О2 13 «13 °4> °6> О10 14 «И Оз, Од, 05 15 «15 ^10 Б17
Т аблица 1.2 № п/п Работ а Опирается на работы Ранг Обозначение в новой ну- мерации 1 01 1 Ь1 2 02 а1, аз 2 Ьз 3 о3 — 1 ь2 4 > (J-2> О3 3 Ь'е 5 аз — 1 Ьз 6 а« — 1 Ьз 7 о? 01 > а», Ок; 6 Ьц 8 а3 01, аг 3 b-i 9 яз> 4 be 10 °10 5 Ьц Н Оц U’j Оц 7 Ьц 12 °12 а1 » 3 bg 13 013 1 > #10 6 Ьц 14 014 Оз, а,, аз 4 bis 15 015 аю 6 bi.. Таблица 1.3 № п/п Работа Опирается ни работы 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 bi b2 Ьз &4 Ьз Ьз ъ, ь. bl, ь2 bl , Ье,. Ь2 bl,'b5 bl, ьъ b2, ba, b3 be be bi, be, Ьц be, ba, Ьц Ьц Ьц, b„ она требует, или, как мы будем говорить далее, на какие работы она опирается. Пример структурной таблицы комплекса работ дан в табл. 1.1. В табл. 1.1 последний столбец содержит перечисление всех работ, без завершения которых данная работа не может быть начата. Прочерк в этой графе означает, что данная работа может быть начата непосред- ственно, сразу после принятия решения о проведении комплекса работ. Первая операция, которую мы проведем со структурной табли- цей, называется упорядочением. При упорядочении работам придается некоторая новая, более удобная нумерация (каждая работа может опираться только на работы с меньшими порядковыми номе- рами). 518
Для упорядочения все работы подразделяются на ранги. Ра- бота называется работой первого ранга, если для ее начала не требуется выполнения никаких других работ. В табл. 1.1, как мы ви- дим, имеются четыре работы первого ранга: а3, а3 и ав. Работа назы- вается работой второго ранга, если она опирается на одну или не- сколько работ первого ранга. Работа называется работой k-ro ран- га, если она опирается на одну или несколько работ не выше (k—1)-го ранга, среди которых есть хотя бы одна работа (k — 1)-го ранга. После того как произведено распределение работ по рангам, рабо- там приписываются новые номера, начиная с работ первого ранга, затем второго, третьего и т. д. Внутри каждого ранга работы нуме- руются в произвольном порядке. Для примера произведем упорядочение работ, помещенных в табл. 1.1 (см. табл. 1.2). В двух первых столбцах табл. 1.2 приведены: номер и обозначения работы в прежней нумерации, в двух последних— ранг работы и ее новое обозначение в упорядоченной структурной таблице. После того как упорядочение работ по рангам произведено, можно составить новую, упорядоченную таблицу, где работы помещены в по- рядке их новых номеров (табл. 1.3). Нетрудно видеть, что в новой, упорядоченной структурной табл. 1.3 каждая из работ опирается только на работы с меньшими по- рядковыми номерами. В дальнейшем, приводя структурные таблицы различных компек- сов работ, мы будем с самого начала считать их упорядоченными, а для работ сохраним первоначально взятые обозначения: аъ а2, ... 2. СЕТЕВОЙ ГРАФИК КОМПЛЕКСА РАБОТ. ВРЕМЕННОЙ СЕТЕВОЙ ГРАФИК Предположим, что нам задана упорядоченная структурная табли- ца комплекса работ, например, табл. 2.1. Таблица 2.1 Работа Опирается на работу '1 а2 а., а2 <ъ> «с а7 а8 а9 а10 Я], а2 аг, а- U4 а'о » Я6 а3 ’ а6 а7 а5 » а8 Связи между работами, входящими в этот комплекс, можно изо- бразить графически, в виде как называемого сетевого графи- 519
к а (или графа). Этот график можно строить по-разному. Чаще всего изображают работы, входящие в комплекс, стрелками, а события, со- стоящие в выполнении каких-то работ и возможности начать новые работы — кружками или «узлами». Для примера изобразим в виде сетевого графика структуру табл. 2.1 (рис. 10.1). Узлы будем обозначать Ао. А1г А2, •••> работы аъ а2, ... Исходный узел всего комплекса работ обозначим Ао и будем по- нимать под ним «начало работ» или «принятие решения о начале ра- бот». Из этого узла исходят стрелки аъ а2, а3, изображающие соответ- ствующие работы и идущие соответственно в узлы AJt Аг, А3. Сов- местное выполнение работ alt а2 мы будем изображать допбйнительным узлом Л1,2, в который ведут пунктирные стрелки, не изображающие никаких работ, а означающие только логическую связь. Из узла А1>2 исходит стрелка ait изображающая работу а4, опирающуюся на рабо- ты аъ а2; в конце стрелки стоит узел Л4, означающий выполнение рабо- ты а4, и т. д. Завершающий узел А означает конец всего комплекса работ. На графе опущены связи, логически вытекающие из других; например, работа а3 в табл. 2.1 опирается на работы а3, аъ, ав; на гра- фе она показана опирающейся только на а5, ап, так как сама работа а5 опирается на а3 и без ее выполнения не может быть начата. Как уже было сказано, существуют разные формы сетевых графи- ков (см., например, [17]). В одних стрелками графа обозначаются ра- боты, а узлами — события, состоящие в выполнении одной или не- скольких работ; в других — узлами обозначаются работы, а стрел- ками — логические связи между ними. Структурную табл. 2.1 можно изобразить графически и по этому, второму способу (см. рис. 10.2). На этом рисунке жирной линией обведены кружки Og, аю, изображающие последние работы комплекса, на которые не опираются уже никакие дальнейшие работы. Каждый из способов построения сетевого графика имеет свои пре- имущества и свои недостатки. Преимуществом второго способа являет- ся то, что в него легко вносить новые, ранее не указанные связи, ко- торые обнаруживаются в ходе выполнения работ. Преимуществом пер- вого, на взгляд более сложного, способа является то, что он может быть сравнительно просто приспособлен к учету времени выполнения 520 отдельных работ и комплекса в целом. Поэтому мы будем пользоваться первым способом. Таблица 2.2 № п/п Работа а/ Опирается на работы Время tf 1 10 2 а2 — 5 3 а3 — 15 4 ai, а2 18 5 as ^2» 19 6 ав «4 18 7 а. 8 8 а8 25 9 аЙ а7 30 10 аю а8 8 Предположим, что нам задана структурная таблица комплекса работ, в которой проставлены времена выполнения каждой работы: t2, ... Эти значения времен выполнения отдельных работ мы пред- полагаем не случайными, а известными заранее. Получится таблица вида табл. 2.2, в которой структурные связи — те же, что в табл. 2.1 и на графиках рис. 10.1, 10.2 (устранены только «лишние» связи), но в правом столбце указаны времена выполнения отдельных работ, вы- раженные в любых единицах времени (часы, недели, месяцы). Такую таблицу мы будем называть структурно-временной. Временною структуру комплекса работ, вместе с логической струк- турой, можно изобразить на одном и том же графике, который мы будем называть временным сетевым графиком. Мы будем его строить следующим образом. График ориентируется вдоль оси време- ни 07, на которой в каком-то масштабе откладываются времена выпол- нения работ. Как и на графике рис. 10.1, стрелками изображаются ра- боты, но длина каждой стрелки не произвольна, а такова, что ее про- екция на ось абсцисс 0/ равна времени выполнения данной работы. Ло- гические связи между работами по-прежнему обозначаются пунктир- ными стрелками, не означающими никакой реальной работы (иногда их толкуют как «фиктивные» работы). Начальный узел Ло по-прежне- 17 з«к. вуз 521
му изображает начало комплекса работ; кроме него, вводится конеч- ный узел А, изображающий окончание комплекса (это точка графика с наибольшей абсциссой). Временной сетевой график для комплекса работ, заданного в табл. 2.2, показан на рис. 10.3. При построении временнбго сетевого графика расположение узлов по вертикали (по оси ординат) берется произвольным, абсцисса же каждого узла равна времени окончания соответствующей работы. Длина каждой стрелки считается от центра до центра кружка. Проследим, как строится временной сетевой график на рис. 10.3. Начинаем его с узла Ао, помещенного в начале координат. Из этого узла исходят три стрелки: аъ а2, и а3, проекции которых на ось 0t равны временам выполнения соответствующих работ: — 10, 12 = 5 и /3 = 15. Работа о4 опирается на работы аг и а2; из них работа а2 кон- чается в момент t2 — 5, а работа аг — в момент — 10; значит, рабо- та о4 может начаться не раньше, чем в момент 1г = 10, когда окончена аг. Начнем стрелку а4 из узла Аъ а узел А2 соединим с AL пунктирной стрелкой. Проекция стрелки а4 равна ti = 18, следовательно, абсцис- са узла А4, в котором эта стрелка кончается, должна быть Ti = tiJr + = 10 + 18 = 28. Стрелка а5, опирающаяся на а2 и а3, должна начаться в узле А3, имеющем наибольшую абсциссу из t2 — 5 и t3 = 15; узел А2 соеди- няем с А3 пунктирной стрелкой. Узел А5, которым заканчивается стрелка а*» имеет абсциссу Т& = t3 4* t-a — 15 4* 19 = 34. Стрелка ов начинается в узле А4 и кончается в узле А6 с абсцис- сой Тв — 4~ te = 28 4- 18 = 46. Стрелка о,, опирающаяся на о5, йв, должна начинаться от узла Ав, имеющего, по сравнению с А51 боль- шую абсциссу; из А5 в Ав направляем пунктирную стрелку. Стрелка о, кончается в узле А, с абсциссой Т-, — 46 4* 8 = 54. Стрелка а8 на- чинается в том же узле Ав с абсциссой Тв = 46 и кончается в узле А8 с абсциссой Т8 = 46 4- 25 = 71. Стрелка Оэ с проекцией t9 = 30 начи- нается в узле А7 и кончается в узле А9 с абсциссой Т3 — 54 4~ 30 = = 84. Стрелка о10, опирающаяся на Og, начинается в узле А8 и кон- чается в узле А1о с абсциссой 710 = 71 4* 8 = 79. 622
Так как работа ад завершается последней, то узел Ад — А озна- чает окончание всего комплекса работ; отметим этот узел жирным круж- ком и соединим с ним пунктирной стрелкой узел Л](| — окончание пре- дыдущей работы а10, на которую, кроме конца работ, ничто не опи- рается. Таким образом, временной сетевой график комплекса работ по- строен. Время Т = 84 от начального узла Ао до завершающего А = Ай представляет собой минимальное время, за которое может быть завершен комплекс работ. Обратим внимание на следующее обстоятельство: время Т пред- ставляет собой сумму времен исполнения не всех работ, а только не- которых из них: Т = ty + + t3 + tf + lg = 10 4~ 18 + 18 4- 8 30 = 84. Работы аъ ait a6, cig, из длительностей которых составлено вре- мя Т, называются критическими работами, а цепочка соответствующих им стрелок на сетевом графике — критичес- ким путем. На рис. 10.3 критический путь показан двойными стрелками. Особенность критических работ состоит в следующем: для того чтобы было соблюдено минимальное время выполнения комплекса, каждая из них должна начинаться точно в момент, когда закончена последняя из работ, на которые она опирается, и продолжаться не более того времени, которое ей отведено по плану; малейшее запозда- ние в выполнении каждой из критических работ приводит к соответ- ствующей задержке выполнения плана в целом. Таким образом, кри- тический путь на сетевом графике — это совокупность наиболее уязви- мых, «слабых мест» плана, которые должны укладываться во времен- ной план с наибольшей четкостью. Что касается остальных, «некрити- ческих» работ (в нашем случае это а2, а3, а5, а8, а10), то с ними дело об- стоит не так плохо: каждая из этих работ имеет известные временные резервы и может быть закончена с некоторым опозданием без того, чтобы это отразилось на сроке выполнения комплекса в целом. Резервы, соответствующие некритическим работам, легко могут быть определены по сетевому графику. Назовем «некритической дугой» совокупность некритических ра- бот и узлов, начинающуюся и кончающуюся на критическом пути (принимая во внимание и пунктирные стрелки). На рис. 10.3 имеются четыре некритических дуги: Л() й2 Ад Al, Ао — Оз — А3 — а5 — А5 — Ав, Ло — й2 Ад А3 • а3 — А3 — Ав, •^в — °в — Аа — а10 — Л10 — Ад. На первой из этих дуг лежит одна некритическая работа а2; на второй — две некритические работы а3, а3, на третьей — две некри- тические работы а2, а3, на четвертой — две некритические работы «8, Яю- 17* 523
Каждой некритической дуге соответствует определенный времен- ной резерв, который может быть произвольным образом распределен между некритическими работами, лежащими на данной дуге. Этот ре- зерв равен разности между суммой времен критических работ, лежа- щих на критическом пути, замыкающем дугу, и некритических, лежа- щих на самой дуге. Например, на дуге Ао — а2— А2— Л] лежит только одна не- критическая работа а2; на замыкающем ее отрезке критического пути Ло — ai — Аг — одна критическая работа резерв времени, прихо- дящийся на работу а2, равен R2 = — t2 — 10 — 5 = 5. Следователь- но, выполнение работы а2 может быть, без ущерба для общего срока, задержано на 5 единиц времени. На второй некритической дуге Ло — аа— Аа—аа — Л5 — Ав лежат две некритические работы aa, а5; на замыкающем участке крити- ческого пути — три критические работы alt ait ав. Значит, общий ре- зерв времени, приходящийся на работы а3, а-а, равен: Яз.Б = 4 4* /4 + k - V» + t6) = 10 + 18 + 18 - (15 + 19) = = 12. Его можно любым образом распределить между работами аа, а5. На третьей некритической дуге резерв равен: Rz,5 = 4 + tt 4* ta — (t2 4* /6) = 10 4* 18 4* 18 — (5 + 19) = 22. Так как нам уже известно, что с работой а2 мы можем запоздать не более чем на 5 единиц времени, а с работой — не более чем иа 12, то требование, чтобы сумма опозданий была не более 22, не говорит нам ничего нового. На четвертой некритической дуге имеется резерв Ri, ю = tq 4* 4 — (ta 4- /10) = 8 4* 30—(25 4* 8) = 5, который может быть произвольно распределен между работами Og, а10. Знание критического пути на сетевом графике полезно в двух отношениях: во-первых, оно позволяет выделить из всего комплекса работ совокупность наиболее «угрожаемых», непрерывно наблюдать за ними, и, в случае надобности, форсировать их выполнение; во-вто- рых, оно дает возможность в принципе ускорить выполнение комплек- са работ за счет привлечения резервов, скрытых в некритических рабо- тах, если удается за счет их «безвредного» замедления перебросить часть сил и средств на более важные, критические работы. Заметим, что на сетевом графике вообще может быть не один кри- тический путь, а два или более; естественно, сумма времен критических работ на каждом из них должна быть одна и та же. Пример. Построить временной график для комплекса работ, данного в структурно-временной табл. 2.3. Найти на нем критический путь (или пути, если их несколько) и определить резервы времени на некритических дугах Решение. Сетевой график комплекса дан на рис. 10.4 Критический путь обозначен двойными стрелками и состоит из работ: О1, ^5» #7> 524
Таблица 2.3 № п/п Работа at Опирается на работы Время ti 1 “1 20 2 “2 15 3 “з 10 4 “4 — 20 5 “.5 в1> а2, а3 10 6 “в “з> а4 10 7 “? ai> “в 20 8 dg а6, ав 15 9 “9 а7> а8 10 10 “10 , Дд 10 11 “11 “»> “10 10 12 “12 а9» а10 20 Однако можно построить и другой критический путь, состоящий, напри- мер, из работ “а> “о> “?> Ojo, Oj2; при этом время Т окончания комплекса работ по обоим критическим путям будет одно и то же: Т = tj + 4 + t7 + k + Ga “ 20 + Ю + 20 + 10 + 20 = 80, T = «4 + 4 + t7 + ll0 + 112 = 20 + 10 + 20 + 10 + 20 = 80. Кроме этих двух на графике (рис 10.4) могут быть обнаружены еще неко- торые критические пути; предоставляем читателю найти их самостоятельно. Выделяем на сетевом графике (рис. 10.4) четыре некритические дуги: Л© —— 02 — А 2 —- А7, Ав — а3 — А 3 — Л1, А3 ~• Оц ~ А3 — А7, Ло — “и — Ли — Л12. 525
На каждой из этих дуг имеется по одной некритической работе: аг, а3, ай и аг1. Резервы времени для ннх равны соответственно: = G G = 5; R 3 ~ G 1=3 R* 3=3 ti — — 5; /?ц = t^3 — а = 10. •Некритическая дуга Ло — а3 — Л3—Л4 в наших условиях не дает новых данных о резервах времени. 3. ФОРМАЛЬНАЯ ЗАПИСЬ (АЛГОРИТМ) ЗАДАЧИ СЕТЕВОГО ПЛАНИРОВАНИЯ Описанный выше графический способ построения и анализа пла- на работ пригоден только в случае, когда планируемый комплекс не слишком сложен (по количеству работ и логических связей). На прак- тике часто встречаются комплексы работ, состоящие из огромного числа звеньев (порядка тысяч и более), сложным образом опирающихся друг на друга. Естественно, что в таких случаях вычерчивание сетевого ррафика вручную — тяжелое и неблагодарное занятие, так как основ- ное преимущество сетевого графика — его наглядность — при этом теряется. Для анализа и усовершенствования плана работ в таких слу- чаях обычно привлекают ЭЦВМ. Для того чтобы машина была способна произвести соответствую- щие действия, необходимо полностью формализовать процедуру по- строения сетевого графика, выразить ее в виде четкой последователь- ности действий или алгоритма. Опишем один из возможных алгоритмов, которые могут быть при- менены для этой цели. Прежде всего, выполняется упорядоче- ние структурной таблицы (см. § 2), для чего работы разделяются на ранги, по признаку числа и рангов работ, на которые они опираются. Это — сравнительно простая задача, и на ней мы останавливаться не будем. Предположим, что упорядочение комплекса работ выполнено, и структурно-временнйя таблица представлена, например, в виде табл. 3.1. Таблица 3.1 № п/п Работа а/ Опирается на работы Время t[ 1 2 3 4 5 6 7 8 9 10 “1 а3 “з а4 “б ав «7 “8 “9 а10 41, а2 aj} азу а2, а3 at ait а3 а3 а9, а9 G G G it G te h t» Go Запишем в виде математических формул систему связей, отражен- ную в структурно-временной таблице комплекса. Для этого обозначим 526
Т; — минимально возможный срок начала работы at (время отсчиты- вается от начала процесса), a Tt — минимально возможный срок ее окончания. Очевидно (3.1) где tt — время выполнения работы at. Пользуясь этими обозначениями, можно записать формулами все логические связи между работами комплекса. Действительно, пусть, например, работа at опирается на работы ajt а[г ak. Тогда работа аг не может начаться раньше, чем кончится та из работ ajt at, ак, которая кончается позже всех. Эту связь мы запишем в виде формулы тг=тах{Т„Тг,7\}. (3.2) Применяя такие формулы ко всем работам комплекса по очереди, мы найдем все моменты окончания работ и, в конце концов, мини- мальный срок окончания всего комплекса работ Т. Продемонстрируем, как это делается на материале табл. 3.1. Вы- числим величины т; и Тг для всех работ комплекса. Для работ первого ранга alf а2, а3 имеем: т4 = 0; 7\=G; т2=0; Г2=^; т3 =0; Т3 = /3. Работа а4 опирается на работы аъ она может начаться в момент т4, когда окончится наиболее поздно кончающаяся из работ alt а2: т4 = тах [7\, Т2}. (3.3) Момент окончания работы at: = + (3.4) Аналогично, для работ а5, ав и т. д.: . T6s=max{7\, Ts, TJ; =Т5 +^5>‘ тв=тах (Т2, Т3); Т'в = тв +^в! т7 = тах{Г4} = Т\, Т~ — Т- -р /г Т1 (3.5) т8 —max (Г4, Тв); Т’з =Т8 +^8‘> т9=тах {Т4, Т5, Тв}; = Т9 "Ь ^9> г10=тах {Т8, Т8}; Ло — т40 4- 587
Таким образом, найдены моменты начала тг и окончания 7\ всех работ комплекса. Естественно, что время окончания всего комплекса равно максимальному из всех времен окончания: Т = тах{Т1, Т2....Т10}. (3.6) Чтобы найти критические работы (а стало быть, и критический путь), нужно сделать следующее; прежде всего найти работу а£, для которой время окончания Т£ = Т максимально; эта работа, конечно, будет критической. Затем найти среди формул (3.5) ту, которой опре- деляется момент начала этой работы т£. Величина т£ представлена в виде максимума каких-то моментов Тj, Т\, Tt, ...; нужно найти тот из них, на котором достигается максимум (если таких моментов не- сколько, взять любой из них). Та работа ат, при которой достигается этот максимум, будет второй от конца работой на критическом пути. Далее точно так же определяется третья и т. д. работы на критичес- ком пути. Таким образом, критической будет работа с самым поздним сроком окончания и все работы, на времени окончания которых дости- гается максимум в выражении, определяющем срок начала очередной критической работы. Конечно, максимум в каких-нибудь из формул (3.5) может достигаться не на одной, а на нескольких работах; соот- ветственно на каждом шагу мы можем получить не один, а несколько критических путей. Продемонстрируем алгоритм построения критического пути на материале той же структурно-временной табл. 3.1. Для этого, очевидно, надо задаться в этой таблице конкретными значениями времен /£ (табл. 3.2). Таблица 3.2 № п/п Работа at Опирается на работы Время t£ 1 “1 — 15 2 — 12 3 —• 20 4 «4 alt а2 10 5 «5 °1. аз> а4 15 6 ав а2> а3 18 7 а. “4 40 8 “8 а4> а5 8 9 а4, а8, ав 23 10 а10 а, , а9 11 1 Имеем: 7, = 15; Т2=12; Г, = 20; т4 = тах{Т1, Т2} =тах {15, 12} = 15. Т4 =т4+ /4 = 15+10 = 25; т5 = тах (Т1( Т3, Т4}=тах {15, 20, 25} = 25. Т5 = т5 + /6 = 25 15 = 40; тв = гпах {Г2, Т3}=гпах{12, 20} =20. (3.7) (3.8) (3 9) 528
7 в = т9 + Iq — 20 + 18=38; т, = тах {T4} =Т4 = 25. (3.10) T7 = t, + t7 = 25 + 40 = 65; T8 = max{T4, 75}=max{25, 40)=40. (3.11) 7\ = t8 4- /8 = 40 + 8 = 48; T9 = max {T4, T5, Te}=max{25, 40 , 38} =40. (3.12) T9 = t9+19 = 40 + 23 = 63; TJ0 = max {Ts, T9}=max (48, 63}=63. (3.13) T io = T49+ t jo = 63 + 11 = 74. Время выполнения всего комплекса работ есть максимальное из всех вре- мен Т{, т. е. Т10 = 74: 7’=тах{71, Г2,.. ,Г19} =74. (3.14) Найдем критические работы, начиная с последней Так как максимум в фор- муле (3 14) достигается для Тм, данная работа а1п является критической. Она опирается на работы а8 и а$ Какая же из них является критической? Очевидно, а$, так как максимум в формуле (3 13) приходится на Т9. Переходим к формуле (3 12) — в ней максимум приходится на Тъ, значит, работа а5 — критическая. Далее, аналогичным способом, просматривая максимумы в формулах (3.11) — (3.7), находим одну за другой все критические работы. Перечисленные в естест- венном порядке, они будут: а4, а3, а4, а5, а^, а10 Таким образом, критический путь найден чисто формальным способом, без построения сетевого графика В табл 3.2 подчеркнуты все критические ра- боты. Совершенно аналогичным формальным способом могут быть определены и некритические дуги, и соответствующие им резервы 4. ОПТИМИЗАЦИЯ ПЛАНА КОМПЛЕКСА РАБОТ Мы уже говорили о том, что сетевой график (или заменяющий его формальный алгоритм анализа комплекса работ) может быть исполь- зован для улучшения (оптимизации) плана. Это улучшение может производиться с различными целями. На- пример, может оказаться, что общее время выполнения комплекса ра- бот Т нас не устраивает; возникает вопрос о том, как нужно форсиро- вать работы для того, чтобы общее время не превосходило заданного срока То- Очевидно, для этого имеет смысл форсировать именно кри- тические работы, снижение длительности которых непосредственно ска- жется на времени Т. Однако при этом может оказаться, что критичес- кий путь изменится, и наиболее слабыми местами по времени окажутся какие-то другие работы. Естественно предположить, что форсирова- ние работ дается не даром, а требует вложения каких-то средств.- Воз- никает типичная задача исследования операций: какие дополнитель- ные средства и в какие работы следует вложить, чтобы общий срок выполнения комплекса работ был не больше заданной величины То, а расход дополнительных средств был минимальным? Другая задача оптимизации относится к перераспределению уже имеющихся средств между отдельными работами. Выше мы убедились, что все работы, кроме критических, имеют какие-то временные резер- вы. В некоторых случаях оказывается возможным, перебросив силы 629
и средства с некритических участков плана на критические, добиться уменьшения суммарного времени выполнения плана. Снова возникает типичная задача исследования операций: какие силы и средства надо перебросить с одних работ на другие для того, чтобы время выполне- ния комплекса работ стало минимальным? Наконец, возможна еще одна постановка задачи оптимизации плана. После построения сетевого графика нам стало известно, что ми- нимальное время выполнения всего комплекса работ укладывается в заданный срок с избытком: Т<Т0, т. е. у нас есть известный резерв времени, которым мы вправе распоря- жаться, несколько растянув работы (но, разумеется, так, чтобы не выйти за заданный срок То). Растянув работы, мы можем сэкономить некоторые средства. Возникает вопрос: до каких пределов можно уве- личивать времена выполнения работ и каких работ, чтобы полученная от этого экономия средств была максимальной? В такой постановке мо- жет ставиться задача оптимизации необязательно всего плана, а может быть, отдельных некритических дуг, на которых выявлены временные резервы. Дадим постановку каждой из этих задач оптимизации в формуль- ной записи. Для простоты будем предполагать, что критический путь — один (если это не так, очевидно, всегда можно, внося во времена выпол- нения работ е-изменения, сделать критический путь единственным, подобно тому, как мы поступали в вырожденных задачах линейного программирования). Задача 1. Комплекс состоит из работ alt а2, ..., ап с временами вы- полнения /2, ..., /п; известен критический путь, причем время вы- полнения комплекса равно Т = ^>Т0, (4.1) (Кр) где суммирование распространяется только на критические работы. Заданный срок выполнения комплекса работ равен То. Известно, что вложение определенной суммы х дополнительных средств в работу аг сокращает время выполнения с /г до ti — ft(x) < /г. Спрашивается, какие дополнительные средства хъ х2, хп сле- дует вложить в каждую из работ, чтобы: —• срок выполнения комплекса был не выше заданного То, — сумма вложенных средств достигала минимума. Таким образом, нам требуется определить неотрицательные зна- чения переменных х1г х2, хп (дополнительные вложения) так, чтобы выполнялось условие (4.2) (кр) где суммирование распространяется по всем критическим работам нового критического пути (полученного после перераспределения 680
средств и изменения времен), и чтобы при этом общая сумма дополни тельных вложений была минимальна: п х== 2 *г = ппп. (4.3) i= । Поставленная задача напоминает задачу линейного программиро- вания, потому что в ней при некоторых ограничениях-неравенствах требуется минимизировать линейную функцию (4.3) от элементов решения. Однако в общем случае входящие в ограничения (4.2) функ- ции /г(хг) нелинейны, так как вложение каких-то средств в работу at не обязательно вызывает линейное уменьшение времени, затрачивае- мого на эту работу. Поэтому в общем виде поставленная задача от- носится к классу задач нелинейного программиро- вания, которые гораздо сложнее линейных задач и общие способы решения которых не разработаны. Такими нелинейными задачами мы здесь заниматься не будем, отсылая интересующихся к специальным руководствам (12, 28]). Однако, если ограничиться сравнительно не- большими изменениями плана (такими,"при которых время выпол- нения работ приблизительно линейно зависит от вложенных дополни- тельных средств, а критический путь не меняется), поставленная зада- ча становится задачей линейного программирования и может быть решена уже известными нам способами (см. гл. 2). Пример 1. Имеется комплекс работ а2, ..., Og, параметры которого даны в структурно-временнбй табл. 4.1. Таблица 4.1 № п/п Работа at- Опирается иа работы Время // 1 ах ___ 20 2 а2 —- 10 3 а3 — 8 4 а1 * а2 20 5 а1> а2> а3 10 6 “в а1> а2> а3 5 7 а, ав 5 8 а8 , а1 10 Сетевой график комплекса работ дан на рис. 10.5. Завершение работы — узел А — Л8; критический путь состоит из работ аъ at, as. Время окончания ком- плекса: Т = t, + tt + ts « 50. Это время должно быть уменьшено до То = 40; для этого нам понадобится форсировать некоторые критические работы. Известно, что в работу а; можно вложить средства х, в размере не более, чем С/, при эюм время выполнения работы уменьшается согласно линейной зависимости: = btx). (4.4) 531
Для критических работ сц, а4, 0g параметры bt, Ot равны! Ьг—0,‘2, Ci = 2, (>4 = 0,3, С 4 = 2, 68==0,1, ся==5. (4.5) Требуется определить вложения xlr xt, хй так, чтобы срок выполнения ком- плекса был не больше Г>, = 40, а сумма вложений достигала минимума! xi +*4-l-X8 = min. Решение. Условия (4 4) и (4.5) дают: 2—Х]>0; 2—х4>0; 5—хя>0. (4.6) Новый срок выполнения работ (при условии, что критический путь не из- менится) Т' — (] 4- 1ц' 4- tg' = (1 —0,2x4) + (4(1 — 0,Зх4)-|-/я(1 — 0,1хя) = = 20 (1—0,2x4)4-20 (1 —0,3x4)4-10 (1 —0,1ха) =50—4x4 —6х4 —х8. Эта величина не должна превосходить То = 4О1 50—4х4—6х4 —х8 < 40, откуда 4Х4 4-6Х4 4-ХД > 10. (4.7) Поставим задачу линейного программирования: найти неотрицательные значения переменных х1э х,, х8, удовлетворяющие условиям-неравенствам (4.6), (4.7) л обращающие в минимум линейную функцию L=Xi 4-х44-хя. (4.8) Решаем задачу согласно общим правилам симплекс-метода (см. гл. 2). Введением дополнительных переменных ylt у2, у3, yt условия-неравенства 532
Таблица ‘t.Z Свободный член Х4 ^8 L 0 -1 -1 -1 Ух 2 1 0 0 У2 2 0 1 0 Уз 5 0 0 1 Уз -10 -4 -6 -1 Таблица ‘t.S у4 — Свободный член 7?! Х4 Х9 Ух 2 0 1 О' ° 1 1 0 0 0 Уг ю со|сл 0 2 3 1 1 1 6 -|<о О Уз 5 0 0 0 ° 1 1 0 1 0 Уз -10 1 3 -4 2 3 О 1 6 -1 1 6 Таблица Ч.Ч Свободный член Т, Уз Х9 L 5. 3 1 3 _2 6 _5 6 У1 2 1 0 0 «/2 1 3 2 3 2 6 _2 6 Уз 5 0 0 1 х4 5. 3 2 3 _2 6 1 6 633
(4.6), (4.7) преобразуются в равенства: ^ = 2—«!, у2 = 2—х4, 1/3 = 5—х8, </4=4х1+6х4+х8—10. Составляем симплекс-таблицу (табл 4.2). Полагая свободные переменные равными нулю: х, = х4 = xs = 0, получим недопустимое решение, в котором yt = —10, поэтому опорное решение ОЗЛП требуется еще найти. Поступаем согласно общему правилу нахождения опорного решения ОЗЛП (см. § 7 гл 2) Отбрасывая временно строку L (при нахождении опорного решения она не нужна) и выбирая в качестве разрешающего элемента элемент —6 в последней строке, получим симплекс-таблицу (табл. 4.3). Продолжая действия, приходим к опорному решению, записанному в табл. 4.4. В табл. 4.4 все свободные члены уже положительны, значит, опорное ре- шение найдено. В строке L табл. 4.4 помещена (в стандартном виде) линейная функция L, выраженная через новые свободные переменные хг, у4, х8: L=xj + х4+Xg=Xf + 6/з—2/з xt + Че р4 — Чб xs+хя= = %+1/з-Ч + 1/в(/4+%Х8 = 6/з*-(—Vs-tl —Чв Все коэффициенты в верхней строке табл. 4.4 отрицательны; следователь- но, увеличение каждой из свободных переменных может только увеличить функ- цию L. Значит, оптимальное решение найдено: Xi = Уь = xs = 0, Ух — 2, у2 — 1/3, у3 “5, х4 = 5/3. При этих значениях переменных сумма вложений достигает минимума' L — =5/3. Таким образом, оптимальным решением по вложению средств является следующее: вложить сумму х4 = 5/3 в работу а4; в работы а4 и а8 не вкладывать средств. При этом срок Г выполнения работ будет: T' = /i+//+/8 = 20 + 20(1—0,3-5/3) +10 = 20+ 10+10 = 40= Го. Проверим, сохранится ли при таком решении критический путь? Из рис. 10.5 видно, что сокращение /4 с 20 до 10 еще не меняет критичес- кого пути, но находится уже на самой границе того сокращения, при котором критический путь меняется. Возникает естественный вопрос: а как быть, если при вложении средств в какие-то работы критический путь изменится? Оказывается, в этом случае задачу оптимизации также можно свести к задаче ли- нейного программирования, но к другой — уже более сложной, с боль- шим числом переменных. Покажем, как это делается, на том же при- мере, но в буквенном виде, не доводя до численных результатов. В качестве переменных введем средства xlt ..., х8, вкладываемые в работы flj...ag,; моменты т4, ..., г8 начала работ а4, ..., а8 (моменты т1( т2> тз равны 0) и моменты Ть Т2, ..., Т8 окончания всех работ. Структурная таблица дает нам следующие ограничения-неравенства: x4^Ti, х4^-Т2", Т5 ^1> ТЬ ^21 Т5 2^ 534
т8 Т6 > ^2> т? 2^ ^в> Т8 ^6> тв =5' Тз", Т8 Л- Условия зависимости времени выполнения работы от вложенных средств дадут нам ограничения-равенства: T^ti—tibiXi + Xi (t=l, 8) (напомним, что здесь tt и bt — постоянные). Далее, сохраняются ус- ловия-неравенства xt < cit (i=l,...» 8). Наконец, условие выполнения всего комплекса работ в срок обратится в ограничения-неравенства из которых, в силу особенностей данной конкретной структурной табли- цы, можно оставить лишь последнее: Та То. При всех этих условиях нужно минимизировать линейную функцию L = Xj +... +х8. Итак, задача свелась к задаче линейного программирования с 21 переменной, с 8 ограничениями-неравенствами и 21 ограничением-нера- венством; введением дополнительных переменных ее можно свести к ОЗЛП с 42 переменными и 29 ограничениями-равенствами. Конечно задача с семью переменными и четырьмя ограничениями-равенствами во много раз проще; так что в таких случаях разумно сначала прове- рить, не сохранится ли критический путь прежним, как это было при числовых значениях tlt bt ct, рассмотренных в примере 1. Задача 2. Имеется совокупность работ: аъ а2.....ап с временами выполнения tY, t2, ..., tn. Время выполнения комплекса работ выра- жается формулой T = ^tt. (4.9) (кр) На некритических работах имеются некоторые резервы времени; пользуясь этими резервами, т. е. перебрасывая какие-то средства с некритических работ на критические, можно уменьшить времена выполнения критических работ и тем самым время выполнения всего комплекса. Имеется некоторый неизменный запас подвижных средств В, ко- торый распределен между работами аъ а2, ..., ап так, что каждой рабо- те соответствует количество подвижных средств, равное соответственно п bl, ьг, .... 6П; /as 1 535-
Известно, что количество средств х > 0, снятое с работы ait уве- личивает время ее выполнения с /г до а количество средств х, вложенное дополнительно в работу aif умень- шает время ее выполнения до ^' = Фг Спрашивается: как надо перераспределить имеющиеся подвиж- ные средства В между работами для того, чтобы срок выполнения ком- плекса был минимальным? Покажем, как может быть решена подобная задача. Обозначим xt — количество подвижных средств, перебрасывае- мых на работу at (xt отрицательно, если с работы at снимается какое-то количество средств). Величины Х{ должны удовлетворять ограничениям: хг>— bt (i=l, .... п). (4.10) Естественно, что сумма средств, снимаемых с каких-то работ, должна быть равна сумме средств, добавляемых другим работам, так что + х„ = 0. (4.11) После переброски средств для тех работ, на которые они пере- брасываются, новые времена будут равны tt = Ф<(*«), (4.12) для тех же работ, с которых средства снимаются: О' = Ж1)- (4.13> Общий срок выполнения комплекса работ будет: т' = S Фг <xi) х}I), (4.14) (кр) (кр) I I где первая сумма распространяется на все работы, на которые переносятся средства, если они входят в критический путь; вторая — на все работы, с которых переносятся средства, если они входят в критический путь. Естественно, кажется, считать, что перенос средств имеет смысл только с некритических работ на критические; однако не надо забы- вать, что при этом некритические работы могут переходить в крити- ческие,^ наоборот; поэтому в формуле (4.14) в общем случае присутст- вуют обе суммы. Итак, перед нами стоит задача: найти такие значения перемен- ных Xj (t = 1, ...,и), чтобы выполнялись ограничения (4.10), а функ- ция (4.14) обращалась в минимум. Задача представляет собой задачу нелинейного программирова- ния даже в случае, когда функции Д и <р^ (что с некоторой натяжкой можно допустить) линейны. Существенно нелинейным в функции (4.14) является то, что значения г, / — номеров работ, на которые распростра- няется сумма (т. е. критических работ), сами зависят от xt. 686
Как уже говорилось, общих способов решения задач нелинейного программирования не разработано; однако в слдельных случаях можно решать подобного рода задачи, пользуясь сравнительно нехитрыми приемами. В следующем примере мы рассмотрим решение одной из таких задач. Пример 2. Комплекс работ аъ а2, а3 задан структурно-временнбй табл. 4.5 Здесь критическими являются работы at, а8; время выполнения комплекса Т = 30. Некритической является работа а3. На ней имеется запас подвиж- ных средств Ь3 «= 1. Запасы подвижных средств на остальных двух работах отсутствуют. Таблица 4.5 № п/п РаСот< а, Опирается на работы Время 1 “1 __ 20 2 а3 10 3 “з at, а$ 10 Известно, что переброска средств х с работы о3 увеличивает время ее вы- полнения до Запас средств х, переброшенный на работу а1, уменьшает время ее выпол- нения до * 14-х ‘ Запас средств х, переброшенный на работу а3, уменьшает время ее выпол- нения до Ю /З'х=-----. 3 14-4Х Требуется определить, как оптимальным образом перебросить свободные средства с работы а3 на работы а, и а3, чтобы срок выполнения комплекса был минимален. Решение. Обозначим количества средств, перебрасываемые с работы а2 соответственно на Oj и а3, через Xj и х3. Требуется найти такие неотрицательные значения х± и х3, чтобы выполнялись условия: ^i+хз < 1, (4.15) «1')кр+(<г*)кр+(<з')кр=п1!п, (4.1 ) где индекс «кр» означает, что соответствующий член входит в сумму только если он принадлежит критическому пути. Посмотрим, при каких условиях работа а3 войдет в критический путь. Это произойдет, если время ее выполнения станет больше, чем время выполнения работы а^: «Перескок» работы аг на критический путь происходит, когда осуществляется равенство; V=ti 837
или (если с работы о2 сняты все средства) 10 20 1—0,1 “ 14-xt ’ что осуществляется при ху = 0,8. Значит, работа а2 при хг < 0,8 критической не станет: критическими останутся работы ах и а3. Предположим, что это так. и в формуле (4.16) второй член будет равным нулю, а два другие 12 и t3'i Т' — t\‘ -\-t3 = 20 10 14*4Xg Учитывая (4.15), имеем х3=1—хг, и 20 [ 10 14-х, 5—4xi‘ Исследуем эту функцию на максимум; найдем ее производную по хх: dT‘ _ 20 _ 40 _ (5—4хх)220—(1+хх)а40 dxj (1 + хц)2 (5—4хх)2 (1+xj)2 (5—4хх)2 dT Производная обращается в нуль тогда, когда обращается в нуль числи- тель. Решая полученное квадратное уравнение и беря тот корень, который лежит между нулем и единицей, получим хх « 0,66. Нетрудно непосредственно убедиться, что в этой точке достигается мини- мум, а не максимум величины Т. Так как хх •= 0,66 < 0,8, то критический путь сохранится. Итак, в нашем примере наивыгоднейшее перераспределение средств со- стоит в следующем: из имеющегося запаса свободных средств &2 = 1 средства хх=0,66 должны быть перенесены на работу ах, а средства х3=1 —0,66=0,34 — на работу а3. При этом время выполнения комплекса работ принимает мини- мальное значение Т' = 16,29. Времена выполнения отдельных работ ах, а2 и аз будут равны соответственно t,' = 12,05, /2" = 11,11, t3' = 4,24. Задача 3. Имеется комплекс работ аг, а2, ап с временами вы- полнения tlt t2, .... tn. Для этого комплекса найден критический путь и установлено, что минимальное время выполнения комплекса Т < То, где То — заданный срок выполнения. Предполагается снизить темпы выполнения некоторых работ с тем, чтобы срок выполнения комплек- са довести до заданного значения То; за счет этого предполагается получить экономию средств. Увеличение времени выполнения работы аг на т (т. е. доведение времени выполнения работы at до + т) вы- свобождает некоторые средства х{, которые зависят от задержки т: *г = А (т). Требуется определить, насколько следует задержать выполнение каждой работы для того, чтобы срок То был выдержан, а экономия средств получилась максимальная. Обозначим тг время задержки работы at. Сумма времен выполне- ния работ, лежащих на критическом пути, не должна превосходить Т'о-- 638
где сумма, как и ранее, распространяется только на критические рабо- ты. Требуется выбрать такие неотрицательные значения переменных тг, чтобы сумма высвободившихся средств достигала максимума: 2 ft (тг)=тах. I Поставленная задача снова относится к классу задач нелинейно- го программирования. В случае, когда речь идет только о незначитель- ных задержках тг, иногда удается свести ее к задаче линейного про- граммирования (а именно, если функции ft близки к линейным в диа- пазоне возможных значений xit а критический путь при задержках не меняется). 5. СЕТЕВОЕ «ПЛАНИРОВАНИЕ ПРИ СЛУЧАЙНЫХ ВРЕМЕНАХ ВЫПОЛНЕНИЯ РАБОТ. ПРИМЕНЕНИЕ ЭЦВМ До сих пор, рассматривая задачи планирования комплекса работ, мы ограничивались случаем, когда времена выполнения отдельных работ были нам в точности известны заранее (так называемый детерми- нированный случай). На практике это редко бывает так: чаще встре- чаются случаи, когда фактическое время выполнения работы заранее в точности неизвестно (случайно) и может сильно отклоняться от свое- го предсказанного значения. Отклонение случайной величины /г — времени выполнения работы аг — от ее заранее заданного значения может быть, вообще говоря, в обе стороны — как в большую (опоздание), так и в меньшую (опережение), хотя на практике второе встречается гораздо реже первого. Возникают следующие вопросы: — Какова вероятность того, что фактическое время выполнения комплекса работ Т не превзойдет заданной величины То? — Как следует организовать комплекс работ для того, чтобы ве- личина Т не превзошла заданного То с достаточно высокой вероят- ностью? Рассмотрим первый вопрос как более простой (тем более, что для ответа на второй, прежде всего, надо уметь ответить на первый). Пред- положим, что времена выполнения работ t1} ts, tn представляют со- бой случайные величины с известными законами распределения. Пред- положим для простоты, что эти случайные величины независимы, и плотности их равны MO. МО. .... МО- Рассматривается функция этих случайных величин — общее вре- мя .выполнения всего комплекса работ: Г = 20- (5-1) (кр) 539
Поставленная задача будет решена, если удастся найти функцию распределения случайной величины Т: F(t)=P(T<t). Тогда, подставляя в нее вместо t величину То, мы найдем искомую вероятность. Функция (5.1) в общем случае является достаточно сложной, так как сам критический путь случаен и зависит от тех значений, которые принимают случайные величины tt — времена выполнения отдельных работ: при одних значениях tt может быть один критический путь, при других — другой. Однако если ограничиться только сравнитель- но малыми отклонениями случайных величин tt от своих номинальных значений ^0> (настолько малыми, что критический путь остается тем же), то задача сильно упрощается. Тогда в формуле (5.1) фигурируют только несколько вполне определенных случайных величин вре- мен выполнения критических работ. Закон распределения случайной величины Т представляет собой в этом случае не что иное, как ком- позицию законов распределения случайных величин tt, относя- щихся к критическим работам. В дальнейшем нам приходит на помощь сама сложность плана и наличие на критическом пути многих работ. Мы знаем, что при сло- жении достаточно большого числа независимых случайных величин, распределенных по любым законам и сравнимых по порядку диспер- сий, закон распределения суммы оказывается близким к нормальному (центральная предельная теорема). Поэтому, если на критическом пу- ти стоит достаточно большое количество работ (скажем, порядка 5— 6 или более), то на практике можно приближенно считать величину Т распределенной нормально. Ее математическое ожидание будет рав- но (кр) 1 где mti — математическое ожидание времени выполнения t-й работы, а ее среднее квадратическое отклонение: (кр) 1 где oti — среднее квадратическое отклонение времени выполнения t-й работы. Таким образом, в данном случае для нахождения закона распреде- ления времени выполнения комплекса работ нет надобности знать законы распределения ft(i) отдельных времен Zt; достаточно знать их математические ожидания и средние квадратические отклонения. Если эти величины известны, вероятность выполнения комплекса в срок Tf найдется по известной формуле Р(Т<То)=ф(^=^-Но.5, (5.2) где Ф — функция Лапласа (см. приложение, табл. 1). 54U
Пример 1. При выполнении комплекса работ alt а2, .... ап критическими оказываются работы Я], а3, а3, ait а3, ag, времена выполнения которых представляют собой случайные величины + ts> ^5> I» с математическими ожиданиями т^ = 10, /п/г = 20, mt„ = 10, mtt =5, т^=7, тц >=10 и средними квадратическими отклонениями: о, =1, о, =1, о, =0,5. о, =0,3, о, =0,5, о, =1. Случайные отклонения времен выполнения работ от их математических ожида- ний не меняют критического пути. Задан срок выполнения комплекса Гв = 65. Найти вероятность того, что этот срок будет выполнен. Решение. Имеем) ,;г<== 10 + 20 +10 + 5+74-10 = 62, at = V12 +13 + 0,52 +0,За+0,52+ 1а = р%59 «1,9. Вероятность выполнения комплекса работ в срок То = 65: Р (Т < 65) = Ф ( —j +0,5 = Ф (1,58) + 0,5. По табл. 1 приложения находим: Ф(1,58) «0,44, откуда вероятность вы- полнения комплекса в срок Р(Т < 65) ~ 0,94. Если при случайных изменениях времен может меняться и сам критический путь, задача вычисления вероятности Р(Т < То) затруд- няется. При сравнительно малом числе работ в комплексе эта задача может быть решена аналитическим способом, но при большом их числе расчеты становятся чересчур громоздкими, и на практике оказывает- ся удобнее определять эти вероятности методом Монте-Карло на ЭЦВМ (см. гл. 8). При этом разыгрываются значения случайных времен tt и для каждой совокупности полученных значений определяется вре: мя Т выполнения комплекса работ тем способом, который применяется для неслучайных времен. Получив достаточно большое число N таких реализаций, мы можем непосредственно найти математическое ожида- Рис. 10.6 541
ние, дисперсию и среднее квадратическое отклонение случайной вели- чины Т. Что касается закона распределения, то он в большинстве слу- чаев для сложных сетей оказывается близким к нормальному. Поэтому вероятность выполнения плана в срок может быть вычислена по той же формуле (5.1). Если имеются основания считать закон распределе- ния величины Т не нормальным (так, например, бывает, если рассеи- вание времени выполнения какой-нибудь одной из критических ра- бот резко превышает рассеивание остальных), то в качестве прибли- женного значения вероятности Р(Т < То) можно принять частоту это- го события в серии реализаций. Надо заметить, что подобного рода расчеты могут быть только су- губо ориентировочными, так как на практике обычно законы распре- деления ft(t) неизвестны, а получение их по статистическим данным затруднительно. В лучшем случае удается указать для каждого вре- мени tt его наиболее вероятное значение /г*, а также грубо оценить наименьшее («оптимистическое») значение и наибольшее («пес- симистическое») значение /™ax (рис. 10.6). Что касается самого рас- пределения то его приходится задавать достаточно произвольно, исходя из умозрительных соображений. Например, то что кривая на рис. 10.6 им'еет положительную асимметрию (более растянута вправо, чем влево) отражает тот общеизвестный факт, что запаздания по срав нению с плановым сроком могут быть значительно больше, чем опере- жения. В заключение остановимся еще на одном вопросе, связанном с при- менением ЭЦВМ при сетевом планировании. Обычно при выполнении сложных комплексов работ первоначально намеченные планы не вы- полняются, и их приходится по ходу работы пересматривать. При этом чрезвычайно удобно держать все данные о комплексе — как пер- воначальный план, так и поступающую информацию о его нарушении — в памяти ЭЦВМ, которая время от времени заново просматривает план работ, находит для каждого момента времени новый критический путь—«угрожаемые» по срокам работы—и оптимизирует план, ука- зывая, какие именно работы и в какой степени следует форсировать. Плодотворное применение метода сетевого планирования при ор- ганизации сложных комплексов работ возможно только при условии непрерывного контроля плана и его оптимизации с помощью ЭЦВМ.
ПРИЛОЖЕНИЕ Таблица 1 1 (* ~Т Значения функции Лапласа Ф(х) ==-з===г-\ е * у 2л J х Ф(х; X Ф(*) * Ф(Х) 1 Ф(х) х Ф(х) X Ф(х) 0,00 01 02 03 04 05 06 07 08 09 0,10 И 12 13 14 15 16 17 18 19 0,20 21 22 23 24 25 26 27 28 29 0,30 31 32 33 34 35 36 37 38 39 0,40 41 42 43 44 0,0000 0040 0080 0120 0160 0199 0239 0279 0319 0359 0,0398 0438 0478 0517 0557 0596 0636 0675 0714 0753 0,0793 0832 0871 0910 0948 0987 1026 1064 1103 1141 0,1179 1217 1255 1293 1331 1368 1406 1443 1480 1517 0,1554 1591 1628 1664 1700 0,45 46 47 48 49 0,50 51 52 53 54 55 56 57 58 59 0,60 61 62 63 64 65 66 67 68 69 0,70 71 72 73 74 75 76 77 78 79 0,80 81 82 83 84 85 86 87 88 89 0,1736 1772 1808 1844 1879 0,1915 1950 1985 2019 2054 2088 2123 2157 2190 2224 0,2257 2291 2324 2357 2389 2422 2454 2486 2517 2549 0,2580 2611 2642 2673 2703 2734 2764 2794 2823 2852 0,2881 2910 2939 2967 2995 3023 3051 3078 3106 3133 0,90 91 92 93 94 95 96 97 98 99 1,00 01 02 03 04 05 06 07 08 09 1,10 И 12 13 14 15 16 17 18 19 1,20 21 22 23 24 25 26 27 28 29 1,30 31 32 33 34 0,3159 3186 3212 3338 3264 3289 3315 3340 3365 3389 0,3413 3438 3461 3485 3508 3531 3554 3577 3599 3621 0,3643 3665 3686 3708 3729 3746 3770 3790 3810 3830 0,3849 3869 3888 3907 3925 3944 3962 3980 3997 4015 0,4032 4049 4066 4083 4099 1,35 36 37 38 39 1,40 41 42 43 44 45 46 47 48 49 1,50 51 52 53 54 55 56 57 58 59 1,60 61 62 63 64 65 66 67 68 69 1,70 71 72 73 74 75 76 77 78 79 0,4115 4131 4147 4162 4177 0,4192 4207 4222 4236 4251 4265 4279 4292 4306 4319 0,4332 4345 4357 4370 4382 4394 4406 4418 4429 4441 0,4452 4463 4474 4484 4495 4505 4515 4525 4535 4545 0,4554 4564 4573 4582 4591 4599 4608 4616 4625 4633 1,80 81 82 83 84 85 86 87 88 89 1,90 91 92 93 94 95 96 97 98 99 2,00 02 04 06 08 2,10 12 14 16 18 2,20 22 24 26 28 2,30 32 34 36 38 2,40 42 44 46 48 0,4641 4649 4656 4664 4671 4678 4686 4693 4699 4706 0,4713 4719 4726 4732 4738 4744 4750 4756 4761 4767 0,4772 4783 4793 4803 4812 0,4821 4830 4838 4846 4854 0,4861 4868 4875 4881 4887 0,4893 4898 4904 4909 4913 0,4918 4922 4927 4931 4934 2,50 52 54 56 58 2,60 62 64 66 68 2,70 72 74 76 78 2,80 82 84 86 88 2,90 92 94 96 98 3,00 3,10 3,20 3,30 3,40 3,50 3,60 3,70 3,80 3,90 4,00 4,50 5,00 0,4938 4941 4945 4948 4951 0,4953 4956 4959 4961 4963 0,4965 4967 4969 4971 4973 0,4974 4976 4977 4979 4980 0,4981 4982 4984 4985 4986 0,49865 49903 49931 49952 49966 49977 49984 49989 49993 49995 0,499968 499997 0,49999997 543
Таблица 3 Значения Рт = ~^е а (распределение Пуассона а т х^ 0,1 0,2 0,3 0.4 0,5 0,6 0.7 0,8 0,9 0 0,9048 0,8187 0,7408 0,6703 0,6065 0,5488 0,4966 0,4493 0,4066 1 0,0905 0,1638 0,2222 0,2681 0,3033 0,3293 0,3476 0,3595 0,3659 2 0,0045 0,0164 0,0333 0,0536 0,0758 0,0988 0,1217 0,1438 0,1647 3 0,0002 0,0019 0,0033 0,0072 0,0126 0,0198 0,0284 0,0383 0,0494 4 5 6 0,0001 0,0002 0,0007 0,0001 0,0016 0,0002 0,0030 0,0004 0,0050 0,0007 0,0001 0,0077 0,0012 0,0002 0,0111 0,0020 0,0003 Продолжение х. а т х^ 1 2 3 4 5 6 7 8 9 10 0 0,3679 0,1353 0,0498 0,0183 0,0067 0,0025 0,0009 0,0003 0,0001 0,0000 1 0,3679 0,2707 0,1494 0,0733 0,0337 0,0149 0,0064 0,0027 0,0011 0,0005 2 0,1389 0,2707 0,2240 0,1465 0,0842 0,0446 0,0223 0,0107 0,0050 0,0023 3 0,0613 0,1804 0,2240 0,1954 0,1404 0,0892 0,0521 0,0286 0,0150 0,0076 4 0,0153 0,0902 0,1680 0,1954 0,1755 0,1339 0,0912 0,0572 0,0337 0,0189 5 0,0031 0,0361 0,1008 0,1563 0,1755 0,1606 0,1277 0,0916 0,0607 0,0378 6 0,0005 0,0120 0,0504 0,1042 0,1462 0,1606 0,1490 0,1221 0,0911 0,0631 7 0,0001 0,0037 0,0216 0,0595 0,1044 0,1377 0,1490 0,1396 0,1171 0,0901 8 0,0009 0,0081 0,0298 0,0653 0,1033 0,1304 0,1396 0,1318 0,1126 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0,0002 0,0027 0,0008 0,0002 0,0001 0,0132 0,0053 0,0019 0,0006 0,0002 0,0001 0,0363 0,0181 0,0082 0,0034 0,0013 0,0005 0,0002 0,0688 0,0413 0,0225 0,0126 0,0052 0,0022 0,0009 0,0003 0,0001 0,1014 0,0710 0,0452 0,0263 0,0142 0,0071 0,0033 0,0014 0,0006 0,0002 0,0001 0,1241 0,0993 0,0722 0,0481 0,0296 0,0169 0,0090 0,0045 0,0021 0,0009 0,0004 0,0002 0,0001 0,1318 0,1186 0,0970 0,0728 0,0504 0,0324 0,0194 0,0109 0,0058 0,0029 0,0014 0,0006 0,0003 0,0001 0,1251 0,1251 0,1137 0,0948 0,0729 0,0521 0,0347 0,0217 0,0128 0,0071 0,0037 0,0019 0,0009 0,0004 0,0002 0,0001
ЛИТЕРАТУРА 1 . М о р з Ф. М., Кимбел Д. Е. Методы исследования операций Изд-во «Советское радио», 1956. 2 . Зуховицкий С. И., Авдеева Л. И. Линейное и выпуклое про- граммирование. Изд-во «Наука», 1964. 3 . Понтрягин Л. С., Болтянский В. Г., Гамкрелидзе Р. В., Мищенко Е. Ф. Математическая теория оптимальных процес- сов. Физматгиз, 1961. 4 . С а а т и Т. Л. Математические методы исследования операций. Воен- издат, 1963. 5 . Карпелевич Ф. И., Садовский Л. Е. Элементы линейной алгебры и линейного программирования. Изд-во «Наука», 1967. 6 . Ю д и н Д Б., Гольштейн Е. Г. Линейное программирование. Физматгиз, 1963 7 Вентцель Е. С. Теория вероятностей. Изд-во «Наука», 1969. 8 Вентцель Е. С., Овчаров Л А. Теория вероятностей (задачи и упражнения). Изд-во «Наука», 1969. 9 Вентпель Е. С Элементы динамического программирования. Изд-во «Наука», 1964. 10 Беллман Р. Динамическое программирование. Изд-во иностранной литературы, 1960. 11 . Веитцель Е. С. Введение в исследование операций. Изд-во «Советс- кое радио», 1964 12 . О в ч а р о в Л А. Прикладные задачи теории массового обслуживания. Изд-во «Машиностроение», 1969. 13 Ди и ер И Я- О некоторых направлениях развития исследования опе- раций. «Морской сборник», 1970, № 1. 14 Гнеденко Б. В., Коваленко И. Н. Введение в теорию массо- вого обслуживания. Изд-во «Наука», 1966. 15 . Б у с л е н к о Н. П., Шрейдер Ю. А. Метод статистических испыта- ний. Физматгиз, 1961. 16 Севастьянов Б А. Формулы Эрланга в телефонии при произволь- ном законе распределения длительности разговора. Труды III Всесоюзного математического съезда, т. IV. Изд-во АН СССР, 1959. 17 Кофмаи А., Дебазей Г Сетевые методы планирования. Изд-во «Прогресс», 1965 18 . Кадыров М. Таблицы случайных чисел Ташкент. Издание Ташкентс- кого Государственного университета, 1936. 19 Романовский В. С Применение математической статистики в опыт- ном деле. Физматгиз, 1947 20 Кофман А., Крюон Р Массовое обслуживание, теория и примене- ния. Изд-во «Мир», 1965. 21 Фаддеев Д. К., Фаддеева В. Н. Вычислительные методы ли- нейной алгебры. Физматгиз, 1960. 22 . Вентцель Е. С Определение вероятностей состояний в динамике боя многочисленных групп. «Морской сборник», 1962, № 10 23 Чуев Ю. В., Мельников П М, Петухов С. И, Степа- нов Г. Ф, Шор Я Б Основы исследования операций в военной тех- нике. Изд-во «Советское радио», 1965. 545
4 «Линейные неравенства и смежные вопросы». Сборник переводов с англ, под ред Канторовича Л. В и Новожилова В. В Изд-во иностранной лите- ратуры, 1959 25 Мак-Кинси Дж. Введение в теорию игр. Физматгиз, 1960. 26 Кокс Д Р. .Смит В Л Теория восстановления Изд-во «Совет- ское радио», 1967. 27 . С о б о л ь И. М. Метод Монте-Карло Физматгиз, 1968. 28 . Гурин Л. С, Дымарский Я- С., Меркулов А. Д. Задачи и методы оптимального распределения ресурсов Изд-во «Советское радио», 1968 29 Р. Д. Ль юс, X. Райфа Игры и решения. Изд-во иностранной лите- ратуры, 1961.
ПРЕДМЕТНЫЙ указатель А Алгоритм преобразования стандарт- ной таблицы 67 — циклический 426 Б Бейеса формула 512 В Вероятности переходные 188 — события 13 — состояний 187 — — предельные 217, 218, 246 — условий 500 Вероятность отказа 244 — поражения цели 410 Ветвящийся циклический процесс 230 Взаимопомощь между каналами 275 — «все как один» 277 — --- равномерная 279 Восстановление единиц 343 — задержанное 396 Выигрыш условный оптимальный 137 Вырожденный случай, вырождение 53, 82 Г Граница выигрыша верхняя 472 — — нижняя 472 Граф состояний 183 — — размеченный 196 д Датчики случайных чисел 424 Динамическое программирование 132 ---, основное функциональное уравнение 139 Дисперсия случайной величины 412 — численностей состояний 297 Дисциплина взаимопомощи 275,276 Дуга некритическая 523 Ж Жребий 412 — единичный 413 3 Зависимость между отказами 401 Задача линейного программирова- ния основная 39 — о запасных элементах 393 — о наборе высоты и скорости ле- тательным аппаратом 124 — оптимизации управления 121, 134 — распределения ресурсов 142, 156, 162 — о резервировании ресурсов 154 — транспортная 82 — — по критерию времени 115 — — по критерию стоимости 83 — — с избытком запасов 111 — — с избытком заявок 112 — — с неправильным балансом 110 — — с правильным балансом 112 Задачи вариационные 17 — детерминированные 16 — динамического программирова- ния 163, 172 — на минимакс 38 Закон распределения показатель- ный (экспоненциальный) 204 — — среднего арифметического 440 — — условный 423 — — частоты события при большом числе опытов 440 Зацикливание 82 Заявки «нетерпеливые» 264 — «терпеливые» 266 И Игра бесконечная 449 — «вооружение и самолет» 453 — «вооружение — помехи» 486 — «два бомбардировщика и истре- битель» 468 547
Игра конечная «т X г» 450 — «т X 2» 472 — «поиск» 451, 456 — полностью усредненная 486 — «распределение сил в наступле- нии и обороне» 477 — и реальная конфликтная ситуа- ция 447 — «самолеты и зенитные орудия» 473 — с нулевой суммой 448 — с полной информацией 460 — с природой 496 — «три пальца» 452 — «2 X п» 472 — «2X2» 466 Излишние стратегии 464 Интенсивность отказов 373 — потока 201 Исследование операций 7, 8, 11, 16 К Клетки базисные 86 — свободные 86 Конфликтные ситуации 23, 447 Координаты системы фазовые 134 Коэффициент вариации времени об- служивания 286 Критерий Вальда (максиминный) 504 — Гурвица (пессимизма — опти- мизма) 505 — мультипликативный 175 — обобщенный (составной) 25, 26 — оценки (показатель эффектив- ности, целевая функция) 12 — Сэвиджа (минимаксного риска) 504 М Максимин 455 Марковский процесс циклический 227 Матрица переходных вероятностей 188 — платежная (матрица игры) 450 — рисков 499 — системы уравнений 40 — — — расширенная 40 Метод динамики средних 291, 357 — запрещенных клеток 118 — итераций в решении игр 489 — потенциалов 99 — псевдосостояний 232, 290 — распределительный 97 — «розыгрыша» 410 — сетевого планирования (СПУ) 517 — статистических испытаний (Мон- те-Карло) 409 548 — статистического моделирования 15 Механизм розыгрыша случайный 414 Минимакс 456 Моделирование 15 — методом Монте-Карло 426 Модели аналитические 15 — статистические 15 Модель бесконечношаговая в зада- чах динамического программиро- вания 179 — математическая 14 — операции 14 — явления 14 Мультипликативный критерий эф- фективности 175 Н Надежность 366 — нерезервированной системы 378 — резервированной системы («го- рячий резерв») 382 — системы 367 — — с восстановлением 393 — элемента 367 Ненадежность элемента 367 О Область допустимых решений 46 Обобщенный показатель (критерий) эффективности 25 Операция 11 Оптимальная стратегия игрока 449 Оптимальное управление 121 Оптимизация решения в условиях неопределенности 18, 19, 496 — плана комплекса работ 529 — по нескольким показателям 23 «Оптимизация в среднем» 21 Ординарность потока 202 Основная прямая 50 Отказы внезапные 366 — зависимые 401 — постепенные 366 Оценка операции комплексная (по нескольким критериям) 25 — эффективности 25 П Параметр показательного закона 204 Перевозки 85 Переменные базисные 44 — добавочные 56 — первоначальные 56 — свободные 44 Планирование комилекса работ 516 — эксперимента 509 План перевозок 85
__ — вырожденный 91 — — допустимый 85 — — опорный 85 — — оптимальный 85 — потенциальный 102 Платежи 99 Платежная матрица 450 Плотность вероятности перехода 195 — распределения времени безотказ- ной работы 368 — — условная 417 Показатель аддитивный 122 — эффективности 12 Положение равновесия неустойчи- вое 324 — — устойчивое 324 Поток восстановлений 394 — заявок 238 — отказов 212, 375 — Пальма 206 — событий 200 — — без последействия 201 ----неординарный 202 ----нестационарный пуассонов- ский 203 ----ординарный 201 — — простейший (стационарный пуассоновский) 200, 202 — — регулярный 200 ----стационарный 200 — успешных выстрелов 330 ---- разведок 339 — Эрланга 207 ----fe-ro порядка 207 Правила игры 448 Правило решения 513 Принцип квазирегулярности 300, 301 — минимакса 456 — недостаточного основания Лап- ласа 503 — оптимальности 137 Принятие решений в условиях не- определенности 446 Программирование линейное 18, 28 — динамическое 18, 120 Производительность группы стан- ков 271 Пропускная способность 238 ----абсолютная 240 ---- относительная 240 Пространство фазовое 132 ----одномер ное 134 Процесс бесконечношаговый 177 — гибели и размножения 433 — марковский неоднородный 195 ---- однородный 195 — случайный 181, 182 ----с дискретным временем 185 ---с дискретными состояниями 183 ---с непрерывным временем 185 ---стационарный 433 --- эргодический 435 — циклический 227 ---ветвящийся 230 Псевдосостояние 232 Псевдостоимость 99 Пункт назначения фиктивный 111 Путь критический 523 Р Работа критическая 523 — некритическая 523 — фиктивная 521 Разрешающая строка 65 Разрешающий столбец 65 — элемент 64 Ранг матрицы 41 — работы 519 , Распределение показательное 204 — Пуассона 203 — Эрланга 208 ---обобщенное 211, 237 Реализация случайная 413 Режим предельный стационарный 219 — работы системы 402 Резерв временной 524 — «горячий» 382 — «облегченный» 383 — «холодный» 383 Резервирование 368, 378 — ресурсов 154 Решение 7, 11 — допустимое 40 — задачи линейного программиро- вания 39 — игры 458, 462 — компромиссное 22, 27 — локально-оптимальное 22 — неудачное 11 — опорное 39, 53, 71 — оптимальное 11, 22, 39 — приемлемое 22 — • удачное 11 Риск 499 — средний 502 С Свойство эргодическое 434 Седловая точка 458 Сетевой график 519 --- временной 521 ---, формальная запись 526 Симплекс-метод 59 Система массового обслуживания замкнутая 268 ------- многоканальная 238 549
Система массового обслуживания одноканальная 238 -------с неограниченным ожида нием 240 -------с не-пуассоновскими пото- ками событий 285 -------со взаимопомощью между каналами 275 -------с ограниченным ожиданием 240 -------с ожиданием (очередью) 280 -------с отказами 240, 286 -------с ошибками 281, 282 — с облегченным резервом 391 — операций 12 — простая (без резервирования) 378 — резервированная 382 — управления боем 338 — управляемая 133 — с холодным резервом 389 Системы с неограниченным ожида- нием 240 — с ограниченным ожиданием 240 — с отказами 240, 286 Ситуация конфликтная 23, 447 Скорострельность эффективная 330 Случай вырожденный 53, 82 — детерминированный 16 Случайная величина нормированная 421 Случайная реализация 413 Случайное число от 0 до 1 414 Случайные числа 424 Смесь стратегий физическая 493 События несовместные 415 Соединение элементов «параллель- ное» 382, 383 ----«последовательное» 381 Способ северо-западного угла 87 Среднее время ожидания 277 ---пребывания в системе 277 Средние по времени для одной реа- лизации 434 Средняя длина очереди 250 Стандартная форма записи уравне- ний 64 Статистические средние по множест- ву реализаций 434 Статистическое моделирование 16, 409 Стационарность потока 201 Стационарный случайный процесс 433 Стратегия 449 — активная 463 — дублирующая 464 — заведомо невыгодная 464 — игрока 449 — максимннная 455 550 — минимаксная 456 — оптимальная 449, 458 — смешанная 452, 461 Строка разрешающая 65 Схема ветвящегося цикла 231 — гибели и размножения 223 — циклическая 229 Т Таблица стандартная 64 — структурная комплекса работ 517 — структурно-временная 520 — транспортная 86 Таблицы случайных чисел 424 Теорема об активных стратегиях 463 — теории игр основная 462 Теория игр 23, 446 — статистических решений 496 Точка опорная 53 — седловая 458 У Управление оптимальное 121 --- безусловное 178 ---условное 137 — системой 133 — шаговое 121 Упорядочение работ 518 Упрощение игр 464 Уравнение основное функциональ- ное (динамического программи- рования) 139 Уравнения динамики боя (модель А) 329 -------(модель Б) 335, 336 — — — (модель В) 338, 340 --- средних 299 — — — для неоднородных элемен- тов 314 — Колмогорова’194, 198 — Ланчестера 329 ---2-го рода 332 — смешанного типа 350 Уровень доверия 442 Условие балансовое 85 — нормировочное 219 Условия операции заданные 27 Учет пополнения 309 Ф Физическая смесь стратегий 494 Форма записи уравнения стандарт- ная 64 Формулы Полнчека — Хинчина 286, 287 — Эрланга 246 Функция времени случайная 292 — Лапласа 298
— распределения огня 348 — — эффективности 349 X Ход личный 448 — случайный 448 Ц Цена игры 462 — — верхняя 456 ----нижняя 455 ----чистая 458 — цикла 93 Центральная предельная теорема теории вероятностей 440 Цепь марковская 186 ---- неоднородная 188 ----непрерывная 194 ---- однородная 188 Цикл 91 — неустойчивый 325 — устойчивый 325 Ч Чебышева теорема 412 Числа псевдослучайные 424, 425 Численности состояний 292 — — начальные 295 — — предельные средние 320 — — средние 297 Численность критическая 323 Число реализаций 440 Э Экспоненциальный закон надежно- сти 372 Элемент разрешающий 64 Элементы теории статистических ре- шений 496 Эргодичность 434 Эффективность операций 11, 12 Я Ячейка транспортной таблицы ба- зисная 86 ------- свободная 86
Елена Сергеевна Вентцель ИССЛЕДОВАНИЕ ОПЕРАЦИЙ Редактор М. С. Гордон Художественный редактор В. Т. Сидоренко Художник Л. Г. Ларский Технический редактор А. А. Белоус Корректоры: Е. П. Оверецкая, М. Ф. Белякова Сдано в набор 2/XI 71 г. Подписано в печать 24/V 72 г. Т-05190 Формат 60x90/te Бумага типографская № 2 Объем 34,5 усл. п. л., 34,540 уч.-изд. л. Тираж 31 000 экз. Ценз 1 р. 96 к. Зак. 573 Издательство «Советское радио», Москва, Главпочтамт п/я 693 Московская типография № 4 Главполиграфпрома Комитета по печати при Совете Министров СССР Москва, Б. Переяславская, 46