Text
                    В. Б. Морозов
А. Г. Сухарев
В, В. Федоров
ИССЛЕДОВАНИЕ
ОПЕРАЦИЙ
В ЗАДАЧАХ
И УПРАЖНЕНИЯХ

В. В. Морозов, А. Г. Сухарев, В. В. Федоров ИССЛЕДОВАНИЕ ОПЕРАЦИЙ в задачах и упражнениях Допущено Министерством высшего и среднего специального образования СССР в качестве учебного пособия для студентов вузов, обучающихся по специальности «Прикладная математика» МОСКВА «ВЫСШАЯ ШКОЛА» 1986
ББК 22.11 М80 УДК 51 Рецензенты: кафедра теории управления и исследования операций Московского физико-технического института (зав. кафед- рой — академик АН СССР Н. Н. Моисеев) и докт. физ.-мат. наук, проф. Р. Ф. Габасов (Белорусский государственный университет им. В. И. Ленина) Морозов В. В., Сухарев А. Г., Федоров В. В. М80 Исследование операций в задачах и упражнениях: Учеб, пособие для студентов вузов, обуч. по спец. «Прикладная математика».— Мл Высш, шк., 1986.— 287 ел ил. Книга знакомит с основными понятиями и методами исследования опе- раций. Рассмотрены задачи, связанные с неконтролируемыми факторами. Отражены как традиционные направления исследования операций, так и развившиеся в последнее время (иерархические игры, задачи принятия решений при наличии бинарных отношений и др.). .. 1502000000-282 л М 001 (01)-86 в9ш8в ББК 22.11 517 © ИЗДАТЕЛЬСТВО «ВЫСШАЯ ШКОЛА», 1986
п РЕДИСЛОВ ИЕ Интенсификация производства, ускорение научно-техниче- ского прогресса предполагают дальнейшее совершенствова- ние систем управления, которые должны обеспечивать приня- тие и реализацию оптимальных решений на основе известной информации об обстановке и имеющихся ресурсах. В настоя- щее время создание систем управления невозможно без раз- работки соответствующей теории принятия решений, отвечаю- щей практическим запросам. Важным разделом этой теории является исследование операций, имеющее многочислен- ные как чисто математические результаты, так и практиче- ские приложения. В исследовании операций особое внимание уделяется методам принятия решений в различных ситуаци- ях — в обстановке полной неопределенности, при наличии случайных факторов или факторов противодействия, неопре- деленности в целях, в иерархических системах и т. д. Данное учебное пособие написано на основе курса «Иссле- дование операций», прочитанного авторами на факультете вычислительной математики и кибернетики Московского го- сударственного университета им. М. В. Ломоносова. Изложен- ный в пособии материал раскрывает принципиальные поло- жения теории и иллюстрируется задачами и примерами, отно- сящимися к самым различным областям приложений. При подборе задач и упражнений авторы ориентировались на дей- ствующую учебную программу. Некоторые задачи составлены с использованием уже опубликованных материалов, приве- денных в списке литературы. Дополнительный список литературы имеет важное зна- чение. Он будет полезным студентам для самостоятельной научной работы, углубленного изучения курса «Исследование операций», а также при выполнении дипломных работ. Настоящее пособие состоит из введения и восьми глав. В каждой главе приведены теоретические сведения, исполь- зуемые при решении задач. Многие задачи могут быть решены методами элементарной математики. Конечно, исследование реальных моделей требует применения численных методов, изучаемых в курсах «Численные методы», «Методы оптимиза- ции» и в специальных курсах. В данном пособии большая часть задач решается аналитически. Авторы выражают особую признательность В. Ф. Матвее- ву, составившему задачи по теории массового обслуживания из гл. 7; они также благодарны Н. С. Кукушкину, А. П. Че- ренкову за отдельные задачи и В. В. Шестопаловой за помощь в подготовке рукописи. Авторы 3
ОСНОВНЫЕ ПОНЯТИЯ И ОПРЕДЕЛЕНИЯ Под операцией понимают совокупность действий, направлен- ных на достижение определенной цели. Участников операции, стремящихся к достижению этой цели, называют оперирующей стороной. Факторы, которыми распоряжается оперирующая сторона для достижения цели операции, называются контроли- руемыми. Для их обозначения будем использовать букву х, а совокупность всех значений контролируемых факторов обо- значим Мо. Факторы операции, которые не контролируются оперирующей стороной, называются неконтролируемыми. Сре- ди участников, составляющих оперирующую сторону, можно выделить исследователя операции, который проводит исследо- вание по отысканию наилучших для оперирующей стороны способов действий. Неконтролируемые факторы группируются по информированности о них исследователя операции сле- дующим образом. Неопределенные факторы у: исследователю операции из- вестно лишь множество значений W факторов у. Случайные факторы z\ исследователю операции известно множество зна- чений Z случайной величины г\ кроме того, закон распределе- ния (т. е. функция распределения или вероятностная мера) со этой случайной величины либо известен точно, либо из- вестно лишь, что со € Q, где Q — некоторое множество законов распределения. В дальнейшем там, где это не приведет к не- ясности, будем использовать одни и те же обозначения для случайной величины и ее реализации, для функции распреде- ления и соответствующей вероятностной меры. Стремление оперирующей стороны к достижению цели описывается стрем- лением к увеличению значения функции F(x, у, г), называемой критерием эффективности. Иногда цель состоит в стремлении к уменьшению значения критерия эффективности; в очевид- ных случаях это специально не оговаривается. К моменту проведения операции оперирующая сторона может располагать большей информацией о неконтролируемых факторах, чем располагал исследователь операции во время проведения исследования. Информация, которой располагает оперирующая сторона к моменту проведения операции, фикси- 4
руется в модели операции информационной гипотезой. Стра- тегиями оперирующей стороны называют разрешенные информационной гипотезой способы действий. Так, если опе- рирующая сторона не располагает дополнительной информа- цией о неконтролируемых факторах, то ее стратегиями яв- ляются сами контролируемые факторы из MQ. Стратегии из Мо называются стратегиями-константами. Если неконтро- лируемые факторы станут известными оперирующей стороне к моменту проведения операции, то ее стратегиями являются всевозможные отображения: х : WxZ->- Л/о; множество всех таких отображений будем обозначать М. Информационная гипотеза- может быть задана с помощью информационной функции R: NxZ-> Ет, определенной на множестве NxZ\ оперирующей стороне к моменту проведения операции станет известным значение R(y, z), где у, z — неконтролируемые факторы в рассматриваемой операции. Множеством стратегий оперирующей стороны в этом случае является множество Л4Л = {х€М|х(1/1, z1) = x(i/2, z2), если R(yx, z^ = R(yv z2)}. Информационная гипотеза может быть задана и иными спосо- бами. В любом случае множество стратегий М. является под- множеством М. Мы будем, кроме того, рассматривать лишь такие множества стратегий М, что М^М0. Зачастую случайные факторы в операции отсутствуют или имеются, но, по информационной гипотезе, оперирующая сторона информации о них не получает, т. е. стратегии не за- висят от случайных факторов; также допустимо осреднение критерия по случайностям. В таких случаях мы будем обо- значать критерий W (х, у), где W (х, у)=\ F (х, у, z) dco(z), z если случайные факторы имеются. При этом информационная функция, очевидно, не зависит от г; для множества стратегий х : N Мо сохраним обозначение М. Критерий эффективности, определенный на множестве MQxNxZ(MoxN), может быть доопределен на множестве MXNXZ (MXN): F(x, у, z) = F(x(y, z), у, z)(F(x, y)=W (х(у), у)), х£М. Если допустимо применение оперирующей стороной смешан- ных стратегий ф£Ф (через ср обозначена и сама случайная величина со значениями в Л40, и ее функция распределения и соответствующая вероятностная мера), то для оценки эф- 5
фективности таких стратегий используется критерий ^(ф, !/)==$ (х, f/)d<p(x). м. Вероятностные смеси стратегий из множеств М=£М0 рассмат- риваться не будут. Если в операции все неконтролируемые факторы являются случайными и допустимо осреднение критерия, то оценкой эффективности стратегии х называют величину F (х, со) = J F (х, z)da>(z). z Если же в операции отсутствуют случайные факторы или кри- терий, как было описано выше, уже осреднен по случайностям, то оценкой эффективности стратегии х называется величина № (х) = inf IT (х, у). — yeN Если в операции имеются различные типы неконтролируемых факторов, то оценка эффективности определяется в зависи- мости от дополнительных предположений об этих факторах. Пусть, например, в критерии F (х, у, z) У=(«/1> У2). yz^Ni, N=NiXNit где yt выбирается первым противником, знающим реализацию случайной величины z, а у2— вторым противником, не знаю- щим этой реализации. Тогда если интересы противников не- известны, а оперирующая сторона разрешает осреднение по случайностям, то оценка эффективности стратегии х имеет вид W (х)= inf inf \ inf F(x, ylt y2, z)dco(z). co € Q Уг € Ns z 6 N1 Пусть W (x, y)—критерий эффективности оперирующей сто- роны, а 1Гп(х, у)—критерий эффективности противника. Предположим, что противнику известна стратегия х опери- рующей стороны и что N(x) = {y€N\W„Cx, t/) = max Wn(x, у')}=?=0. y'tN Тогда оценка эффективности стратегии х принимает вид W (х) = inf W (х, у). У G N (х) 6
Если у—природная неопределенность или стратегия против- ника, имеющего противоположные интересы и не знающего реализации смешанной стратегии ф, то оценкой эффектив- ности стратегии ф называют величину №(ф)= inf у). y$N Стратегия хй^М называется оптимальной в множестве М, если W (х0) = max W (х); х€ М стратегия х8 С М, называется е-оптимальной в М, если № (хе) > sup W (х)—е. — хем ~ Величина W (М) = sup W (х) называется наилучшим гаран- хвМ тированным в множестве стратегий М результатом. Точно так же в случае, когда в операции неконтролируемые фак- торы случайны или имеются неконтролируемые факторы раз- ных типов, оптимальной называют стратегию с наибольшей оценкой эффективности. По аналогии с приведенными выше определениями определяются в этом случае понятия е-опти- мальной стратегии и наилучшего гарантированного резуль- тата. Наконец, величину 1Г (ф) == sup inf W (<р, у) <ts<t>yeN называют наилучшим гарантированным результатом в сме- шанных стратегиях, а стратегию ф0€Ф, для которой inf Г(Фо, у) = Г(Ф), yeN — оптимальной смешанной стратегией. Если цель операции состоит в уменьшении значения крите- рия эффективности, то во всех определениях верхние грани нужно заменить на нижние и наоборот. В дальнейшем приведенные определения и обозначения используются без дополнительных пояснений и ссылок. Кроме того, используются следующие обозначения: Еп—n-мерное евклидово пространство; = {* = (*1, = {*€£? .... х„)€£п|х/^0, /=1, п 1 2 х/= 1 >—симплекс; ( = 1 J .... »}; 7
p(x, y)—евклидово расстояние между векторами х, у£Еп\ р(х, А) = inf р(х, у)— расстояние от точки х£Еп до множества А; У&А В (х, г) = {у£Еп | р (х, у)^г} — шар радиуса г с центром в точке х; 0, t^a, IГ (0 = [f]— целая часть числа f; М — наименьшее целое число, которое больше или равно I; | А | — число элементов конечного множества А; 2А — множество всех подмножеств множества А; А—замыкание множества А; int А — внутренность множества А; со А — выпуклая оболочка множества А; / ^11^12 • •• ain \ (^/)тхп= 7.ain. ; IF(1, n)\ W (2, n) \. \ат1ат2 * * • ^тп 1) U7(l, 2) .., W (tn, 1) W (tn, 2) ... W (m, ri)/ W(x, y)) = (aij)mXn означает, что W (i, = /==!, ..., tn, 1 = == 1, ..., n; x0 = Xi, ..., хт в соответствующем контексте означает, что сущест- вует т оптимальных стратегий х1э ..., хт\ х: —а—переменной х присваивается значение а; Argmax / (h) = {/i£/7 | f (h) = max f (h,')}, he и h'eH Argmin f (h) == {hgH | f (h) = min f (ft')} h e H h'GH для функции f, определенной на множестве Я; —знак отношения эквивалентности высказываний. . В задачах гл. 7, посвященных массовому обслуживанию, используются следующие обозначения и сокращения: Е—символ математического ожидания; Da = E (а—£а)2—дисперсия случайной величины а; М (а) — экспоненциальное распределение случайной величины с пара- метром а > 0; Ег (а)—эрланговское распределение порядка г\ D (х0)—детерминированное распределение; U [0, 2a] — равномерное распределение на [0, 2a]; Р (а) — пуассоновское распределение с параметром а; Bi (N, р)—биномиальное распределение с параметрами N и р; Я (0—функция восстановления. J
1 Глава СОСТАВЛЕНИЕ МОДЕЛЕЙ ОПЕРАЦИЙ И ОЦЕНКА ЭФФЕКТИВНОСТИ СТРАТЕГИЙ # В задачах этой главы требуется составить модель операции, т. е. опи- сать контролируемые и неконтролируемые факторы, критерий эффектив- ности и множество стратегий оперирующей стороны, а также найти оценки эффективности стратегий. В конце главы предлагаются несколько задач# в которых используется свертывание критериев. Начиная с задачи 1.31 до конца главы предполагается, что оперирующая сторона стремится к уве- личению значения своего критерия. Некоторые задачи взяты из [1, 3, 7# 8, 19, 29, 31] Ч Ж 1.1. Скорость движения машин в автомобильном туннеле не превышает 50 км/ч и связана с плотностью потока (количе- ством машин на километр дороги) Р следующим эмпирическим соотношением: Р=(^о—v}lzt где ро=6О км/ч, a г — случайная величина, которая в любой момент определяется соотношением легковых и грузовых ма- шин, проходящих через туннель. Известно, что величина г равномерно распределена на отрезке [1/2, 1]. Регулировка движения в туннеле производится выбором скорости движения v. Цель операции состоит в увеличении потока машин F, т. е. количества машин, выходящих из туннеля за 1 ч. Составить модель операции. Найти оценку эффективности произвольной стратегии в каждом из следующих предполо- жений: а) оперирующая сторона разрешает осреднение критерия; б) оперирующая сторона не разрешает осреднение крите- рия. Найти скорость движения машин, при которой поток F максимален. 1.2. Две страны обмениваются товарами. Пусть Дь 1=1, . .. . . . , /и,— количество товара г-го типа первой страны, В этой и следующих главах использованы также материалы из различных научных журналов и зарубежных публикаций. 9
предназначенное для обмена на товары второй страны, a Bs, j=l, ...» п,— количество товара /-го типа второй страны, \ предназначенное для обмена на товары первой страны. Това- ры обеих стран, вообще говоря, различны. Пусть at, а\ и — цена единицы товара i-ro типа первой страны соответственно на внутреннем рынке первой страны, на внутреннем рынке второй страны и на международном рынке. Аналогично, пусть bj, b'j и ру— цена единицы товара /-го типа второй страны соот- ’ ветственно на внутреннем рынке второй страны, на внутрен- нем рынке первой страны и на международном рынке. Обмен товарами осуществляется следующим образом. Пер- вая (соответственно вторая) страна выбирает количество xi} (соответственно уц) товара i-ro (/-го) типа, которое она хочет обменять на соответствующее количество товара /-го (i-ro) типа второй (первой) страны. Обмен товара i-ro типа первой страны на товар /-го типа второй страны производится в ко- личестве, максимально допустимом величинами хц и yi}, т. е. на сумму шш(^, щуц), выраженную в ценах между- народного рынка (эквивалентный обмен на международном рынке). Будем считать первую страну оперирующей стороной, i которая не знает выбора уц второй страной. Цель первой стра- ны — так выбрать xtj, чтобы по возможности увеличить при- быль, полученную в результате обмена и выраженную в ценах своего внутреннего рынка. Составить модель операции. Найти оценку эффективности произвольной стратегии, если: а) интересы второй страны неизвестны; = /=1..........................т = п> б) интересы второй страны известны и задаются критерием ; эффективности, аналогичным критерию первой страны; вто- ' рой стране известна стратегия первой страны и 1.3. Межотраслевое объединение ведет строительство ав- томобильного завода. Предстоит выполнить следующие основ- ные работы: А — строительство заводских корпусов; В — завершение разработки модели нового автомобиля; С — наем рабочей силы; D — монтаж оборудования; Е — отладка мо- дели автомобиля. Очередность выполнения работ задана сете- вым графиком (рис. 1). Пусть /А=2 и tD—l — время выполнения работ А и D соответственно; для остальных работ времена их выполнения 10
точно не известны и являются независимыми случайными ве- личинами. При этом tB и tc принимают значения 2, 3, 4 с ве- роятностью 1/3. Зависимость дополнительной прибыли объ- единения от времени выполнения всего комплекса работ приведена в следующей таблице: Время выполнения всего комплекса работ, усл. ед. 3 4 5 6 7 Дополнительная прибыль объединения, тыс. руб. 120 110 100 50 0 В распоряжении объединения имеется резерв, ввод кото- рого ускоряет все строительство завода на 1 ед. времени, но потребует дополнительных расходов в 20 тыс. руб. Следует ли использовать резерв, если цель объединения — увеличение по мере возможности чистой дополнительной при- были (т. е. дополнительной прибыли за вычетом расхо- дов в случае использования резерва)? Составить модель операции. Критерий эффек- тивности записать с помощью матрицы. Осреднить получен- ный критерий и решить во- прос о целесообразности вво- да резерва. 1.4. Форма склада имеет вид треугольника G с верши- нами Aj, j— 1, 2, 3. На Рис. 1 склад можно проникнуть толь- ко в точках Aj с вероятностями ®у, относительно которых известно, что ®7'^®y^®y, /=1, 2, 3. Цель операции — «наилучшим» образом установить сторожевую вышку на тер- ритории склада, чтобы обнаружить момент проникновения нарушителя на склад. Известно, что вероятность необнаруже- ния нарушителя пропорциональна квадрату расстояния до него. Составить модель операции. Найти оценку эффектив- ности произвольной стратегии, если: а) ®;=0, ®)=1, / = 1, 2, 3; б) ®; = 0, ®/= 1/2, /=1, 2, 3; в) ®j = ®" = ®2 = ®3= 1/2, ®2 = ®з = 0; г) ®; = 0, ®/> 1/2, /= 1, 2, 3. 1.5. В «дуэли» принимают участие два противника (первый и второй «дуэлянты»). В начальный момент времени они на- 11
ходится друг от друга на расстоянии D. Затем противники начинают без остановки сближаться, но не ближе барьеров, расстояние между которыми равно d, d<ZD. Каждый из про- тивников имеет в своем распоряжении по одному выстрелу и может выстрелить в любой момент времени после начала сбли- жения. Дуэль заканчивается либо когда оба противника сде- лали по выстрелу, либо когда выстрелил один из них и поразил другого. Пусть Pi(di) — вероятность поражения i-м «дуэлян- том» противника, если выстрел был произведен с расстояния dit i’=l, 2. Предположим, что каждый «дуэлянт» слышит выстрел другого. Будем считать первого «дуэлянта» оперирую- щей стороной. Составить модель операции, предполагая, что критерий эффективности принимает значение 0 или 1 в зависимости от выполнения следующих целей оперирующей стороны: а) поражение противника; б) сохранение собственной жизни; в), сохранение собственной жизни и поражение противника. Осреднить полученные критерии по случайностям. В слу- чаях а) — в) найти оценку эффективности стратегии, которая рекомендует первому «дуэлянту» стрелять с расстояния d, если противник выстрелил раньше него и промахнулся. 1.6. Пусть в условии задачи 1.5 первый «дуэлянт» имеет возможность произвести два выстрела в различные моменты времени, а второй «дуэлянт» имеет по-прежнему в своем рас- поряжении только один выстрел. Составить модель операции, предполагая выполненными условия а) — в) задачи 1.5, и осреднить полученный критерий. 1.7. Рассматривается взаимодействие двух сторон в сле- дующей операции. Первая оперирующая сторона распреде- ляет общее количество бесконечно-делимых А средств по хг- на f-й из п пунктов /=1, . . . , п. Вторая сторона выделяет резерв С из общего количества В своих средств (средств за- щиты) и распределяет оставшееся количество В — С средств по ut на i-й пункт, не имея информации о распределении средств второй стороной. Первая сторона знает распределение основных средств защиты После того как происходит вза- имодействие двух сторон вторая сторона узнает распределение средств первой стороны xt и, в свою очередь, размещает резерв С по Vi на i-й пункт, 1=1, . . . , п. Пусть Pi— количество средств первой стороны, которое может «уничтожить» 1 ед. основных средств второй стороны на i-м пункте при взаимодействии, a qt— количество средств первой стороны, которое может «уничтожить» 1 ед. резерва средств защиты на Лм пункте. Цель первой стороны — стрем- 12
ление к увеличению суммарного количества уцелевших средств. Составить модель операции. Показать, что для любой страте- гии первой стороны найдется стратегия, имеющая не меньшую оценку эффективности и состоящая в нанесении «концентри- рованного удара», т. е. в направлении всех средств на один пункт. 1.8. Пусть в условиях задачи 1.7 вторая сторона резерва не выделяет, а первая сторона перед началом операции полу- чает информацию о расположении средств второй стороны. Поступающая информация u't о расположении средств второй стороны, вообще говоря, не является точной: первой стороне известно лишь, что \ut—izz|^ez, u'i^O, i = l, ..., п, где е,->0 — числа, характеризующие точность разведки. Вы- полнить задание, сформулированное в условии задачи 1.7. 1.9. Форма расположения города — круг G радиуса R. Будем предполагать, что из любой точки города можно про- ехать на машине в любую другую точку по прямой линии и что машины движутся по городу с постоянной скоростью. Ре- шается вопрос о размещении в городе трех пожарных частей. Нужно так выбрать точки расположения пожарных частей, чтобы до возникшего в точке y£G пожара можно было скорее всего добраться. Составить модель операции. Найти оценку эффективности произвольной стратегии. 1.10. Форма расположения нефтяного района — область G на плоскости. Предположим, что форма района залегания нефти имеет вид круга В (у, r)cG известного радиуса г. Поло- жение центра круга у неизвестно. Разведка нефти произво- дится поочередным бурением скважин в точках области G до тех пор, пока не будет обнаружена нефть. Цель операции — обнаружить нефть и пробурить при этом как можно меньше скважин. Составить модель операции. Найти оценку эффек- тивности произвольной стратегии. 1.111’ . Два предприятия производят один вид продукции и называют на нее цены; при этом первое предприятие не знает предполагаемого выпуска и цены на продукцию вто- рого. Пусть D — потребность рынка в продукции, а и и v — количество продукции, производимой соответственно первым и вторым предприятиями, причем u, v<.K, где К задает огра- ничения на производственные мощности обоих предприятий. Пусть р и q — цены единицы продукции, назначаемые первым 1 1) Задачи 1.11, 1.12, 2.37, 8.9 следует интерпретировать как модели конфликтных ситуаций, присущих капиталистической экономике [24, 29]. 13
и вторым предприятиями и удовлетворяющие неравенствам асрсЬ, a<q<b, где а — себестоимость (цена единицы) про- дукции. Предполагается, что вначале покупается более деше- вая продукция, а если цены равны, то покупается продукция второго предприятия. Будем считать первое предприятие оперирующей стороной. Цель оперирующей стороны состоит i в получении как можно большей прибыли от продажи произ- веденной продукции. Составить модель операций. Найти оценку эффективности произвольной стратегии, если: - а) цель второго предприятия неизвестна; б) цель второго предприятия известна и задается крите- рием, аналогичным критерию первого; кроме того, второму предприятию известна стратегия первого предприятия. 1.12. Два предприятия производят т видов продукции. , Пусть щ, vt— количество продукции i-ro вида, производимой соответственно первым и вторым предприятиями, щ, - i=l, . . . , т, a pt, qt—цены единицы продукции - i-ro вида, назначаемые первым и вторым предприятиями и ’ удовлетворяющие неравенствам pt<b, qt<.b. Предположим, что для производства вектора продукции u=(«i, .... «то) .1 первому предприятию необходимо затратить gj(u) единиц /-го вида производственных факторов, /=1, . . . , п; при этом i единица j-го вида производственных факторов стоит Коли- чество денег на рынке ограничено и равно С, а потребность рынка в продукции i-ro вида равна D. Целью первого пред- приятия (оперирующей стороны) является получение как можно большей прибыли от продажи всех видов продукции. Записать критерий эффективности оперирующей стороны, : если: а) сначала у второго предприятия покупается продукция тех видов, на которые она назначила цены не большие, чем оперирующая сторона. После окончания всех таких закупок продукция покупается у оперирующей стороны, если на рынке, конечно, остались деньги и имеется неудовлетворенный спрос; б) сначала у второго предприятия покупается продукция ; тех видов, на которые она назначила цены не большие, чем : оперирующая сторона, затем у оперирующей стороны заку- пается продукция тех видов, цены на которые не выше, чем у второго предприятия, далее оставшаяся продукция заку- пается у второго предприятия и, наконец, оставшаяся продук- ция закупается у оперирующей стороны. 1.13. Предприятие производит продукцию в течение . Г от- резков времени. В начале Л го отрезка предприятие произво- дит продукцию в количестве xt. Спрос yt на продукцию в на- чаде i-ro отрезка неизвестен, но известно, что dt<.yt^.Dt, где 14
д Dt— фиксированные границы спроса. Предположим, что спрос t)t на продукцию удовлетворяется в начале отрезка t, а вся произведенная нереализованная (в том числе и в пред- шествующие моменты времени) продукция хранится на складе в течение всего /-го отрезка времени. Пусть а — стоимость единицы произведенной продукции, 0 — стоимость хранения единицы продукции в течение одного отрезка времени, у — плата за единицу недоданной продукции (неустойка) и i9— начальный запас продукции на складе. Цель предприятия состоит в таком выпуске продукции xt, t= 1, . . < , Т, чтобы суммарные издержки (производство, хранение и неустойка) были по возможности меньшими. Составить модель операции-. Найти оценку эффективности произвольной стратегии-кон- станты при у=0. 1.14. Турист заблудился в лесу; он знает, что форма рас- положения леса — область G, но не знает, в какой точке об- ласти он находится. Кроме того, ему неизвестна ориентация области G. Цель туриста — выйти из леса как можно более коротким путем. а) Пусть G — полуплоскость; турист знает, что он нахо- дится на расстоянии 1 км от границы леса, но он не знает, в каком направлении от него находится граница леса. Дока- зать, что стратегия, состоящая в движении по кривой PQRHE, изображенной на рис. 2 (PQ, Q/?, НЕ — отрезки, RH — большая ду- га окружности длины 7л/6 км), является единственной оптималь- ной стратегией; б) пусть G — квадрат с длиной стороны, равной 1. Доказать, что стратегия, состоящая в движении вдоль прямой линии вплоть до вы- хода из леса, является единствен- ной оптимальной стратегией; в) в условиях п. б) найти оценку эффективности следующей смешанной стратегии <р: сначала турист согласно равно- мерному закону выбирает случайное направление, затем дви- жется прямолинейно вдоль выбранного направления вплоть до выхода из леса. 1.15. Первая сторона будет находиться в «конфликте» со второй стороной в течение периода времени, равного Т, от момента /=0 до момента t=T. Пусть в момент времени t пер- вая и вторая стороны имеют ресурсы в количествах, соответ- ственно равных р(/) и q(t), а скорость производства ресурсов 15
равна соответственно тг и mt и не зависит от t. Предположим, что в момент t первая и вторая стороны выделяют доли «(/) и v(t) ресурсов на уменьшение производства («изнурение») противника. При этом скорость производства ресурсов про- тивника уменьшается соответственно на величины сги (t) р (/) и q(t), где Ci>l/T и с2— постоянные, не зависящие от t. Остальные ресурсы в количествах (1—«(/)) p(t) и (1—и(/)) q(t) взаимодействуют в конфликте, где единица ресурса одной стороны эквивалентна единице ресурса другой стороны. Пре- восходство одной стороны над другой выразим как разность между суммарными количествами ресурсов сторон, участво- вавших в конфликте за весь период Т. Будем считать первую сторону оперирующей, цель которой — выбрать и (/) таким образом, чтобы ее превосходство в ресурсах над второй сторо- ной было как можно большим. Пусть запасы ресурсов в момент /=0 у первой и второй сторон равны соответственно и q0, причем p^mjct,—пцТ12, q&CjnJc-L—тгТ!2. Найти оценку эффективности стратегии uxi i 1, 0</<т, 0, т</<Т, т<Т-1/с1. 1.16. Лесное хозяйство занимается посадкой и вырубкой леса на некотором участке земли. Если лес вырубить в начале k-ro года после посадки, то прибыль от продажи леса с учетом коэффициента дисконтирования х> ал_, составит ак_г (а—Ь*), где а>Ь и 0<Ь<1. Коэффициенты дисконтирования ak точно не известны: ак=гл, где z — случайная величина, распреде- ленная на отрезке [а, р], O<a<0d, с известным математиче- ским ожиданием г. Цель операции состоит в получении как можно большей дисконтированной прибыли путем выбора года вырубки леса. Составить модель операции. Найти оценку эффективности произвольной стратегии. Найти оптимальную стратегию. 1.17. Продавец берется продать k газет, причем за каждую проданную газету получает прибыль, равную а. Непроданные газеты он возвращает, но при этом терпит убыток, равный 6, на каждой непроданной газете. Спрос, т. е. количество г людей, покупающих газеты, является неконтролируемым фак- тором, принимающим значения на отрезке la, pi, где а, р — известные натуральные числа. Цель продавца — так выбрать х> Коэффициент дисконтирования a^-i отражает падение денежного курса к началу k-ro года, а также психологическое отношение оперирую- щей стороны к будущим выигрышам (их преуменьшение). 16
количество газет k для продажи, чтобы по мере возможности увеличить прибыль от продажи. Составить модель операции. Найти опенку эффективности произвольной стратегии, если: а) спрос г является неопределенным фактором; б) спрос г является случайной величиной с известным ма- тематическим ожиданием г и дисперсией D>0. 1.18. Фотограф занимается фотоохотой на лисьей тропе, имеющей форму отрезка, длина которого равна 1. Точка z появления лисы на тропе является случайной величиной. О функции распределения со величины г известно лишь, что она принадлежит множеству функций распределения Q. Если засада в точке х, а лиса выйдет на тропу в точке г, то качество снимков определяется известной убывающей функцией f от расстояния |х—г|. Цель фотографа состоит в выборе такой точки засады, чтобы достигнуть наиболее качественной съем- ки. Составить модель операции. Найти оценку эффективности произвольной стратегии, если: а) /(/)—® — {<> б) /(0=^. в) /(0 = 1—1», Q = <<o 1 J г dco(z) = a о 0<а< 1; г) /(0 = 1-1», ' 1 \ z dco (z) bI , 0 <а< 6 <1. о / Найти оптимальные стратегии. 1.19. Имеется два агрегата 1 и 2, для которых известны математические ожидания времени работы и tt. Известно также, что с вероятностью 1 агрегаты выходят из строя до момента Т после их включения. Пусть в момент t=0 включают агрегат 1. В момент т, 0<т«Т, если агрегат 1 еще работает, его заменяют агрегатом 2, а если агрегат 1 к моменту т вышел из строя, то указанная замена не производится. Для каждого т оценить математическое ожидание времени работы описан- ного дублированного агрегата. Найти оптимальное время замены т0 и наилучший гарантированный результат. 1.20. На промышленное предприятие ежемесячно посту- пают детали, поставляемые смежными предприятиями. Пред- положим, что вероятность выполнения смежниками поставок 17
в каждом месяце постоянна, равна р и неизвестна. Статистик стремится оценить вероятность р по результату выполнения Я поставок в прошлом месяце. При этом если он приходит к вы- воду, что вероятность выполнения поставок равна х, то ве- I личина потери составит (х—р)2. Цель статистика — так вы- I брать х, чтобы величина потери была как можно меньшей. Составить модель операции. Найти оценку эффективности I произвольной стратегии. Я 1.21. Самолеты, пролетающие над наблюдательным пунк- Я том, могут подавать сигналы двух видов: «свой» и «чужой». Я Предположим, что «свои» самолеты знают расположение своего 1 наблюдательного пункта и всегда подают сигнал «свой». 1 «Чужие» самолеты не знают о том, кому принадлежит наблю- 1 дательный пункт, но знают, как подавать сигнал «свой». По- 1 этому самолеты противника могут подавать любой сигнал; I при этом отсутствие сигнала для наблюдателя равносильно I подаче сигнала «чужой». Пусть для следующих событий ущерб11 | для наблюдателя от осуществления этих событий соответ- | ственно равен: а — если свой самолет принимается за «свой»; I b — если свой самолет принимается за «чужой»; с — если | самолет противника принимается за «чужой»; d — если само- 1 лет противника принимается за «свой». 1 Пусть со — вероятность того, что приближающийся к наб- 1 людательному пункту самолет является «своим». Относительно 1 (о известно лишь, что со'«о «в". Предположим, что опери- . | рующей стороной является наблюдатель, который принимает | решение о том, чей самолет приближается к пункту: «свой» | или «чужой». Целью наблюдателя является уменьшение ущерба I от осуществления перечисленных выше событий. | Составить модель операции. Осреднить полученный кри- терий. Найти оценку эффективности произвольной стратегии, j * В следующей задаче используются некоторые понятия и факты, взятые J из теории массового обслуживания, с которыми можно познакомиться 1 в [17]. * 1.22. В новом микрорайоне города решили открыть парик- махерскую. После экспериментальных исследований было обнаружено, что моменты прихода посетителей можно охарак- j теризовать с помощью простейшего потока с параметром X (т. е. функция распределения промежутка между двумя по- следовательными приходами посетителей равна 1—e~v). О параметре X известно лишь, что 2<Х«2,2. Время обслужи- 11 Под ущербом можно понимать математическое ожидание стоимост- ных затрат, которые несет оперирующая сторона от осуществления пере- числяемых ниже событий, 18
вания посетителей одним парикмахером — случайная вели- чина, имеющая функцию распределения 1—е~*. Кроме того, парикмахерскую можно рассматривать как систему массового обслуживания с потерями. Если в парикмахерской работают п мастеров, то вероятность того, что все мастера заняты, равна ^^)= Л'га|' •> 2 (х*/й!) k=0 а среднее число занятых мастеров равно ап=А(1—РП(Х)). Требуется выбрать число п мастеров в парикмахерской, при котором ап^п/2, а Рп(к) было бы как можно меньшим. Составить модель операции. Найти оценку эффективности произвольной стратегии. 1.23. Пусть f g U, где U — класс всех унимодальных функций на [0, 1] {f^U означает существование такой точки Xf, что f возрастает на [0, xf\ и убывает на (х/, 1] или же воз- растает на [О, X/) и убывает на {х^ 1]). Необходимо, вычислив значения функции f в п точках отрезка [0, 1], локализовать точку Xf в промежутке наименьшей длины. Если при выборе очередной точки xi+1 известны значения функции f в точках Xi, . . . , xt, 1=1, .... п—1, т. е. точки выбираются после- довательно, то говорят, что для поиска максимума функции f применяются последовательные стратегии. Если же точки хи . . . , хп выбираются одновременно, то говорят, что приме- няются пассивные стратегии. Описать модель операции. Найти: а) оценку эффективности произвольной пассивной стра- тегии; б) оценку эффективности последовательной стратегии х. Пусть 6<1; положим ао=О, 60=1, Xi=(l—б)/2, х2=(Ц-б)/2, xaft-i = (aft-i4A-i—6)/2, х2к = (ак_1 + + ^-i + s)/2, где &й_х = &й_2, если f(x2fc_8)< < f (''“2й-'г)> ак-1~ fyj-1 = ^2ft-2> ^ЛИ / (Xsfc-g) / С^гй-г)» k — 2....m; n — 2m. Описанная стратегия называется дихотомией; в) оценку эффективности последовательной стратегии х. Положим т = (1 + К 5)/2, Х!=1/т2, х2=1/т, каждую следую- щую точку надлежит выбирать в промежутке локализации максимума симметрично с уже имеющейся в этом промежутке точкой; т. е. _J 1/т\ /(хг)>/ (хг), ** I 1 —1/т", /(xj </(х2), И т. д. Описанная стратегия называется золотым сечением. .19
t.24. Пусть f££(/<), где L(K)—класс всех функций, удовлетворяющих на отрезке [0, 1] условию Липшица с константой К.. Для приближенного вычисления интеграла 1 используется квадратурная формула о 1 $/(/)d/«J(x, у), О где х = (хх-, ..., х„), y = (ylt .. Функция J (х, у) и узлы xlt . величина 1 J/(/)d/-J(x, у) о •. Уп)> yi = f(xt), 1=1, .., хп выбираются так, чтобы была как можно меньше. Число узлов п фиксированно. Составить модель опера- п ции. Пусть J (х, у) = 2 ^Уг Найти оценки эффективности i — 1 для следующих квадратурных формул: а) прямоугольников: п— 1, хх = 1/2, Лх=1; б) трапеций: n=2, Xi=0, х2=1, ki=kt=l/2; в) Симпсона: п=3, Xi=0, хг=1/2, х3—1, &i=£s=l/6, £2=2/3. 1.25. Построить какую-либо информационную функцию, соответствующую заданной ниже информации о неконтроли- руемых факторах, которой будет располагать оперирующая сторона к моменту проведения операции, если: а) информация о неконтролируемых факторах отсутствует; б) имеется полная информация, т. е. известны значения У и z; в) известны четные компоненты вектора y£Na.Eik и сумма всех его нечетных компонент. 1.26. Пусть /Ио={1......т}, N={1, . . . , п}, г=ф. Построить какую-либо информационную функцию R(y), со- ответствующую заданной информационной гипотезе, и опре- делить число стратегий в множестве MR, если оперирующая сторона к моменту принятия решения знает: а) четным или нечетным числом является значение не- определенного фактора у, б) выполняется ли неравенство у^п—4. 1.27. Пусть множество R(NxZ) состоит из k различных элементов и /Ио={1, .... т}. Сколько имеется стратегий в множестве MR? 20
1.28. Как с точки зрения исследователя операций есте- ственно определить понятие эквивалентности информацион- ных функций? 1.29. Сколько различных классов эквивалентности инфор- мационных функций существует в случае N={1, ... , п}, 1.30. Спелеолог продвигается из точки С\ в точку С2 по пещере, имеющей форму, изображенную на рис. 3. Здесь Ct, i=l, 2, 3,—выходы из пеще- f _________сг ры, D — точка разветвления, ——5Г“ ——— t;1£>=3 км, CiC2=8 км, DCa— X ==2,5 км. В некоторый момент времени to спелеолог повредил д себе ногу, и начиная с этого момента его цель состоит в том, чтобы как можно быстрее выйти из пещеры, выбирая любой из ее выходов. Предпола- гается, что спелеолог при желании может измерять расстоя- ние, пройденное по пещере. Положение спелеолога в момент to на отрезке [Сь С21 характеризуется расстоянием у, пройден- ным от Ci. Составить модель операции в следующих вариантах информированности спелеолога об у: a) 3,5<z/<5; б) 2 <у<4, но спелеолог не помнит, проходил ли он точ- ку D. Найти оценку эффективности произвольной стратегии. >|с В задачах 1.31, 1.35 и 1.37, где множества Л10 и N в операции конечны, стратегии х: N —> Л40 будет задаваться вектором х=(х(1), ... .... х(п)). * 1.31. Пусть х€М0 = {1, 2, 3, 4}, у£/У = {1, 2, 3} и / 3 (W(x, f/))4X3=(j \ 4 7 —IV 3 — 2 | 2 3 у 3 —8/ Найти оценки эффективности стратегий Xi = (l, 1» 0> хг = = (3, 2, 4) и смешанной стратегии <р = (1/2, 1/3, 0, 1/6), если: а) у—неопределенный фактор; б) у—случайная величина с законом распределения со — = (2/3, 1/6, 1/6). 1.32. Пусть F(x, у, z) = х(у-\- z), х£Л40=[—1,-1]; у — стратегия противника, интересы которого противоположны интересам оперирующей стороны, y$N=[—1, 1]; z—слу- чайная величина с плотностью распределения p(z)~ 1—| z |, 21
zgZ=[—1, 1]. Найти оценки эффективности стратегий хг: « - ~ ( I, г 0, у^О или z^O, у^О, х<(у, z) — yz, х.-.хЛу, г) = < , 7 ' ( —1 в других случаях, если: а) противник не знает реализации г; б) противник знает реализацию z. 1.33. Пусть F(x, у, z) = |x—у—z|, x€Afo=[O, 1]; у — стратегия противника, интересы которого противоположны интересам оперирующей стороны, г/€Л<г=[О, 1/2]; z—слу- чайная величина, равномерно распределенная на отрезке Найти оценку эффективности смешанной стратегии—рав- номерного распределения на отрезке [0, 1], если противник: а) не знает реализации z и выбора х; б) знает реализацию z, но не знает выбора х; 'в) не знает реализации г, но знает выбор х\ г) знает выбор х и реализацию г. 1.34. Пусть F(xx, х2, yv уг, zx, z2) = 4t/xxxzx(#x + x^)-|- + 4д/2х2г2 (^2 + xfzx), (хх, х2) £/Ио = [-—1, 1]х[—1, 1]; yit уа — стратегии первого и второго противников, интересы которых . неизвестны, —1 yt1, i=l, 2; zx, z2—две независимые случайные величины, равномерно распределенные на отрезке [—1, 1]. Найти оценку эффективности стратегии оперирую- щей стороны x:x(zx, z2) = (zx, z2), если: а) противники не знают реализаций zx и z2; б) второй противник знает реализацию z2, но не знает реализации гх, а первый не знает реализаций zx и г2; в) второй противник знает реализацию zx, но не знает реализации г2, а первый не знает реализаций гх и z2; г) второй противник знает реализации гх и z2, а первый эти реализации не знает; д) второй противник знает реализации zx и г2, а первый знает реализацию г2, но не знает реализации гх; . е) второй противник знает реализации гх и г2, а первый знает реализацию гх, но не знает реализации z2; ж) оба противника знают реализации zx и г2. 1.35. Пусть хёЛ4о={1, 2, 3, 4, 5}, z€Z={l, 2, 3, 4}, (1—23 О' 0 2 2 7 0 3 2 1 1—12—1 7 —2 0 5. 22
г—случайная величина с неопределенностью в законе рас- пределения ®; известно лишь, что: а) <й € й = {® 6 I ®з = = 1/4}; б) (,)G^={“€S4|co1 + o)2 = w3 + (o4}; в) o)£Q = {®€S4|«>z< 1/3, i=l, 2, 3, 4}; г) со £ й = {® € S41 ©f + 2/5, i#=/, i, j=l, 2, 3, 4}. Найти оценки эффективности стратегий х1=«(2, 5, 2, 5), х2 = (1, 2, 3, 1) и смешанной стратегии <р = (1/3, 1/3, 1/9, 1/9, 1/9). 1.36. Решить задачу 1.32, предполагая, что г—случайная величина с неопределенностью в законе распределения: 1) ® = Р1/-1/2 + Pa/i/2> l/3^Pi^2/3; 2) ® /z(“b’g-/г2> 1^24<Czg^l; 3) плотность f <7 ПРИ |г|< 1/(2<7), Z — I. О при 1/(2<?) < | z| 1, 4^1/2. 1.37. /1 2 3 4 (Г(х, у))зхв- 5 “I 2 3 \5 —2 —2 3 2 3\ х€М0={1, 2, 3}, 4 -з/’ 1/61V = {1, 2, 3,4, 5, 6}, у—стратегия противника, знающего стратегию оперирующей стороны. Найти оценки эффективности стратегий хх = (1, 2, 2, 3, 3, 3), ха = (2, 1, 2, 1, 3, 2), если: а) интересы противника заданы матрицей /2 3 3 4 2 3 \ 4 1 2 3 2 3,5 ; \5 3 —5 2 —1 —2 / б) интересы противника заданы матрицей с элементами 1Гп(х, У)> ° которых известно лишь, что W1(x,y)^. <№п(х, Wi(x, у) при всех x^M^y^N, где W^x, у) — элементы матрицы из п. а), а 1Га(х, у) — элементы матрицы /Я 4 4^Я4\ (Wt(x, </))зхо=/5 2 3 4 3 4Д \6 4 —4 3 0 1 / в) интересы противника заданы либо матрицей (1ГХ (х, у)) из п. а), либо матрицей /О 1 0 1 о 0\ (Г3(Х, </))зхв= 1 0 0 0 1 0 ; \1 0 1 1 1 1/ 23
г) интересы противника с вероятностью 1/2 описываются матрицей (ЖДх, у)) и с вероятностью 1/2—матрицей (W3(x, У))- 1.38. W (х, у) = ^(Х-у)\ хеМо = [О, 1], у£ N— [0, 1]; у—стратегия противника, знающего стратегию оперирующей стороны. Найти оценки эффективности стратегий х,: х, (у) = = у*, x2:x8(t/) = min(l—И"у, 1/2), если: а) критерий противника 1Гп(х, t/)=min(x, 1—2z/); б) критерий противника U?n(x, y) — fa(\x—у\), где [ t -( + з“« о при 0^ t ^а, при а < t 2а, при 2а < t За, при За < i 1, а параметр а является неопределенным фактором, о котором известно лишь, что 1/6 а 1/4. 1.39. 1Г(х, (/) = % + #, хбЛ4о==[О, 1], [0, 1]; у — стратегия противника, знающего стратегию оперирующей стороны. О критерии эффективности противника у) известно лишь, что он непрерывен и что % + у (*, У) ^х + у + а при всех х£Л40, где параметр а>0 известен. Найти оценку эффективности стратегии х в зависи- мости от а. 1.40. Завод выпускает п видов продукции и реализует единицу i-ro вида по цене ch i=l, . . . , п. Имеется основной план с0 по стоимости реализованной продукции, а также до- говоры с организациями на поставку продукции i-ro вида в количестве dif i=l, . . . , и. Завод ежегодно выполнял ос- новной план, но каждый раз недопоставлял продукцию по договорам. Поэтому решено было относить основной план к разности между стоимостью всей реализованной продукции и стоимостью всей недоданной, продукции по договорам. Записать критерий эффективности. 1.41. Автомобиль собирают из пх деталей 1-го типа, .. ., ns деталей s-ro типа. Пусть Wt— количество деталей i-ro ти- па, 1, . . . , s, выпускаемых автомобильной промышлен- ностью. Цель состоит в увеличении производства автомоби- лей. Записать критерий эффективности. 1.42. Поражаемая мишень состоит из четырех отдельных частей. Для поражения объекта необходимо поразить не менее двух частей, в том числе обязательно первую и третью. Пусть 24
для »=h 2, 3, 4 ( 1, если i-я часть поражена, = { л ' ( 0, если t-я часть не поражена; ( 1, если объект поражен, jjz -J ( 0, если объект не поражен. Записать критерий Wo как функцию критериев Wt, ТГ2, Ц73. W7*, используя только операции взятия максимума и минимума. Предположим, что в операции имеется векторный критерий (Wi, i=l, а оперирующая сторона стремится к увеличению значений каж- дого из частных критериев W;. Часто от векторного критерия переходят к скалярному, формируя обобщенный (или единый) критерий. Обобщенный критерий представляет собой свертку векторного критерия и является функцией вида Fo (JFi, ...» Ws). Конкретный вид обобщенного критерия зависит от цели, которую преследует оперирующая сторона по отношению к векторному критерию [3]. * 1.43. Пусть х С Л40 = {1, 2, 3}, = 2, 3}, /3 8 2\ /1 2 7\ (ГДх, «/))зхз = 8 4 8 , (Г2(х, У))зхз= 7 7 7 . \3 2 4/ \4 2 3/ / 2 8 8\ (W3(x, Z/))3X3=4 3 4 10 . \10 10 о/ Записать обобщенный критерий Wo, если: а) все частные критерии равноправны, а оперирующая сторона стремится к увеличению значения хотя бы одного частного критерия; б) все частные критерии равноправны, а оперирующая сторона стремится к одновременному увеличению значений всех частных критериев; в) оперирующая сторона стремится к последовательному достижению частных целей, т. е. для любых х$М0, y^N, k ^о(х, У)= 2 У), i = 1 если W{(x, у)— max W{(x', у'), i— 1, ..., k — 1; Wk(x, y)< max W^x', y'). (*', y')&MaXN 25-
1.44. Частный критерий Wt принимает значение 1,. если выполнена f-я частная цель, и значение 0 в противном случае, /==1, . . . , s. Записать обобщенный критерий используя только операции взятия максимума и минимума, если цель оперирующей стороны состоит в следующем: а) достигнуть хотя бы одной пары целей с соседними но- мерами; б) для любой пары целей с соседними номерами достигнуть хотя бы одной цели из пары; в) достигнуть не менее k целей, &<s; г) из любых k целей достигнуть не менее т целей, Для решения следующей задачи воспользоваться фактом: линейная функция на многограннике Л евклидова пространства Es достигает своего минимума в некоторой вершине многогранника. Многогранник Л задан системой неравенств ранга $. Метод поиска всех вершин многогранника Д состоит в следующем [59, с. 183—185]; нужно перебрать все подсистем^ ранга s, содержащие s неравенств, и решить соответствующие им системы уравнений; если при этом решение системы уравнений является решением исходной системы неравенств (принадлежит Л), то это решение является вершиной многогранника Л. 1.45. Экспертная комиссия определяет «важность» Крите-» риев Wi9 ..., Ws с помощью неотрицательных весовых коэф- s фициентов Zj, ..., Х4, для которых 2 К, = 1. При этом уста- i=i навливается, что вектор X = (Х£, ..., Х4) «должен» принад- лежать множеству Л. Предположим, что оперирующая сто- рона поручает исследователю операции выбор X £ Л для уточ- S нения критерия 2 t. В этом случае исследователь one- 1= 1 рации приравнивает вектор X к неопределенному фактору S и находит обобщенный критерий 1Г0= inf 2 Устано- Х«Л i=l вить вид критерия для следующих множеств Л: ( s а) Л = < X | 2 1; = 1 , р 11 1g Ч I i= 1 где р—константа, 0 < р < 1/з; б) Л==<Х| 2 ^=1. 0<Х,<р,< 1, i=l, .... $ I i= 1
где <= 1, • • •. 8константы, 2f4>1’ 2to<M=l> 1=1 i-\, X|2^ = l, 0<X1SCX2<.. .^Xs<v i= 1 в) A = где v—константа, 1/s < v < l/(s—1); r) A = \X| 2^7=1> • •^^-s ^s-i (» ( 4= 1 J где Ц—константа, 2/(s +1) s < p < 2/(s— 1) s. 1.46. На обувной фабрике можно производить три вида обуви: мужскую, женскую и детскую. На каждую пару муж- ской, женской и детской обуви соответственно требуется клея 20, 20 и 10 г, кожи 4, 2 и 1 дма. Стоимость мужской, жен- ской и детской обуви с учетом всех работ соответственно равна 20, 30, 10 руб. Запасы клея составляют 3 т, а кожи — 4000 м2. Рассмотреть следующие две операции: в первой операции все имеющиеся ресурсы используются полностью, а во второй последнее требование не является обязательным. В обеих операциях цель состоит в выборе такого производства обуви, при котором стоимость выпущенной продукции является максимальной. а) Найти оптимальные стратегии в обеих операциях и сравнить наилучшие результаты. б) Предположим, что детская обувь не выпускается совсем. Наложить необходимое и достаточное условие на количество ресурсов, при котором во второй операции оптимальное про- изводство не использует всех ресурсов. 1.47. Имеется и промышленных предприятий, производя- щих разные типы продукции, но использующих ресурс одного и того же вида. Если t-e предприятие выпускает продукцию в количестве xit то затраты ресурса составляют VatXi, а при- быль dXt—d-iXi, где ait ct, d,— положительные константы. Пусть Ai— количество ресурса, находящегося в распоряже- нии i-ro предприятия, a Bt— план по производству продук- ции. Предположим, что все предприятия объединились для выполнения планов и получения положительной прибыли путем перераспределения ресурсов 1*. Найти необходимое и Достаточное условие, при котором эта цель будет достигнута. Х) Ресурс предполагается бесконечно делимым. 27
1.48. Рассмотрим две операции, в которых критерием яв- ляется количество денег, полученных от двух производств, использующих один вид ресурса: т w1(x)= 2 w, i= 1 m 2 i= i й; > 0, i = 1 , . . . , m ^2 ({/)= .5 djyp y£M%=ly€E''. 2 bjy, < B, i— 1 I / = 1 bj > 0, / = 1, ..., n Рассматривается объединенная операция, цель которой получение возможно большей суммы денег от обоих произ- водств. При этом предполагается, что между производствами возможно перераспределение ресурсов, а после выбора х, у и получения ГДх), — выплата побочного платежа при известных х, у, W\(x), W2(y). Составить модель объединенной операции. Найти необходимое и достаточное условие такое, что при оптимальном поведении в объединенной операции сумма денег, полученных двумя производствами, будет боль- ше, чем аналогичная сумма, когда объединение частных опе- раций не происходит, но х и у в них выбираются оптималь- ными. Замечание. В соответствии с терминологией теории игр опери- рующие стороны производства можно считать игроками, а оперирующую сторону объединенной операции — коалицией двух игроков. Пусть значе- ния критериев W\(x) и W2(y) являются количествами бесконечно-делимого и свободно передаваемого между игроками продукта. Тогда под побочным платежом понимается передача части продукта’одного игрока другому в количестве, не превышающем max(W\(x), IF2(j/)).
2 Глава ОПЕРАЦИИ ПРИ НАЛИЧИИ ВЕКТОРНЫХ КРИТЕРИЕВ И БИНАРНЫХ ОТНОШЕНИЙ ПРЕДПОЧТЕНИЯ Рассмотрим операцию с векторным критерием IF(х) = (WY(x), ...» IF5(x)), х^М0. Пусть оперирующей стороне желательно иметь возможно большее значение каждого частного критерия IF/(x). Стратегия х°£М0 называется эффективной (оптимальной по Парето), если не существует стратегии х£М0 такой, что ^/(x)>IF/(x°), Z=l, ..., s, W(x) Ф IF(x°). Множество всех эффективных стратегий обозначим Р (Мо). Стратегия х°£М0 называется слабоэффективной (полуэффективной, оптимальной по Слейтеру), если не существует такой стратегии xgM0, что IF/(x) > > IF/ (х°), *=1, ...» s. Множество всех слабоэффективных стратегий обозначим S (Л10). Понятия эффективной и слабоэффективной стратегий являются обобщениями понятия оптимальной стратегии на случай век- торного критерия. Положим, D — IF (Мо) — {и£ES | найдется стратегия х£М0 такая, что IF (х) — и}~ образ множества 7И0 при отображении IF: Мо—> Es. Аналогично положим Р (D) — IF (Р (Мо))» 5 (D) = IF (S (Мо)). Множества Р (D), S (D) определены, в частности, для произвольных множеств DczE5. Действительно, достаточно положить Мо —D и для любых wgD IF/(u) = u/, i — l, s. Векторы из множеств Р (D) и S (D) называются соответственно эф- фективными и слабоэффективными векторами. Основы теории много- критериальных задач см. в [6]. >|с 2.1. Показать, что всякий эффективный вектор является слабоэффективным. Верно ли обратное утверждение? 2.2. Доказать, что множество эффективных векторов из компакта DczEs не пусто. 2.3. Доказать, что множество всех слабоэффективных век- торов компакта D с Es является компактом. 2.4. Доказать, что множество всех эффективных векторов из выпуклого компакта Da.E2 является компактом. Сущест- венно ли здесь требование выпуклости множества D? 2.5. Построить пример выпуклого компакта D<~1E\ для которого множество всех эффективных векторов не замкнуто. 2.6. Найти множества всех эффективных и слабоэффектив- ных векторов для следующих множеств D евклидова простран- 29
ства: a) D = < и € Es S 2 «/«?= R 1=1 где константы /?, а{, 7=1, s, положительны; б) D= {и £ Es |й, ^.и{ ^b{, t=l, .... s} — параллелепипед евклидова пространства Es; в) D = 2.^°—1, / = 1, .... sp, г) £> = со{а, Ь, с, d, ak, bfc, &=1, 2, ...}а:Е3, где а = (/2/2; /2/2; 1), &=(/2/2; /2/2; 0), с = (0; 0; 1), d = (.0; 0; 0), aA = (cos/ft; sin/A; 1), b* = (cos^; sin/*; 0), /й = л/4 + М^), 4 = (tk + tk+1)/2t Л=1, 2, ...; д) O=co(//1u//1), где H1 = {u£Ei\(ui> «a)€Qi, 0<«3<l, m4 = 0}, H2 = {« E* | (ui, «a)€Q2, m3 = 0, 0<w4<l}, Qi, Q2cE3—выпуклые множеству с границами, соответст- венно равными L3 U L2 U [(0; 0),(/2; 0)]и[(0; 0)Д0; /7-1)] и LxU^uK/T-l; 0), (0, 0)]и[(0, 0), (0; /2)], /, 1 = 1, 2, 3, 4,— меньшие из дуг окружностей uJ + «2 = 2, («i + l)®-|- +(«a+1)2 = 8, соединяющих соответственно точки (0;/2) с (1; 1), (1; 1) с (/2; 0), (0; /7-1) с (1; 1) и (1; 1) с (/7—1; 0). 2.7.. Найти множества всех эффективных и слабоэффек- тивных стратегий в следующих многокритериальных задачах: а) Л40 = [0, (3 + /13)/4], Wt (х) = х, W7, (х) = х3—Зх2+2х; б) /Ив = [0, 1], Г4(х) = ах + 6(1—х), Г2(х) = х“(1—х)Р, где а, Ь, а-, 0—положительные константы; в) /И0 = 53, W\(x) = min(xf, 1/2), lFs(x) = xa, (х3, 0^х3^1/3, 1/3, 1/3<х3< 2/3, х3—1/3, 2/3 < х8< 1; г) Af0=S*, {/ s s сгхД 2 xj ) > если S х] > 0, \/=* / / = 1 О, если 2 xi = О, / = » 30
где i, ...» s < k9 a cz, /= 1, ..s—положительные кон- станты; д) Mo — Ss> F/(x) = min (minx,, f=l, s, где константы kt > 1, i = l, ..., s. 2.8. В евклидовом пространстве Es задано такое мно- жество Q векторов с целочисленными координатами, что для любого вектора «€Q Q(«)flS(Q)#= 0, где Q («) = {«'€ QI и' = M + reCQ. г—целое}, е=(1; !)€£< Найти подмножество D множества Q, содержащее наиболь- шее число векторов такое, что для любой упорядоченной пары векторов и, и' £D неравенство ut^ut выполнено хотя бы для одного номера i. 2.9. В евклидовом пространстве заданы целочисленный параллелепипед Ql = {u^Es\0^.u1^ai, иг—целые, i = 1, ..., s} и шар Q2=|«€£*| 2 ^г4» ui—целые, i = l, ...,s|, где ab ,i=b •••, s—натуральные числа, а г—вещественное число. Для множества ,Qf при s = 2, 3 и для множества Qj при s = 2 найти подмножество D, содержащее наибольшее число векторов такое, что для любой упорядоченной пары векто- ров и, u'£D из i = l, ..., з, следует и —и'. * Для вещественных чисел р/ > О, Р/, 1=1...s, положим р=Чрь рД X = (%i, ХД P = (Pi, PJ. Определим для ком- пакта Dc:Es множества Di (р, Р) = Argmax Г min р/(«/—Р/)“|, u^d J (р. Р) = Argmax У «/• «егмр. ₽) i=i $ Dt (%) = Argmax У! * «<=D 2.10. 1) Показать, что для произвольного множества DcEs справедливы следующие равенства: S(D)= fu£D\ sup min = 01, I |u'6Dl<f<s J P(D)=/u£D| sup u'{—u{^0, i—1, ..., s\, 1 | u'eR(u) f где /?(«)»= {a'Z=l, .... s}. 31
2) Показать, что для компакта DczEs найдется вектор P°££s такой, что S(D)= и DJp.p»), Р(£>) = U О2(р, ₽«). рб int ре int 2.11. Показать, что для выпуклого компакта Da:Es S(D)= U KeEs+\{0} Будем говорить, что 'множество эффективных векторов Р (D) удовлет- воряет условию регулярности в точке и^Р (р), если найдется такая; константа с (и) > 0, что для всех uf s •min (и; — Ui)^~c(u) 2 (u’i~ui)* l<i<s i=l j Множество P (D) регулярно, если оно регулярно в каждой точке. Мно- жество Р (D) равномерно регулярно, если константу с в определении; регулярности в точке можно выбрать не зависящей от .и£Р (D). ?|с •’ 2.12. Показать, что для выпуклого компакта D условие регулярности в точке и £ Р (D) равносильно существованию такого вектора % € int Es+, что u$D3(k). 2.13. Показать, что если DczE2—выпуклый компакт и множество Р (D) регулярно, то множество Р (D) равномерно регулярно. Привести пример невыпуклого компакта DtzE2, для которого множество Р (£>) регулярно, но не равномерно регулярно. >|с Возьмем вектор такой, что Р? < min U[ == U(, i=l, ..., s. utD ~~ Для e > 0 и pgint£+ определим множество Z)8 (p) = Argmax min pi(ui — P?) + e S “< • * x 1-Ci^s j— j 2.14. Пусть DcEs—компакт, для которого множество равномерно регулярно. Доказать, что P(D)= и Пе(р) ре int при некотором е > 0. Для компакта Da:Es величина г ,(£>) = max «f—ut, t=l, ue D — ..., s, называется i-м размахом множества D. 2.15. Пусть выпуклый компакт Dc.E2 имеет положитель- ные размахи rt(D), r2(D). Показать, что при р{ = 1/г{(0), = и{, i = l, 2, найдется такой вектор и£Р (D), что (р7 £) = {«}• 32
2.16. В условиях п. а), в), г) задачи 2.7 найти множества ЛЩХ) = Argmax 2 хеМ0 i=i где К € int Es+. 2.17. В условиях п. а), г), д) задачи 2.7 найти множества MJ (р) = Argmax Г min хеМ0 L 1<i<s J rflep€int£j.. 2.18. В условиях п. a)—д) задачи 2.7 найти множества Mo (р) = Argmax Г max р{W{ (х)1, где р€ intEj.. 2.19. Пусть {D*}£=i—последовательность компактов DkaEs, сходящаяся к компакту DcEs в метрике Хаусдорфа р(А, В) = max/sup inf p(u, v), sup inf p(«, v)l, A, BcE5. \ue A veB ve В tie A f 1) Показать, что для всякого найдется последо- вательность ик е Р (D1*), k = 1, 2, ..., такая, что ик —► и. 2) Показать, что для последовательности ик, 6=1,2, ..., такой, что ик £ S (Dk), 6=1, 2, ..., предел и € S (D). 3) Привести примеры, показывающие, что первое утверж- дение не верно для множеств слабоэффективных векторов, а второе—для множеств эффективных векторов. Пусть Мо— произвольное множество. Подмножество RaMQX MQ назы- вается бинарным отношением на Мо. Предпочтения оперирующей стороны на множестве стратегий Л10 можно задавать с помощью бинарного отноше- ния. Для этого достаточно описать множество 7? пар (х1, х2) для которых оперирующая сторона предпочитает (вообще говоря, в нестрогом смысле) стратегию х1 стратегии х2. Если (х1, х2)£7?, будем также писать х1/?х2. По заданному бинарному отношению R определяется соответствую- щее ему отношение строгого предпочтения'. Р={(хх, х2) g/?|x17?x2, (х2, x^ffcR). Бинарное отношение R называется рефлексивным, если xRx для всех х£М0; симметричным, если х17?х2 влечет х^х1; транзитивным, если x1Rx2, x2Rx* влечет х1/?х3. О бинарных отношениях см. [33, 34, 38, 56]. >|с 2.20. Для следующих бинарных отношений R найти усло- вия на параметры, при которых R рефлексивно (симметрично, транзитивно): а) Л1о = [О, 1], 7? = {(х1, х2)^Л40хЛ10|а^х1^& или c^x2^d}, где а, 6, с, d—вещественные числа; б) Л1о=[О, 1], R = {(x\ х2)еМ0хМ0[х1+а<х2<хЧЬ], где а, b—вещественные числа; в) Мо = {1.....т}, /? = {(/, i)eMoxMo\a{/>c}, где (аи)тхт—матрица, ьй строкой которой является вектор 2 № 1904 33 L
(О, 1, 2, ...» m—V), «циклически сдвинутый» на i—1 ком- поненту вправо, а с—вещественное число. >|с Множество Сд = {х1 g Л101 не существует х2£Л40 такого, что х2/?хт} называется ядром бинарного отношения R. Множество назы- вается решением отношения R, если выполнены следующие условия: 1) для любых х1, x2£Vr (х1, х2) £ R, (внутренняя устойчивость)] 2) для любого x2(£v# найдется х1^^: х^х2 (внешняя устойчи- вость). Если R рефлексивно, то C^=F^ = 0 и целесообразно использовать ядро и решение отношения строгого предпочтения Р, соответствующего R. Когда предпочтения оперирующей стороны на множестве страте- гий Мо заданы бинарным отношением, то в качестве «оптимальных» стратегий следует брать стратегии из ядра или решения. # 2.21. В условиях предыдущей задачи найти ядра и ре- шения бинарных отношений R и Р. 5|с Пусть на множестве стратегий Л40 задан векторный критерий IF: MQ —> Es. Определим следующие бинарные отношения на Мо: для х1, х2£/И0 будем писать х1^х2, если IF/(х1) IF/(х2), 1=1, .... $, IFfr1) w (х2); х1 > х2, если IF/(х1) > IF/(x2), Z=l, ...» s; х1^1ехх2, если первая ненулевая компонента вектора IF (х1) — IF (х2) положительна. Бинарное отношение lex задает лексикографический способ сравнения стратегий. Говорят, что критерии IF/, IF у однородны, если sup W7/ (х) = sup IF у (х), inf IF/(x)= inf IFy(x). хем0 Х€Л1О Пусть критерии IF/, i== 1, s, попарно однородны и равноценны для оперирующей стороны. Будем писать х1 > х2, если найдется переста- новка л индексов 1, 2, ..., s такая, что ^co^^lF/Cx2), i=l,..., s, и хотя бы одно из этих неравенств’Выполнено как строгое. Если в век- торном критерии все частные критерии попарно однородны и равно- ценны для оперирующей стороны, то ей следует использовать стратегии 2.22. Показать, что С>=5(Л40), С> = Р(М0), а если векторный критерий W непрерывен на компакте ЛТ0, то 5(Л40) и P\MQ)—единственные решения бинарных отноше- ний > и 2.23. Пусть частные критерии W h f = l, ..., s, ограни- чены на Л1о и имеют положительные размахи. Найти кон- станты > 0,, р/, i= 1, ..., s, такие, что критерии a/ITj+p,, i = 1, ..., s, попарно однородны. 2.24. Пусть векторный критерий W непрерывен на ком- пакте Мо. Показать, что ядро лексикографического отноше- ния предпочтения ]ех не пусто, а если, частные критерии 34
у/ i = l, .... s, равноценны и попарно однородны, то ядро С ’^=0- 2.25. Найти ядро лексикографического отношения пред- почтения в следующих многокритериальных задачах: a) Ma={xeEs\Ci^x{^dh i=l.........s}, (х) = 2 /= 1 /==1, s, где c{, d{, aif, i, / = 1, .... s—вещественные числа; б) Mo = Ss, Wt (x) = min(xz, ct), где 0 < ct < 1 — вещест- венные числа, i= 1, ..., s. 2.26. В следующих многокритериальных задачах перейти к попарно однородным критериям az!Fz + ^z, а{ > 0, 1 = 1, ..., s, и найти ядро бинарного отношения >: а) Л4о = [О, 1], W^xj — x, F2(x) = — ах* + Ь, где а, b — положительные числа; б) выполнить задание п. б) задачи 2.25. 2.27. Пусть R—бинарное отношение, заданное на ко- нечном множестве стратегий Мо = {х1', j — I, ..., tn}. На мно- жестве смешанных стратегий {ф} = 5га определим [38] бинар- ное отношение R: (ф, ф') € R, если Д(<р, ф') = 2 Ф/Ф/— 2 Ф/Ф/>0-1 I»./): xiRxJ xjRxi а) Показать, что поиск стратегий ф из ядра сводится к решению игры с матрицей v А = (aZ;)mxm» где (1, если x<Rx< (хЛ x‘)£R, —1, если xfRx't (х^ х^Т?, О в остальных случаях. б) Пусть 7? = {(xf, x7)|(g j) = (i> i+Hmodm))}* Найти ядро C^. в) Показать, что но для решений вклю- чение в общем случае не имеет места. * Говорят, что векторный (скалярный, если $=1} критерий IF: Л40-> представляет бинарное отношение RciMqX на множестве Мо, если для любых и х2 соотношение х17?х2‘ выполнено тогда и только тогда, когда хх>х2. Размерностью dim R бинарного отношения называется минималь- ная размерность представляющего его критерия. Бинарное отношение R называется асимметричным, если xrRx2 влечет (х2, х1)^/?; отрицательно 1) Основные понятия антагонистических игр см. в гл. 4, 2* 35
транзитивным, если из (Xх, х2)§ЁЯ, (х2, x?)$£R следует,- что' (х1, х3)^/?; отношением древесного порядка, если из х2КК*, x2Rx? следует, что либо х17?х2, либо х2/?х1. 2.28. Показать, что, для того чтобы для бинарного отно- шения R на счетном множестве стратегий Л10 существовал представляющий скалярный критерий, необходимо и доста- точно, чтобы отношение R было асимметрично и отрицательно транзитивно. Привести пример, показывающий, что утверж- дение может быть неверно для несчетных множеств Мо. 2.29. Показать, что, для того чтобы для бинарного отно- шения R на конечном множестве стратегий Мо существовал представляющий векторный критерий, необходимо и доста- точно, чтобы отношение R было асимметрично и транзитивно. 2.30. Найти размерности и соответствующие представляю- щие векторные критерии для следующих бинарных отношений: а) Мо= {xz| / = 1......5}, /?—{(xf, х1), i^2, (х2, х2), б) Мв = |хЛ yf, i=l, ..., k}, 7? = {(хЛ, Z/A)I/1 /J; в) Mo = {x^ | j = 1, ...» m}, R—бинарное отношение дре- весного порядка. >|с Пусть для векторного критерия W:M0—> Es и некоторого номера Z, 1 I s, множества М/ = Argmax (х) не пусты при 1=1, I—1 и пусты при Z = Z, s. Последовательность стратегий fc=l, 2, называется лексикографически максимизирующей [48], если для всех достаточно больших k стратегии х* принадлежат множеству Mi-i и sup Wt(x)= lim (хЛ). x€^z-i /г->оо Последовательность стратегий ^=1,2, называется эффективной, если либо lim W; (xk) — + оо, i = 1, ..., s, k 00 либо для любого ненулевого вектора e = (8i, &т) с неотрицательными компонентами найдется такое натуральное число kQ, что для всех k^k0 не существует такой стратегии х £ Л40, что W; (х) (хк) 4-8/, z=l, s, и по крайней мере одно из этих неравенств выполнено как строгое [6]. # 2.31. Найти лексикографически оптимизирующую и эффек- тивную последовательности в такой многокритериальной задаче: Af0 = £'1, -+ £2, IT1(x) = min(l, f(x—а)), W2(x)^f(x-b), где а а и Ь—вещественные числа. 36
2.32. Показать, что последовательность, максимизиру- ющая скалярный критерий, представляющий бинарное отно- шение ^1ех, может не быть лексикографически максимизи- рующей. ^Рассмотрим иерархию задач принятия решений. Пусть f: p—f(x) — функция агрегирования, отображающая множество стратегий Мо нижнего уровня на множество стратегий верхнего уровня. На множе- стве М0(Л11) задано бинарное отношение оперирующей стороны. Первоначально оперирующая сторона выбирает стратегию р£М} на верх- нем уровне, а затем стратегию на нижнем уровне. В проектирова- нии сложных технических систем это соответствует процессу уточнения (детализации) проекта. Будем говорить, что отношение согласовано с от- ношением если для любых стратегий р, p'gAli, х'£М0, таких, что pR^p', л:'^/”1(р'), найдется такая стратегия х^/“др), что х%ох'• Отно- шение Ri согласовано с отношением ROi если для любых стратегий х, х' £М0 из xRqx’ следует f (х) R1f(xf). Отношения Ro и R± вполне согласованы, если 7?0 согласовано с 7?i, a Rr— с /?0- Бинарное отношение >, задаваемое векторным критерием F (крите- рием W) на верхнем (нижнем) уровне, будем обозначать >1 (>0). >|с 2.33. Доказать следующие утверждения: . а) если отношение 7?0 согласовано с отношением Rif то Cr, => б) Если отношение согласовано с отношением 7?0, то Cr, <= /(€/?<,)• Всегда ли справедливы аналогичные включения для ре- шений и Vr,? 2.34. Указать значения параметров, при которых выпол- нены условия согласования в следующих иерархиях много- критериальных задач: а) М0={х1, х2, х3, х4}, Мх={р1, р3, р3}, f(xf)—ps, j— = 1, 2, 3, f(x4)=p\ W : Mo-> Е3, 1Г(х1)=(3; 5; a), F(x2)= =(5; 2; 3—а), 1Г(х3)=(6; 8; 2), Г(х4)=(а; а2; 1), F : Е3, F(p1)=(8; 7), Е(р2)=(Ю; 6), F(p3)=(9; 7), где а — вещественное число; б) Мо=Ю, Их[0, 1], Мх=[0, а+₽], f(xit х2)=ахх+₽х2, W : Л40-> Е3, Wt(xi, x2)=Xi+x2, W2(xlt х2)=—хх4-х2, F : Mx-> Е1, F(p)=p, где а, (3 — положительные числа. Найти ядра'отношений ^0, в этих задачах. Рассмотрим задачи принятия решений при наличии неопределенных факторов y£N. Пусть на множестве Л10ХМ задано бинарное отношение предпочтения R оперирующей стороны. Определим на множестве страте- гий Mq бинарные отношения Rr и R2i соответствующие отношению R. Для стратегий х, х'£2И0 будем писать х/^х', если для любого значения у'найдется такое значение y£N, что (х, у) R(x*, /); xR2x', если для любого значения y£N найдется такое значение у' .что (х, у) R(x', у'). Если оперирующая сторона при выборе «оптимальной» стратегии исполь- зует бинарное отношение R1(R2)t то она ориентируется на более (менее) благоприятные исходы (х, у), 37
Пусть ;на> множестве MQ X N задан векторный критерий IF: MQX N —Наряду с бинарными отношениями 1, ^2, соответ- ствующими отношению по критерию IF, определим бинарное отно- шение 3 на множестве Л!о: для стратегий х, х' £ Мо будем писать х^Зх', если inf IF/(х, y)^t inf IF/(x', у), /=1, ...» s, y$N yeN и хотя бы одно неравенство выполнено как строгое. Вектор и£Е3 назы- вается достижимым, если найдется стратегия х £ Л40 такая, что inf IF/ (х, у) «/, i = 1, ..., s; ye N при этом стратегию х будем называть стратегией, гарантирующей век- тор и. 2.35. Найти ядра бинарных отношений >1, ^2, >3 в следующих многокритериальных задачах: а) Ма — {х1, х2, х3}, N— {у1, уг, у3}, W•.MoxN —► £2, /1 5 3\ (ВД ^))»хз = (4 12, и Л J * /5 1 5\ («Ш = _4 у; б) М„ = {х1> х2, Xs, х4}, N={y1, у3}, W-.M^xN —> Е2, /4 5\ (HW«/'))<x8= 8 2 . 0W^))4x2= з 2 • \5 3/ . \ 4 —1/ 2.36. Рассмотрим модель из задачи 1.7, в которой вторая сторона не выделяет резерва (0 = 0), а критерий первой стороны—векторный: W ’.MoxN —+ Еп, W((х, y) = max(xi—piyi, 0), t=l....п. . а) Найти ядра отношений >1, >2, ^>3. б) Показать, что, для того чтобы вектор и € О" был до- стижимым, необходимо и достаточно выполнения неравенства ^2 и^^^А—В рр itlW ie/(u) где I(u) = {i\ut > 0}. 2.37. Две стороны обмениваются товарами т типов; а=(а1( ... ат)—вектор запасов товаров и А—количество денег у первой стороны; Ь = (Ь1г ..., Ьт)—вектор запасов товаров и В—количество денег у второй стороны. Обмен товарами происходит следующим образом. Стороны незави- 3S
tn симо друг от друга выделяют деньги в количествах / т 4 на покупку товара i-ro типа; Мй=\х^Е^ 2 */ = множество стратегий первой стороны; N= ^Ур=в\— множество стратегий второй стороны. Цена р{ единицы то- вара i-ro типа определяется выражением = i=l at + b. т. После распределения сторонами денег обмен товарами происходит в соответствии с установленными ценами. В ре- зультате обмена новое количество товара i-ro типа у первой (оперирующей) стороны равно W Лх, y)= ( _ . , ' а' ( ab Pi = 0, t= 1, ..., tn. Векторный критерий оперирующей стороны—F — (W ь..., Wт). а) Найти ядра бинарных отношений ^1, ^2, ^3 б) Показать, что, для того чтобы вектор и^Е™ был до- стижимым, необходимо и достаточно выполнения неравенств т лТв(а'+^ /=1.........т- Яс Рассмотрим вопрос принятия решений при наличии случайных фак- торов 2 £ Z. Предположим, что множества Мо и Z конечны, т, е. 7И0 = {хг, ..хт}, Z = {z1, ...» zn}, а q g Sn — вероятностное распределение на Z. Пусть на множестве MQ X Z задано бинарное отношение R. Если (х\ z71) R (xl2, г72), то будем писать более коротко: (if, i2, j±> /2) € Я. На мно- жестве смешанных стратегий Sm оперирующей стороны определим бинар- ное отношение Rt; если (p = (pj; ..рт), р'т) € т0 будем писать <p7?i(p', когда .2. pmwiS .2 /лад,- (G» /1> /») € R Ui» 1*2» /1» /2) € R Из определения ясно, что если <р/?1<р', то более предпочтительные исходы (х, z) возникают с большей вероятностью при стратегии <р, чеАм при стратегии <р'. Для бинарного отношения соответствующего векторному крите- рию W:MoxZ—►£$ наряду с бинарным отношением ^1, определим на множестве Sm отношение 2:(р^ 2(р', если 2 №к(х‘, Wk (х>, г/) p’iqf, fe=l, .... s, i. i i. I и хотя бы одно неравенство выполнено как строгое. 38
2.38. Пусть Ма*={х1, х\ х*, х4}, Z={zl, z\ z8}, q*= »= (1/6; 1/3; 1/2). Найти ядра отношений Rit соответствующих следующим бинарным отношениям R: а) /? «{((А гЛ), (хг>, гЛ))|(/ь i2, jit /8) = (1, 4, 3, 2), (2, 3, 1, 1), (4, 2, 1, 3), (2, 2, 3, 1)}; б) /?={((х'*, zA), (х'., zA))| 4<i8, /i = /J. 2.39. Показать, что ядро бинарного отношения Ri яв- ляется множеством оптимальных смешанных стратегий пер- вого игрока в некоторой матричной игре с кососимметри- ческой матрицей. 2.40. Найти ядра бинарных отношений 1 и ^2 в сле- дующей многокритериальной задаче: Л40={х\ х8}, Z={z\ г8, г3}, </ = (1/4; 1/4; 1/2), W-.MtxZ — Е3, (ИМх', z/))2X3 = (J 72 {), (W. г/))2Хз = (5 1 б)-
3 Глава ОПТИМИЗАЦИОННЫЕ ЗАДАЧИ Оптимизационные задачи приходится решать при поиске оптимальных стратегий в операциях без неопределенных факторов, т. е. в условиях пол- ной определенности 1). Действительно, в этом случае критерий эффектив- ности F зависит лишь от стратегии X оперирующей стороны и, как отмече- но во введении, оптимальной является стратегия х°£М0, для которой F(x°)= maxF(x). (3.1) х€ М о Экстремальные задачи (3.1) могут иметь нестандартный вид и потребовать от исследователя выдумки и изобретательности при разработке методов их решения. В какой-то мере это естественно, поскольку изучению подвер- гаются самые различные ситуации и модели. Отсюда следует, что исследо- ватель операции должен владеть основными методами решения задач ма- тематического программирования, динамического программирования, ва- риационного исчисления, оптимального управления и т. д. [2, 9—11, 29, 30, 43, 49]. В настоящей главе не ставится цель познакомить читателя ср всеми разделами и тонкостями соответствующих теорий, поскольку не- возможно изложить столь обширный материал в рамках одной книги. Предлагаемые задачи могут быть решены с использованием лишь основных фактов теории и методов оптимизации. # 3.1. Колхоз предполагает засеять зерновыми культурами поле площадью S. В его распоряжении имеется К единиц удобрений. Из опыта известно, что внесение x(s) удобрений в точку sgS дает прибавку урожая a(s)>x(s), причем в точку s можно вносить не более b (s) единиц удобрений. Определить распределение удобрений по площади S, обес- печивающее наибольший урожай, если урожайность в точке s£S без внесения удобрений равна c(s). 3.2. Найти максимум функционала. F (%(.))= min [1, a(s)x(s)]ds s при ограничениях x(s)>0, J x(s) ds= 1, где a(s)>0. s 1} Модели операций co случайными факторами рассматриваются в гл. 7, 41
а) Дать содержательную интерпретацию задачи, анало- гичную задаче 3.1. б) Рассмотреть случай S=[—1, 1], a(s) = 6-]-s2, где 0<feC I- 3.3. 1) Доказать лемму Гиббса:, пусть функции /Дх), х С Е1 дифференцируемы и х° = (х?, ..., х„) максимизирует п п 2 fi(xi) при ограничениях 2 xt=X, хг>0; тогда суще- 4 = 1 1 = 1 ствует число X такое, что ( <Х, х? = 0, ««> = ( Х.х<>0. <3-2) 2) Пусть, кроме того, все функции /Дх) вогнуты. Дока- зать, что тогда необходимое условие (3.2) является и доста- точным. 3.4. Пусть некоторый объект находится в одном из п ящиков с вероятностями plf ..., рп. Если оперирующая сторона затрачивает xf единиц времени на поиск объекта в t-м ящике, то в этом случае вероятность обнаружения объекта равна 1—e~btxi (если, конечно, объект находится в данном ящике). Время поиска ограничено величиной X. Определить время поиска в каждом из ящиков, обеспечи- вающее наибольшую вероятность обнаружения объекта. Найти решение задачи при pibi— const. Указание. Использовать лемму Гиббса из задачи 3.3. * Следующие три задачи иллюстрируют элементы теории оптимального управления. 3.5. В результате технологического процесса произво- дится некоторый продукт. Функционирование этого процесса на отрезке времени [О, Г] описывается уравнением x(t) = [au(t)—Р] х(4), х(0) = а, где х(4)—количество продукта в момент 4; а—начальный запас в момент 4 = 0; и (4), 0 и (4) 1 —часть продукта, вновь направляемая в производство в момент 4; а, р—про- изводственные коэффициенты. Целью оперирующей стороны является максимальное накопление продукта за период [0, Т]. Найти оптимальную стратегию. 3.6. Минимизировать т F(x(), u(-))=$x2(4)d4 о при ограничениях х(4) = м(4), х(0)=1, |м(4)[^1. 42
3.7. Решить задачу о быстрейшем попадании траектории системы /х(0=-//2(0 + «2(0. U(o=«(o с управлением u(t), | ы (£) | 1, из точки х = 0, у = 0 на множество Q = {(х, у) | х = 1}. >|с Многие задачи оптимизации, встречающиеся в исследовании операций, могут быть решены методом динамического программирования (см., на- пример, [1, 2, 11, 13]). Этот метод предлагается использовать в задачах 3.8—3.11. * 3.8. Имеется начальное количество средств /f0, которое нужно распределять в течение т лет между двумя отраслями производства 1 и 2. Средства X, вложенные в ью отрасль, приносят доход А(х), однако уменьшаются при этом до gi(x)<Zx. По истечении года оставшиеся средства заново распределя- ются между отраслями. Средств извне не поступает, и в про- изводство вкладываются все оставшиеся в наличии средства; доход не вкладывается, а накапливается отдельно. Требуется найти способ управления ресурсами, при ко- тором суммарный доход обеих отраслей за т лет будет мак- симальным. Решить задачу в следующих случаях: а) /Со=Ю, т=5, Л(х)=х2, g*i(x)=0,75x, /2(х)=2х2, g^x)~ =0,Зх; б) /Со=2, m=5, А(х)=1—е~~\ g’i(x)=0,75x, f2(x)=l— е~2*, g2(x)=0,3x. 3.9. Известно, что промышленность может выпускать п различных типов станков. Пусть bki k=\, . . . , и,— потреб- ность в каждом из этих типов. Станок типа k может выполнять работу станка типа &+1 и всех последующих типов. Задана функция стоимости изготовления т станков типа k. Требуется определить, какие типы станков и в каком ко- личестве необходимо выпускать, чтобы удовлетворить задан- ные потребности при наименьшей сумме затрат на производ- ство. а) Решить задачу при n=4, bh=k, fb(x)=akxQ>*\ av— = 1900, а2=1700, «3=4300, «4=1100. б) Найти решение задачи, если функции стоимости Мх)_-= ==«&% — линейные. 3.10. Предприятие выпускает консервы (овощной суп с цыплятами) в течение всего овощного сезона. Договор на поставку цыплят заключается перед началом сезона. Цена цыпленка зависит от размера покупаемой партии, которая должна быть кратна 100. Если цыплят не используют в ту же 43
неделю, когда они доставлены, их следует хранить в холо- дильнике, который арендуется предприятием. Требуется опре- делить количество цыплят, которое следует покупать каждую неделю, чтобы минимизировать суммарные затраты на покупку цыплят и их хранение при условии, что недельная потребность в цыплятах 300 шт., период работы длится 5 недель, а цены и затраты приведены ниже. (Замечание: в первую не- делю предприятие закупает не менее 600 цыплят.) Количество цыплят, сотни шт. Цена, руб. Запас, сотни шт. Цена за хранение, руб. 1 150 1 10 2 280 2 20 3 410 3 30 4 540 4 50 5 660 5 70 6 780 6 100 7 890 7 130 8 1000 8 160 9 1100 9 200 3.11. Рассмотрим электронную систему, состоящую из четырех блоков, каждый из которых обязательно должен функ- ционировать для работы всей системы. Надежность системы может быть улучшена путем включения в блоки параллельно работающих компонент. В табл. 3.1 приведены вероятности функционирования блоков, если они содержат 1,2 или 3 па- раллельно включенные компоненты. Таблица 3,1 Число компонент Вероятность функционирования блока 1 2 3 4 1 0,70 0,50 0,70 0,60 2 0,80 0,70 0,90 0,70 3 0,90 0,80 0,05 0,90 Вероятность успешного функционирования всей системы равна произведению вероятностей надежной работы блоков. Стоимость включения 1, 2 или 3 параллельных компонент в блоки приведена в табл. 3.2. 44 Л
Таблица 3.2 Число компонент Стоимость блока, руб. 1 2 3 4 1 10 20 10 20 2 20 40 30 30 3 30 50 40 40 На создание всей системы выделено не более 100 руб. Определить необходимое число компонент в каждом из четырех блоков, чтобы максимизировать вероятность успеш- ной работы «сей системы. >|с Важное место в исследовании операций занимают линейные модели [1, 10, 13, 29]. Поэтому на практике широко применяют методы линейного программирования. Изложению теории линейного программирования и численных алгоритмов посвящена обширная литература (см., например,' [2, 10, 13, 30]). Решение .сколько-нибудь сложных задач линейного програм- мирования требует привлечения вычислительной техники. Поэтому мы огра- ничимся простейшими задачами, решение которых может быть получено без использования ЭВМ. # 3.12. Две фабрики производят продукцию из сырья трех типов. Запасы сырья для годового производства составляют соответственно 11, 7 и 10 ед. Первая фабрика для изготовле- ния условной единицы продукции, цена которой равна 1, потребляет сырья указанных типов 2, 1 и 2 ед. соответственно. Для второй фабрики цена продукции равна 2, а удельные потребности в сырье составляют 4, 3 и 1 ед. В прошедшем году плановое задание первой фабрики со- ставляло 3, а второй — 1 ед. продукции. Определить задание на предстоящий год, которое обеспечивало бы максимальную суммарную стоимость продукции фабрик и при этом требовало бы минимальных затрат на перестройку производства. Стоимость перестройки задается функцией f(xi, xs)=6l(x1-3)8+(x»-l)al, где (хь х2) — плановые задания фабрик. 3.13. Решить графически задачу линейного программи- рования: z=0,5xi+2x2->- шах, Xi+x2<6, Xi—Х2<1, Хх>1, 2х1+х2^6; 0,5X1——4, х2>1. 45
3.14. Переходя к двойственной задаче, найти" минимум функции z=xl+x2+2x3+8x4 при ограничениях 2х4—х2+3ха—2х4=3, —xi+3x2—4х2+4х4=1, х,-^0, i=l, . . . , 4.‘ Одна из проблем, возникающих при численном решении задачи линей- ного программирования шах (с, х), Ах<Ь, (3.3) связана с тем, что ЭВМ оперирует лишь приближенными значениями пара- метров задачи. По сути дела, происходит замена задачи (3.3) некоторой задачей тах(с(6), х), Л(6)х<Ь(6), (3.4) где [|Л (б)-Л||<6, ||& (6)—д||<Д Цс(д)—с||<б. (3.5) Пусть Х°— множество решений задачи (3.3); d — ее оптимальное значение; Х°(6) nd (6) — соответственно'множество решений и значение «возмущенной» задачи (3.4). Приведем следующее определение. 1) Задача (3.3) называется устойчивой по функционалу, если для любого 8>0 существует такое 60>0, что как только выполнены условия (3.5), то |d(6)—d|<s при 0<б<60. 2) Задача (3.3) называется устойчивой по решению, если для любого 8>0 найдется такое число 60>0, что при выполнении неравенств (3.5) множество Х°(6) принадлежит 8-окрестности Х° при 0<6<о0. Если задача (3.3) неустойчива в смысле данного определения, то ее решение на ЭВМ может привести к результатам, сильно отличающимся от истинных [10, 53]. # 3.15. Привести пример неустойчивой задачи линейного программирования. 3.16. Доказать, что устойчивая (по решению или по функ- ционалу) задача линейного программирования (3.3) имеет ограниченное множество решений Х°. 3.17. Доказать, что для устойчивости задачи (3.3) по функ- ционалу необходимо и достаточно, чтобы она была устойчивой по решению. 3.18. Предприятие планирует организовать выпуск про- дукции п технологическими процессами. Производство еди- ницы продукции /-м процессом требует затрат Сц единиц сырья i-ro типа) °. Для закупки сырья предприятие имеет в своем распоряжении деньги в количестве В. Пусть dj— рыночная стоимость единицы продукции, произведенной /-м процессом, а р$— стоимость единицы сырья Z-го типа. Цель предприятия — производство продукции наибольшей стои- мости. Описать модель операции. Найти оптимальную стра- Х) Все виды продукции и сырья предполагаются бесконечно делимыми. 46
тегию предприятия. Сформулировать условие, при котором производство продукции любого типа при полном использо- вании всех ресурсов составляет оптимальную стратегию. 3.19. Покупатель имеет сумму денег J и может купить товары трех видов по цене р1( р2, р3 за единицу. Функция полезности покупателя имеет вид u(x)=xixlx^, где а, ₽. Т>0; Xi, х2, х3— количество товаров, которые он покупает. Определить, какое количество товара каждого вида .при- обретает покупатель. 3.20. Рассмотреть возможность применения метода мно- жителей Лагранжа для решения задачи z=Xi+x2-> max при xl+xl=0. 3.21. Решить графически задачу нелинейного программи- рования с целевой функцией z=10(xi—3,5)4+20(х2—4)2-> -> min и теми же ограничениями, что и в задаче 3.13. 3.22. Найти все локальные максимумы функции z=25(xt—2)2+(х2—2)2 на множестве {X/ | х2 2, Xi + x2<6, х1( х2^0. Xj х2 2, хх—Зх2 2, 3.23. Комплексная целевая программа включает k под- программ. Известно, что для выполнения i-й подпрограммы в полном объеме достаточно ресурсов в количестве Р}, сте- пень же выполнения подпрограммы при выделении на нее X; ресурсов составляет qt = xtlPt, Q^xt-^Pt. Степень вы- полнения всей программы определяется как k <7=П Я?, • Г = 1 где а£ > 0—коэффициент важности f-й подпрограммы. Найти оптимальное распределение общего ресурса k объема S по подпрограммам в случае дефицита: 2 I — 1 3.24. Решить задачу z = 0,25xi 4- х2 —* max; Xi + 0,3x2<: 1,5, • 0,5Xi + 1,75, xv x2Z>0, xn ха—целые. 47
Решить ту же задачу как задачу линейного программи- , рования с последующим округлением результатов до бли- жайших целых, удовлетворяющих ограничениям. 3.25. Найти: a) min {г = 4 (х4—6)2 + 6(х2—2)2}, J 0,5xj х2 4, 3xi Н- 15, 1 Х! + х2>Г, хп х2>0; б) max {z = 3x1Tj-2x2}, (хх—2)2 + (х2—1)2^9; хп х2>0; в) max {z = 8х? + 2x1} > Г х? + С 9; ( Xj 2; Xj, xs> 1; г) max {z = 4xj + Зх2}, (2xt—х2^0, 0,5хх—х2^0, х^О, (чх14-х2^5, Х(—целые, i=l, 2; д) то же, что и в п. г), только хг—целое, х2—действи- тельное. . .. 3.26. а) Найти максимум z = 8xt + 5х2 + х3 при ограни- чении Зхх + 2ха + х313, xzZ>0—целые числа; t=l, 2, 3. б) Найти- лексикографический максимум вектор-функции F(x) = (x1( х2, х3) при тех же ограничениях. ; 3.27. Найти максимум z = 2хх + 7х2 + Зх3 + х4 при огра- 1 ничении 6х14-Зх24-2х3-|-х4^2, х,->0—целые. Я 3.28. В приемной в ожидании личной встречи с директором 1 , собралось п посетителей. Предварительный опрос позволил 1 выяснить, что рассмотрению вопроса i-ro посетителя директор | должен уделить время Tt, i—l, . . . , п. Директор, зная, что хотя общее (суммарное) время, которое он уделит всем посе- п ; - тителям, одно и то же: T='£lTt (независимо от очередности * i = l I их приема), хотел бы так организовать прием, чтобы посети- тели находились в приемной в целом как можно меньше. Ка- кова должна быть очередность приема? k 3.29. Требуется за минимальное время закончить обра- i бртку деталей. Каждая деталь i обрабатывается сначала на * первом станке (первая операция), длительность обработки затем на втором станке (вторая операция), длительность обработки bi. Вторая операция не может начать выполняться, пока не закончилась предыдущая, а также пока станок еще занят выполнением операции. 48
Решить задачу со следующими исходными данными; чистой стали и какое количество х2 металлолома следует ис- пользовать для приготовления (из соответствующего сплава) литья для одного из своих заказчиков. Пусть производствен- ные затраты на 1 т стали составляют 3 усл. ед., а затраты на 1 т металлолома — 5 усл. ед. (последняя цифра больше пре- дыдущей, так как использование металлолома связано с его предварительной очисткой). Заказ предусматривает поставку не менее 5 т литья; при этом заказчик готов купить и большее ' количество литья, если завод поставит перед ним такие усло- вия. Предположим, что предназначенные для литья запасы чистой стали составляют 4 т, а металлолома — 6 т. Отношение веса металлолома к весу чистой стали в сплаве не должно пре- вышать 7/8. Производственно-технологические условия та- ковы, что на процессы плавки и литья не может быть отведено более 18 ч, при этом на 1 т стали затрачивается от 2,5 до 3 ч, а на 1 т металлолома — от 1,5 до 2 ч. Цель завода — выпол- нить заказ с минимальными производственными затратами, выраженными в условных единицах. Составить модель опера- ции, считая при этом, что критерий принимает значение —оо, если не выполнены ограничения задачи. Указать необходимые и достаточные условия на хъ х2, при которых оперирующая сторона (завод) может быть уверена, что ограничения задачи будут выполнены. 3.31. Диспетчерская служба имеет следующие минималь- ные потребности в количестве диспетчеров в различное время суток: __________________________. Порядковый номер периода Время суток, ч Минимальное число диспетчеров, требуемое в указанный период ,1 2—6 20 2 6—10 50 3 10—14 80 4 14—18 100 5 18—22 40 6 22—2 30 49
При этом нужно иметь в виду, что период 1 следует сразу же за периодом 6. Каждый диспетчер ежедневно приступает к работе в начале определенного периода и работает восемь часов без перерыва. Требуется составить расписание на каж- дые сутки таким образом, чтобы обойтись минимальным числом диспетчеров, но при этом не нарушая сформулированных выше требований. п 3.32. Доказать, что величина Уatbj достигает максимума, / если выбирать t=/, где последовательности {at} и {bj} заданы и удовлетворяют условиям ai>a2>. . .>яп>0; . •> >Ьп>0. (Замечание: в указанную сумму каждое зна- чение из последовательностей {aj и {bj} входит только один раз.) 3.33. Требуется проехать в автомобиле 1000 км по дороге в пустыне с минимальным расходом топлива. Баки автомобиля могут вместить самое большее 500 ед. топлива. Расход топ- лива составляет 1 ед. на километр. Автомобилист должен сам постепенно устраивать промежуточные склады, используя топливо из собственных баков. Определить расположение складов на пути, при которое минимизируется расход топлива на все путешествие, число рейсов между каждой парой скла- дов и минимальное количество топлива, которое ему надо взять со старта. 3.34. Доказать следующее утверждение (критерий Г росса}-. необходимое и достаточное условие того, что вектор с неот- рицательными целочисленными компонентами x — (xit ..., х„) п минимизирует выражение 2 Ф/С*/)» гДе Ф/—выпуклые п функции, при ограничении 2 Х/ = т, где т>0—целое / = 1 число, состоит в том, что min {ф/ U/ Н-1)—Ф/ (*/)] > /в/ > шах [ф/U/)—ф/(ху—1)], /e/W /={1, .... n}, 7(x)={/€Z|x/>0}. 3.35. Для уничтожения п мишеней имеется т единиц оружия. Каждой /-й мишени приписана стоимость ©у, а ве- роятность поражения мишени при использовании 1 ед. ору- 50
жия равна q/, / = 1, . • ., n. Вероятность сохранения f-й ми- шени при попытке ее поражения единицами оружия равна р*/ = (1— qj)xS- Распределить оружие по мишеням так, чтобы минимизировать стоимость сохранившихся мишеней. 3.36. Показать, что положительные целые числа xit ..., хп п п максимизируют ТТ А при ограничении 2 xt = C тогда и i = 1 i = 1 только тогда, когда х{—\, 2 и 3, i«=l, ..., п. Здесь С — положительное целое число, а п не фиксировано.
4 Глава ЗАДАЧИ НА МИНИМАКС И СЕДЛОВЫЕ ТОЧКИ * Минимаксные (максиминные) задачи возникают в исследовании опера- ций как следствие применения принципа наибольшего гарантированного результата. Они отличаются друг от друга множествами стратегий и не- определенных факторов, числом операций взятия максимума и минимума, связями между переменными. Минимаксные задачи относятся к более ши- рокому классу так называемых негладких экстремальных задач [22] и обла- дают рядом характерных особенностей. Разработке численных методов для таких задач в настоящее время посвящено много исследований (например, [3, 21, 23, 46, 54]). Однако их решение по-прежнему представляет собой серьезную проблему. В этой главе приведены модели и минимаксные задачи, допускающие аналитическое решение. Значительная часть, материала относится к теории матричных и бесконечных антагонистических игр, т. е. к проблеме отыска- ния седловых точек. При решении задач полезны следующие факты. Функция f(x), х g Еп называется дифференцируемой в точке х0 по направлению g £ Еп, ||g||=l, если существует конечный предел lim + —f (*q) . Этот Предел называется производной функции а -> о+ а f (х) в точке Xq по направлению g и обозначается • Пусть задана функция F (х, у), х g X, у g Y, где X —открытое множество в Ent a Y — компакт. Если F (х, y)t -^F (х, у) непрерывны по совокупности переменных в XxYt то функция f(x)= minF(x, у) (4.1) y<=Y . имеет в каждой точке х g X производную по любому направлению g б Еп* ||g|)=l, причем [21, 23] W (*) dg где min ysR (x) .(4.2) (*. «/)=/«}• Чтобы функция (4.1) достигала максимального на в точке х°, необходимо, а в случае вогнутости f (х) на Еп чтобы Еп значения и достаточно, шах II g 11= 1 df (х°) dg =со, 52
«ли, ЧТО то же самое, max min (^-F (х°, у), g\<0. (4.3) II g ||= 1 yeR (x°) \vx J Точки, удовлетворяющие необходимым условиям максимина (4.3), назы- ваются стационарными. х Функция f(x), определенная на множестве X метрического простран- ства, называется полунепрерывной снизу в точке xogX, если для любой последовательности точек хп£Х, сходящейся к х0, выполнено неравенство f(x0X lim - f (x„). Хп•-* Х0 Функция f (х) называется полунепрерывной сверху, если функция — f (х) полунепрерывна снизу. Если f (х) в точке полунепрерывна сверху и снизу, то f (х) непрерывна в х0. Пусть F: X—>2^—многозначное отображение, ставящее каждому х£Х в соответствие некоторое подмножество F (х) компакта Y метри- ческого пространства. Отображение F (х) называется полунепрерывным сверху в точке xQ£Xt если из того, что хп—> х0, хп£Х, уп—> yQ, yn£F (хп), следует, что Уъ^Р (Л'о)- Отображение F {х) называется полунепрерывным снизу, если из того, что хп—► х0, y<&F(x^ вытекает существование последовательности Уп такой, что Уп —> У о- Полунепрерывное сверху и снизу в точке xQ^X отображение F (х) называется непрерывным. >|с Задачи 4.1—4.32 посвящены изучению свойств операций взятия максимума и минимума. 4.1. Пусть Л(х), Г2(х)— непрерывные на компакте функ- ции. Доказать следующие неравенства: a) max [Fr (х) + F2 (х)] max Fr (х) + max F2 (х), хе X хе X хеХ min [Fx (х) + F2 (х)] min F, (х) + min F2 (х); хе х хех хе х б) max [У7! (х) + F2 (x)J > max Fr (х) + max F2 (х), хе X xeXt хе N где N = {х € X | Fx (х) = max Ft (г)}; min [Fx (x) + Fa (x)] < min Ft (x) + min F2 (x), xe x xeX xeM где M = |x€ X | Fj (x) = min Fr (z)|; в) I max Fj (x) — max F2 (x) I < max | Ff (x)—F2 (x)|, I хе X xeX I хе X I min Ft (x) — min F2 (x) I max | Fj (x)—F2 (x) I. I x e X x e X I x e X 53
4.2. Для произвольных функций F{ (х), Ф(- (х),” 1 i щ, доказать неравенство I inf max F{(x)—inf шах Ф;(х)|^ | х € X 1 < Z < /п - xGXl^i^m j < sup max | Ft (x)—Ф, (x) |. x e X 1 < i < m 4.3. Доказать, что при X = (J Xa as A supF(x) = sup sup F(x); inf F(x)= inf inf F (x). xgX aeAxeX x$X aeAxeX a a 4.4. Доказать, что если F(x, у) — непрерывная на про- изведении компактов X, Y функция, то функция минимума f (х) = min F (х, у) также непрерывна на X. yeY 4.5. Пусть функция F (х, у) непрерывна на произведении компактов X, Y и при любом х£Х существует лишь одна реализация у(х) максимума maxF(x, y) = F(x, у(х)). y$Y Доказать непрерывность у(х). 4.6. Пусть функция g (х, у) непрерывна на произведении компактов X, Y. Доказать, что отображение X (х)= {у £Y \ g(x, y)^Q}, (4.4) которое не пусто для всехх^Х, является полунепрерывным сверху на X. 4.7. В условиях задачи 4.6 доказать, что функция f(x)= inf F(x, у) (4.5) ySN (х) полунепрерывна снизу на X, если F непрерывна на XxY. 4.8. Пусть для функции (4.5) из задачи 4.7 существует точка х°£Х такая, что /(х°)= sup/(x). хе х Доказать непрерывность /(х) в точке х°. 4.9. Пусть функция g(x,y) непрерывна на произведении мет- рических компактов X, Y; множества №(х)={у £ Y]g(x, х/)>0} не пусты при всех х € X и замыкание № (х) совпадает с мно- жеством (4.4). Показать, что: а) многозначное отображение (4.4) полунепрерывно снизу на X; б) N (х) непрерывно на X в метрике Хаусдорфа h(A, B) = maxJsup infp(x, у)-, sup inf p(x, y)\, (xG А у € В y€B xeA ) где 4, В—множества метрического пространства с метрикой р. 54
Установить, когда из h(A, В) = 0 следует Д = В; в) выяснить, совпадает ли №(х) с внутренностью intAT(x) множества (4.4) в условиях задачи. • Установить, верно ли равенство № (х) = int/У (х) в общем случае. 4.10. Доказать, что в условиях задачи 4.9 функция (4.5) непрерывна, если функция F (х, у) непрерывна на XxY. Построить пример разрывной функции (4.5) при непрерыв- ных F, g. 4.11. Пусть fa(x), а С Л,— выпуклые на выпуклом мно- жестве X функции. Доказать, что q> (х) = sup fa (х)— выпук- . CCG А лая функция. . 4.12. Доказать, что максимум выпуклой функции на выпуклом многограннике достигается в одной из крайних точек. 4.13. Доказать, что если 7(0—вогнутая функция иУ — выпуклое множество, то функция q>(x) = sup/(x+ у) также вогнута. 4.14. Пусть функции Г(х, у), g(x, у) вогнуты по сово- купности переменных на ХхУ; X, Y—выпуклые множества. Доказать, что функция <р(х) = sup F(x, у), где N (х) опре- У € N (х) деляется формулой (4.4), вогнута. 4.15. Пусть F(x, у), -^F (х, у) непрерывны на EnxY, где Y—компакт, и g, git gt—направления в Е", для которых g = agi + ₽g2; ₽ > О- Доказать, что производные по направлениям функции минимума (4.1) обладают следующим свойством: df (*) „ df (х) , ft df (х) dg dgi ' Р dg2 ' Л2 4.16. Пусть F (х, у)£С2, z/)^a>0 на ЕпхЕ1. Доказать, что функция f(x) = inf F (х, у) непрерывно диф- ференцируема и Г (*) = !/(*-1/)| . , их \у =у (X) где f(x) = F(x, у(х)). 4.17. Пусть F(x, у)—достаточно гладкая на Епх Y функ- ция, Y—компакт. Выяснить: а) является ли функция (4.1) дифференцируемой? 55
б) будет ли функция (4.1) дифференцируемой, если minF(x, у) достигается в единственной точке при любом х? 4.18. Вычислить производную функции f(x) в точке х0 по направлению g, если: a) f (х) = max (х, 1—х); х0=1/2; g=l; б) f(х) = min(х2, х+1, 1—х); —оо<х<оо; ^г=1; §2= — 1; в) / (х) = min (х8, ф(х)), хо = О, g=l, где ( х#=0, ’’W-U * = <>. г) /(х) = min min(x — Ixly, —xy), xo = O, g =— 1; - 1 < 1 Д) f(x) = min min(|x|—xy, —2xy*); xo = O, g=l; -i <y< i e) f (Xi, x2) = • min (xj sin + x2 sin t/2); x0 = (l/2, 1/2); Уи Уг>П 1/1+^2 = л/2 gi = (l; 0); g2 = (0; 1); g3 = (l//2, 1/^2); ж) f(xit х2) = тт(1пх!—x2, tgx^), x0 = (l; 1), £=(-1; 2); з) (Xi, x2, xs) = min (xf + xf + xf; 2x?—3x2; e“*a4-2x3; cos nx2 + *2+ 10x8); x0=(2; — 2; 1); g=(-3; 2; -1). 4.19. Пусть F (x, у), -^F(x, у) непрерывны на прямом произведении Еп и компакта Y, причем max min F (х, у) = = min F (x°, у). Доказать эквивалентность неравенства (4.3) у 6 Y и следующего условия для точки х°: 0€L(x°), (4.6) где L(x°) = co^z = ^F(x0, у) | у£ R (x°)j>. 4.20. Сформулировать необходимые условия для точки х°, реализующей maxminF(x, у) = minF(x°, у) на выпуклом х$Х уZY у € У замкнутом множестве X с: Еп, где функция F удовлетворяет условиям задачи 4.19. 4.21. Доказать неравенство sup inf F(x, у)^. inf supF(x, у). xeX ysY yzY xeX 56
4.22. Пусть F (х, у) = <р (х) + ф (у)- Y (х) = {у | g(х, у) > 0}, X (у)= {х\ё(х> «/)>()}, Х={х|У(х)=^0}, Y~{y\X(y)^0}. Доказать неравенство sup inf F(x, i/)> inf sup F (x, y). xeXi/tYM убУхвХф) 4.23. Доказать следующие утверждения о перестановоч- ности операций взятия максимума, минимума и предельного перехода: а) если последовательность {/„ (х)} сходится на X к функ- ции /0(х), монотонно неубывая, то lira supfn(x)= supf0(x); n-* xgX хе X б) если дополнительно X—компакт, a f„(x) полунепре- рывны снизу на X, то lira minf„(x)= min/0(x). n-> <x> xG X XG X Показать, что одной монотонности {/п(х)} для справедли- вости этого равенства недостаточно. ' 4.24. Доказать, что класс функций на метрическом ком- пакте X, определяемый формулами (4.4), (4.5) при всевозмож- ных непрерывных функциях F, g, совпадает с классом огра- ниченных полунепрерывных снизу функций. 4.25. Пусть Л = {х£Х|<р(х)> 0}, В= {у£ У|ф(г/) >0). Доказать, что sup infF(x, у)= sup inf inf sup 2 (x, у, p, X); XGAyGB xg X yG Y ц > 0 к < 0 inf sup F (x, y) = inf sup sup inf 2 (x, г/, p, X,) yGBxGA yG Y xg X к < 0 ц > 0 для любых функций F\ <р, ф, если Л, В не пусты. Здесь ^(х, у, р, X) = F(x, у) + р.ф (х) + Хф (у). 4.26. Доказать, что если sup inf 2 (х, у, р, X) = inf sup 2 (х, у, р, X), хе х уе у уеУ хеХ Х<0ц>0 ц>0Л<0 то и sup inf F(x, у) — inf supF(x, у). XGAyGB yGBxGA " 4.27. Обосновать метод штрафных функций: пусть F{x, у), ф(у) непрерывны на произведении метрических компактов X, 57
1 У; тогда ' < maxminF(x, у)= lim maxmin{F(x, у) + С [min (0, ф({/))]2}. Л хе х уев с& хеХ yeY я 4.28. Пусть ф (у) — вогнутая дифференцируемая функция 1 на выпуклом множестве Y. I а) Доказать выпуклость штрафной функции Jч (у) = I = |min(0, ф(у))|? при 9^1 и ее дифференцируемость при 1 <7>1- t д * б) Вычислить производную I 4.29. Обосновать «метод невязок»: пусть функция F (х, у) непрерывна на прямом произведении компакта X и куба Y ' евклидова пространства. Введем функцию / J(x, w)=$[min(0; F(x, у) — м)]2dy. y Тогда максимальное значение и = и, для которого min J (х, м)= { хбх j = 0, равно величине максимина maxmin/7(x, у). При этом * ' f точка х°, реализующая min J (х, и), является оптимальной | хеХ стратегиёй в задаче поиска максимина maxminF(x, у). f хеХ ysY I 4.30. Доказать, что любая предельная точка последова- » тельности {х (С„) | Сп —► оо}, реализующей max {/2 (х) + Cnft (х)} Т; х€Х * при непрерывных на компакте X функциях /2, является точкой лексикографического максимума вектор-функции | F (x) = {fl(x), /2(х)), т. е. реализует максимум /2(х) на мно- | жестве, где достигается максимум по х£Х функции Л(х). | 4.31. Пусть X—компакт, С (X)—пространство непрерыв- g ных функций на X. Определим функционал <р, обладающий | следующими свойствами: | а) <р(а) = а а£С(Х):а(х) = а); б) Ф(/Ч-а) = <р(/) + а; I в) <p(nf) = nq>(f) (п—натуральное число); •« г) ф(тах[/о /4]) = тдх[ф(Л), ф(/2)]. | Доказать, что Ф (f) = max f (х), (4.7) х€ Е где EsX—непустое замкнутое подмножество. 58
4.32. Показать, что если X — нормальное пространство, содержащее более одной точки, то условия б) — г) в задаче 4.31 независимы. * В следующих задачах найти каким-либо способом максимины, мини- максы, седловые точки и оптимальные стратегии. >|с 4.33. Вычислить max min F (х, у) и min max F(x, у), если: X у ух а) Г(х, У) = (х—у)г, 0<х, i/<l; б) F(x, у) = (х—у)2—0,5х2, —1 С* 1> —0,5 ^у ^0,5; в) F(x, у) = — [х—у(\—у2)]2, — 1<х, t/^1; г) F(x, у) —х cos у—sinx, л^х^2л, л/2^у^Зл/2. 4.34. Пусть F (х, у) = , а, Ь, с > 0. Найти условия на коэффициенты a, b, с, при которых стационарные точки максимина max min F (х, у) лежат в интервале (0, 1). X О < у < 1 4.35. Найти значение х^[л/4, л/2], реализующее min max [у*—2у*зтгх—2 (1 4-cosx)3]. Л/4 < х < л/2 | у |< 1 +COS х 4.36. Оперирующая сторона производит стрельбу по ми- шени, представляющей собой точку, расположенную на от- резке [0, 11. Если х — координата точки прицеливания, у — координата мишени, то вероятность ее поражения равна е-х х>0. В распоряжении оперирующей стороны име- ется два выстрела, причем результат первого выстрела не становится известным перед вторым. Мишень неподвижна, а ее положение — неопределенный фактор. Определить оптимальную стратегию стрельбы в том слу- чае, когда критерием эффективности служит математическое ожидание числа попаданий в мишень. 4.37. В условиях задачи 1.9 найти оптимальное располо- жение пожарных частей в городе и наилучший гарантиро- ванный результат. 4.38. Найти оптимальную стратегию размещения сторо- жевой вышки в предположениях а)—в) задачи 1.4. 4.39. Найти minmaxF(x(-), «/(•)) функционала »(•) *<•) f (*(•), {/(•)) = j min [1, ds; b, с>0, при следующих ограничениях: $ х (s) ds = J у (s) ds — 1; x (s), у (s) >0, s € s s 59
4.40. Обосновать принцип уравнивания-, пусть функции fi(t) непрерывны и возрастают на отрезке [0, В], В > 0, fn(O) = ff(O), l<t<n. Рассмотрим множество S St(xt) = А > 0, 0^х{^В; i= 1 i= 1, .... п Ма — | X — (Х1( .... Хп) задаваемое непрерывными возрастающими на отрезке [0, 5] п функциями gt(t) такими, что 2 Si (0) < A, St^)> A; i = 1=1 = 1, . . ., п. Доказать, что в операции с критерием J 1Г(х) = min f{(xt), х£М0, 1 < i < п оптимальная стратегия х° удовлетворяет системе уравнений Л(4)=Л(*?). 1. 4.41. Пусть С—конфигурация из пяти точек Pit i= 1, ... ..5, расположенных в замкнутой области D. Показать, что < 2-1/2, если D—единичный квадрат, 1/2,-если D—равносторонний треуголь- maxminp(Pf, РА — < с i^i ник со стороной, равной 1, 2sin(n/5), если D—единичный круг, л/2, если D—поверхность единичной сферы, где р(/\, Pj) — расстояние от Pt до Pj. 4.42. Пусть в условиях задачи 1.5 и 1.6 функции метко- сти «дуэлянтов» одинаковы и заданы непрерывной убывающей функцией р(-), причем p(d)=l, р(£>) = 0. Найти наилуч- шие гарантированные результаты для первого «дуэлянта» в этих задачах. 4.43. В условиях задачи 1.20 найти оптимальную стра- тегию статистика и наилучший гарантированный результат. # Теоретико-игровые методы часто применяют в исследовании опера- ций. Анализ ряда моделей включает в себя решение игр. Число изучен- ных в настоящее время классов игр велико [3, 5, 14 , 24 , 29, 40]. Нач- нем рассмотрение с простейшего класса, который составляют матричные игры. Матричная игра задается матрицей А = (ац)тХп9 где 2.т}, {1, 2, ..., п}—соответственно множества чистых стратегий первого и второго игроков. Элементы матрицы a/у имеют смысл выигрыша первого игрока (проигрыша второго) при выборе игроками чистых стратегий /. 60
Смешанные стратегии игроков в матричной игре с матрицей А за- даются векторами Р = (РГ> •••» Рт) € • • •’> Рп) € где pif qj—вероятности выбора чистых стратегий t, /. Таким образом, т п 2 Р< = 2 ?/=1- Pi> i= 1 /= 1 Обозначим т п А (р, j)= 2 aijPb А (I, ?)= 2 aU<U' 1=1 j= 1 tn п А(р, <7)= 2 2 аЦР1Ч/- ! i = 1 j = 1 Известно [5, 29, 40], что любая матричная игра имеет седловую точку в смешанных стратегиях, т. е. существует пара (р°, q°), для которой min А (р°, /) = min А (р°, q) — max min А (р, q) = q$Sn pGSmqeSn min max A(p,q)= max A (p, qQ) — max A (i, qQ). (4.8) qe Sn P^Sm P^Sm Можно доказать, что равенства (4.8), определяющие седловую точку, эквивалентны тому, что " А (р, <?°)<а = Л (р», ?°)<Л (ро, q) (4.9) для всех p£Sm, q£Sn. Величина v называется значением игры. Очевидно, что v—наилуч- ший гарантированный на множестве смешанных стратегий результат оперирующей стороны (первого игрока) в операции с критерием эффек- т тивности 2 aijPi и множеством значений {1.......п} неопределенного i= 1 фактора /. Аналогично можно интерпретировать —v с точки зрения второго игрока. Неравенства (4.9) показывают, что седловая точка (р°, qQ) обладает свойством устойчивости: никому из игроков невыгодно в своем выборе стратегий отклоняться от нее. Поэтому естественно назвать тройку <р°, qQ, у> решением матричной игры. >|с 4.44. Показать, что матричная игра с матрицей А= ~(а1/)тхп имеет решение в чистых стратегиях, и найти та- кое решение, если: в) г) аа = 1—Г, /а Ь\ л [ с d \ 1 А =. , , а, Ь, I а а Г \с Ъ/ га е а е а 4 = [ь f ь f f \С g g с с с, d—произвольные числа; е а е\ д f a, bt с, е, f, g—произ- g g с/ 61
вольные числа; Д) а„ a--]~bj аь bj—произвольные числа, c{i dj—по- ложительные числа; e) m = n и для любых i, /, k, 1 i, /, имеет место тождество + + = 4.45. Показать, что если каждая подматрица размером 2x2 матрицы А имеет седловую точку, то матрица А также имеет седловую точку. 4.46. Найти вероятность того, что игра с матрицей имеет седловую точку, если —независимые слу- чайные величины, имеющие одну и ту же плотность расп- ределения. 4.47. Найти хотя бы одно решение матричной игры с матрицей Д = (а/7)тхп, если: • I 1. «¥=/; а> о. б) т = п,' каждая строка и каждый столбец матрицы А содержат все целые числа от k + 1 до k + т\ в) л=(_1 /1 4\ Г) А = 3 -2 ; \0 5/ ООО О О 0\ 4 2 0 2 1 1 \ 4 3 1 3 2 2 1 4 3 7 —5 1 2» 4 3 4 —1 2 2 / 4 3 3 —2 2 2/ / 0 1 —2\ е) А= -1 0 3 ; ' \ 2 —3 0/ 6 1 4\ /1 2 3\ 2 4 2 • з) А = 4 0 1 1 • 4 3 5/ г \2 3 0/ 1 1 0 0\ 0 0 10 1 10 0 1В 0 11 1/ /3 ж) Л = ( 5 /1 и) ^ = ( о \ о к) т = п, а!^;а2^.. .^ап > 0, /0 at ... аг / а2 0 а2 ... а2 А = «з «з ° ... а3 а« аи aw ... 0 62
4.48. Найти все решения в матричной игре с матрицей: /—1 3 _з\ /4 3 3 2 2 6\ а) 2 0-3); б) 6 0 4 2 6 2 ). ' \ 2 1 О/ \0 7 3 6 2 2/ 4.49. Два игрока одновременно и независимо друг от друга показывают один, два или три пальца. Пусть k — общее число показанных пальцев. Если k — четное, то первый из игроков платит второму k руб. Если k — нечетное, то второй игрок платит k руб. первому. Найти оптимальные смешанные стратегии игроков и значение игры. 4.50. Каждый из двух игроков записывает одно из чисел 0, 1,2, не показывая написанного противнику. Затем первый игрок называет предполагаемую сумму записанных чисел, после чего второй игрок также называет предполагаемую сум- му, причем ему не разрешается называть ту сумму, которую назвал первый игрок. Угадавший игрок получает от против- ника 1 руб. Если же никто не угадал, то выигрыш каждого из игроков равен нулю. Определить число чистых стратегий каждого из игроков. Найти оптимальные смешанные страте- гии и значение игры. 4.51. Первая сторона, располагающая k единицами ре- - сурса, взаимодействует в п пунктах со второй стороной, у которой s единиц ресурса. Распределение ресурсов каждой стороной по п пунктам производится в условиях, когда ин- формация о решении «противника» отсутствует, причем в один пункт можно направлять несколько единиц ресурса. Каждая единица ресурса второй стороны, расположенная в любом из пунктов, уничтожает одну единицу ресурса первой сто- роны, направленную в этот пункт. Неуничтоженная единица ресурса первой стороны прорывается через соответствующий пункт взаимодействия. Составить и решить матричную игру, считая выигрышем первой стороны (и проигрышем второй) общее число прорвавшихся через п пунктов взаимодействия единиц ресурса первой стороны. >|с Напомним, что в задачах 4.52 — 4.54 и далее использованы следую- щие обозначения: т п А (р, I) = 2 аиРь А («, <7) = 2 1 /= 1 т п А[р, <7)=2 2 где А = (аи)тУп—матрица игры, 1= 1 /= 1 4.52. Пусть А (р, Г)=А(р, 2)=. . .=А(р, п) для p£Sm. Можно ли утверждать, что р — оптимальная стратегия пер- вого игрока? 63
4.53. Пусть А(р, 1)=Л (р, 2)=. . .=Л(р, п) для p£Sm; А (1, q)=. . .=Л (т, q) для q(tSn. Можно ли утверждать, что р, q оптимальны? 4.54. Пусть Л (р, q)=v, где v — значение игры, p$Sm, q£Sn. Можно ли утверждать, что р, q оптимальны? >К В задачах 4.55—4.59 через и (Л) обозначается значение игры с матрицей А. * 4.55. Показать, что v(cA)=cv(A), а множества оптималь- ных стратегий в играх с матрицами Л и сЛ совпадают, если с>0, сА=(сац)тхп. 4.56. Показать, что н(—Л)=— р(Л*), где Л*—матрица, транспонированная к Л. 4.57. Показать, что и(Л+В)=о(Л)+&, а множества оп- тимальных стратегий в играх с матрицами Л и А+В совпа- дают, если все элементы матрицы В равны Ь. 4.58. Привести примеры таких матриц А и В, что: а) о(Л+В)>и(Л)+ц(В); б) ц(Л+В)<ц(Л)+»(В); в) ц(Л+В)=о(Л)+о(В). 4.59. Пусть Л=(аг;)тхп, а(;=—ац. Показать, что о(Л)=0, а множества оптимальных стратегий игроков совпадают. 4.60. Показать, что множество оптимальных Стратегий любого из игроков в матричной йгре является выпуклым мно- гогранником. 4.61. Показать, что значение игры, матрица которой со- стоит из рациональных чисел, рационально. 4.62. Показать, что значение матричной игры есть неубы- вающая непрерывная функция элементов матрицы. 4.63. Может ли строка матрицы игры, в которой все эле- менты не превосходят значения игры, а некоторые меньше этого значения, входить с ненулевой вероятностью в: а) некоторую оптимальную стратегию первого игрока? б) любую оптимальную стратегию первого игрока? 4.64. а) Может ли строка матрицы игры, строго домини- руемая некоторой выпуклой комбинацией других строк, вхо- дить с ненулевой. вероятностью в некоторую оптимальную стратегию первого игрока? б) Может ли строка матрицы игры, доминируемая неко- торой выпуклой комбинацией других строк, входить с нену- левой вероятностью в любую оптимальную стратегию первого игрока? 4.65. Следует ли из того, что i-я компонента любой опти- мальной стратегии первого игрока равна нулю, доминирова- ние i-й строки матрицы игры некоторой выпуклой комбина- цией других строк? 64
4.66. Все элементы матрицы А не отрицательны, причем каждый столбец содержит по крайней мере один положитель- ный элемент. Показать, что значение игры с матрицей А по- ложительно. Верно ли это утверждение, если вместо предпо- ложения о столбцах считать, что каждая строка содержит по крайней мере один положительный элемент? 4.67. Показать, что: а) если az_lty—2nz/-|-oz+ltZs^0; г = 2, ..., tn—1; /=1, .... п, то в игре с матрицей A = {aij)m'x.n каждый игрок имеет оптимальную стратегию, в которой используется не более двух чистых стратегий; б) если ai-i'j—2av4-af+i,/ i = 2, ..., tn— 1; /=1, ..., n, то в игре с матрицей Л = (агу)тхп первый игрок имеет оптимальную стратегию р, для которой pz = 0, i = 2, .... т—1. 4.68. Определим точечно-множественные отображения f: Етп—► 2£'л, g: Етп—>2£" следующим образом. Отождест- вим матрицы размером тх п с точками евклидова простран- ства Етп и положим /(Л) = Р0, g(i4) = Q0, где Ро, Qo—мно- жества оптимальных стратегий в игре с матрицей А= — (a{j)mxn первого и второго игроков соответственно. а) Показать, что отображение f и g полунепрерывны сверху. б) Являются ли отображения fag полунепрерывными снизу? /1 3 2\ 4.69. Найти значение игры с матрицей (2 1 3 1 по ме- \3 2 1J тоду Брауна [29] с точностью до двух десятичных знаков. 4.70. Даны s матриц Л*== £=1, s. Пря- мой суммой матриц Ак называется матрица Л=5 = . .ts\ . .1$)гпхп> где >h. .is1k—1* •••» fyp s s k— I, ..., s; tn= И tnk, n = П я*. k=i k=i Доказать, что если <pft, qk, us>—решение игры с матрицей s Ак, то (р, q, 2 —решение игры с матрицей А, где Я..../, = П РЬ <7^...Ъ=П <7/• /2=1 k &=! !k 3 № 1904 65
* Пусть А = (а^)ц j 1 —бесконечная матрица, S='x = (xx.хп, ...) 2 х< = 1. Xi^O, 1=1, 2, 1=1 ао оо оо /) = 2 a‘jPi’ л(ь<7)= 2 “'Л" А(р’ '?)= 2 aUPi4j- 1=1 /=1 i,j=l 4 = ( Будем говорить, что игра с матрицей А имеет решение <р°, q°, v>, если для любых р, q£S ряд А (р, q) сходится абсолютно и А (р, qQ)^v^ ^А(р°, q). * 4.71. Показать, что игра с матрицей А = (tf/Д, j > i не имеет решения, если: a) az/ = sign(i—/);__________ б) ai3 = (i-h/V 14- (i-/)2. ‘ 4.72. Найти все решения игры с матрицей а 2а 1/2 2а 1/4 2а 1/6 ... а 1 2а 1/3 2а 1/5 2а ... * Введенное в формулах (4.8) и (4.9) определение седловой точки естественным образом обобщается на функцию F (х, у), заданную на произвольных множествах X и Y, А именно: пара (л°, yQ)£XxY назы- вается седловой точкой функции F на XxY, если F (х, у«) < F («о, у») < р (до, у) (4.10) при всех х ё*. у^у- Неравенства (4.10) равносильны тому,, что max inf F (х, у)—min F (х°, p) = F(x°, z/°) = maxF (%, y°) = xsXyeY ytY xeX = min sup F (xt y)~v. yeY xsx (Доказать это утверждение.) Понятие седловой точки играет важную роль в теории бесконечных антагонистических игр, в которых в отличие от матричных игр множе- ства чистых стратегий игроков бесконечны. В следующих задачах устанавливается существование и свойства решения некоторых антагонистических игр. * 4.73. Функция f называется квазивыпуклой {квазивогну- той} на выпуклом множестве X, если множество {xgX|/(x)< (*о)} ({* ё X\f (x)^f (x0)}) ВЫПУКЛО При ЛЮбОМ Х0£Х. Доказать, что f квазивогнута тогда и только тогда, когда ^(axj+fl— a) xa)>min{/(xi, }(хг)} при любых xt, х2$Х, а£[0, 1]. 4.74. Пусть X, Y — выпуклые компакты. Доказать, что функция F (х, у), определенная и непрерывная на X х Y, 66
квазивогнутая по х на X и квазивыпуклая по у на Y, имеет на ХхУ седловую точку. 4.75. Пусть X, Y—выпуклые компакты, функции f и g определены и непрерывны на X х Y, функция f вогнута по х, выпукла по у и положительна, а функция g выпукла по х, вогнута по у и положительна. Доказать, что функция F {х, у) = имеет на X х Y седловую точку. 4.76. Показать, что функция F (х, у) = ^т-гт-тт^ имеет X х Y седловую точку, если функции а и с непрерывны на ах г седловую точку, если функции а и с непрерывны на компакте X, функции b и d непрерывны на компакте Y и, кроме того, с и d положительны. кроме того, с и d положительны. 4.77. Доказать, что задача Чебышева о наилучшей равно- мерной аппроксимации непрерывной функции f (t), t £ [0, 1] п,' полиномом 2 а^' эквивалентна задаче поиска седловой точки /=0' (Л°; Т°, р°) функции п + 2 F(A; Т, р)=2 Pj ' П *12 i=0 J где Л = (а0, .. .,а„), T={Tt......Т'п+2}, Т7= ........../?}; Р€$п+2- # Одним из важных классов бесконечных антагонистических игр являются игры на единичном квадрате. Они задаются функцией выигрыша /<(х, у), 0<х<1, Многие игры на единичном квадрате имеют седловую точку в смешанных стратегиях [5, 24, 29]. Как и для матричных игр, тройка (ф°, ф°, ц), где ф°, ф°— оптимальные смешанные стратегии соответственно первого и второго игроков, называется решением антагонистической игры на единичном квадрате с функцией выигрыша {ядром} /С(х, у). 4.78. Доказать, что в игре на единичном квадрате т п с функцией выигрыша К (х, у)— 2,2 aufi(x)gj(y), где 1 = 1 /— 1 функции ft, gj непрерывны на [0, 1], существуют оптималь- ная смешанная стратегия первого игрока, сосредоточенная не более чем в т точках, и оптимальная смешанная стратегия второго игрока, сосредоточенная не более чем в п точках. 4.79. Найти хотя бы одно решение игры на единичном квадрате со следующей функцией выигрыша: а) К (х, y) = 3cos7xcos8t/4-5cos7xsin8z/4" 4- 2 sin 7х cos 8у 4- sin 7х sin 8у; б) К(х, z/) = sin[n (х + у)/2]; в) К (х, у) = 16у*— Зх//4-х2; з* 67
KI \-J — (x+l)2 + f/s + 4i/ + 2, x<y, Г) Л(х, y)-\ _(x_2)t + yt_2y + 5t x>y. ,K( Ч-! -^-’/з^+г^-б/!^2, x^y, Д) Л(Х,^-^ _(x_2/3)2 + 2(y_7/12)tf x>y. XK( -(^-V^ + ^-l^)2, X<1/, е)Д(х, y)-\ _(x_1/3)2 + (y_1/3)4> x>y. . / —3x2 + 4/2 + xy + 3x—2y+l, x<y, ж)К(х,у) = < v„. v> i y->„. I —x тУ —ХУтх~г *» Х^У> {х, х^.у/2, у—х, у/2^.х^ у, х—У> У^х^У1% + 1/2, 1—х, у/2-\- 1/2 <х (рис. 4) 4.80. Смешанные стратегии ф°(х) = х, ^°(у) — у опти- мальны в игре с функцией выигрыша К(х, у). Показать, что стратегии ф1 (х) — х2, ф1 (у) = у3 оптимальны в игре с функцией выигрыша КДх, у) = К(х2, у2). 4.81. Пусть <<р°(х), ф° (у), и>—решение игры на единичном квадрате с функцией выигрыша К (х, у). Доказать, что п 11ф0(х/), ф’(1/), от)—решение игры на (п-|- 1)-мерном п единичном кубе с функцией выигрыша 2 (хь У)- 4.82. Пусть множество значений непрерывной функции К (х, у), х£[0, 1], у С [0, 1], принадлежит отрезку [а, §], 68
на котором определена непрерывная возрастающая выпук- лая функция f. Обозначим через v и значения игр на . единичном квадрате с функциями выигрыша К и f (К) соот- ветственно. Показать, что: а) б) v1 = f(v), если функция К выпукла по у. 4.83. Решить игру на единичном. квадрате с функцией выигрыша К< }-! *’ тах[х~У> Му—х)]>о', Х’ — ( 0, max [х—у, к (у—х)]<и', где 0 < X 1, 0 < t/ < 1. 4.84. Решить в смешанных стратегиях игру на единич- ном квадрате с функцией выигрыша К (х, у), о которой предполагается, что функции К. (х, 0), К (х, 1) выпуклы на [0, 1]; функции К (0, у), /<(1, у) вогнуты на [0, 1]. 4.85. Доказать, что игра на единичном квадрате с функ- цией выигрыша —1, х < у < х + 1/2, 0, x^t/ или у = х-}-1/2, 1 в остальных случаях не имеет решения.
5 Глава СЕТЕВЫЕ ЗАДАЧИ В данной главе приведены задачи, которые можно сформулировать в терминах теории графов и сетей. Напомним, что граф задается множеством вершин или узлов и множеством дуг или ребер [47]. Каждая дуга задается парой вершин. Сетью называется граф, каждой дуге которого поставлено в соответствие некоторое неотрицательное число. Эти числа могут выражать пропускную способность, длину, время, стоимость и т. п. Сетевые задачи часто встречаются в приложениях и отличаются постановкой и методами решения. Рассмотрим задачу выбора кратчайшего пути (маршрута, цепи). Пусть фиксированы начальная и конечная точки маршрута—вершины aQ и ап соответственно. Необходимо выбрать путь из а0 в ап, длина которого минимальна. Иными словами, отыскать цепь, т. е. последова- тельность дуг (aQ, aib (aix, ..., aim)t (aim, an) такую, чтобы сумма чисел, приписанных этим дугам, была минимальной. Раз- работаны различные алгоритмы решения данной задачи [1,8, 27, 58]. Приведем один из наиболее простых методов. На первом шаге отыскивается такая вершина aJV расстояние кото- рой до а0 минимально. Для этого достаточно выбрать минимальную из длин дуг,:выходящих из а0. Пусть а,х ..., ау есть k ближайших к а0 вершин, т. е. длина кратчайшего пути из aQ в ар, р $ {0, jlt ...., /л}, не меньше длины кратчайшего пути из aQ в a^t ..., /^. Пред- положим, что известны также сами кратчайшие пути из а0 в ... ...» из а0 и aj . Будем называть вершины а0, а^х, ..., aj исходными, а остальные вершины сети — новыми. Обозначим через * новую вершину, ближайшую к а0. Для отыскания a/k+i достаточно перебрать новые вершины а'^, •••, aj , соединенные кратчайшими дугами соответственно с а0, а^х, ау^, ' определить длину кратчайших путей из а0 в эти новые вершины и вы- брать наименьшую из этих длин. При этом для отыскания длины крат- чайшего пути из а0 в aj достаточно к длине кратчайшего пути из а0 в aj. прибавить длину дуги то задача решена. В противном к отысканию вершины запомнив (аур aj ). Если случае следует предварительно переходить кратчайший маршрут из а0 в ау и т. д. * 1 j + f 5.1. В горной лесопарковой зоне расположено семь пло- щадок для отдыха, соединенных тропами. Расположение пло- 70
щадок и длины троп указаны на рис. 6. Найти кратчайший путь из а0 в ав. Рис. 6 Рис. 7 Рис. 8 Рис. 9 5.2. Найти кратчайший путь из aQ в из а0 в Лю, из а0 в as в сетях, изображенных соответственно на: а) рис. 7; б) рис. 8; в) рис. 9. 71
5.3. Для местного аэропорта приобретается дополнитель- ный автокар. Через три года планируется установка механи- зированной погрузочной системы, после чего автокары станут ненужными. . Тем не менее может оказаться выгодным заме- нить автокар через год или два года или даже осуществить две замены (через год и через два года). В следующей таблице приведены полные расходы (с учетом стоимости эксплуатации и выручкой от продажи), связанные с покупкой автокара в конце года i и его продажей в конце года /: Год покупки (0 Год продажи (/) 1 2 3 0 4 8 15 1 5 И 2 6 Необходимо минимизировать расходы. Сформулировать задачу как задачу выбора кратчайшего пути. Решить полу- ченную задачу. # Циклом называется цепь, начальная вершина которой совпадает с ко- нечной. Граф, в котором каждая пара вершин соединена некоторой цепью, называется связным. Дерево — это связный граф без циклов. 5.4. Описать алгоритм построения минимального остов- ново дерева для данной сети, т. е. дерева с дугами из данной сети, содержащего все ее вершины, и такого, что сумма длин дуг минимальна. 5.5. Все площадки для отдыха (см. задачу 5.1) необходимо соединить телефонной сетью, причем телефонные линии долж- ны проходить вдоль троп лесопарковой зоны. Спроектировать телефонную сеть с минимальной суммарной длиной линий. 5.6. Построить минимальные связывающие деревья (см. задачу 5.4) для сетей задачи 5.2. >|с Пусть в сети имеется единственный источник а0 и единственный сток ап. Каждой дуге (а/, ау) поставлено в соответствие некоторое неотрицательное число bip называемое пропускной способностью дуги в направлении от а/ к ар и некоторое неотрицательное число Ь(р называемое пропускной спо- собностью дуги в направлении от aj к а;. При этом не обязательно bij—bp. Потоком в сети из источника а0 в сток ап называется множество поставлен- ных в соответствие дугам сети неотрицательных чисел х;у таких, что V V 17"i О’ xi j Xjk = \ 0» / 0 П) i k (ц, /=71, где o^O, х/у «С 6/y для всех t, /. Число v называется величиной потока. Важное значение имеет задача построения максимального пото- ка (потока максимальной величины). # 72
5.7. Сформулировать задачу построения максимального потока как задачу линейного программирования. Опишем алгоритм построения максимального потока. Выбирается не- который начальный поток, например нулевой. Начальные пропускные способности дуг заданы. Пусть после нескольких шагов алгоритма полу- чены некоторый поток х/у, некоторые текущие значения пропускных способ- ностей дуг bij (недоиспользованные пропускные способности) и некоторое текущее значение величины потока и. Тогда алгоритм работает следующим образом. 1°. Выбирается путь из а0 в ап положительной пропускной способ- ности 0 (здесь 0 — минимальная из пропускных способностей дуг, состав- ляющих путь). Для этого можно использовать следующий алгоритм (ис- точник Оо считается вначале помеченным, но не просмотренным, а все ос- тальные узлы — не помеченными). 1а. Выбрать любой помеченный, но не просмотренный узел а/. 16. Всем узлам яу, для которых 6/у>0, приписать пометки (7, /) и считать их помеченными. Считать узел я; просмотренным. Если при этом сток ап оказался помеченным, то по пометкам легко восстановить искомый путь из я0 в ап. В противном случае следует перейти к шагу 1а. Если это невозможно, то искомого пути не существует. 2°. Пусть (я0, aZl), (я/р я/2).......%,) —найденный путь. Тогда для каждой дуги (я^, входящий в этот путь, следует выполнить операторы: =э*/^+1 + 9» %/»+1:=М+1-0> ^+1^'=Ч+1^+е> Далее переходят к шагу 1°. Если пути положительной пропускной спо- собности не существует, то полученный поток является максимальным. # 5.8. По тропам лесопарковой зоны (см. задачу 5.1) можно провести ежедневно ограниченное число туристских групп. На рис. 10 на каждой дуге (aif aj) около узла сц указано мак- симальное (за один день) число групп, которые можно про- вести от сц к aj, а около узла а;— максимальное число групп, которые можно провести от aj к Найти максимальное (за один день) число групп, которые можно провести от а0 до 73
5.9. Найти максимальные потоки из ав до а„ из а0 в ап в сетях, изображенных соответственно на: а) рис. 11; б) рис. 12 (на дугах указаны их пропускные способности в каждом из на- правлений). Рис. 12 5.10. На железной дороге между узловыми станциями d0 и dn расположены промежуточные станции dx....dn_j. Движение пассажирских поездов из d0 в dn происходит в строгом соответствии с заданным расписанием. На запасных путях промежуточной станции dt может одновременно нахо- диться не более rt товарных поездов. Путь между станциями di и dl + 1 занимает для товарнбго поезда jff мин (все кратны 5). Товарные поезда могут отправляться со станций начиная с 0 часов с интервалом в 5 мин. Ни с какой станции не могут одновременно отправиться более одного товарного поезда. Товарный поезд может отправиться в данный момент со стан- ции dj лишь при условии, что он не помешает движению пас- сажирских поездов до момента, пока не достигнет станции, запасные пути которой заполнены не полностью. Необходимо составить расписания товарных поездов так, чтобы общее число товарных поездов, вышедших в течение данных суток из do и прибывших в dn, было максимальным. Сформулировать 74
эту задачу как задачу построения максимального потока в сети. При организации работы над различными проектами, планировании комплексов работ широкое распространение получили методы сетевого планирования и управления. Начальная информация о проекте задается перечнем всех работ, их продолжительностью, последовательностью вы- полнения (для каждой работы должно быть указано, каким работам она предшествует или за какими следует). Сетевым графиком проекта называют наглядное представление проекта в виде сети. Дуги этой сети являются ориентированными, т. е. для каждой указаны начало и конец, и представ- ляют работы, вершины (их называют событиями) представляют последова- тельность выполнения работ. Ни одна работа, представленная дугой, выходящей из некоторой вершины, не может начинаться прежде заверше- ния всех работ, представленных дугами, входящими в данную вершину/ Каждую пару событий должна соединять не более чем одна работа. В се- тевом графике должно быть одно начальное и одно конечное событие. Для выполнения перечисленных требований допустимо введение фиктивных работ (работ нулевой продолжительности, не требующих затраты каких- либо ресурсов). # 5.11. Информация о проекте задана перечнем работ, их продолжительностью и последовательностью выполнения (табл. 5.1). Таблица 5.1 Работа * Каким рабо- там предшест- вует Продолжи- тельность в днях Работа Каким рабо- там предшест- вует Продолжи- тельность в днях 1 11,15 15 9 5 10 2 1,13 5 10 — 20 3 9,14 5 11 . 5 10 4 10 10 12 1,13 20 5 —. 5 13 9,14 10 6 3,4 30 14 10 10 7 8,2 10 15 9,14 5 8 11,15 20 Построить сетевой график проекта. Обозначим начальное событие через р0. Рангом события pj назы- вается максимальное число дуг в путях, соединяющих р0 с pj. Ранги событий можно определить с помощью алгоритма Форда. Первоначально вершине р/ ставится в соответствие число Х,: = 0, а дуге (р/, Pj) — число f/i7==l; r = 0, 1, ...,п,'/=1, 2, ..., п (предполагается, что в сети п+1 вершин р0, pi, . ..,р„). Если дуга (р^ pj) не существует, то yij = b. На #-м шаге (#=1,2, ...) по очереди просматриваются вершины ру, п. При просмотре ру вычисляется величина Ху: = max (Х/+«//у). i=o, 1,..., п ' Ц.СЛИ после очередного шага Хь не изменились, то полученные значения являются рангами событий plt »..tpn соответственно. Говорят, 75
что график пронумерован, если событию нулевого ранга р0 присвоен номер 0, события первого ранга занумерованы в произвольном порядке числами 1, klt события второго ранга —числами &1+1, ...» ^1 + ^2 и т. д. Обозначим Ле событие в пронумерованном графике az. Очевид- но, что для любой работы (az, aj) выполняется неравенство i < /. >|с 5.12. Пронумеровать сетевой график, построенный в за- даче 5.11. # Будем считать длиной дуги продолжительность выполнения соответ- ствующей работы, временем наступления события — время окончания всех работ, входящих в событие. При этом предполагаем, что работа над проек- том начинается в момент времени t0— 0. Минимальное возможное время (минимальное время) наступления события pj обозначим ^-.Очевидно, что значение tj равно максимальной длине пути из р0 в ру. Минимальное время J tn наступления конечного события рп назовем критическим временем про- екта. Критическим называется любой путь из р0 в рп длины tn. Моменты времени , tn легко вычисляются с помощью алгоритма Форда, если в этом алгоритме заменить р,у на продолжительность //у выполнения работы (pz, ру). * 5.13. Убедиться, что если сетевой график пронумерован, то для вычисления минимальных времен наступления собы- тий достаточно выполнить один шаг алгоритма Форда. # Обозначим через Ту наиболее позднее (максимальное) время наступле- ния события ру, при котором еще возможно выполнить комплекс работ к моменту времени tn. # 5.14. Разработать алгоритм отыскания величин Tj. 5.15. Указать необходимые и достаточные условия при- надлежности некоторому критическому пути: а) события ру; б) работы (рг, pj. 5.16. Указать способ отыскания критического пути. 5.17. Для сетевого графика, построенного в задаче 5.11, найти минимальные и максимальные моменты времени /у, Tj наступления событий ру, /=1, ...» 8, критическое время проекта и критический путь. >jc Значение сетевых методов планирования и управления велико. Важную роль играет само составление сетевого графика, позволяющее составить ясное представление о работе над проектом во времени. Отыскание крити- ческих путей дает возможность выявить работы, на которых следует со- средоточить внимание в первую очередь. Определяется минимальное время завершения всего комплекса работ. Вычисление величин //, Ту позволяет определить резервы времени. Так, полный резерв времени для работы (pz, ру) равен Ту—ti—tij (это максимально возможное увеличение продолжитель- ности работы (pz, ру) без увеличения времени выполнения всего проекта). Свободный резерв времени tj—tt—tij—это максимально возможное увели- чение продолжительности работы (р/, ру), при котором можно начать все работы, выходящие из ру в наиболее раннее время. Независимый резерв времени max{0, tj—Tz—//у} — это максимально возможное увеличение продолжительности работы (р/, ру), не влияющее на резерв времени других работ. Анализируя сетевые графики, иногда можно решить некоторые опти- мизационные задачи и сделать полезные выводы. 76
5.18. Строительство гидроэнергетического комплекса со- стоит из следующих работ: а — строительство дорог; Ь — подготовка карьеров к эксплуатации, закладка фундамента с — строительство поселка; строительство завода; f — строительство плотины, дамбы и водосброса; g — строительство галереи и по- дводящих трубопроводов; h — соединение завода и трубопроводов; i — предва- рительные испытания. Сетевой график проекта изображен на рис. 13. Каждая работа может d — заказ оборудования; е — Рис. 13 быть выполнена в нормаль- ном ритме (нормальный план), и ее выполнение может быть уско- рено до некоторой минимальной продолжительности (срочный план), при этом ее стоимость возрастает. Зависимость стои- мости работ от их продолжительности линейная. Продолжи- тельность (в месяцах) и стоимость всех работ (в млн. руб.) приведена в табл. 5.2. Таблица 5.2 Опера- ции Нормальный план Срочный план Стоимость ус- корения за месяц продолжи- тельность стоимость продолжи- тельность стоимость а 4 - 5 2 15 5 Ь 6 11 5 30 19 С 4 3 2 11 4 d 12 150 9 180 10 е 10 10 8 20 5 f 24 147 19 212 13 g 7 18 6 30 12 h 10 4 7 25 7 i 3 2 2 5 3 Найти критическое время выполнения проекта и указать способ сокращения критического времени проекта на 9 мёс. при минимальном увеличении стоимости. 5.19. Информация о проекте задана перечнем работ, их продолжительностью и последовательностью выполнения (табл. 5.3). 77
Таблица 5.3 Работа Каким рабо- там предше- ствует данная работа Продолжи- тельность, мес. Работа Каким рабо- там предше- ствует данная работа Продолжи- тельность, мес. 1 4,5,6 . 20 5 8 10 2 4, 5, 6 10 6 7 5 3 5, 6 8 7 8 5 4- 8 20 8 — 10 а) Построить сетевой график проекта, найти критическое время проекта и критический путь, если известно, что в t-ю работу можно вложить средства xit где при этом время выполнения работы уменьшится до тг(1—bixt). б) Полагая £>t=0,2, Ci=2, &4=0,3, с4=2, Ьв=0,1, се=5, определить размер вложенных средств хг, х4, х8 в 1-ю, 4-ю и 8-ю работы так, чтобы время завершения всего комплекса работ не превышало 40 мес, а сумма вложений была минималь- ной. в) В общем случае сформулировать задачу минимизации суммы вложений, необходимых для того, чтобы обеспечить завершение всего комплекса работ к заданному моменту вре- мени Т, как задачу линейного программирования.
6 Глава ОПТИМАЛЬНЫЕ РЕШЕНИЯ ПРИ РАЗЛИЧНЫХ ВАРИАНТАХ ИНФОРМИРОВАННОСТИ >|с В данной главе приведены задачи на отыскание и исследование свойств оптимальных и абсолютно оптимальных стратегий при различных предпо- ложениях об информированности оперирующей стороны о неконтролируе- мых факторах. В том числе рассматривается случай постепенного поступ- ления информации, а также в случай, когда неконтролируемые факторы — стратегия противника, интересы которого не противоположны интересам оперирующей стороны [3, 12, 15]. Стратегия ха(£М называется абсолютно оптимальной в М, если при всех x£Mt W (Ха (#)> У) Э» W (X (У), У). Стратегия называется ъ-абсолютно оптимальной в М, если при всех х£М, y£N W(Ха ({/), У) > IT (х <</), у) —е. * 6.1. Построить пример операции, в которой ни при ка- ком е С [0,1 ] у оперирующей стороны в Л40 нет е-абсолютно оптимальной стратегии. 6.2. Построить пример операции с седловой точкой в Мо х У такую, чтобы в Л40 не имелось абсолютно оптималь- ной стратегии. 6.3. В операции множества А40 и W—компакты; крите- рий W (х, у)—непрерывная функция. Построить абсолютно оптимальную в М стратегию ха и найти выражение для гарантированного ею результата W (711). 6.4. Доказать, что: а) стратегия ха абсолютно оптимальна в М тогда и толь- ко тогда, когда W (ха, у) = maxxeMo W7 (х, у)-, б) для существования во множестве смешанных страте- гий Ф абсолютно оптимальной стратегии необходимо и до- статочно, чтобы абсолютно оптимальная стратегия сущест- вовала в 7И0. 6.5. Установить, всякая ли оптимальная в М стратегия абсолютно оптимальна в М. 79
6.6. Для операции с критерием Мо= {1,2, 3, 4, 5}, IV- {1.2, 3,4}, найти: а) оптимальную в Мв стратегию, W (Л40); установить, име- ются ли в AfoxW седловые точки, а в Мо — абсолютно оптимальные стратегии; б) W (Л4); оптимальные и абсолютно оптимальные стра- тегии в М\ указать число седловых точек в MxN; в) W (Ф) и оптимальную смешанную стратегию; г) IT(MR); оптимальные в Л4Д стратегии; абсолютно оп- тимальные стратегии и седловые точки в, MRxTV (если они существуют). Информационная функция R задана следующим образом: R (1)=R (3)=1, R (2)=R (4)=2. 6.7. Пусть операция с критерием W (х, у) имеет на MvxN седловую точку (х0, у0). Доказать, что эта точка является также седловой точкой операции на MxN (стратегии из М принимают значения лишь из Л4о). 6.8. В операции множества Мв и N— компакты; крите- рий W (х, у) и информационная функция R (у) непрерывны. Построить оптимальную в MR стратегию хй и найти вы- ражение для гарантированного ею результата W (MR). 6.9. В операции множества Л40 и N—компакты; W(x,y)— непрерывная функция; множество стратегий М таково, что оптимальная в М стратегия х0 существует. Доказать, что равенство W (М) = W (М) дает необходимое и достаточное условие существования в MxN седловой точки. Построить седловую точку в М х N. Обязательно ли М содержит абсо- лютно оптимальную стратегию? [—1 2 4 6 0 3\ 6.10. a) (ЯЧх,</)) = ( 6 1 -3 4 4 1 , \—о О О и I —Z / Я(1) = Я(2) = /?(5) = 0, Я(3) = 1, Я(4) = /?(6) = 2. Найти W (Мв), W(M), W (MR); оптимальные, абсолютно оптимальные в MR стратегии; седловые точки в MRxN (если таковые существуют); б) Выполнить задание п. а), заменив в матрице (U7(х, у)) элемент Г (2, 2)=1 на W (2, 2)=3. в) Найти такую информационную функцию R, принимаю- щую три различных значения, что множество Л4Н содержит 80
абсолютно оптимальную стратегию; матрица (W (х, у)) та же, что в п. а). г) Найти все неэквивалентные информационные функции R, принимающие два различных значения такие, что MRxN содержит седловую точку; матрица (1Г (х, у)) та же, что в п. б). 6.11. Отряд пионеров, участвующих в игре «Зарница», должен форсировать реку в одной из точек прямолинейного участка длиной 1 км. На участке расположен один наблюда- тельный пункт «противника», причем вероятность выполне- ния задания прямо пропорциональна расстоянию от точки форсирования до наблюдательного пункта «противника». Не- обходимо выбрать место форсирования реки. а) Построить модель операции. Найти наилучшие гаран- тированные результаты W (М 0) (местоположение наблюда- тельного пункта неизвестно), W (Ф) (в смешанных стратегиях), W (Л4) (расположение наблюдательного пункта станет из- вестно благодаря разведке к моменту проведения операции). Найти соответствующие оптимальные стратегии; б) к моменту проведения операции будет установлено, ле- жит ли наблюдательный пункт правее середины участка или нет. Построить информационную функцию /?; найти наилуч- ший гарантированный в Л4Д результат и оптимальную стра- тегию %0; в) будет установлено, лежит ли наблюдательный пункт на отрезке [1/4, 1] или нет. Выполнить задания п. б); г) будет установлено расположение наблюдательного пунк- та или его отсутствие на отрезке [1/4, 1]. Выполнить задания п. б); д) оперирующая сторона кроме расположения точки фор- сирования реки выбирает расположение отрезка заданной длины а<1, на котором будет проведена разведка. Точнее, выбирается 0 € [0. 1—а] и к моменту проведения операции разведка установит местоположение наблюдательного пункта на отрезке [0, 0+а] или отсутствие его на этом отрезке. Найти наилучший гарантированный результат. 6.12. а) Пусть множество значений критерия W принадле- жит отрезку [а, 0], на котором определена непрерывная воз- растающая функция f. Определим новый критерий Wi=f(W). Доказать, что для произвольного множе- ства стратегий М; более того, всякая стратегия х0, оптималь- ная по критерию W, оптимальна по критерию и обрат- но. б) В условиях задачи 6.11 вероятность выполнения зада- ния прямо пропорциональна квадрату расстояния от точки 81
форсирования до наблюдательного пункта «противника». Вы- полнить задания п. а) — д) задачи 6.11. 6.13. Пусть: a) W(х, t/)=p(x, у); б) W(х, у)=р2(х, у), Мо= ^N=K, где /С— выпуклый компакт в Ет. Найти наилуч- ший гарантированный результат W (М) во множестве стра- тегий М (М — множество всех непрерывных отображений х:К-+К). 6.14. В операции с критерием W (х, ylt Уг)=уЛх+у1') ска- ляр х£[—1, 11 — контролируемый фактор; (уг, уг) £ [—1, Их х[—1, 1] — неопределенные факторы. Найти наилучшие гарантированные результаты: а) 1F(MO); б) Г(М); в) W(MR), если R(ylt уг)=уй г) JF(MH), R(ylt Уг)=Уг, & W(MR), R (ylt у2)=У1+уг; e) W(MR), R(ylt уг)=уг-у2; ж) IF(Mr), R (ylt уг)=У1Уг. 6.15. Оперирующая сторона выпускает п снарядов в не- подвижную мишень, представляющую собой отрезок длины 2е с центром в точкег/^Ю, 1]. Предполагается, что техниче- ское рассеивание снарядов отсутствует и расположение центра цели на отрезке 10, II неизвестно. Определить стратегию стрельбы (т. е. координаты точек прицеливания), обеспечи- вающую наибольшее гарантированное число попаданий в цель, а также наилучший гарантированный результат при следующих дополнительных предположениях: а) стрельба ведется залпом; б) стрельба ведется одиночными выстрелами, перед оче- редным выстрелом поступает информация о результатах пре- дыдущего. 6.16. В задаче 6.15 п. а) найти оптимальную смешанную стратегию оперирующей стороны и наилучший гарантирован- ный результат. 6.17. Пусть т подразделений, участвующих в учениях, прорываются через линию «обороны», представляющую собой прямолинейный отрезок длины 1, на котором расположено п укреплений. Подразделение прорвется через «оборону» в том и только в том случае, если ее расстояние до ближайшего укрепления больше 8, е<1/(2п). Оперирующая сторона, в со- став которой входит т подразделений выбирает места про- рыва (в одной точке могут осуществлять прорыв несколько подразделений), ставя перед собой цель максимизировать ко- личество подразделений, прорвавшихся через «оборону». Най- 82
ти оптимальную стратегию и наилучший гарантированный результат, если: а) прорыв осуществляется всеми подразделениями одно- временно, информация о местонахождении укреплений отсутствует; б) соблюдены условия п. а); допустимо применение смешанных стратегий; в) прорыв осуществляется одновременно и к началу опе- рации известно расположение tix укреплений, пх<п; г) вначале информация об укреплениях отсутствует: под- разделения осуществляют прорыв одно за другим, причем перед началом прорыва очередным подразделением поступает информация об успехе или неуспехе предыдущего. 6.18. В условиях задач 1.8 и 1.9 найти наилучшие гаран- тированные результаты для первой стороны. В следующих задачах затронуты некоторые элементы теории игр с не- противоположными интересами — иерархических игр [12, 15]. Такие игры характеризуются обменом информации между игроками и являются моде- < ля ми иерархических систем. Пусть интересы первого и второго игроков (т. е. оперирующей сторо- ны и противника) состоят в стремлении к увеличению критериев F (х, у), G(x, у), причем каждый из них выбирает соответственно х и у из множеств Мо и N конечномерных пространств. Принцип выбора стратегий вторым игроком состоит в том, что в ситуации, где исход зависит только от его выбора, он всегда максимизирует свой выигрыш. Предполагается, что первому игроку, обладающему правом первого хода, известен этот прин- цип, а также известны F, G, Мо, N. В зависимости от информации о выборах второго игрока, имеющейся в распоряжении первого игрока, можно сформулировать различные по- становки игр. Игра Г х. Первый игрок не рассчитывает иметь какую-нибудь ин- формацию о выборе второго игрока, и его стратегия состоит в выборе и сообщении второму игроку некоторого хх^7И0. Тогда наилучший гаран- тированный результат первого игрока равен sup inf Fix1, у1), (6.1) ' х1 еЛР y^NHx1) v где N1 (x1) = {z/1^^11 Gf*1» Уг)= max G (x1, 2)}, = Л41 = Л4О. zeN1 Игра Г2. Первый игрок будет иметь информацию о выборе y1^N вторым игроком, и его стратегия состоит в выборе и сообщении второму игроку стратегии-отображения х2 из множества всех отображений Л12 = = {х2: N —> Л40}. В этом случае наилучший гарантированный результат первого игрока равен v2 = sup inf F(x2, у2), (6.2) хЧМг y2eN2(x2) Игра Г3. Второй игрок формулирует свой выбор как функцию у (х) 4 т. е. выбирает отображение y3£N3={y3: М1—> W1}. Первому игроку принадлежит право первого хода, и тот, зная у3, сообщает второму игроку правило поведения х3— элемент множества отображений: А43 = {х3:7V3-> 83
Л41}. Наилучший гарантированный результат первого игрока в такой | игре равен * у3= sup inf F (х3, у3). (6.3) Многозначные отображения N2 (х2), N3 (х3). в играх Г2, Г3 определяются, аналогично N1 (х1), как множества ответов второго игрока при фиксиро- ванной стратегии первого. Наращивая глубину рекурсии, можно индуктивно определить игры Г2", Г2Л+1, п^2. В игре Г2л множества стратегий игроков М2п = {х2п: N2n___> Al2w“2}, N2n = {у2п'. ТЙ2п"2_> N2n~2}r а наилучший гарантированный результат первого игрока v2n ==' sup inf F(x2n,y2n). xineMin yineNin (x2«) В игре Г2и+1 соответственно имеем u2rt+1 =sup inf F (х2л+1, 7/2и+1), х2П + 1е М2^1 Л'2Л+1(х2'* + 1) + д?2л + 1__> /v2w + 1 = {y2w+1: M2z2“x_> N2*-1}. Здесь Nk (JA) = {yk £ AfA I G (x*, у*) = max G (x*9 z)}. Справедливы следующие соотношения [39]: v2n~v2, у2/2+1 = у3 при 2. Таким образом, для первого игрока дальнейшее усложнение стратегий по сравнению с играми Г1, Г2, Г3 не имеет смысла, т. е. первые три игры можно считать основными и ограничиться лишь их исследованием. Эти игры допускают экономическую интерпретацию в рамках иерар- хической системы «центр — производитель» [12]. Рассмотрим три способа экономического управления «центра». 1) Назначение цен х1 на продукцию «производителя» у. При управле- нии ценами наиболее естественна формулировка игры Г1, так как цены назначаются заранее без информации об у. 2) Фиксированные выплаты х2 (дотации, премии, отчисления от при- были и т. д.). Поскольку расчет с «производителем» осуществляется по предъявлении продукции у, система фиксированных выплат в соответствии с результатами труда может быть заранее сообщена «производителю». Это приводит к игре Г2 на множестве стратегий х2—х2(у). 3) Выделение ресурсов х3 (сырья, оборудования, рабочей силы и т. д.). > Ресурсы, очевидно, должны выделяться до начала производства, и фор- - мально «производитель» имеет право диктовать свои условия: ^==^(х3). Однако, поскольку право первого хода за «центром», он сообщает свою стратегию как отображение х?£М3. Это типичная формулировка игры Г3. > Здесь также возможна формулировка игры Г1. < & Перейдем теперь к вопросу о решении сформулированных игр с пере- дачей информации [15]. | Решение игры Г1 сводится к отысканию максимина со связанными | переменными (6.1) (см. также введение); некоторые особенности этой задачи £ были рассмотрены в гл. 4, f 84
Для описания 8-оптимальной стратегии первого игрока в игре Г1 введем следующие величины, множества и функции: L2— max min G (х, у) — max G (хн (#), у); yeN хеМ0 yeN e2={«/€^|G(x"(i/)) j/) = l2}; Ds = {(*> y}^M^N\G(x, y)>L2}- K2 = sup F (x, y)<F(xi, Уе) + ъ, eSsO; (x, y) e Ds X (y) = Argmax F (x, y); xa (y) £ Argmax G (x, y); xeM0 xeX(y) P2~ min max F (x, y). yeEz хем0 Здесь K2 — — оо, если D2 = 0. В случае конечных множеств MQ, N все верхние и нижние грани достижимы, так что можно принять 8 = 0. Справедлива следующая теорема. Теорема 6.1. Наилучший гарантированный результат первого игрока в игре Г2 равен и2 = шах (К2, Р2). Стратегия ре, У = Уг, К2 > Р2- \=={ ха(у), У €^2, V хн (у) в остальных случаях является оптимальной стратегией первого игрока в игре Г2. Здесь хн (у)—стратегия «наказания»; xaJ(y) — абсолютно оптимальная стратегия первого игрока. Случай К2 > Р2 наиболее интересен и соот- ветствует ситуации, когда цели обоих игроков (уровней иерархической системы) в некотором смысле близки. Приведем аналогичный результат для игры Г3. Обозначим ^>з = {(лг, £/)£MoXW| G (х, у) > L3 = min max G (х, #)}; хе Mq ye n Кз = sup F (x, y)^F (x , у ) +’e, s 0; (x,y)eDz B = {xgM0|max G (x, y) = Ls}, ye w N (*) ={y£N I o (Xt y) = max G (x, г)}, zeN P3 = sup min F(x,y)< min F(xg, r/)H-8. xeByeN(x) yeN(x\) Теорема 6.2. Наилучший гарантированный результат первого игрока в игре Г3 равен max (К3, Р3). Стратегия - =рг. ?=7е. ^»> J’s, 8 l^e, Кз^Рз либо у ^~уё является оптимальной стратегией первого игрока в игре Г3. Здесь уе, — стратегия второго игрока, состоящая в выборе точки !/e€/v. . Роль стратегии «наказания» в игре Г3 выполняет х8££. Стратегия «наказания», являясь важной частью оптимального поведения первого 85
игрока, обеспечивает устойчивое поведение второго игрока в tfrpax с пере- дачей информации. При этом неважно, знает ли второй игрок интересы первого или нет. Напротив, точное знание первым интересов второго су- щественно (в противном случае решение игр Г усложняется). Теоремы 6.1 и 6.2 можно назвать теоремами о решении игр Г2, Г3, поскольку они сводят вариационные задачи 6.2 и 6.3 к задачам нелиней- ного программирования (гл. 3) и минимаксным задачам (гл. 4) в конечно- мерных пространствах. >|с 6.19. Пусть в условии задачи 1.2 п.б) дополнительно выпол- нено: /п=п, i=l, . . . , m; /=1, . . . , т. Найти наилучшие гарантированные результаты для первой страны в играх Г1 и Г2. 6.20. В условии задачи 1.11 найти наилучший гаранти- рованный результат для первого предприятия в предположе- ниях а) и б). 6.21. Определить наилучший гарантированный результат и какую-либо оптимальную (либо 8-оптимальную) стратегию первого игрока в игре Г1, если: а) Д40 = (0, оо), /V={1, 2}, pir ,A_/sinx> U=l’C,(r ,А-/ —4 + 2’^=1’ Г (х, у) — х2—7 и=2 У>—\ 1 п (ил л /, у л, (log2x, у =2; б) Af0, N те же, что и в п. а), I -х + 9, у=1, (]/'х,у=1, Р(х,у)-^ 2х—5, у—2, °('х’У^~\8/х, у=2. 6.22. Определить наилучшие гарантированные результаты и какие-либо оптимальные (либо е-оптимальные) стратегии первого игрока в играх" Г2 и Г3, если: а) Мо = [О, 1], W = [0, 1], F(x, у)=х + у, G(x, у) = х—2у, . б) Мо={1, 2, 3, 4}, JV={1\ 2, 3, 4}, / —3 2 7 4\ /г; v / 3 2111 (F(x,#))= -2-451* \—3 1 0 4/ (2 —1 —2 —3\ —1 2 3—11 3 4-2 2 Г —1 5 4 —4 / 6.23. Пусть первый игрок — «центр» заинтересован в уве- личении выпуска сверхплановой продукции вторым игро- ком — «производителем». 86
а) «Центр» назначает цены х на сверхплановую продук- цию у «производителя». Критерий «производителя» — при- быль, есть G(x, y)=xy—b 1п(а/(а—у)), где 0<у<а; а, Ь>0- ac^b‘, b 1п(а/(а—у)) — функция затрат. Крйтерий «центра» F(x, у)—су—ху — прибыль от продажи продукции у на внеш- ний рынок по цене с. Определить оптимальную стратегию «центра». б) «Центр» стимулирует увеличение объема продукции пу- тем выплаты премии. Обозначим через х размер премии; тогда критерий «центра» есть F(x, у)=су—х, а критерий «произво- дителя» С(х, у)=х—b 1п(а/(а—у)). Найти оптимальное пре- мирование в предположении ас>Ь. 6.24. Доказать, что наилучшие гарантированные резуль- таты в играх Г1, Г2, Г3 связаны неравенствами t^ct^cu2. 6.25. Пусть в условиях задачи 2.37 функции выигрыша игроков соответственно равны F (х, у) = min 1Г} (х, у), 1 < i < т G(x,y) — min W2t(x,y), 1 < i < m где f Xj (ai+bj) , . n W] (X, y) = < xt+ffl ’ Xf + > °’ \at, x,-+t/f = O; “ЙгЬИ. *< + </.> o, b{, Xi + y^O. W](x, Решить игры Г1 и Г2, если известно, что bt< min (ау + ЬД-тт-д, i=l, • m. Будем говорить, что в игре Г1 первый игрок использует «блеф», если вместо сообщенной второму игроку стратегии х1 он применяет другую стратегию zxgAl0. При этом, как и раньше, предполагается, что второй игрок верит сообщению первого и стремится максимизировать G(xLt у) по y£N. 6.26. Найти выражение для наилучшего гарантированного результата первого игрока в игре Г1 при использовании «бле- фа», предполагая, что функции F и G непрерывны на произве- дении компактов Мо и N. 6.27. Найти решение игры Г1 при использовании блефа первым игроком, если a) Afo = [O, 1], Л7 = [0, 1]; F (х, у) = Зх + 2у, G (х, у) = (х— у)2; ST
6) Л40={1, 2, 3}, tf={l, 2,3}, /7 8 1\ /31 4\ (F(x,y)) = ls -1 4 ,(G(x,1/)) = {2 1 3 . \Z 1 □/ \Z Z 1 J 6.28. В отличие от задачи 1.11 предположим, что возмож- ности рынка ограничены не потребностью в производимой продукции, а суммой денег С на рынке. Предположим также, что аТребуется: а) записать критерий эффективности операции, считая оперирующей стороной первое предприятие; б) найти оценку эффективности стратегии (х, р); в) найти оптимальную стратегию и наилучший гаранти- рованный результат в случае отсутствия информации о не- контролируемых факторах (у, q); г) найти 8-оптимальную стратегию и наилучший гаранти- рованный результат в случае полной информированности; д) проследить зависимость наилучшего гарантированного результата и оптимальной стратегии от информированности на следующем числовом примере: С=1 млн. руб., К=0,9 млн. банок сока, а=0,4 руб., Ь—2 руб. 6.29. Обозначим через vl(F, G) наилучшйи гарантирован- ный результат (6.1) первого игрока в игре Г1, где F, G — не- прерывные на произведении компактов Мй, N функции. По- казать, что: а) при 8 —> О v1 (Fg, G) —>• v1 (F, G), если p(FerF) = шах |/%-(*, У)—F(x, г/)|—« 0; (х, у) gMqXN б) при р (Ge, G) —» 0 величины о1 (F, Ge) могут не схо- диться к о1 (F, G). 6.30. В операции х£Л40={1, 2, 3} — контролируемый фактор, y^.N— {1, 2, 3} — неконтролируемый фактор, яв- ляющийся стратегией противника. Интересы оперирующей стороны и противника описываются соответственно матрицами / 5 _з о\ /—1 —1 1\ (1Г(х, У))=\^ 4 (Г„(х, t/))=^ 2 2 3j. Заданы три информационные функции! fl,z/=l,2, fl, z/==l,3, Я10/)=(д у=3. Яг(*/)=|2, z/==2; fl, у =2, 3, ^)=U^i. 88
а) Найти W (Af0), W (M), W i=l, 2, 3, если мат- рица Wn неизвестна исследователю операции; б) найти наилучшие гарантированные результаты W, (Мо), Wt (М), IF, (МЛ/), 1=1, 2, 3, и соответствующие оптималь- ные стратегии, если исследователь операции знает IF„, а оперирующая сторона сообщает противнику выбранную стратегию; в) найти наилучший гарантированный результат W* (М0) и оптимальную стратегию, если исследователь операции знает, что lFn(l, 2) =—1, 1ГП(1, 3) = 1, а оперирующая сторона сообщает противнику выбранную из множества Л40 стратегию; г) найти наилучшие гарантированные результаты Wt (Л40), Wt (М), i=1, 2, 3, и соответствующие оптималь- ные стратегии, если исследователь операции знает, что Г„(1, 1) = -1, Г„(1, 3)=1, ТГ„(2,2) = 2, W„(2, 3) = 3, а оперирующая сторона сообщает противнику выбранную стратегию. 6.31. Найти наилучшие гарантированные результаты i—1, 2, 3, и соответствующие оптимальные стратегии, если: оперирующая сторона сооб- щает противнику выбранную стратегию; матрица, описываю- щая интересы оперирующей стороны, и информационные функции 7?i, R2, Ra те же, что в задаче 6.30; исследова- телю операции дополнительно известно следующее: а) интересы противника описываются одной из двух матриц: /—1 —1 i\ /2 —з 2\ (W\(X, У))=\ * II) ИЛИ (W'(x, У)) = (3 1 о); б) элементы матрицы IF„, описывающей истинные инте- ресы противника, удовлетворяют условию W„(x, y)—e^W°n(x, t/)<IFn(x, y) + &, 1<х<3, 1 <у<3, 8>0. 6.32. Пусть Л40= {1, ..., т}, JV = {1, ..., п}, W—кри- терий эффективности оперирующей стороны, критерий эф- фективности противника совпадает с одним из критериев lFfc, ££S={1,..., s}. Информационная функция /?:Sx xN —> Е1 такова, что для любых k и у имеем R (k, у) £ где Rkl(] Rfli = 0, Найти наилучший гарантирован- ный результат, считая, что противник знает стратегию опе- рирующей стороны. 89
э|с Следующие задачи посвящены исследованию многошаговых операций (в том числе многошаговых игр с полной информацией), отысканию наилуч- ших гарантированных результатов в них, изучению свойств последователь- ного максимина и минимакса. # 6.33. В операции Мо={1, 2, 3, 4, 5}, 77= {1, 2, 3, 4, 5, 6} критерий задан матрицей /4 5 3 О \5 (№(*, */)) = 3 3 4 3 0\ 5 2 4 2 0\ 3 3 12 4 2 2 3 3 5 / 21522/ Вычислить наилучший гарантированный результат IF(Af), если операция протекает следующим образом (тем самым опре- деляется и множество стратегий Л4): а) оперирующая сторона выбирает четность х, затем узна- ет значение природной неопределенности у и, наконец, вы- бирает х в соответствии с ранее выбранной четностью; б) оперирующая сторона выбирает четность х, затем узна- ет четность природной неопределенности у и, наконец, вы- бирает х в соответствии с ранее выбранной четностью; в) случайный механизм выбирает четность х, приписывая равные вероятности 1/2 множествам четных и нечетных зна- чений х, затем противник выбирает четность у, оперирующая х сторона выбирает х той четности, которая выбрана случайным механизмом, и, наконец, случайный механизм выбирает с ве- роятностями 1/3 одно из значений у из множества {1, 3, 5} или {2, 4, 6} в зависимости от выбора четности у противником. 6.34. Задана матрица Игра происходит сле- дующим образом. На первом шаге первый игрок выби- рает непустое собственное подмножество Л41 множества М = {1, ..., т}, затем второй игрок, зная выбор первого, вы- бирает непустое собственное подмножество Д/х множества Л/={1, .. ., и}. На втором шаге первый игрок, зная выборы на первом шаге, выбирает непустое собственное подмножество /И2 множества /Их, затем второй игрок, зная все предшествующие выборы, выбирает непустое собственное подмножество N2 множества Л/х и т. д. Как только один из игроков выбирает на очередном шаге одноэлементное множество, сразу же вслед за этим другой игрок также должен выбрать одноэлементное множество и на этом игра кончается. Если последнее множе- ство, выбранное первым игроком, состоит из вторым — из j g /V, то выигрыш первого игрока составляет величина aZ7, а выигрыш второго — величина — а^. Найти значение игры v и оптимальные стратегии игроков. 6.35. Пусть функция F (xlt х2, У1, у^ г2) определена при 90
yj^Nj, zh£Zh; i, j, k=l, 2. Обозначим через St опе- рацию взятия верхней грани по хг через Д— операцию взятия нижней грани по у} £ N}, через Eh— операцию взятия математического ожидания по zh, при этом zk— случайная величина с заданным распределением, принимающая значе- ния из Zh. а) Можно ли при произвольных Mi, Nj, Zh, F утверждать, что SiS2/1/2F2/2F2S2F</1/2F? в) Установить, можно ли связать определенным знаком неравенства величины S1/1Z2S2/:' и IiSiS2ItF при произволь- ных Mt, Nj, zh, F. в) Доказать следующую цепочку неравенств: SiS2£'i£2/1/2F<£iSi£'2/iS2/2F <£i/2Si71.E’2S2F«:/2£1ZiSiX xE2S2F. 6.36. В задаче 1.23 найти: а) оптимальную или е-оптималь- ную пассивную стратегию; б) s-оптимальные последовательные стратегии при п=2, 3, 4. 6.37. Пусть L (Д’) — класс всех функций, удовлетворяю- щих на [0, 11 условию Липшица с заданной константой Д’. Пусть также x=(xi, . . . , хп) — пассивная стратегия (см. задачу 1.23) поиска максимума функции f£L(K); f(xt)=yi, /=1 n; y=(yt, . . . , уп)- Критерием эффективности является F (х, f)= max f(t)— max yt. /е[о, i] i с п а) Найти оптимальную пассивную стратегию х° и наилуч- ший гарантированный результат. б) Доказать, что стратегия х° оптимальна во множестве последовательных стратегий. 6.38. К задаче 1.24 найти оптимальную на классе Д(Д) квадратурную формулу и наилучший гарантированный ре- зультат. 6.39. Найти оптимальную пассивную стратегию х°=(х?, . . . , х’) поиска максимума функции из класса = — —Ж)1«Ж—Д, /2€Ю, 1/2], 1№)-Ж)1<Шз—М, 4, /4£[1/2, 1]} и наилучший гарантированный результат. 6.40. Доказать, что алгоритм деления пополам интервала локализации корня является оптимальным последовательным алгоритмом поиска корня функции, непрерывной на отрезке и принимающей на концах значения разных знаков, если критерием эффективности является длина интервала локали- зации. 6.41. При п=2, 3, 4, 5 найти значение vn следующей n-шаговой антагонистической игры. 91
На первом шаге минимизирующий игрок выбирает точку Xi € (0, 1), разбивая тем самым отрезок [0, 1] на отрезки [0, XiJ, [%!, 1], а максимизирующий игрок, зная хх, приписывает этим отрезкам неотрицательные числа 1Ъ 12 соответственно, при этом число, приписываемое отрезку, не должно превышать его длину и где /£[0, 1] — заранее фиксированное число, известное обоим игрокам. На втором шаге минимизирующий игрок выбирает точку х2 € (о, Xi) U (%1, 1), разбивая тем самым один из отрезков пер- вого шага на два, а максимизирующий игрок, зная хъ х2, приписывает этим двум отрезкам неотрицательные числа, каждое из которых не превосходит длины своего отрезка, а сумма равна числу, приписанному объединению этих отрез- ков на первом шаге, и т. д. После того как все п шагов сделаны, максимизирующий игрок получает от минимизирующего максимальную из ве- личин, приписанных к п+1 отрезкам, на которые разбит от- резок [0, 1].
1 Глава СТОХАСТИЧЕСКИЕ МОДЕЛИ В ИССЛЕДОВАНИИ ОПЕРАЦИЙ * Задачи 7.1—7.14 посвящены выяснению роли случайных факторов в ис- следовании операций, в том числе в случае, когда законы распределения случайных факторов известны неточно. э|с 7.1. Пусть /—1 2 4 6 0 3\ (F(x, ?)) = ( 6 1 -3 4 4 1 , ' v ” \—3 5 301—2/ z—случайный фактор с распределением со. Информацион- ная функция 7? задана следующими соотношениями: 7? (1)= = 7?(2) = 7?(5) = О, 7?(3)=1, R (4) = R (6) = 2. Найти F(M0), F (М), F(Mr)m соответствующие оптимальные стратегии, если: а) со = (1/6, 1/6, 1/6, 1/6, 1/6, 1/6), б) со=(0, 1/3, 1/4, 0, 5/12,0). Сравнить полученные результаты с результатами задачи 6.10. 7.2. В операции с критерием F (х, z) = |x—z| (см. за- дачу 6.11)) MQ — Z — [0, 1]; х£Мй—контролируемый; г— неконтролируемый случайный фактор, равномерно распреде- ленный в Z. Найти: а) наилучшие гарантированные результаты F (Мо) и F(M), а также соответствующие оптимальные стратегии; б) F(Mr) и оптимальную стратегию, если информацион- ная функция П. *€[1/4, 1J. 1 ,-10, г€[0. 1/4); в) F(Mr) и оптимальную стратегию при р(г)42'г61,/4'IJ’ ’“(о, г g [0, 1/4). 7.3. В условиях задачи 7.2 положить F(x, г)=(х—г)2. 7.4. Пусть: a) F(х, г)=|х—г\; б) F(х, г)—(х—z)2; х, zg € 10, 1], х — неконтролируемый фактор, г — случайный фак- 93
тор, функция распределения которого © известна исследова- | телю операций. Найти наилучший гарантированный резуль- Я тат во множестве стратегий М (М — множество всех непре- рывных отображений [0, 1] в [О, 1]). Сравнить полученный j результат с результатом задачи 6.13. I 7.5. В’ операции с критерием F(x, zlt z2) = z2(x + z1) | (см. задачу 6.14) х£[—1, 1]—контролируемый фактор, | Zj£[—1, 1]—случайный фактор с плотностью распределения “ z2 G [—1> 1]^случайный фактор с плотностью распределения (1/4, = (3/4, —1 с/«с о, 0< /<1. Случайные факторы—независимые случайные величины. Найти наилучшие гарантированные результаты и оптималь- ные стратегии в следующих множествах стратегий: а) /Ио; б) М\ в) Mr,R(z^ z2)=z^ г) Mr, R(zx, z2)=z2. 7.6. В операции с критерием F(x, у, г) = Л(х, y+z), / j з 2\ где (Л (х, и))==Н j 5), xgAl0={l, 2}—контроли- руемый фактор, у£А/={1, 2} — неопределенный фактор, z£Z={0, 1}—случайный фактор, принимающий значения О, 1 с вероятностью 1/2. Найти наилучший гарантирован- ный в М результат W (М) и оптимальную стратегию, если: а) Л4 = М0; б) М = М\ в) M = MRf R(y, z) = z; г) M = MR, . R(y, z) = y\ д) M = MR, R(y, z) = y + z, считая при этому . природной неопределенностью. ; 7.7. Решить задачу 7.6, считая у стратегией противника, { который к моменту принятия решения знает реализацию случайной величины z. Оперирующей стороне интересы про- тивника неизвестны. 7.8. Контролируемый фактор —номер х£ Л1о= {1, ..., /п} строки матрицы (Л(х, у))тхгл- Случайный механизм выби- рает четность столбца у: нечетный—с вероятностью ри четный—с вероятностью р2. Противник, интересы которого < противоположны интересам оперирующей стороны, выбирает ; порядковый номер у столбца среди k возможных четных * или нечетных номеров. Построить модель операции, запи- ; сать выражение для наилучшего гарантированного резуль- « тата, найти наилучший гарантированный результат для i 94
случая /1 2 3 ох / 2 3 2 4 \ (Д(х, //)) = ( 3 1 2 0 \ Р1= 1/3, р2 = 2/3, \О 2 2 3/ если: а) противник не знает реализации четности; оперирую- щая сторона не имеет информации о неконтролируемых факторах; б) противник не знает реализации четности; оперирующая сторона к моменту проведения операции располагает полной информацией о неконтролируемых факторах; в) противник не знает реализации четности; оперирующая сторона к моменту проведения операции знает стратегию про- тивника; г) противник знает реализацию четности; оперирующая сторона не имеет информации о неконтролируемых факторах; д) противник знает реализацию четности; оперирующая сторона к моменту проведения операции располагает полной информацией о неконтролируемых факторах; е) противник знает реализацию четности; оперирующая сторона к моменту проведения операции также знает реали- зацию четности. 7.9. В операции с критерием /3 0 2 к /с/ / 4 4 0 3\ (F(X, z)) = l6 12 3 неконтролируемый фактор г — случайная величина с неоп- ределенностью в законе распределения co=(.cob со2, со3, <о4). Найти наилучший гарантированный результат W, если о не- контролируемых факторах дополнительно известно следую- щее: а) о) неизвестен исследователю операции и не станет из- вестным оперирующей стороне; б) со неизвестен исследователю операции, но станет из- вестным оперирующей стороне к моменту проведения опера- ции; в) исследователю операции известно, что со4=1/4, допол- нительной информации о со оперирующая сторона не получит; г) исследователю операции известно, что со4= 1/4, со станет известным оперирующей стороне к моменту проведения опе- рации; д) исследователю операции известно, что со3=со4=1/4, дополнительной информации о со оперирующая сторона не получит; 95
е) исследователю операции известно, что <х>3=а>4= 1/4, со станет известным оперирующей стороне к моменту проведения операции; ж) исследователю операции известно, что (01+<д2=<0з+<04, дополнительной информации о со оперирующая сторона не получит; з) исследователю операции известно, что (01+<д2=(0з+<о4, со станет известным оперирующей стороне к моменту проведе- ния операции. 7.10. Решить задачу 7.9, предполагая дополнительно, что оперирующая сторона к моменту проведения операции знает реализацию случайной величины z. 7.11. Решить задачу 7.9, предполагая, что оперирующая сторона к моменту проведения операции знает четность реали- зации случайной величины z. 7.12. В операции с критерием F (х, z) = (x—z)2 (см. задачи 7.3 и 7.4) Mo=Z=[0, 11, х^Мо—контролируемый фактор, z € Z — неконтролируемый фактор, являющийся случайной величиной с неопределенностью в законе распределения со. Найти наилучший гарантированный результат W, если о не- контролируемых факторах дополнительно известно следующее: а) ш неизвестен исследователю операции и не станет из- вестным оперирующей стороне; б) со неизвестен исследователю операции, но станет из- вестным оперирующей стороне к моменту проведения опера- ции; , в) исследователю операции известно, что плотность рас- пределения co'(z) существует и имеет вид (У, г€[0, 1/2], ® (г>~\2-у, г £({/2, 1], параметр «/€[0, 2] неизвестен исследователю операции и не станет известным оперирующей стороне; г) исследователю операции известно, что плотность рас- пределения со' (г) существует и имеет вид г€[0, 1/2], “ (г)~\2-у, г£(1/2, 1], параметр уб[0» 2] станет известным оперирующей стороне к моменту проведения операции; 1 д) исследователю операции известно, что J zdco(z) = 1/4, .о 96
дополнительной информации не предполагается; е) исследователю операции известно, что z dco(z)^: 1/4, о дополнительной информации не предполагается; ж) исследователю операции известно, что J z dco(z) 1/4, о дополнительной информации не предполагается. 7.13. Решить задачу 7.12, предполагая дополнительно, что оперирующая сторона к моменту проведения операции знает реализацию случайной величины z. 7.14. В операции с критерием F(х, у, г)—г(х+у) (см. за- дачи 6.14 и 7.5)х€/И0=[—1, 1]; у(Е[—1, 11 — неопределен- ный фактор, zg[—1, 1] — неконтролируемый фактор, яв- ляющийся случайной величиной. Найти наилучший гаранти- рованный результат W и оптимальную стратегию, если о неконтролируемых факторах дополнительно известно следую- щее: а) у — природная неопределенность, случайный фактор z равномерно распределен на [—1, 1], значения у и z не станут известными оперирующей стороне; б) у — природная неопределенность; плотность распре- деления г (р, —1<г<0,’ = р, 0<г^Г; параметр р, а также конкретные значения у, г не станут известными оперирующей стороне; в) у—природная неопределенность; плотность распреде- ления г ?(*)={ р, —1Сг<0, 1— р, 0<г<1; параметр р станет известным оперирующей стороне к моменту проведения операции; г) дополнительно к предположениям п. в) предполагается, что значение у станет известно оперирующей стороне к мо- менту проведения операции; д) дополнительно к предположениям п. в) предполагается, что значения у, z станут известными оперирующей стороне к моменту проведения операции. 7.15. Предприятие, занимающееся обработкой древесины, ежемесячно перерабатывает 10 т имеющегося в наличии леса, 4 № 1904 97
производя пиломатериалы и фанеру. К концу месяца из 1 т леса производится 3 м3 пиломатериалов или 5 тыс. листов фанеры. Один кубический метр пиломатериалов дает суммар- ную прибыль Ci, а тысяча листов фанеры — с2; кроме того, предприятие получает прибыль с3=3 за каждую тонну реа- лизованного на рынке неиспользованного леса. Величины с2 являются случайными с математическим ожиданием Ci= 10, с2—15. Пусть Di— максимальное количество пиломатериалов, a D2— максимальное количество фанеры, которое предприя- тие может продать к концу месяца. Случайные величины Di, i=l, 2, имеют следующее распределение: Р[£>г=П—0,2; Р[Ог=3]=0,4; Р[£»г=8]=0,3; Р[Рг=10]=0,1; i=l, 2. Вся выпускаемая предприятием продукция должна быть пол- ностью реализована с вероятностью не меньше 0,8. Опреде- лить объем древесины, предназначенный для получения пи- ломатериалов и фанеры, который максимизирует ожидае- мую прибыль. 7.16. Деталь машины изготовляют на токарном станке в механической мастерской. Диаметр выпускаемой детали — случайная величина х, распределенная по нормальному за- кону с дисперсией а2 и математическим ожиданием а п. Предполагается, что о не зависит от режима работы стан- ка, задаваемого величиной а. Диаметр детали х не должен выходить из допустимого интервала [xi, х2]. Если x<xlt де- таль должна быть выброшена. Если х>х2, деталь может быть продана для вторичной обработки в другую мастерскую за цену pi. Стандартная деталь продается по цене p>pi. Сум- марная стоимость обработки каждой заготовки равна k. . Определить значение а, при котором прибыль мастерской максимальна. 7.17. Автозаправочная станция (АЗС) обслуживает авто- мобили, которые прибывают случайным образом, и, если не могут сразу приступить к заправке, становятся в очередь. На длину очереди ограничений нет. Известно, что промежутки времени t между двумя после- довательными прибытиями автомобилей удовлетворяют экспо- ненциальному закону с плотностью (пуассо- новский процесс [16]). Время обслуживания на АЗС также имеет экспоненциальное распределение с плотностью /2(/)= =ре-'*<, />0. Определить следующие критерии работы АЗС: — сред- нюю длину очереди автомобилей, 1Г2— среднее время простоя 11 Вероятность событий {х<0} и {х>т} для некоторого известного т принимается равной нулю, 98
автомобиля в очереди, 1Г8— среднее время нахождения авто- мобиля на АЗС, й?4— среднюю долю времени простоя обору- дования АЗС, W г— среднее число автомобилей на АЗС. 7.18. Оценить по критериям задачи 7.17 варианты АЗС, имеющие среднее время обслуживания автомобилей, l/p,i=* =5 мин, 1/р2=3 мин 30 с„ 1/р3=2 мин, 1/р4—1 мин, 1/ц5~ =30 с, если средний интервал между последовательными прибытиями автомобилей равен 4 мин. # Опишем одну из простейших моделей хранения запасов 126, 51]. Пусть на складе хранится единственный бесконечно-делимый продукт, который расходуется с постоянной интенсивностью Л. При управлении запасом применяется следующая стратегия: выбирается уровень запаса продукта s такой, что при достижении этого уровня посылается заказ на пополнение запаса в количестве q>0. Предположим, что заказ выполня- ется через заранее известный промежуток времени 0>О, т. е. по истечении времени 0 после поступления заказа уровень продукта возрастет на вели- чину q. * 7.19. Составить уравнение для количества продукта ?(/) на складе в момент времени t, если z(0)=S, причем /=0 — момент пополнения запаса. 7.20. Средние затраты в единицу времени, связанные с пе- риодически изменяющимся запасом г(1) (см. рис. 37), оцени- ваются критерием т Здесь at, а2 > 0, — издержки за единицу времени, связанные с нерациональ- ным расходом продукта и затратами на его хранение, а также с неудовлетворением спроса в случае недостатка продукта; b(d)=Co+cid — издержки на организацию и доставку заказа. а) Используя решение задачи 7.19, определить оптималь- ные значения управлений s, S минимизирующие затраты W. б) Найти оптимальную стратегию хранения при больших издержках при неудовлетворении спроса (ах-+- оо). >|с Для решения задач 7.21—7.24 необходимо использовать некоторые Сведения об управляемых марковских процессах. Пусть некоторая система в любой момент времени находится в одном ,ИЗ Л4+1 состояний, нумеруемых числами 0,1, . . . , М. Состояние системы Наблюдается в моменты времени t=0, 1, .... После каждого наблюдения принимается одно из К возможных решений, нумеруемых числами 1, .'. ., а. Рассматриваются лишь такие стратегии управления, в которых при- нимаемое после наблюдения в момент t решение зависит лишь от состояния 4* 99
системы в момент t (и не зависит от предыдущих состояний)*' Таким обра- зом, стратегия определяется набором чисел (r0> rlt . . . , гм), где rzg{l, . . ; , К} — решение, которое принимается, если система находится в со- стоянии i. Если система находится в состоянии i и принято решение kt то система переходит в состояние j с известной вероятностью р/у (/?). При этом м 2 Pij(k) = l; i, / = 0, 1......Л4; k=l, К. i=o Итак, в случае использования произвольной фиксированной стратегии R управляемый процесс превращается в конечную марковскую цепь [32, 60]. Пусть лу— предельная вероятность /-го состояния, /=0, 1, ...» М (пред- полагается, что при любой стратегии R предельные вероятности для полу- чающейся марковской цепи существуют). Напомним, что если движение началось в далеком прошлом, то л у можно трактовать как вероятность, с которой система находится в данный момент в /-м состоянии. Будем предполагать, что принятие решения k в состоянии i связано с расходами (с^ может иметь смысл математического ожидания случай- ной величины, определяющей расходы). Тогда, считая, что система функ- ционирует длительное время, эффективность стратегии #=(г0, гъ ,,, , г^) естественно оценивать величиной м g (#)= 2 Cir-ni’ i= 0 ' имеющей смысл средних расходов в единицу времени. Стратегия, для которой эта величина минимальна, называется оптимальной. Можно показать, что для некоторых (#)» t>i (Я), •••» ил-±(^) и vji(/?) = 0 справедливы равенства м g (Я) =С1Г/+ 2о Plj (R), i = 0, 1, ..М. (7.1) Система (7.1) состоит из М +1 уравнений и содержит 7И+1 неизвестных g(R), vq(R), v^R), . . . , VM-itR). Решив ее, найдем g(R). Таким образом, полным перебором всевозможных R можно найти min#g(/?) и оптимальную стратегию. Однако при достаточно больших К и М такой путь нереален. Приведем алгоритм улучшения стратегий, с помощью которого можно найти оптимальную стратегию. Сначала выбирают произвольную страте- гию R и решают систему (7.1). Основной шаг алгоритма состоит в опреде- лении новой стратегии S=(s0, , «л) с помощью правила 4 м cis,+ 2 РЦ И VJ (R)~vi (R) = ' 7=0 / M X . = min | clk+ 2 Pij{k)vj(R) —MR)] • (7.2) Zt=l, ...,K j-Q ) Оказывается, что g(S)cg(R). Если S=/?, то S — оптимальная стратегия. В противном случае для стратегии S следует решить систему, аналогичную системе (7.1), и определить новую стратегию Т по аналогии с (7.2). За конечное число шагов оптимальная стратегия будет найдена. # 100
7.21. В теннисе, если подающий игрок при первой подаче не попадает в пределы площадки или задевает сетку, ему дается вторая попытка. Если это случается дважды, то он проигрывает одно очко. Начинающий теннисист при подаче «сверху» попадает в пределы площадки с вероятностью 3/8, при подаче «снизу» — с вероятностью 7/8. Если он при по- даче «сверху» попадает в пределы площадки, то он выигрывает одно очко с вероятностью 2/3; при подаче «снизу» — с веро- ятностью 1/3. Найти оптимальную стратегию выбора способа подачи. 1 7.22. Предположим, что в дискретнохМ управляемом мар- ковском процессе допустимо применение смешанных страте- гий, т. е. в состоянии i решение k принимается с вероятностью к dih, f=0, 1, .. . , М>, k=l, dik^0, ^dik=l. Сфор- fe=i мулировать задачу отыскания оптимальной смешанной стра- тегии как задачу линейного программирования. Яс Видоизменим рассматриваемую постановку задачи. Будем учитывать расходы, которые предстоят через т периодов времени в будущем с коэф- фициентом дисконтирования аот, 0<а<1, т. е. расход единицы денежных средств через т периодов времени эквивалентен расходу ат в настоящий момент (деньги, пущенные в оборот, приносят прибыль; происходит «па- дение» денежного курса). Обозначим через V? (R) математическое ожидание суммарных за п периодов времени дисконтированных расходов в случае применения стра- тегии /?=(г0, ri, • • • , гм) Для системы, находящейся в начальный момент в состоянии I. Имеем м V?(R) = clri+a 3 V}(R)=clr_, i = 0, 1,..., AL 1 / = 0 1 Можно показать, что V (R)—>Vi(R) при n—•> oo, где м Vi(R) =c(r,+ a 2 PiJ(rt) Vj(R), i = 0, 1.M. (7.3) 1 7 = о Величину Vi(R) можно интерпретировать как общие дисконтированные расходы на функционирование системы, находящейся в начальный момент времени в состоянии i. Приведем алгоритм, позволяющий найти оптимальную стратегию, т. е. стратегию, которая минимизирует все V{(R) одновременно, i—0, 1, . . . , М. Этот алгоритм аналогичен описанному выше алгоритму для задачи без дисконтирования (см. формулу (7.2)) и также называется алго- ритмом улучшения стратегий. Сначала выбирают произвольную стратегию R и решают относительно неизвестных Vo(/?), • • • , Ум (#) систему уравнений (7.3). Основ- ной шаг алгоритма состоит в определении новой стратегии S=(s0, , Sjh) по правилу Af / м \ <Ч + а 2 P</(*)W) = ,min Jc<*+a 2 V/ (*)}• (7.4) 7 = 0 / = о ) 101
Оказывается, что У,- (S) < У, (R), i = 0, 1, М. Если 5 = 7?, то S — оптимальная стратегия. В противном случае для стратегии S следует решить систему, аналогичную системе (7.3), и определить новую стра- тегию Т по аналогии с (7.4). За • конечное число шагов оптимальная стратегия будет найдена. * 7.23. Емкость водохранилища гидроэлектростанции 3 усл. ед. На производство электроэнергии необходимо в течение месяца использовать 1 ед. воды. Будем считать, что попуск (т. е. сброс) воды из водохранилища производится в начале месяца. Если попуск не производится совсем, то убытки со- ставляют 300 000 руб. Если производится попуск 1, 2 или 3 ед., то гидроэлектростанция не -несет убытка, а доходы от использования воды на орошение составляют соответственно 100, 200 или 300 тыс. руб. В течение каждого месяца в водо- хранилище поступают 0, 1, 2 или 3 ед. воды с вероятностью соответственно 1/6, 1/3, 1/3, 1/6. Если общее количество воды оказывается больше емкости водохранилища, то избыток сразу же выпускают; это не приносит ни прибыли, ни убытка. Найти стратегию попусков воды, минимизирующую общие дисконтированные расходы при коэффициенте дисконтиро- вания а=0,99. 7.24. Химический комбинат может производить два вида продукции. Обозначим их 0 и 1. В начале каждого месяца принимается решение о том, какой вид продукции произво- дить в данном месяце. Принимаемое решение целиком опре- деляется спросом. Спрос имеет случайный характер, причем если в текущем месяце изготовляется продукт 0, то в следую- щем месяце с вероятностью 1/5 окажется необходимым про- должать изготовление этого продукта и с вероятностью 4/5 — переключаться на изготовление продукта 1. Если же в теку- щем месяце выпускается продукт 1, то в следующем месяце с вероятностью 3/5 придется продолжать выпуск этого про- дукта 1 и с вероятностью 2/5 — переключаться на выпуск продукта 0. Для борьбы с загрязнением окружающей среды исполь- зуют один из двух процессов очистки 1, 2. Уровень загрязне- ния при производстве продукта i и использовании процесса k равен biti, где ,, . /100 10\ (»м)'=о. I =1 ю 30)• Для подготовки к началу каждого из процессов очистки необходимо достаточно длительное время, поэтому вопрос о том, какой процесс очистки будет использоваться в данном месяце, приходится решать в начале предыдущего месяца. 102
Найти стратегию, минимизирующую общий уровень загряз- нения с учетом дисконтирования (коэффициент дисконтиро- вания а=0,5). >|с Для анализа функционирования сложных систем (автоматических теле- фонных станций, ЭВМ, автоматизированных информационных систем, различных диспетчерских служб и т. п.), в которых необходимо учитывать массовую «обработку» некоторых объектов с учетом случайных факторов, часто бывает полезно исследовать специальные модели — системы массо- вого обслуживания (СМО). Описание СМО включает задание: а) «входящего» потока требований (запросов, вызовов, клиентов); б) приборов (линий, каналов) и длитель- ности «обслуживания» на них требований; в) порядка (механизма, алго- ритма) такого обслуживания. Для повышения эффективности работы реальных систем необходимо уметь рассчитывать характеристики СМО, учитывающие наличие очередей, вынужденное ожидание начала обслуживания требованиями либо простой системы из-за отсутствия требований, потери требования (уход из системы без обслуживания). Эти характеристики СМО задаются случайными про- цессами и случайными величинами. Как правило, интерес представляют условия существования и конкретные выражения для стационарных рас- пределений характеристик СМО. Особенность случайных величин, описывающих параметры и характе- ристики СМО, состоит в их неотрицательности. Поэтому помимо задания их функциями распределения используется их представление в виде пре- образований Лапласа — Стилтьеса, а для целочисленных случайных вели- чин — ив виде производящих функций. Во многом это связано с приводи- мыми ниже свойствами (задачи 7.25—27). Обозначим неотрицательную случайную величину через а; тогда А (х) — Р (а < х), х^ 0, А(х) = 0, х<0—ее функция распределения,; со £a=^xdA(x)— математическое ожидание случайной величины а; о со а (s) — Е ехр (— sa) = exp (— sx) d А (х)— преобразование Лапласа — о Сти|лтьеса функции распределения случайной величины а; если а —цело- численная случайная величина, то Р (г) = £га — 2" > о Рп^п — произ- водящая функция распределения случайной величины а, где рп=Р (а=п), п 0—распределение случайной величины а. * 7.25. Показать, что у неотрицательной случайной вели- чины а математическое ожидание, дисперсия и моменты более высоких порядков определяются следующими формулами? а) Еа=—a'(0)i б) Da=E(a—£a)2=a"(0)—[a'(0)]2; в) Еа =(—l)«aU)(0); если a — целочисленная случайная величина, то следующи- ми формулами: а') £а=Р'(1); б') Da=P"(l)+P'(l) [1— P'(1)L 103
7.26. Показать, что если {aki &=1, 2, . . — последова- тельность независимых неотрицательных случайных величин, то для преобразования Лапласа — Стилтьеса функции рас- пределения их суммы справедливо представление / N \ ' Я £ехр —s2 afc ) = a1(s);. .aA,(s)= Ц£ехр(—saft); \ k=i J *=i если-аА, —целочисленные случайные величины, то для производящей функции распределения их суммы имеет место представление £zS"= ’ (г)... (z) = П k= 1 7.27. Показать, что если целочисленная случайная вели- чина v (с производящей функцией F(z)=£zv) и последователь- ность неотрицательных одинаково распределенных случай- ных величин {ak, k—l, 2,...} (с преобразованием Лап- ласа—Стилтьеса a(s) = £exp(—sak), независимы в совокупности, то преобразование Лапласа—Стилтьеса функции распределения суммы случайного числа случайных слагаемых af + ... +av имеет представление / V \ Е exp I — s 2 ak ) == F (a ($)) \ /г=1 J И £ 2 ajfe = £a^-£v=[F'(a(O))(—а'(0))]. *=i * В задачах 7.28 — 7.33 рассмотрены примеры распределений случайных величин, наиболее часто используемых при анализе СМО. * 7.28. Случайная величина а имеет экспоненциальное (М) распределение с параметром а > 0(a~ М (а)), т. е. Р (d < х) = 1 — ехр (—ах), х 0. Показать, что: а) a(s) = £exp(—8а) = -^-; б) Ёа = а~1, Da = a~?; в) Р (а t -|- т) = Р (а t) ехр (— ат) (основное свойство экспоненциального распределения); .г) для независимых случайных величин a ~ АГ (а), 0 ~М (Ь) min (а, Р) ~ М (а + Ь). 104
7.29. Пусть случайная величина а имеет детерминирован- ное (D) распределение (а~£>(х0)), т. е. Р(а = х0)=1. Показать, что: a) a (s) = Е ехр (— sa) = exp (— sx0); б) Еа — хл, Da — 0. 7.30. Случайная величина а имеет эрланговское (Ег) рас- пределение порядка г (а ~ ЕГ (а)), т. е. справедливо пред- ставление а — S aft, где afe, k= 1, ..., г +1 —последователь- k=i ность независимых одинаково (экспоненциально с параметром а (г +1)) распределенных случайных величин. Показать, что: а) функция распределения случайной величины а имеет вид ха (r+ 1) £г(х) = у ^-е~“ди, х^О: б) a(s) = £exp(-Sa)=[^i^]r+1; /у “ 2 в) Еа = а~г, Da = —r-г . > г+1 Замечание. Случайная величина а в пределе имеет распределе- ние, не отличающееся от детерминированного, т. е. Da—>0 при /•—><» и сохранении постоянным значения математического ожидания случай- ной величины a (Ег). 7.31. Случайная величина а имеет равномерное (V) рас- пределение на интервале [0, 2а] U [0, 2a]), т. е. ее функ- ция распределения U имеет вид U (х) = 0, х^О; U(x)~ — x/(2a), xg[0, 2a]; t/(x)= 1, x^2a. Показать, что: a) ,a (s) = E exp (— sa) = — (1 — в--20*); 6) £a = a, Da = a2/3. 7.32. Случайная величина a имеет пуассоновское (Рл) распределение с параметром а>0, (а Р°(а)), т. е. = = Р (а = k) — е_°, k = 0, 1, 2....Показать, что: а) Р (z) = Eza = e~a{1~2>; б) Еа = а, Da = a. 7.33. Случайная величина а имеет биномиальное (Bi) распределение с параметрами N, р: N = 1, 2, ..., 0 р 1, (a~Bi(jV, р)), т. е. pk = P(a = k) — CkNpk(\—P)N~k> k = 0, 1, . • •, N. Показать, что: а) Р(г) = £г“ = (q + pz)N, q=\ — p\ б) Ea = Np, Da = Npq. 105
>|с Чаще всего рассматривают СМО с рекуррентным входящим потоком, когда последовательность интервалов между поступлением требований в систему {?£, £>1} — независимые в совокупности одинаково распреде- ленные (с функцией распределения А (х)*) случайные величины. В том случае, когда А (х)= 1— е_дх, а>0, поток называют простейшим с интен- сивностью а или пуассоновским с параметром а. Если требования поступают в СМО в моменты времени, образующие рекуррентный поток (с функцией распределения длительности интервалов между моментами А (х)) и в каж- дый из этих моментов в СМО может поступить случайное число требований v (с производящей функцией Ф (z)—Ezv), то говорят, что в СМО поступает квазирекур рентный поток требований (А,Ф). Если рекуррентные моменты образуют простейший поток с параметром а, то говорят о квазипуассонов- ском потоке (а, Ф). # 7.34. Входящий поток пуассоновский с параметром а. Найти распределение числа требований, поступивших в СМО: а) за интервал времени длины /; б) за интервал времени длины а, где а — неотрицательная случайная величина с функцией распределения Л(х), неза- висимая от потока. 7.35. Входящий поток — квазипуассоновский (а, Ф(г)). Показать, что производящая функция числа требований, по- ступивших в СМО: а) за время t имеет вид Р (?) = Ezv^ = б) за независимый случайный интервал а с преобразова- нием Лапласа — Стилтьеса a(s) имеет вид £zv(a>=a(a— —аФ(г)). 7.36. Входящий поток — рекуррентный с функцией рас- пределения Л(/). Найти распределение числа требований, поступивших в СМО: а) в интервале [0, /]; б) за независимый случайный интервал [О, Р), где р~7И (Ь). 7.37. Входящий поток — квазирекуррентный (Л, Ф). По- казать, что для распределения величины v(t) — числа требо- ваний, поступивших в СМО: а) в интервале [0, t) справедливо представление о С p-^p^vm л/ — 1—<x(s) SJe сг ''ar- l-<D(z)a(s) > о б) за интервал [0, 0), где 0 ~ М (Ь), EzVW = , 1— Ф(г)а(6) Ж Если задан рекуррентный поток с интервалами времени между тре- бованиями {z/г} и отсчет времени таков, что момент поступления п-го 106
требования tn = 2? гЛ»то случайный процесс v (/) = max {«: 2? г* < 0 - число требований, поступивших до момента /,— называют рекуррентным процессом восстановления, а функцию — — функцией восста- новления. Для Н (t) справедливы представления 2 лно= 2 ^**(0= 2 ^(zi4-...+zft<o /г>1 k^\ k>l И H(t) = A (/) + Н*А (0 = А (0 + А*Н (0, t rAe A (t) = P (zk < t), 1, H*A (t—u) (L4 («). о Распределение вероятностей случайной величины, принимающей с вероят- ностью 1 лишь значения вида &Д, где Д > 0, a k—целое, называют ариф- метическим, соответствующая функция распределения также называется арифметической. Для рекуррентного процесса восстановления справедливы следующие утверждения [35]. } Теорема 7.1 (теорема Блекуэлла). Если рекуррентный процесс восста- новления имеет неарифметическое распределение случайных величин г^, 1,— интервалов между поступлением требований,— то для всякого числа h при t—>оо Н (t+h)-H (t)--*ah, VW a-l = Ezk, 1. Теорема 7.2 (узловая теорема восстановления). Если рекуррентный процесс восстановления задает неарифметическое распределение интер- валов Zk, f (х) —непосредственно интегрируемая по Риману на [0, оо) функция, то справедливо соотношение t 00 lim f f (t—x) dH (х) — a f f (и) du, s s где a~i = Ezk, 1. Замечание. Функция f (x) непосредственно интегрируема по Ри- ману на отрезке [0, оо), если [0, оо)= (J Д^, Дд = [(&—-1) Л, kh), k>\ т^ — inf f(x), Мь= sup f (x), lim h m^ — lim h и ряды в *€Д/г хе Д/г , h|0 Л|0 последнем равенстве сходятся абсолютно. При исследовании СМО эффективно рассматривать регенерирующие процессы, т. е. случайные процессы % (/), для которых существует такая последовательность точек t^, k 1, /0 = 0, называемых точками регене- рации, что Zjz — tf^—k^l, образуют процесс восстановления, а совокупность случайных процессов (/) = /^_i), ^)» при- нимающих значения в измеримом пространстве (X, ®), стохастически независима и эквивалентна. Во многих случаях бывает необходимо вы- яснить условия существования предела lim'Р {£ (f)g В}, В для ре- /—>со генерирующего процесса £ (/) и способ его вычисления. Оказывается, что при достаточно широких предположениях этот предел определяется через соответствующие вероятности событий на отдельном цикле регенерации — интервале ^). Положим и(/, В) = Р(И^-1+0€В, zk > t). Тогда справедлива следующая предельная теорема для регенерирующих процессов. Если А (х) = Р (z^ < х) — неарифметическое распределение, / 107
£zfc = a~x < + оо, а функция р, (t, В) интегрируема по Риману на лю- бом конечном интервале, то для регенерирующего процесса g (t) 00 lim Р(£(1)£В)=а f jn(/, B) dt * /->00 У 7.38. Предполагая, что моменты прихода автобуса на неко- торую остановку образуют рекуррентный процесс с неарифме- тической функцией распределения А (х)=Р (zfe<x), определить в установившемся режиме распределение времени ожидания прибытия очередного автобуса начиная с произвольного ! момента времени. 7.39. В условиях задачи 7.38 показать, что длина интер- вала отсутствия на остановке автобуса до фиксированного момента времени в установившемся режиме имеет такое же распределение, что и время ожидания автобуса. 7.40. В условиях задачи 7.38 предположим, что поток пас- сажиров, приходящих на остановку, квазипуассоновский (а, Ф(з)) и в каждом из прибывающих автобусов имеются места для всех пассажиров. Определить распределение числа j пассажиров, ожидающих автобуса, в установившемся режиме. « 7.41. {Альтернирующий процесс.} У восстанавливаемой f системы интервалы безотказной работы ak чередуются с ин- тервалами восстановления работоспособности (рис. 14). j <4 Л/ О? $2 ^4 Аь Рис. 14 Предполагая, что (afe, pfe), &=1, 2, . . . ,— независимые в со- вокупности случайные величины, задаваемые функциями рас- пределения Л(х)=Р(а<х) и В(х)=Р(Р<х), определить ве- роятность того, что в произвольно выбранный момент вре- мени установившегося режима функционирования системы застанем ее в рабочем состоянии. # Для основных видов СМО приняты следующие обозначения: А | В | п | т, С, где А — распределение интервалов между последователь- ными моментами поступления требований, В — распределение длитель- ности обслуживания требований, п—количество приборов в системе, т—число мест ожидания для требований, С — порядок обслуживания требований. Поясним это на примерах. Пример 1. Система | М | М | 31 2, FIFO или М | М | 31 2—трехка- нальная СМО с простейшим потоком, экспоненциальным обслуживанием, с двумя местами для ожидания и обслуживанием требований в порядке поступления (First In First Out}. Пример 2. Система Е2 | D | 1 |°о, LIFO или Е21 D J 1, LIFO—однока- нальная СМО с рекуррентным эрланговским потоком порядка 2, детер- 108
минированным обслуживанием без потерь (неограниченная очередь), инверсионным порядком обслуживания (Last In First Out). Пример 3. Система М21 U211 |оо, PR, FIFO или Л421 U21 1, PR — одноканальная СМО с двумя простейшими потоками требований различ- ных приоритетов с равномерно распределенными длительностями обслу- живания, без потерь с прямым порядком обслуживания однородных требований. Пример 4. Система GI|M|oo—СМО с неограниченным числом кана- лов, рекуррентным входящим потоком и экспоненциальным временем обслуживания требований. Для исследования СМО во многих случаях бывает полезно рассмотреть соответствующие марковские процессы, т. е. такие случайные процессы, «будущее» и «прошлое» которых не зависят друг от друга при известном «настоящем». В тех случаях, когда марковский процесс g (/), /g Т, при- нимает не более чем счетное число состояний из множества I, говорят, что имеет место цепь Маркова с непрерывным временем, если Т = [0, оо), или дискретным временем, если Т — [0, 1, 2,...}. При вероятностном описании цепи Маркова важное значение имеет матрица переходных вероятностей Р* = (Р{/), где р*ц = Р (g (/ + s) = j | g (s) = г) — вероятность перехода из состояния i в состояние / за время t. Будем рассматривать однородные цепи Маркова, когда переходные вероятности не зависят от начального момента времени s. Далее достаточно рассматривать не- разложимые цепи Маркова, т. е. такие, у которых все состояния сооб- щающиеся (для любых двух состояний i, j£I существует t£T такое, что р*ц >0). Для цепи Маркова справедливо уравнение Колмогорова—Чепмена', t+x VI t X } .-j Pij = Zj PikPkh h kel Центральным вопросом теории цепей Маркова является выяснение существования и нахождение стационарного распределения {л^, 2ЯЛ=1 и nkPkm, m£I, k<=i k<zi Если пт— lim pL,, то цепь Маркова называется эргодической. Полезно введенное в [4] понятие сжимаемости цепи Маркова, т. е. су- ществования для любой пары состояний ilt i2^I такого состояния /g/ и t£T, что p^i > 0 и p-j > 0. В частности, однородная сжимающая цепь Маркова с конечным множеством состояний — эргодическая. Понятие неразложимости и сжимаемости равносильно неразложимости и неперио- дичности, а в случае существования стационарного распределения — эргодичности цепи Маркова и л^ > 0, k£I. Достаточным условием эргодичности однородной неразложимой, сжи- мающей цепи Маркова является существование неотрицательной пробной функции f (i) для t£T, q < 1 и конечного множества Jal таких, что max ^{/ (g (0) | g (0) = 0 < оо. i€ J Если у сжимающей цепи Маркова не существует стационарного распределения, то lim pL = O для всех состояний i и /g/. Процессом гибели и размножения называется случайный процесс v(/), /^0, со значениями в /=={0, 1, 2,...}, удовлетворяющий сле- дующим условиям: 109
1) время пребывания в состоянии fg/подчинено экспоненциальному распределению 1—e“a**, х^О, с параметром а/ > 0, не зависящим от траектории процесса до попадания в это состояние; 2) из состояния i£I процесс переходит в состояние i1 или (I—1)+ — щах (0, i— 1) с вероятностями р( и qi — 1 —р/ соответственно. # 7.42. В СМО М | М 11 | 0 определить распределение ве- роятностей пребывания СМО в различных состояниях. 7.43. Для процесса гибели и размножения v(t) с конеч- ным числом состояний I = {0, 1, 2, ..., п} р0 = 1, 0 < < 1, i=l, ..., n—1, рп = 0 определить стационарное распреде- ление. Воспользовавшись результатом задачи 7.43, решить задачи 7.44 — 7.45. * 7.44. Показать, что стационарное распределение вероят- ностей состояний СМО М | М | п 10 имеет вид = «<₽*/&! п где п0 определяется из условия 2 ял = 1> Р = а/^; аир— 6=0 интенсивности входного потока и обслуживания. (В частно- сти, л„ = лор"/п!—формула Эрланга для вычисления ве- роятности потери требования.) 7.45. Показать, что стационарное распределение вероят- ностей состояний СМО М. | М | п | т имеет вид Л* = Я«ТГ’ k = Q> *’ •••’ п’ = » k = n, п +1, ..., n + m, т где р = а/р, а л0 определяется условием 2 Я6=Ь 6=0 Рассмотрим теперь процесс гибели и размножения со счетным числом состояний. >|с 7.46. Для процесса гибели и размножения v(t) со счет- ным числом состояний /= {0, 1, 2, ...} и р0= Ь 0 < Pk < для всех k^\ определить условие существования и вид стационарного распределения. # Задачи 7.47 — 7.49 можно решать, воспользовавшись результатами задачи 7.46. >|с 7.47. Показать, что стационарное распределение вероят- ностей состояний СМО М | М 11 при р = а/р < 1 имеет гео- метрическое распределение л^ = (1—р)р\ k^Q. 110
7.48. Показать, что стационарное распределение вероят- ностей состояний СМО М | М | оо при р = а/ц<1 имеет пуассоновское распределение лй ==е~РрА7£!, k^O. 7.49. Показать, что стационарное распределение вероят- ностей состояний СМО М | М | п при р = аЦщь) < 1 имеет вид лЛ = £--у-, k > п; л0 определяется из ус- ловия 2пл=1» а вероятность ожидания требованием на- /г>0 чала обслуживания определяется формулой Эрланга л = lim Р (v(Z) >п) = т^- = л0 . /»оо ' V f !-р ° (1 —р) >jc Приемы исследования процессов гибели и размножения (составление системы дифференциальных уравнений и последующий предельный пере- ход) применимы при изучении цепей Маркова с непрерывным временем более общего вида. >jc 7.50. Найти стационарное распределение вероятностей со- стояний СМО М|М|1|0 с ненадежным прибором. Длитель- ность жизни и восстановления работоспособности прибора — экспоненциально распределенные случайные величины. Тре- бование, обслуживание которого прервано поломкой при- бора, теряется. 7.51. Найти стационарное распределение вероятностей со- стояний СМО М|М 1111, у которой требование в очереди может находиться не более случайного интервала времени с экспо- ненциальным распределением, после чего теряется. 7.52. Найти вероятность свободного состояния ро(0 СМО Л41М1 по. 7.53. Найти вероятность того, что СМО М|М|1|оо ни разу не освободится до момента Т>0, если при /=0 в системе k требований k^\. 7.54. Найти вероятность ро(О того, что в момент £>0 СМО М|М|1| 1 свободна, причем длительность обслуживания тре- бования имеет экспоненциальное распределение с параметром Pi, если в системе нет других требований, и с параметром если есть ожидающее требование. Важной характеристикой СМО является период занятости системы — интервал времени с момента поступления требования в свободную систему до первого последующего момента освобождения системы от требований. %, |7.55. Показать, что преобразование Лапласа — Стилтьеса л (s) функции распределения периода занятости л СМО M|GI 1 удовлетворяет и однозначно определяется функциональным уравнением л (s)=р (s+а—ал ($)), (7.5) 111
где $(s)—E ехр(—ф), 0 — время обслуживания, а— пара- метр входящего потока. 7.56. Определить математическое ожидание и дисперсию периода занятости СМО ЛИОН. 7.57. Определить вероятность застать систему М|G1 1 в сво- бодном состоянии в установившемся режиме. 7.58. Показать, что в СМО М|G| 1 преобразование Лапла- са — Стилтьеса длительности периода занятости системы при задержке начального обслуживания требований на случайный интервал ф имеет вид л (s) = л (s) ф (s + а—ал (s)), где л($) = 0 (s-j-a—ал(s)), ф($) = £ехр( — 5ф). >|с При исследовании СМО бывает полезно искать распределения искомой характеристики не в произвольные моменты времени, а в некоторые спе- циально выбранные, например такие, что последовательность значений характеристики в эти моменты образует однородную цепь Маркова (такую цепь Маркова называют вложенной). >jc 7.59. Определить стационарное распределение вероятно- стей числа требований, которые находятся в СМО A4|G| 1 в мо- менты времени, непосредственно следующие за окончанием обслуживания или предшествующие очередному обслужива- нию. 7.60. Определить характеристику предыдущей задачи толь- ко в моменты, непосредственно следующие за окончанием обслуживания требований. # Если сравнить распределения, полученные в задачах 7.59 и 7.60, и вероятность, найденную в задаче 7.57, то можно заметить, что эта вероят- ность Р(0)=1—aEp совпадает с соответствующей вероятностью распре- деления, которая получена при решении задачи 7.60. Распределения в задачах 7.59 и 7.60 различны. Установим, совпадает ли одно из них со стационарным распределением количества имеющихся в системе требований для произвольного момента времени. Для ответа на этот вопрос воспользуемся предельной теоремой для регенерирующих про- цессов с зависимыми циклами регенерации марковского типа (полуреге- нерирующих процессов) в следующей форме. Случайный процесс £(/), принимающий значения из (X, ЯЗ),— регенерирующий процесс указанного вида, если существуют моменты регенерации tn$T\ и процесс £(/) такие, что £(f) = £(^), 6z+i), £л==5(М, образуют однородную цепь Маркова со значениями в /, а распределения процесса на цикле регенерации zn+1=tn+1— tn, начинающемся в точке и длительность этого цикла регенерации zn+t зависят только от значения Для определения lim Р (g (t)£B), В&8, обозначим аналогичное /->00 распределение на отдельном цикле регенерации щ (у, В) = Р (zn + i > у, 1^п + У)^\Ц = ^ k£I. . Предположим, что: 112
а) цепь Маркова —эргодическая, неразложимая со стационарным распределением зц, k£I ( 2 лЛ = 1\; ' ие/ / б) Wfr — E (zn+i | Zn = k)\ кроме того, потребуем, чтобы 2 n№k < + °°: kti в) pij—переходные вероятности за один шаг однородной ЦМ a Aij(x) — функции распределения длительности цикла регенерации, пе- реводящего цепь Маркова из состояния tg/ в состояние jg/; потре- буем, чтобы существовали такие состояния k£I и что р^т > О и функция распределения А^т (х) абсолютно непрерывна (имеет плот- ность). Тогда HmP(J(0€B. = = = В) dy, о где aM = nm/2 nk™k- * 7.61. Доказать, что стационарное распределение коли- чества требований, находящихся в СМО M|G| 1 в произволь- ный стационарный момент времени, совпадает с распределе- нием (1) из решения задачи 7.60. 7.62. Определить стационарное распределение времени ожидания начала обслуживания в СМО M|G| 1, FIFO. 7.63. Определить стационарное распределение времени ожидания начала обслуживания требованием в СМО M|G| 1, LIFO. 7.64. Найти распределение числа занятых приборов в СМО MIDIoo.
8 Глава НЕАНТАГОНИСТИЧЕСКИЕ ИГРЫ # В данную главу включены задачи и упражнения, в которых исполь- зуются в основном классические понятия оптимальности теории бескоа- лиционных и кооперативных игр [5, 44]. Пусть задана игра в нормальной форме Г = <Х^, />, &£7>, где /={1, $} — множество номеров игроков, участвующих в игре, — S множество стратегий х/j й-го игрока, />: X Х^—Х—^Е1-функция k'=\ выигрыша &-го игрока. Игроки независимо друг от друга выбивают стратегии х^^Х^, 6=1, ..., s; в результате образуется набор стратегий x=(xf, ..., х5)£Х, называемый ситуацией, и &-й игрок получает выиг- рыш fk(x). Вектор f (х) = (fi (х), ..., fs (х)) называется исходом игры. Игрок с номером k предпочитает ситуации х' ситуацию х тогда и только тогда, когда (х) > fk(x')', если (х)— /# (х'), то ситуации х и х' для £-го игрока равноценны. Для ситуации х° и стратегии xt Z-го игрока через х° || Xi обозначим ситуацию у, в которой (х° I, k=l. Ситуация х°£Х называется ситуацией равновесия, если для всех k^I выполняются равенства /л(х°)= max fk (х°||хЛ). xkeXk Стратегии х£, составляющие ситуацию равновесия, будем называть равновесными. Множество всех ситуаций игры Г обозначим Е (Г). Рас- сматривается следующий способ проведения игры Г. Вначале все игроки договариваются о некоторой ситуации х°££(Г), затем дальнейшие пе- реговоры запрещаются и игроки выбирают стратегии независимо друг от друга. Игра Г, проводимая таким образом, называется бескоалиционной. Игра Г называется биматричной, если s —2, а множества страте- гий игроков конечны, т. е. Xi = {l, т}, Х2 = {1, п}. В этом случае функции выигрыша игроков можно задать двумя матрицами: 4 = n — (f^ (*’ /))znX п и Xtr * 8.1. а) Показать, что в ситуации равновесия х° выигрыш 6-го игрока не меньше, чем величина v(k)= inf sup fk(x). xieXi xkeXu 114
б) Показать, что в антагонистической игре (s = 2, « — f2) седловые точки функции fa на множестве и только ©ни являются ситуациями равновесия. 8.2. Рассмотрим вспомогательную операцию О со стра- тегиями х € М„ = X, неопределенными факторами y£N = X и критерием эффективности оперирующей стороны Ф(^. У)= 2 (М*)—UUW- &= 1 а) Показать, что ситуация х° £ X игры Г тогда и только тогда является ситуацией равновесия, когда х°— оптималь- ная стратегия с нулевой оценкой эффективности в операции О. б) Если критерий Ф имеет на произведении множеств МохХ седловую точку (х°, г/°), то х°—ситуация равновесия игры Г. Выяснить, верно ли обратное утверждение. 8.3. Найти множества всех ситуаций равновесия в сле- дующих биматричных играх с матрицами А = (ац)т и В = (Ь/^тХп'- а) А — В; б) Ь{/=1, i — 1, ..., т, 1=1, ..., и; в) т=п, аи = Ь}, — 0, i /, a,,, b{i> 0, i, j—1...m; ' о . / —8 —1\ D /—8 —10\ г) т — п — 2, А — ^_10 _5j, В — _5J; д) m = 2, n = 3, е) m = h = 3, /3 8 —1\ /1 3 4\ А — 4 0 2 1, В= 2 18. \1 2 3/ \2 3 О/ 8.4. Найти ситуации равновесия в следующих играх Г: a) s = 2, Xj = X2 = [0, .1], xi) = —xl + ^>x1x2 + xl, /aUl. X2) = (xt X2)2 tXX2, где a—вещественное число; б) Х* = [0. 1]. f S / 1__ \<7 s \ где p, <£>0, Ca>1, k=l, . . . , s— вещественные числа. 8.5. Два объединения производят разведку полезных иско- паемых на п месторождениях. Фонды средств на разведку у 115
Первого и второго объединений составляют а и b соответствен- но. Прибыль, которую можно получить от добычи полезных ископаемых на /-м месторождении, равна и распреде- ляется между объединениями пропорционально суммам, 'за- траченным на разведку на данном месторождении. При этом если обе последние суммы равны нулю, то предполагается, что и прибыли, полученные обоими объединениями на i-м месторождении, также равны нулю. Описать бескоалиционную игру двух сторон, считая выигрышем каждого объединения суммарную прибыль, полученную от добычи полезных иско- паемых на всех месторождениях. Найти ситуацию равновесиям 8.6. Пусть имеется т радиостанций и п частот, на которых они могут работать. Каждая i-я радиостанция независимо от других выбирает номер jt рабочей частоты. Если на /-й частоте кроме i-й работают еще k радиостанций, то ущерб Лй радио- станции равен kCijt. Описать бескоалиционную игру т лиц. Найти ситуацию равновесия игры в случае двух рабочих ча- стот (и=2). 8.7. В условиях задачи 2.37 исследовать вопрос о суще- ствовании ситуации равновесия в бескоалиционной игре двух лиц, в которой функции выигрыша участников равны /Л(х> У) = min Wki(x, у), k=l, 2, 1 < i < т где W\(x, i/)=| Xi + yi bt, Xi + yt>Q, at, Xi + yt = 0, ^±b<>yi, x{ + yt>Q, x{ + y^Q. 8.8. Имеется s промышленных предприятий, которые ис- пользуют по 1 усл. ед. количества воды из природного водое- ма. Каждое предприятие располагает двумя очистными соору- жениями для отработанной воды (с биологической очисткой и без нее) и независимо от других предприятий выбирает долю количества воды, которую оно собирается сбрасывать без биологической очистки. Если общее количество сброшенной без биологической очистки воды превышает величину а, то k-e предприятие несет денежный убыток в размере ck. Стои- мость полной очистки единицы количества воды для k-ro предприятия равна ak. Описать бескоалиционную игру многих лиц и найти все ситуации равновесия. 116
8.9. Имеется s предприятий, которые выпускают товар1* одного вида. Себестоимость единицы товара для &-го пред- приятия равна ск. Если К —общее количество товара на рынке, то цена единицы товара рынка р = тах(а—КЬ, 0), где а и b—положительные числа. Производственные мощ- ности предприятий не ограничены, и они независимо друг от друга выбирают количество производимого товара. Весь произведенный товар продается по цене р. Цель каждого предприятия состоит в том, чтобы получить наибольшую прибыль от продажи товара. Предполагается, что’ ск < а, £= 1, . •s. а) Описать бескоалиционную игру и найти ситуацию равновесия. б) Какие предприятия следует считать нерентабельными? Показать на примере, что при изменении параметра а нерен- табельность одного предприятия может вызвать нерентабель- ность других. # Игра Т=<Хд,.fki /?£/> называется расширением игрыУ^^Х^ fkt k£I>, если для каждого k существуют подмножество УкаХк и взаимно однозначное отображение пк'.Ук—* Хк такие, что 7л(*ь • ••> = •••» для всех хк£У & 6=1, ...» s. Наиболее распространенный способ расширения игры состоит в ис- пользовании игроками смешанных стратегий ф^—вероятностных рас- пределений на множествах чистых стратегий Хк, 6=1, ...» s. В сме- шанном расширении выигрышами игроков являются математические ожидания выигрышей исходной игры Г [5]. Смешанное расширение би- матричной игры Г с матрицами 4 = (а/Дпх/ь В = (^7)/пхл имеет вид Г = •= <sm, S„, А (р, д), В (р, <?)>, где А (р, д) = 2 2 Pia‘^b в (Р> Я) = <=!/=! е 2 2 Pibif4/< P^Sm> g^Sn. i = 1 / s= 1 В качестве другого примера расширения определим понятие много- шаговой игры с полной информацией. Пусть в исходной игре Г страте- гия 6-го игрока имеет вид хк—(х{, ...» хк), Где значения контролируе- мых факторов Xk^Xk игрок выбирает в моменты времени f=l, ..., Т. Полная информированность игроков означает, что при выборе значе- ния xl 6-му игроку известен выбор всех игроков на предыдущих шагах, а также выбор игроков с номерами 1, 2, ..., k — 1 на шаге L Опре- делим стратегии игроков в игре с полной информацией Г. Положим х*~(х{.....х$), xl = (x1t ..., xl, ..., хк) (в частности, ~х} = — (xi....xs) — x). В общем случае предполагается, что множества Товар предполагается бесконечно-делимым. 117
Хь зависят от x{-i, но для простоты записи эту . зависимость лвно указывать не будем. Отображения ~х[- Хх...хХхЦ Xi—Xk, t- 1 раз 1 /• ° \ .. .,ТД=1, ...,s здесь Ц Х{ = 0, !, \ i-l / определяют поведение игрока на всех шагах игры. Поэтому стратегией k-ro игрока в многошаговой игре с полной информацией Г является набор отображений хк=С4, <=1. •••, T)^Xk, где Хь — множество всех стратегий этого игрока. Ситуация x=(xi, ...» xs) игры Г однозначно определяет ситуацию х~л(х) исходной игры Г по следующему правилу: х}=х1, xl—xlfai), .х£ = == xk (xjUi), • • •, Xs = xl (xf-i). Определим в игре Г функции выигрыша игроков, полагая fk (х) == fk (л (х)), k—l, s. Игра Г в нормальной форме имеет вид r=<xk, Ik. k£I>. При T==l, s = 2 игра Г является игрой Г1, определенной в гл. 7. # 8.10. Пусть (р°, qQ)—ситуация равновесия в смешанных стратегиях в биматричной игре с матрицами А = (а^)тУп, B = (bij)niXn. Показать, что: а) для всякого номера i такого, что р? > 0, A(if qO) = A(p\ q°); б) для всякого номера j такого, что > 0, В(р0, j) = B(po, qO)- в) необходимо выполнены равенства А (р°, <7°)= max A (i, qa), l<i<m В(ра, g°) = max В(р°, j). 1 -С / -С я Показать, что последние равенства достаточны для того, чтобы ситуация (р°, q11) была ситуацией равновесия в смешан- ных стратегиях. 8.11. В биматричной игре с матрицами А и В найти хотя бы одну ситуацию равновесия в смешанных стратегиях, если: / 0 —4 2\ Г 4 4 4\ а) л= 3 -5 0 , В= -2 4 1 ; ’ \—1 4 1 \ 3 — 1 1/ б) б) т— п\ аи = Ьи — 0, j, а{1 > 0,Ьн < 0, i, /= I, 118
8.12. В биматричной игре с матрицами /6 0 2\ /60 7\ Л= 0 4 3 ), В= 0 4 0) \7 О О/ \2 3 О/ найти все ситуации равновесия в чистых и смешанных стра- тегиях. 8.13. Каждое из трех предприятий, использующих воду из природного водоема, располагает двумя стратегиями: стро- ить сооружения для полной очистки отработанной воды (стра- тегия 1) или же сбрасывать ее через имеющиеся очистные соо- ружения без биологической очистки (стратегия 2). Предпо- лагается, что особенности водоема и технологических процес- сов таковы, что в случае, когда не полностью очищенную воду сбрасывает не более одного предприятия, вода в водоеме оста- ется пригодной для использования и предприятия убытка не несут. Если же не полностью очищенную воду сбрасывают не менее двух предприятий, то каждый пользователь воды несет убытки в размере трех единиц. Стоимость строительства очист- ных сооружений для каждого из предприятий составляет единицу. Найти все ситуации равновесия в чистых и смешан- ных стратегиях в описанной бескоалиционной игре трех лиц. 8.14. Пусть в многошаговой игре с полной информацией Г множества X*, k=l, .... s, /=1, .... Т,—компакты, не зависящие от x^-i, а функции выигрыша fj(x), k — 1, ...,s, непрерывны на произведении X}x...xXf. Доказать, что в игре Г существует ситуация равновесия. 8.15. Пусть задана биматричная игра Г с матрицами X = (az/)4X4, B = (bt/)ixi вида z3 7 8 k /5 4 2 k . /5 6 4 3\ D /0 3 8 2\ Л = \ 8 3 2 7 ’ ь = \ 5 6 4 4- '7 1 2 4' '0215' Рассмотреть следующую двушаговую игру Г. На первом шаге вначале первый игрок выбирает четность строки, а затем вто- рой игрок, зная выбор первого, выбирает четность столбца. На втором шаге сначала первый игрок, зная выборы на первом шаге, выбирает номер строки в соответствии с выбранной ранее четностью, а затем второй игрок, зная все сделанные выборы, выбирает номер столбца в соответствии с выбранной ранее четностью. Найти ситуацию равновесия игры с полной информацией Г. z 8.16. Пусть в игре Г стратегия первого игрока состоит в выборе номера строки, второго игрока — в выборе столбца 119
матрицы д /( 1; 2; 3) (-2; 3; 1)\ ^i==<(—3; 2; 0) ( 0; 1; 0)> или матрицы л /( 1; -3; 4) (—5; 8; -3)\ ^2 —<(—1; 7; 4) ( 7; 1; 2)Л одну из которых выбирает третий игрок. Элементами матриц Ai и А2 являются исходы игры Г (т. е. векторы выигрышей игроков). Найти ситуацию равновесия одношаговой игры Г, соответствующей игре Г. 8.17. Группа из п школьников, среди которых установлена определенная очередность, решила разделить круглый торт. В порядке установленной очередности школьники делают по одному разрезу вдоль радиусов торта, а затем в том же порядке забирают образовавшиеся доли торта. а) Описать игру с полной информацией, считая выигрышем школьника величину полученной им доли торта. Указать какую-либо ситуацию равновесия. б) Найти все ситуации равновесия при п=3. в) Найти наилучший гарантированный результат каждого школьника. 8.18. Пусть в условиях задачи 8.5 сначала первое пред- приятие выбирает хх, затем второе предприятие, зная вы- бирает г/i, затем первое, зная х19 yi, выбирает х2, и т. д. Найти ситуацию равновесия в многошаговой игре с полной инфор- мацией. 8.19. Пусть в игре двух лиц Г = <Л40, N, F, Gy, где Мо, N—компакты, а функции выигрыша игроков F и G непрерывны на произведении Л40хЛЛ Найти множества ^(/ЦГ1)), л (В (Г2)) ситуаций игры Г, соответствующих все- возможным ситуациям равновесия игр Г1 и Г2. * Ситуация равновесия (х°, у°) игры Г = <Л40, N, F, Gy называется псевдоседловой, если из равенства F (х', y®)=F (х°, г/°) следует неравен- ство G (х', г/°)^6(х°, z/°), а из равенства G (х°, #') = G(x°, у°)— нера- венство F (х°, y')^F(x\ у°). Множество всех псевдоседловых ситуаций равновесия игры Г обозначим Е' (Г). # 8.20. В условиях задачи 8.19 найти множество л(£'(Р)) ситуаций игры Г, соответствующих всевозможным псевдосед- ловым ситуациям равновесия игры Г1. # Рассмотрим другой подход к играм многих лиц, связанный с воз- можностью образования в игре коалиций. Приведем основные понятия кооперативной теории. Будем рассматривать игры с побочными плате- жами, в которых игроки получают выигрыши в количествах бесконечно- делимого товара и могут перераспределять их между собой. Под коала- 120
цией S будем понимать множество игроков 5 с/, договорившихся в данной игре действовать совместно. Кооперативной игрой называется пара </, v> где /=={1....s} — множество игроков, а у: 27\0—> Е1— характеристическая функция, сопоставляющая каждой коалиции Sc / некоторую числовую оценку u(S). Число v (S) обычно представляет собой (гарантированный) выигрыш коалиции S. Кооперативная игра может быть порождена исходной игрой в нормальной форме Г = <Х^, f^, ££/>. Действительно, в качестве и (S) можно взять величину <>($)= sup inf (8.1) xkeXk xkeXki$S k$S — наилучший гарантированный результат для коалиции S, стремящейся к увеличению коалиционного критерия 2 // (*)♦ Характеристическая ieS функция, задаваемая формулой (8.1), называется макси мин ной. Кооперативная игра </, и> называется существенной, если выпол- нено неравенство п 2 V(k)<v(l). k= 1 Если последнее неравенство нарушается, то игра называется несущест- венной [5]. В дальнейшем (за исключением задачи 8.22) все кооператив- ные игры предполагаются существенными. Дележом называется вектор y^,Es, удовлетворяющий условиям S 2 yk^v(k)> k—\9 .s. Дележ является возможным рас- k- 1 пределением выигрыша v (/) коалиции всех игроков. Множество дележей обозначим А. Задача заключается в выборе так называемого разумного дележа у^А с учетом интересов всевозможных подмножеств игроков S С2 I. В кооперативной теории нет единого понятия разумного дележа. Более того, различные соображения «оптимальности» приводят к мно- жествам разумных дележей, таким, как ядро, решение, п-ядро и т. п. Игроки, вступающие в коалицию 1, должны выбрать концепцию разум- ного дележа, например связанную с ядром, а затем уже выбрать конк- ретный дележ из ядра. Изложим некоторые принципы оптимальности. Первый подход к решению кооперативных игр был предложен в [44] и основан на определении способа сравнения дележей. Говорят, что де- леж у доминирует дележ z по коалиции S (обозначение: y> Sz), если выполнены следующие условия: 1) 2 2) yt>Zh Ин- терпретируем введенное отношение доминирования. Пусть группа игро- ков I обсуждает вопрос, какой дележ выбирать: у или г? Группа игро- ков S мбжет (хотя и не обязана) настоять на дележе у, угрожая в про- тивном случае действовать самостоятельно и образовать коалицию <$. Говорят, что дележ у доминирует дележ г (обозначение: г/>г), если у доминирует z по некоторой коалиции S. Ядро С и решение V бинарного отношения > на множестве дележей А (см. гл. 2) называются соответ- ственно ядром и решением кооперативной игры [44]. Введем понятия n-ядра и £-ядра. Эксцессом множества игроков S для дележа у называется величина e(S, y) — v(S)—2 УЬ которую ____________ * €S Х) Для краткости вместо v ({/, /, /}) будем писать ... /). 121
рассматривают как меру «неудовлетворенности» множества игроков S де- “ Л’ежом у. Пусть для всякого дележа у вектор 0 (y}£E2s~2 содержит в качестве компонент эксцессы подмножеств <$^27\(0и^), расположен- ные в порядке невозрастания, т. е. существуют такие попарно различ- ные множества Stg 2Z\(0(J /), что Qt(y)-e(St, y)^Gt+i(y) = e(St+it у), /= 1, ..., 2*-2. Ядро бинарного отношения lex (см. гл. 2), соответствующего вектор- ному критерию—0 на множестве А, называется п-ядром (nucleolus). • Для любой пары номеров г, i Ф jt положим &// = {£с 11 i£S, \ l£S}, Sij(y) = max e ($> у)> У^Л. Величина S[j (у) называется воз pa- I жением f-го игрока /-му по дележу у. Если Sij(y) > SjiiyY то f-й игрок находится в более «неудовлетворенном» множестве, чем /-й. Поэтому в: случае, когда yj > v (/), f-й игрок может потребовать у /-го игрока часть Ц его доли у;. Множество дележей l(sz/(y)~ s//(y)) (У/—1'(/))<°> «./=1. S, i£j} называется k-ядром (kernel). Если y$k, то ни у одного из игроков нет оснований (в упомянутом смысле) потребовать у другого игрока часть 1 его доли в дележе. # j 8.21. Показать, что максиминная характеристическая функция супераддшпивна, т. е. для любых множеств S, Тс/ таких, что S[\T = 0, выполнено неравенство v(S) + v(7’)<v(Su7’)- | 8.22. Показать, что в несущественной кооперативной | игре с супераддитивной характеристической функцией обра- | збвание коалиций не имеет смысла. | 8.23. В условиях задачи 8.9 найти максиминную харак- | теристическую функцию игры. При вычислении величины 1 o(S) считать, что коалиция предприятий /\S знает стра- тегию (хк, k£S) коалиции S и при минимизации критерия 2 ft (х) не допускает отрицательных прибылей ни для од- kes i ного предприятия из /\S. 8.24. Показать, что ядро и решение кооперативной игры двух лиц совпадают с множеством всех дележей. I 8.25. Показать, что ядро С кооперативной игры </, и> представимо в виде многогранника С = 2 $<=Л- I Hes J 8.26. Доказать, что в кооперативной игре трех лиц </, у> с супераддитивной характеристической функцией не- равенство v (12) + v (13) + v (23) 2v (123) является необхо- димым и достаточным условием непустоты ядра. 8.27. Найти ядро и решение в следующих кооператив- ных играх <7, и> трех лиц: 122
a) v (/) = 9, v(23) = 7, (13) = и(12) = 4, v(i) = 0, 7=1, 2,3; б) у (7) = 8, v (12) = v (13) — v (23) = 6, y(i) = 0, 7=1,2,3. 8.28. Найти все решения кооперативной игры трех лиц <7, у> с характеристической функцией v (/) = v (13) = v (23) = 6, v (S) = 0 для остальных коалиций S. >|с Говорят, что кооперативная игра <7, г> имеет постоянную сумму, если для любой коалиции S С I выполнено равенство v (S) + v(/\S) = v (7). Кооперативная игра <7, г> называется симметричной, если ее ха* рактеристическая функция зависит только от числа игроков, т. е. t»(S)=/(|S|), SC 7. * 8.29. Показать, что в кооперативной игре с постоянной суммой ядро всегда пусто. 8.30. Показать, что в симметричной кооперативной игре I S I </, у> выполнение неравенств v (S) -b_L v (I) для всех Sal является необходимым и достаточным условием непу- стоты ядра. 8.31. Показать, что решение кооперативной игры не может состоять из одного или двух дележей. 8.32. Доказать, что выпуклое решение кооперативной игры является многогранником. # Решение V кооперативной игры называется дискриминирующим i-ro игрока, если у/= const для всех дележей у V. 8.33. Показать, что если V—выпуклое решение коопера- тивной игры, не дискриминирующее /-го игрока, то min ^=0(7). у<= v 8.34. Показать, что в кооперативной игре с постоянной суммой всякое выпуклое решение является дискриминирую- щим для некоторого игрока. 8.35. В кооперативной игре <7, у> с супераддитивной характеристической функцией задано множество дележей У={У£А\У1 + Уг = и(1)—аз—«4. {/з = а3, (/4 = а4}, где а3, а4—константы, удовлетворяющие неравенству а3—у(3)>а4—w(4). Показать, что условия: 1) а4 = о(4), 2) а(12)>у(7)—а3—а4, 3) если а3 > у(3), то v(13) + v(23) > >у(7) + 2а3—w (3)—и (4),— необходимы и достаточны для того, чтобы множество V было решением кооперативной игры. 8.36. Показать, что в кооперативной игре шести лиц, для которой у(7) = 3, у (1346) = 2, v (12) = v (34) = v (56) = 1 и o(S) = 0 для всех других коалиций, существует единст- венное выпуклое решение, не совпадающее с ядром. 123
8.37. Найти решения следующих кооперативных игр11 </, п>: а) / = {1,2, 3,4, 5}, о(/) = 2, v(123) = о(45)= 1, v(145)= =о (245) = v (345) = а > 4/3; б) /={1, 2, .... 2/}, />3, о(/) = /, u(ii+l)=l, o(/\{t, i+ 1}) = а, i=l, 3, ..., 2/—1, где I—1<1а^Х/. 8.38. Доказать, что в любой кооперативной игре п-ядро не пусто и состоит из единственного дележа. 8.39. Пусть в кооперативной игре </, п> характеристи- ческая функция v супераддитивна. Тогда для любого дележа i/° g Argmin max е (S, у) ye A SCI и любого номера i € I найдется коалиция S, для которой iCS и e(S, z/°) = min maxe(S, z/). ye A sc/ 8.40. Показать, что если ядро кооперативной игры не пусто, то .в нем содержится п-ядро. 8.41. Доказать, что в любой кооперативной игре п-ядро содержится в 6-ядре. 8.42. Пусть в кооперативной игре трех лиц с супераддитив- ной характеристической функцией все неравенства из опре- деления суперадцитивности выполнены как строгие. Пока- зать, что 6-ядро состоит из единственного дележа у0, для ко- торого выполнены неравенства z/?>u(O, 2, 3. 8.43. Найти 6-ядра и n-ядра в следующих кооперативных играх трех лиц: a) v (/)=21, v (12)=5, v (13)=4, и(23)=8, v(l)=l, v(2)=2, п(3)=0; б) v (/)= 18, v (13)=у (23)= 12, v(12)= 15, v (0=2, f=l, 2, 3; в) v(/)=15, v(12)=y(13)=6, v(23)= 10, v(l)=3, v(2)= =u(3)=0. 8.44. Найти n-ядро кооперативной игры s лиц с характе- ристической функцией, найденной в задаче 8.23. # Кооперативную игру </, с>> назовем дискретной, если компоненты де- лежей и характеристическая функция v принимают целочисленные зна- чения.. # 8.45. Найти решение дискретной кооперативной игры че- тырех лиц (/, v), в которой характеристическая функция v удовлетворяет следующим условиям: v(S)=<v(I) при |S|=±=3; v(S) = 0 при |S| =1,2. 1> u(S) = 0 для всех коалиций, не указанных в п. а) —в); далее, I—натуральное, а — вещественное числа.
ОТВЕТЫ И РЕШЕНИЯ Глава 1 1.1. Контролируемый фактор Мо^= {v| 0 < v 50}, 2 —случайный фактор с известным законом распределения, критерий эффективности — поток машин через туннель z) = yP = u(60—u)/z. Множество стратегий—Л40. Оценка эффективности: 1 а) Г (и)= j v(60— v)ydz = o(60—и) 2 In 2; 1/2 б) U7(u)= min (v (60—у)/г) = о(60—и). — 1 /2 < г < i Поток максимален при о =30 км/ч. 1.2. ПОЛОЖИМ X=(X/y, t=l, ..., tn, j—l, . • ., n), у — (y{j, 1 = 1, ..., m, j = 1, ..., n). Контролируемые факторы / n x£/W0 = lx|xzy>0, 2 xi}^.At, i=l, .... tn, \ /=1 m \ 2 V//<hA,/=1.........n[ ; неопределенные факторы / m y£N = \у\уи^0, 2 i=\, ...,n, \ 1 = 1 n 2 ВД/CMi, l'= 1.......m != 1 Если первая и вторая страны выбрали количества това- ров х и у соответственно, то обмен товара Лго типа первой страны на товар /-го типа второй страны по условию про- изойдет на сумму = min(Xzxl7, выраженную в це- нах международного рынка. При этом стоимость товара /-го типа второй страны на внутреннем рынке первой страны равна Ка стоимость товара i-ro типа первой страны 125
на ее внутреннем рынке равна /(z/az/Xz. Таким 'образом, в результате обмена товара i-ro типа первой страны на товар /-го типа второй страны прибыль первой страны, выраженная в ценах ее внутреннего рынка, составит Kijty'jlpj—Отсюда критерий эффективности первой страны имеет вид т п / » \ min(kzxz/, . 1=Ц=Л \г*/ Множество стратегий—Л40. а) Найдем все крайние точки множества N. Заметим, что система неравенств, определяющая N, имеет ранг, рав- ный т2, а система неравенств 2 /=1. •••> "*. 1 = 1 / = 1 имеет ранг 2m—1. Пусть у*—произвольная крайняя точка множества N. Если для всякого / найдутся 1\, ц такие, что y*tj > 0, y*j > 0, Ф ig, то не найдется подсистемы системы неравенств, определяющей N, ранга т\ которой у* удовлетворяет как системе уравнений. Поэтому найдутся ip ji такие, что у*^ = B}i, у*/л = 0, ip Отсюда и из того, что НдВд = lZl4Zl, следует: = j=£jp Вычеркнем if-ю строку и /j-й столбец матрицы (у*,). Останется матрица размера (т—1)х(т—1) и предыдущее рассуждение можно повторить. Таким образом, yljj^Bj, у‘ц—0, i,j*=l, i =/=• • • > im>— некоторая перестановка индексов 1,.... т. Отсюда и из вогнутости критерия ^(х, у) по у имеем №\(х)= min (х, у)=* у 6 N tn f ' а \ e min S Mu( 777 —ТГ-) ’ <1.<«,/ = 1 1 1 \Vi Ч} J где минимум берется по всем перестановкам 1р .... 1т. б) Критерий эффективности второй страны равен т п / ' 6 • \ ИМ*, у) — min(Xzxz/, ^уц)() • i = 11 = 1 4 ' ' Вторая страна при известной стратегии х£М0, максимизи- руя свой критерий, выберет y£N таким, что f///«»Xzxz<z/y^' 126
при всех Л /. Отсюда т п t L г)- — i = i /=1 ХН/ . А</ 1.3. Пусть х=0 означает, что принято решение не ис- пользовать резерв, а х— 1—решение использовать резерв. Контролируемый фактор х€Л40={0, I}, случайный фактор г—время выполнения всего комплекса работ без использо- вания резерва, z£Z = {4, 5, 6, 7}. Пусть Р (/7) —вероят- ность осуществления некоторого события Н. По сетевому графику нетрудно подсчитать, что: Р ({г = 4}) = 2/27, Р ({2 = 5}) = 8/27, Р ({г = 6}) =14/27, Р ({г = 7}) = 3/27. Кри- терий эффективности .. /ПО 100 (F(x, z)) = (j00 90 50 0\ so зо;- Осредненный критерий эффективности F(0)= 1720/27, ?(1) = 2130/27. Отсюда вытекает, что резерв следует исполь- зовать. 1.4. Пусть точка x£G характеризует положение вышки внутри склада; контролируемый фактор x$M0 = G = М, случайный фактор j имеет неопределенность в законе рас- пределения, критерий эффективности F (х, j) = p2(x, Aj) — квадрат расстояния между точками х и Aj. a) W (х) = шах р2 (х, А,); — 1 < / < з з б) W (х) =-i max 52 Р2 (х, Afr, — z 1 </< з 1 i^i в) W (x) = l max (p2(x, Aj + рЦх, Лу)); — * 1=2, 3 r) W_(x) = max [(1 — co3)p2(x, Ла) + ®3p2 (x, Л3), o>;p2(x, As) + (1 —©2)p2(x, A3), w'/p2 (x, 4- + (i—“0p2(x, a2), (i—со;)р2(х, л1)+®;ра(х, л2), (i—©;)р2(х, л1)+©^)2(х, л3), ®;'р2(х, Л1)+(1— (о;)р2(*. л3)]. 1.5. Контролируемый фактор djg/W0 = [d, D], неопреде- ленный фактор d2£N=[d, D], Для 7=1,2 рассмотрим функции (1, если i-й «дуэлянт» поразил противника, стреляя с расстояния d{, 0 в противном случае. 127
Здесь (dt) при фиксированных d{, i == 1, 2, можнб рассмат- ривать как случайные факторы с известным законом распре- деления: ( IddA, d^d,, a) F (dlt da, (dx), (d2))= [ (1 _ di < ( ^к) + (1-^№))(1-^(44)), dt>d2, j I 1-Ш). d^d,, . Р__( > d$, B) Стратегия оперирующей стороны (первого «дуэлянта») характеризуется константой а € MQ и функцией b: N —> Л40. Первый «дуэлянт» решает выстрелить с расстояния а при условии, что до этого момента не поступит информация о выстреле противника. Если такая информация поступит (т. е. d2 > а), то первый «дуэлянт» стреляет с расстояния b(d2). Таким образом, стратегия оперирующей стороны d^M имеет вид _ ( a, d,^. а, dj(d2)=l .... .2Z ( b(d2), d2 > a. Осредненный критерий в случае а) имеет вид ¥(ditd2, pjdo, рМ = __( Pi(di)> d1^d2, vO Р2 (d2)) pt (dx), di <Z d2. Пусть dla—стратегия, описанная в условии; для нее — _ ( Pi(D), a — D, a) J^(dle)=^ (1 —Pa(a))Pi(d)), a<D\ б) Г (dle) = ( 1—p2(d), a — d, "( min(l— p2(a), Pi(a) + (1—px(a))(l—Pg(cO)). a>d; в) W (dle) = Pi (a) (1 — pt (a)). 1.6. Обозначим через d[ расстояние, с которого первый «дуэлянт» производит второй выстрел, dj < dv Контроли- руемые факторы (dj, dj) £ Л40= {(dj, dJld^dl < df^D}, неопределенный фактор da £ Af= [d, О]. Осредненный крите- рий эффективности: 128
a) w = l-(l-p1(d1))(l-p1(^)), diXiJXii, Pi (dx)+U Pl (di)) 0 Pa (d2)) Pi (dx), (1 -Pa (da)) (1 -(1 -Pl (dx)) (1 -Pl (dD)), d2 > di; Pl (do + (1 — Pi (<M) (Pl (di)+ + (1 -Pl (dj)) (1 -Pa (d2))), di >d{> d-t, Pi (di) + (1 pi (dx)) (1 p2 (d2)), di > di di, 1 Pa (da)> d2 d^, B) IF = ' f Pi(di) + (1— Pl (dx)) Pi (d;), dx>d;>d2, Pi (dx)+(l—Pi (dx)) (1 —p2 (d2)) Pi (di). dx>d2>d; (1 —Pa (d2)) (Pi (d,) + (1 — pi (di)) pi (d;)), di > dt. Стратегия оперирующей стороны характеризуется двумя константами a, f£ld, D1 и тремя функциями b(d2), h(a, d2), e(d2), принимающими значения из отрезка [d, £>]. Первый «дуэлянт» намечает произвести первый и второй выстрелы на расстояниях а и f, a>f, и он эти выстрел^ производит, если d2<f. Если f<d2<a, то первый «дуэлянт» производит первый выстрел с расстояния а, а второй выстрел — с расстояния h (a, d2), учитывая поступившую информацию о выстреле вто- рого «дуэлянта». Аналогично, если d2>a, то первый «дуэлянт» производит первый и второй выстрелы соответственно с рас- стояний b(d2) и e(d2), b(d2)>e(d2). Окончательно стратегию первого дуэлянта можно записать в виде di—(di, d[), где & (d2), d2 я, d2<f, 3.'i (a, d-2) = (d2) < d2, h (я, d2) d2, в (d2) d2, b (d2) >e(d2). 1.7. Положим x=(xi,... ,x„), U—(Ui,... ,Un), V=(Vi, .... vn), y = (C, u, y), U (C)— 2 ui— &—1=b •••,»( k <=i ) > V (C) == (v | 2 vt~^> vt о» = i > ..., n) . k i = 1 J Контролируемые факторы 5 № 1904 .129 •
неопределенные факторы i/6^={i/|0<C<B, u£U(C), v£ V(C)}; критерий эффективности п W (х, у) = 2 шах(хг—PiUt—др{, 0), Af—множество стратегий х таких, что х(и, С) С Мо при любых С € [О, В] и и € U (С). Пусть х—произвольная стратегия первой стороны. Если найдутся С и и £ (7 (С) такие, что xf (u, С)—ptut^Q, i= 1,.. .,п, то F(x) = 0 и утверждение очевидно. Допустим, что для любых С С [О, В] и u£U(C) /={i|xz(«, С)—PiU{>0} =/= 0. Зафиксируем С € [О, В], u£U (С) и найдем min W (х, С, и, v). OS V (С) Пусть , tft} и без ограничения общности <7/,^ гл Х( , (U, С) PijU-ii ^qt ^q,. . Если X--------------т.----L С, то min 1F=O, / = 1 7 »6V(C) W (х) = 0 и утверждение доказано. Пусть, далее, найдется номер £0: гл xij(u> 0 РijUij гл xij (и> 0 Pijuij £ Ъ . Тогда min IT (х, С, и, у) = ие V (С) X[j(ufC) PijUi X _ ~ / r»\ = ( 2.--------7------G^o + X XiSu' C)~pbUiJ' \j =1 4,i / i=ka Но для xlft€Af0: x** = 0, Хк= А нетрудно проверить, что min W (x1*, C,u,v)=A—PiJii. — qt.C^ min W (x, C, u,v). veV(O « s л o6V(C) Поэтому для стратегии x^Xi (С, и) = х1^ (где ik определяется, как и выше, по С и и) W (xj W (х). 1.8. Положим u' = («i, ..., и„), «/ = («, и'). Тогда конт- ролируемые факторы x^Afo (см. решение задачи 1.7); не- ( п определенные факторы y€.N = ) У .2 ui == n 130
|M[—«j>0, i=l................я?; критерий эффективно- п сти F (х, у)= max (х{—p{t/i, 0). Утверждение о целесо- образности осуществления первой стороной «концентриро- ванного удара» доказывается аналогично такому же утверж- дению в задаче 1.7. 1.9. Пусть x‘£G, i=l, 2, 3,—точки города, в которых располагаются пожарные части. Контролируемые факторы х = (х1, х4, х3) € М0 = {х | х1 € G, х1 х\ i Ф j}; неопределен- ный фактор y€N = G' критерий эффективности W (х, у) = = min р(х‘, у). Возьмем произвольную стратегию х£Ма. 1<<< з Если при некотором i точка х{ совпадает с центром круга G, то W(x) = R. Пусть каждая точка х1' не совпадает с центром круга G. Положим Gt — B (и1, р (и*, х')), где точка и! £ G такова, что р(ие, xf) = maxp(u, х(). Если для некоторого u€ G I x-'^intGi, /=£i,TO W(x)i=p(x/, и1). Пусть, далее, для любого i найдется номер / такой, что j и xJ С int Gt. В этом случае для каждой из трех пар х{, х1, i /, i, /=1, 2, 3, через uiJ и vi} обозначим точки пересечения прямой, проходящей через середину отрезка [х‘, х7] перпен- дикулярно ему, с окружностью круга G. Тогда W (х) = max max (р (х, и'Л, р (х, vU\). — /«1, 2, 3 1.10. Пусть х1—точка области G, в которой бурится Ля скважина, i=l, 2, .... Будем предполагать, что вектор контролируемых факторов х = (х\ х2, ...) всегда удовлет- воряет следующему условию: xzy=xy, /=1, ..., i—1, если хе~1^В(у, г), и формально х( = х‘~1, если х(~1 С В (у, г) для всякого i. Пусть G1 = E2\G—дополнение к области G. Тогда неопределенный фактор у k N = {у € G | р {у, Gj) > г}; критерий эффективности U7(X( у) U min{i|x'eB(t/, г)}, UjxQnBUf, ( оо в противном случае. Рассмотрим функции хЛ x*(xl, y)$G, .х‘(х1,... • •., xz“l, y)^xJ, ..., i— 1, если xz“x^B(i/, г) и х{~1, у) = х{~*, если х?~1$В(у, г). Для страте- 5* 131
гии х = (х1, х®, •••) оценка эффективности ( ( i ~ 1 00 - " I min<i (J В(хЛ Nc: U В (xf, г), = < 1 /=1 .. J I oo , W<£ и В (xy, г). \ /=1 1.11. Контролируемыефакторых= (и, р) € Л40=Л1={х| 0^ ^.и^К, а^.р^Ь}\ неопределенные факторы у — (о, q) £ #= = {t/|0^o^K, a^q^b}; критерий эффективности [ pmin[M, max (О, D—о)]—аи, p^q, IF, (х, у) = \ 1V а> ( pmin(u, D)—аи, p<q. а) Если D^.K, то Wl(x)=—аи, а если £>>Л, то IFi(x) = pmin(M, D—К)—aw, б) критерий эффективности второго предприятия ™ max(°> D—u)]—av, q>p, t\x> У)— । £))—aV) qt^.p. Если D—^min(K, D)^.u или p — b, to (x)= — au, а'если u<D—^^min(K, D) и p <b, то №\(х)=5 — pmin(w, D)—au. 1.12. Введем следующие функции: f 1, a^O, = \ 0, a < О, s(a) = 1, a > О, О, a^O. Положим: u = (uit .-..,um), v = (vit ...» vm), p = (pit q = (<7i....<7m). ^ = («. P). У = (о, q). [ m a) W (x, i/) = min< 2 P/min(«z; Dt—vz); К i= 1 / m \ A n maxi C— 2 qivi< 0 /(—" .2 “/§/(“)» \ t=l / J /=1 где Ui=min(D/; h (p{—qt)v{,) i = l........tn; {tn 2 Pi) min (wf, Dt—Uf); f m \ 1 maxf C — ^qfli, OJ? 132
.— количество денег, полученных оперирующей стороной при первой закупке, C1 = max<0; С—2 Qtvi—С— I i= 1 — 2 Qis^i~Pi) min [о,; max(Dz —ut- 0)]} 1=1 ) — количество денег, оставшихся после первой закупки у второго предприятия, первой закупки у оперирующей сто- роны и второй закупки у второго предприятия; критерий эффективности оперирующей стороны Л F (х, у) = С — 2 a/g/ («) + / = 1 {т А Cf, 2 Pis(Pt—Qi) min [«/’. max(£>z—v{\ 0)]z. 1.13. Пусть it—количество хранимой на складе продук- ции в начале /-го промежутка времени после удовлетворе- ния спроса yt. Тогда z( = max O’t_i + xz — yt, 0), t — 1, ..., T. Положим х = (хи ..., хт), у = (уь .... Ут)- Контролируе- мые факторы х^М0= {x\xt^0, t = l, ..., Г}; неопреде- ленные факторы y^.N —{y\dt^.yt^.Dt, /=1, .... Т}\ критерий эффективности т т т W(x, у) = а 2 *t + P 2 Ч + V 2 max(yt—it_i—xt, 0;) t= i /= i *= i стратегия предприятия x — (xit ...» xz)£Mi x1==x1>0, xt(xo ..., xf_f, yt, .... t = 2...T; оценка эффективности стратегии-константы xi т т F(x) = a 2 + P 2 max(it-i + xt—dt-, 0). — t= i t= i 1.14. Стратегия туриста — движение вдоль спрямляемой кривой, один из концов которой совпадает с Р. В п. а) и б) условимся считать, что две конгруэнтные кри- вые задают одну и ту же стратегию. Кривую и соответствую- щую ей стратегию будем обозначать одной и той же буквой. Для произвольной стратегии L через d(L) обозначим длину кривой L. 133
а) Указание. Сначала показать, что стратегия L тогда и только тогда гарантирует выход из леса, когда со (Р, 1). Затем для произволь- ной стратегии L, гарантирующей выход из леса, построить кривую L(a) длиный(1(а))сс((1) такого же вида, что и кривая, изображенная на рис. 2, причем а не обязательно равно л/6, 0<а<л/2. Наконец, показать, что л/6— единственная точка минимума функции d(L(a)) на [0, л/2]. б) При движении вдоль прямой в худшем случае турист должен будет пройти отрезок длины К2. Допустим, что най- дется кривая L длины d. (L) не совпадающая с отрезком - 7, С к прямой длины ]^2 и такая, что стра- п тегия L гарантирует выход из леса. На кривой L возьмем две точки А и В, максимально удаленные друг от друга. Тогда р(Д, В)с]/2. Нетруд- но показать, что квадрат G можно рас- положить так, чтобы точки А и В лежали на его диагонали и, кроме того, нашлись две точки С и D кри- вой L, лежащие на противополож- ных сторонах квадрата или их про- должениях. При этом без потери Т £ гг Н Рис. 15 общности будем считать, что точка С принадлежит лучу Р/ с началом в точке F (рис. 15) и проходящему через точку К, а точка D — лучу Р2 с началом в точке Н и проходящему, через точку Т. Минимальная по длине ломаная Li, соединяю- щая точки А, В, С и D, имеет длину d(Li)<d(L)«:K2. По- кажем, с другой стороны, что d (Lr)>K2, и тем самым придем к противоречию. Положим р(Д, F) = x, р(В, Н) = у (рис. 15). Так как р(С, В) ^р(Д, В), то р(Д, С) > х и, аналогично, р(В, D) > у. Если Li = CABD, то dlLj^pffi, Л) + р(Д, В) + р(В, D) > > х+К2 —x—y + y=Vr2. Можно проверить, что min (р(Д, С') + р(С', В)) = ]/'х2 + (К2 — уУ. С'еР, Если Lt = ACBD, то d(L1)=р(Л> с)+р(с- В)+Р(В, D)> >V х2 + (/Г-у)2 + у >^2. Аналогично рассматривается случай L1 = CADB. Пусть, наконец, L1 = ACDB. Положим p(F, C)~zlt p(Ht D) = z2. 134
Тогда ____________ ' d га) = у zl + №—KT xzt + + уГг1 + у2—Уг2 yzt+ V1 4-(l—Zi —z2)a. Покажем, что min f(zlt z2) > K2. Действительно, си- Zj 0, 2?2 0 стема уравнений df (Zi, z2) _ q df(Zj, z2) _ q dzi ’ dz2 имеет четыре решения: z1 = (0; 0), г2 = ( \, _W</+/2 Ж+Г2/’ 3 _ / К 2 xy . (2 —К2 x) у\ г4 _ /(2 —K2 у) x . V2xy \ Z \K2—x-f-y’ /2— х-Н/ \ K2 — y+x ’ V2— y+x/' Можно проверить, что f(z')>K2; i = l, 2, 3, 4. Следова- тельно, min /(Zj, za)>K2. zx > 0, z2 > 0 в) Выберем на плоскости прямоугольную систему коор- динат и расположим квадрат G таким образом, чтобы начало координат совпало с одной из вершин квадрата, а две сторо- ны квадрата лежали на координатных осях. Для произволь- ной точки (a, b)£G, 0<а<1, 0<Ь<1, можно показать, что математическое ожидание расстояния, пройденного туристом перед выходом из леса, равно 1 1 d К’ 6) “ i S S Uz + Л/) — In (Kl! +П/ — ty))+ f = 0/=0 + T]7 (In (Kfc? + T)/ + Bz) — In (Ks<+ Я/ —U)]’ где gf=fa+(l—i)(l— a), i = 0, 1; t|/=/& + (l—/)(!—&), / = 0, 1. Если точка (a, b) лежит на границе квадрата, то зна- чение d(a, b) доопределяется по непрерывности. Докажем, что функция d(a, b) является вогнутой на G. Действительно, пусть d(a, b, а)—расстояние от точки (а, Ь) до границы квадрата вдоль прямой, образующей угол а с осью абсцисс (0 а < 2л). Тогда при фиксированном а € [0, 2л) функция d(a, b, а) вогнута по. (а, &), что нетрудно проверить. Но 2п тогда функция d(a, d(at b9 а) da также вогнута. 135
Далее имеем dd (1/2, 1/2) _ dd (1/2, 1/2) _ n да db ’.-Эе Отсюда 4)=>(тй)- 1.15. Пусть Ll—множество функций, интегрируемых на отрезке [О, Г]. Стратегия оперирующей стороны u^M = Li, стратегия противника v € N = Lx; критерий эффективности W (и, tj = j ((1 —и (0)Р (/)-(!-V (0) q (0) dt, о где р.{1) и q(t) удовлетворяют следующим ограничениям: “ mi—civ О) q (*)> = тг~сги (О Р (0. р(О) = Ро- <7(0) = <7о- Докажем, что при и — их и любой функции v£N ре- шение (р, q) последней системы удовлетворяет условию р(/)>р0, 9 0)>?о ПРИ 0<t<T. Действительно, из вто- рого уравнения следует, что </(/)<:<70-|-т2/, Отсюда из первого уравнения следует неравенство р(*)>Ро + т^—Ci^qJ.-}- m2y) , Чтобы доказать, что р (t) > р0 при 0 < t Т, достаточно проверить неравенство mJ—(?i ^Т + пц > 0. Но справедливость этого' неравенства вытекает из условия задачи. Аналогично можно доказать, что ПРИ 0 < t < Т. Запишем гамильтониан и сопряженную систему: Я = (1—их) р—4>о (1 — и) q + ydrui—Wq) + ф2 (тг—саихр), = —Фо (1 —«т) + ф = Фо (1 —«) + Согласно принципу максимума Л. С. Понтрягина [49], стратегия противника v0£N, реализующая минимум крите- 136
рия W по при 'заданном их, удовлетворяет следую- щему необходимому условию: существуют, константа ф0==—1 и решение сопряженной системы (ift, фа) такие, что -Ц>г (Т)= =яр2(71) = 0 (условие трансверсальности на правом свобод- ном конце траектории) и ( h — 1—^1(0> 0. М 0, -1-^1(0<О. Отсюда следует, что сто(/) = О в некоторой левой полу- окрестности U точки Т. Из уравнений сопряженной системы имеем фх(0 < 0, фа (t) > 0 при t$U. Отсюда и из вида правых частей уравнений сопряженной системы следует, что ф1 (0 < 0, ф2 (0 > 0 и на всем отрезке [0, Т], причем ф1 возрастает, a фа убывает. На отрезке [т, Т] функция —1 —= 1—ct —Т) принимает значения разных знаков. Поэтому найдется число ст£(т, Т) такое, что —1—С1Ф1(о) = 0. Отсюда а=Т—ср1 и 1> 0^/^ст, vt(t) = O, a<t^.T. Итак, стратегия противника ст0, удовлетворяющая необходимому условию, единственна и поэтому минимизирует критерий W при за-: данной стратегии ит. Оценка эффективности № («%) = — 4 (о8—х8) + у («1 + (т2т— q (т)) cj (ст?—т2) + + [р (т)— [ — у W2 + (mi + («2х—Я (т)) ci) *]} (<*—*) + +у (m1—mt) (Т?—о2) + \р (о)—q {а)—о (/пх—/иа)] (Т—о), где Р (?) = — у с1пг2 (ст2—т2) + [mi + (тгт — q (т)) с,] (ст—т) + р (т), <7(ст) = та(о—т) + <7(т), р (х) = a Kci е~Ус*с‘т + р (— К Ci) еУс,Сг х 4- , с2 q (т) == а V сг е “ т + ₽ j/^2 е^»т + 137
1.16. Контролируемый фактор k£M0 = {1, 2, ...}«Л4; случайный фактор z имеет неопределенность в законе рас- пределения; критерий эффективности F(k, z) = zk~~1(a—bk). Пусть со—функция распределения случайной величины z на отрезке [а, р]. О со известно лишь, что f 3 * * со £ Q = | со | J z dco (z) = z \ а > Тогда оценка эффективности _ з W J zkda(z) = zk(a—bk). co e Q a Последнее равенство следует из выпуклости функции гк и неравенства Йенсена [2].' Оптимальная стратегия fe0: b^-1 > а(1 —г) 1 — Ьг Указание. Показать, что значения W (k) при k^k0 не убывают, а при k^ka—1 возрастают. 1.17. Контролируемый фактор k£M0 = {0, 1, 2, ...} = М, критерий эффективности W (k, г)=апип(&; г) + b tnin (0; г—/г). а) Неопределенный фактор г принимает целочисленные значения из отрезка [а, р] ( ak, k С а, — ’ ( аа-Ьо(а—л), а < k. б) Пусть спрос принимает значение г с вероятностью ®г и <o = (cotx, соа+1, .... ®и). О со известно лишь, что cogQ = 1 ci$Ell~a+l 2 ®г=1. z=a сог>0, 3 2 г®г = г, г=а 3 - 1 2 г2 ®г = гг- + D г. г=а / 138
W(k, co) = Осредненный критерий эффективности имеет вид k—i 2 ((а + b) г—kb) + z=a 3 4- 2 ak(dz-, a < k < P, 2 =/? z(a-\-b)—bk, fe^p, ak, W (k) = z(a + b)—bk, fe>p; W (k) = ak, k^a. Пусть теперь a < k < p. Перечислим все крайние точки множества £2. Возьмем пару (zit z2) такую, что a^z1<z< <z2<P, D + z2 + z1z2—z(z1 + z2) = 0. Тогда г2— z z—zt . = а>г = 0, Z^Zt, 42 <1 42 41 является крайней точкой множества £2. Множество всех та- ких крайних точек обозначим £2. Возьмем тройку (zlt z2, z3) такую, что a Zj < z2 < z3 р, D + ? -j- z2z8—z (z2 + z8) > 0, D + z2 + г^з — z (Zi + za) < 0, D + z2 + ZiZ2—z (Zi + z2) > 0. Тогда _ г(г/+г7)—ZiZj—D— ? (гк — г^(г. — гк) (k; i\ /)==(1; 2; 3), (2; 3; 1), (3; 1; 2)/ coz=O, z=/=zft, k= = 1, 2, 3, — крайняя точка множества £2. Множество всех таких край- них точек обозначим £2а. Теперь £2, и £22—множество всех крайних точек множества £2, поскольку любая крайняя точ- ка множества £2 имеет не более трех положительных компо- нент [3, с. 111]. Из линейности критерия W (k, со) по о следует, что k—1 __ ( k-i & \ W (k)= min { 2 ((a + ^) z—bk) 2 ak(i>z\. co€QiU02 ( 2=a z^k ) 1 1.18. a) F(x)=min J 1+(A._2)2d® (z)=y + 139
Указание, Согласно [3, с. 112], минимум по© достигаетедда функциях распределения вида (0 = Pi^Zi “Ь Рi 0> ^=1, 2, 0<zi<z2<l, Pi + P2=l, PiZi + P222=1/2. Отсюда следует, что zjsC 1/2 *С?2, а при Zi < z2 z2—1/2 ~ \/2—zi П-i — “ j 1 • Z2 —ZX Z2 — Zi Итак, T^(x) — min p(zf, z2), где (Zi, Zt) € Q ( z2—1/2 । 1/2—ац 2«)-(га_г1) (1 +(x-z1)2) + (z2-z1) (1 + (z-z2)2) ’ Q = {(Zj, z2) j 0 Zi 1/2 z2 1}. Проверить, что не существует таких (zj, z2), что (4, z^gintQ, ' 'v- dzt дгг и исследовать на минимум функцию q на границе множества Q. Оптимальная стратегия х°=1/2. б) Ответ такой же, как и в п. а). в) W(x)=l—а—х2- + 2ха, оптимальная стратегия /=я. — 1 г) Положим г — г d со (г). При фиксированном г о 1 max ( z? d со (г) =» г, (О€ о где е= { со •1 J г d со (г) = г о Отсюда I W (х)== min J (1—(х—z)2)dco(z)= rnin (1—х? + 2хг—г) == ®вй q а<г<6 fl—b + 2bx—х2, х 1/2, 1—а-{-2ах—х2, х>1/2. Оптимальная стратегия х0— 1/2, Ь, а, а < 1/2 < Ь, Ь<1/2, 1/2. 1.19. Согласно [3, с. 209], выражение для математичес- кого ожидания времени работы " дублированного агрегата 140
имеет вид т ^(т, p1)=Spi(0d^ + p1(t)72, 0. где pj—функция надежности агрегата 1 (pt (/) —вероятность невыхода из строя этого агрегата до момента /)> Pi€^ = ;={Pi|Pi(Q)= 1» Pi монотонно не возрастает, непрерывна т справа при t > 0, p1(t)=Q, t>T, p1(i) dt — t,}. о W (t) = int W (t, pj = < — p,ea min(?i; ^У7а)), Т>т>7ъ 72, r = 0. Указание. Показать, что inf W (т, Pi) достигается на функции Pi€Q Pi вида Pi (/) = %, 0 < t < т, Р1(/)~Р1(т), Найдем оптимальную стратегию т°. Предположим, что + Тогда й (о, т° = G > /2. Пусть ?14- tj > Т. Функции fi (т) = г + 72 и Л (*) = — - пересекаются в нуле й в точке т* = Т— Функция /х(т) вогнута и достигает максимума в точке т'~ = Т—(Т —Tj)?2, т* < т' < Отсюда max min(/i(x); /2(т)) = /1(т/)=71 + (1/Т —— т/72 )2 'о, Т^2]Л (Т-71)/2, у, т>2/(т 1.20.. Пусть z = l или г = 2 означает, что в прошлом месяце смежники справились или соответственно не справи- 141
лись с выполнением поставок. Контролируемый фактор х£ О'М0==[0, 1]; неопределенный фактор p(EAf = [O, 1]; случай- ный фактор z£Z = {l, 2}; критерий эффективности W (х, р, z) — (x—р)2-, стратегия x:Z—>М0, х£М. Положим x{ = x(i), i=i 1, 2, для х^М. Тогда W (х, р) = (р—xt)2p + (p—V(l — Р) = = (1 4- 2х2 — 2xJ р2 + (Xj2—х%—2х2) р + х|, W (х) = max (х|; (1 —х^2), если 1 + 2х2 — 2Xi^0. Пусть 14~2х2—2X1 < 0; тогда lF(x) = ' х2, 2х2 + х2—х2 > 0, ? (1-Xj)2, (1-х2)24-1 <(*!-2)2, _(2хг-х1+х%)г , /2%2 + Х2~Х* < °- 4(1 + 2(X2-Xi)) +Х2’ 1(1—Х2)?+1 >(Х1-2)2. 1.21. Пусть х=1 или х = 0 — решение наблюдателя при- нять самолет соответственно за «свой» или «чужой», у = 1 или Уг=0—решение пилота самолета подать соответственно сигнал «свой» или «чужой», a z = l или z = 0 означает, что приближающийся самолет является соответственно «своим» или «чужим». Здесь: контролируемый фактор x£At0 = {0, 1}; неопределенный фактор y(-N={0, 1}; случайный фактор zgZ={0, 1} имеет неопределенность в законе распределе- ния; критерий эффективности ( ах 4-6(1—х), г = 1, F(х, у, г)— { , , .. . п ' ( dx+c(l—х), z = 0; осредненный критерий эффективности F(x, у, (о) = (ах—х)) ®4- (dx4-c(l—х))(1—®); множество стратегий М состоит из четырех стратегий: X'.NxZ—>М0 вида х(1, 1) = х(1, 0)=х', х(0, 0) = х(0, 1) = х"; Xjix'= х"== 1; х2:х' = х" = 0; х3:х'=1, х" = 0; х4:х'=0, х"=1. 142
Оценки эффективности: W (x^ — max (cm' 4-d(l—os'), aco"4-d(l—co")); W (x2) = max(&®' + c(l — co'), 6®"-|-c(l — co")); W (x3) = max (aco' + c(l — co'), aco' + d(l —co')), ~ ' aco" + c(l—co"), czco" + d(l — co")); W (x4)= max (ba)' + c(l —co'), ba' + d(l —co'), — bn"4-c(1—co"), 6co"-|-d(l — co")). 1.22. Контролируемый фактор ng/W0 = {l,2, — неопределенный фактор XgJV = {X| 2< X 2,2}; критерий эффективности Г(п, Х)-| £(1)=11/16, W_(2) = 121/281, IT (3) = 1331/5546, 1F (п)= сю, п^4. 1.23. Положим x = (xf, ...; х„), хо = О, х„+1=1 и будем без потери общности считать, что xt х$ х„. Кон- тролируемые факторы xgMo={x|O<x1<x2<...<x„<l}; неопределенный фактор = U\ критерий эффективности W( А = (Х1’ Х/€[0’ | х/+1—xt, xfe(x{, х<+1}, i>2*. а) №(х)=Л Xi+1~Х{~г' — ( xt+i—Xi, f(xi+]L) = f(Xi)>f(xj), i^i, i+1; в)Г(х') = ^х. 1.24. Контролируемые факторы x g /Ио = {x 10 ^xr x2 <...<x„<l}, /gf1; неопределенный фактор f£N= —L(R)-, стратегия x:x(f) = (x, J (x, у)); критерий эффектив- ности i W(x, f) = ^f(t)dt—J(x, y) . 0 a), 6) F(x*j = K/4; в) F(x) = K/8. 1.25. a) R(y, z) = const; 6) R(y, z) — (y, z); в) R(y, z) = • / л-i \ \ У4> • • • 1 f/aA’ "2i Uil +i )• \ i =0 J 143
1.26. a) R(l) = R(3)=... = 1, R(2) = R(4)= ... =2- Множество MR состоит из m2 стратегий. ,.,,ф 6)R(1) = R(2)= ... = R(n—5)=1, R(n—4) = R(n—$ = = R(n—2) = R(n—1 ) = R (n) = 2. Множество MR состоит из m2- стратегий. 1.27. Множество MR содержит mk стратегий. 1.28. Информационные функции Rj и R2 называются экви- валентными, если для любых уг, у2 £ N., z2, z2 £ Z, R2 (yt, zt) = = Ri (f/2, z2) тогда и только тогда, когда R2 (уи zj = R2(y2, z2). 1.29. Надо подсчитать число различных разбиений мно- жества ЛГ={1, ..., п} на подмножества. Обозначим это число Ln. Разбиений, в которых элемент п. составляет отдель- ное множество (множество, состоящее из одного элемента), разбиений, в которых элемент п входит в множества, состоящие из двух элементов, Q_iL„_2 и т. д. Имеем £я = = £n-i+Q-A-2+-•-+Сп1^1 + 1- Например, = 1, L2=2, £3 = 5, £4=15, £б = 52. 1.30. а) Контролируемый фактор—номер i выхода Ct из пещеры, {£Мо={1, 2, 3}. Выбор i означает решение спе- леолога двигаться к выходу Ct. Неопределенный фактор у=[3,5; 5]; критерий эффективности 7 у, 1=1, ГГ(1) = 5, W\(i, У) = ) 8—У> ( у—0,5, i=3, №(2) = «7(3) = 4,5. б) Пусть 5=1 или 5 = 2 означает решение спелеолога двигаться вдоль отрезка [Clt С2] по направлению к С2 или по направлению к С2. Выбор 5 € {1. 2} позволяет спелеологу к моменту установить выполнение одного из неравенств: у 3 или у > 3 (для этого достаточно измерять пройденное расстояние). В момент спелеолог выбирает ig {1, 2, 3}. Здесь: контролируемые факторы х = (5, i)£M0= {1, 2} х х{1, 2, 3}; неопределенный фактор у £.N = [2; 4]; критерий эффективности 3-y + W\(i, 3), 5 = 2, у^З, 1 + ^xG, У-1), В=1, {/<3, Ц-И\(/, у+ 1). £=2, у>3, у-3+W^ 3), 5=1, у>3, Г(х, у) = где «^(i, у)—естественным образом доопределенный крите- рий из п. а). Выберем информационную функцию . [ .1, У<3, ^/?^ = {2,,>3. 144
Тогда стратегия х=(|, i): i(R («/))€ {1, 2, 3}, ££{1,2}. функцию I'.R (N)—> {1, 2, 3} будем задавать вектором (i(l), Г(2)). В этом случае Г(2; (1; 1))=Г(2; (3; 1))=Г(2; (2; 1)) = ¥(2; (2; 2)) = = №(2; (2; 3)) = Г(1; (1; 2)) = №(1; (3; 2)) = 6; №(1; (2; 1))=Г(1; (2; 2))=Г(1, (2; 3)) = 7; Г (2; (1; 3)) = Г (2; (3; 3)) = 5,5; F(l, (1, 3)) = 3,5; “ Г(1; (3; 1)) = Г(1; (3; 3)) = 4,5; F(2; (1; 2)) = Г(2; (3; 2)) = 5, F(l; (1; 1)) = 4. 1.31. a) W (xj = — 1, F (х2) = — 8, W (ср) = — 5/2; б) ¥(х\) = 3, ¥(х'2) = -17/6, ¥ (<р) = 83/36. 1.32. а) ¥ (x'j) = — 1 /6, ¥ (х2) = — 1/3; б) ¥ (Xj) = — 21/80, ¥(х2) = —5/6. 1.33. а) 13/48; б) 1/4; в) 7/48; г) 1/12. 1.34. а) —2/75; б) —46/1575; в) —14/375; г) —22/525; д) —46/875; е) —14/315; ж) —2/35. 1.35. а) ¥(х1) = 3/4, ¥(х2)=1, ¥(ф) = 5/4; б) ¥(хх) = 0, _¥"(х2)=1/2, ¥(ф) = 19/18; в) ¥(х1) = 0, ¥(х2)=1, £(ф)=10/9; г) ¥ (хх) = 3/5, ¥(х2) = 1, ¥"(ф) = 56/45. 1.36. 1) a) ¥(Xi) = —5/12, ¥(х2) = —5/6; б) ¥ (хх) = — 49/96, ¥ (х2) = — 7/6; 2) a) ¥U1)=¥(x'2) = -2; б) ¥ (х,) = ¥&) ------2; 3) a) ¥(Xj) = —1/3, ¥’(ха) = — 1/2; б) ¥ (хх) = — 43/96, ¥ (х2) = — 1. 1.37. a) W (х2)=1, _^(х2) = 4; б) £(х;) = -1, №(х2)=1; в) Г (Xj) = —3, ^(х2) = 2; г) Га1) = (1/2)1+(1/2)(-3) = -1; £(;а) = (1/2)4 + (1/2)2 = 3. 145
1.38. a) W_ (xj = — 34 + 24 /2, W (x2) = — 1/4; 6) W(x1) = — 1/16, F(xa) = -1/4. 1.39. Для любого критерия противника Wn (х, у), удовлет- воряющего условиям задачи, имеем max U7n(x, y)^Wn(x, 1)^х +1. (/ею, 1] Поэтому, если у0 таково, что max №п(х, y) = Wn(x, у0), (/в[0, 1] то x+y0 + a^Wn(x, t/o)>x+l и, значит, </„>1—а; от- сюда №(x) = x + max (1—а; 0). 1.40. Пусть Xi—количество произведенной продукции t-ro вида. Критерий эффективности , п п I 1, 2 cixi—2c/max(d/—хг; 0)>с0, W(xlt .... x„)=J ,=„‘ '=* I 0, 2 cixi— S cimax №—Х{', 0) < cg. 1 »=i (=i 1.41. Г= min 1 < i < s ”< L42. F0=max[min(I^1; max(Fa; IFS; W\)), min(lF3; max (IVY, IFa; IF,))]. / 3 8 8\ 1.43. a) Wo= max W{, (W,(x, {/))= 8 7 Ю ; 1 <«< 3 \10 io 4/ /1 2 2x б) Го= min Wh (IF0(x, (/))= 3 4 7 ; 1 < К 3 \3 2 0/ / 3 10 2\ ~ В) (№О(Х, (/))= 18 4 25 . \ 3 2 4/ 1.44. a) Fo= max min(W\; 1T/+1); K(<s-1 6) IT0 = min max(№z; W\+1). i < ><s-l Положим /={1, ..., s}. в) 1To= max min IT;; j62z: iiJ I Л=й г) Wg= min max minlFy. J e 21: J, e 2Z: ‘ 6 |J| = fe|J,| = S 146
1.45. а) Множество Л определяется s неравенствами S и одним уравнением 2 1- Перечислим все подсистемы из $ неравенств ранга s: ^2» •••» ^7+i^^7 + 2’ •••> 2xf=i, z= i, s—i. 1=1 Система, соответствующая номеру /, имеет единственное решение Zz£A:?4=p, i=l, /, М = i = l+l, .... s, где 2^f = 0- ’ »•= i б) Крайними точками множества Л являются pz_i, 1—Ht+i..................../==1. s, min f + \ i =£ I / / в) Крайними точками множества Л являются ХЧХр i=i, X' = v, i = I +1 f , s; I = 1, ..., s, ' / I S ч y.= min (S(-1-~<i,~')v)»\+v S 1 < l< s M=1 7 f = /+l / r) ( • W„= min 2‘П<+2 , 1 < I < s-1 U= 1 /г== 1 где 1 2~z (H1) И + (s-0 (s-l-1) ?|X /+1 (s—/)(«—/+!) 1.46. Пусть xit Xj, xs—количество произведенных пар. соответственно мужской, женской и детской обуви, а х = J47
— Ui> хя). В первой операции вектор контролируемый факторов х принадлежит множеству ’«л Ml = {х| 2xj + 2х2-|-х3 = 300 000, 4х!4-2х24-х8 = 400 000, xt и целочисленны}; во второй операции х 6 М% = [х 12xj + 2х2 + х3 300 000, 4хх +2х2-|-х3 400 000, хг^0 и целочисленны}; критерий эффективности W (х) = 20xj + 30х2 + 10х3. а) Крайними точками множества Ml являются (50 000; 0; 200 000), (50 000; 100 000; 0). Оптимальное производство соответствует вектору х*=(50 000; 100 000; 0); W(х*)= =4 000 000. Крайними точками множества Ml являются (0; 0; 300 000), (0; 150 000; 0), (100 000; 0; 0), (50 000; 0; 200 000), (50 000; 100 000; 0). Оптимальное производство во второй операции соответствует вектору х°=(0; 150 000; 0), 1Г(х°)=4 500 000. Во второй операции оптимальное производство дает большую стоимость выпущенной продукции, чем в первой. б) Ограничения на ресурсы во второй операции можно записать в виде неравенств Xi+x2<ai, 2xi+x2«a2. При ах< <aa<2ai производство х*=(—ai+a2, —a24-2a!), использую- щее все ресурсы, менее выгодно, чем оптимальное производ- ство х°=(0, aj, которое не использует все ресурсы, т. е. W(х*)<1Г(х°). При ai=a2 W(x*)=F(х°). Искомое условие имеет вид ai^=a2. 1.47. Положим b( = max В{). Если найдется номер I п ___________________________________________________ такой, что то искомое условие имеет вид 2 V п < 2 At. Если же Bt > dt/c* для всех i, то искомое условие <=1 п ______ п 2 У2 А{. i= 1 i= 1 1.48. Пусть £—ресурс первой оперирующей стороны после перераспределения ресурсов. Тогда А 4- В—£—ресурс второй оперирующей стороны после перераспределения ресурсов. Очевидно, что 0 А + В. Положим 4 т 2ал^5, х,^Ъ, /=1, .... т i=l W) = G Sbjy^A + B-l yj^Q, j=l \ /=1 n 148
Пусть а(х, У, В)—побочный платеж, осуществляемый после того как стали известны |, x€A1J(B), Если а (я, у, В) < О, то первая оперирующая сторона выплачивает второй |а(х, у, В) |, а если а(х, у, В) > 0, то вторая опе- рирующая сторона выплачивает первой а(х, у, В). Наконец, в случае а(х, у, В) = 0 выплата побочного платежа не про- изводится. Таким образом, должно выполняться неравенство — (х) < а (х, у, В) < (//)• Опишем модель объединенной операции. Контролируемые факторы (В, х, у, а):В€ [О, А Н-В], у&МЩ), а€[—№i(x), Г Ду)]; неконтролируемые факторы отсутствуют; W (х, у) — №\(х)+^(у); стратегия — (В, х‘, у, а):х~(В)€Лед, y(B)€W), 5(х, у, В) (= [-(х), 1Га(у)]. Пусть и—максимальная сумма денег, которую можно получить в объединенной операции. Тогда и= max max (^i(x) + ^(y)) = о < 6 < а+в х 6 Mi (6)1 у € м 2 (5) а= (Л 4- В) max ( max —; max \ 1 < l < т ai 1 < I <n °i / Положим yt = max (с(/а,), y2 = max (d//67). Если у, =4y2, i < i < т i < j < n то (A-\-B) max^; y2) > Лу!-|-Вуа. Последнее неравенство означает, что сумма денег, полученных при оптимальном по- ведении в объединенной операции, больше, чем сумма денег, полученных при оптимальном поведении в частных операциях. Таким образом, уг#у2 — искомое условие. Глава 2 2.1. Обратное утверждение не верно. Это показывает сле- дующий пример: Afg = |х = (х^, х2) 11 х^ | 1, i == 1, 2}, Г(х) = (ЯМх), ИМх)) = (х1( ха). Вектор (О, 1)£П слабоэффективный, но не является эффек- тивным. 8 2.2. Выберем стратегию х°£ Arg max 2 №\(х). Тогда i=i нетрудно проверить, что вектор (H7I(x°), fssl, ..., $) эффек- тивен. • Д49
2.3. Докажем замкнутость множества S (D)-. Возьмем последовательность {u*}“=i векторов из S (£>) и пусть и* —► и0. Если вектор и® С D не принадлежит S (D), то найдется вектор u'^D такой, что и'{ > u®, i=l, .... s. В этом случае най- дется номер kQ такой, что для всех номеров k^k0, u’t > ик, i=l, ..., s, что противоречит слабой эффективности век- тора ик. 2.4. Докажем замкнутость множества P(D). Возьмем после- довательность {«*}£-! векторов из P(D) и пусть ик—»и® = = (и®, м“) € D. Допустим, что и°£Р (D). В этом случае найдется такой вектор и' € D, что без потери общности > и®, и2 и2. Если «2 > ы®, то вектор u°£S(D), что противоречит замк- нутости множества S(D) (см. задачу 2.3). Следовательно, и’2 = «а. Для некоторого номера kQ, и[ > ик<> и, поскольку вектор ик° эффективен, ик°> и2 = и%. Далее, найдется Х<1, близкое к 1 и такое, что Хм' + (1 — X)u*ogD (это следует из выпуклости множества D) и XuJ + (l— к)ик° > u®, i= 1, 2. Таким образом, вектор и° (fcS(D) (имеет место противоречие). Предположение о выпуклости множества D существенно. Пример: 4= [О, 2], Г2(х)), ( 1—х, O^x^l, W1(x) = x, 1Г2(х) = | 0 1<х^2. Здесь D—невыпуклый компакт и множество P(D) = W ([0,1) и U {2}) не является замкнутым. 2.5. Введем следующие множества: Т — {и £Е31 Ui + «2= 1, ыа = 0}, /? = {и € Е31 ul = u2— 1/К2, 0^us^l} и положим £> = со(Ти^)- Последовательность {ик}^ эффек- тивных векторов u*=(cos/*; sin/*; 0)gD, /*—>л/4 сходится при k—>оо к вектору и®=(1/рЛ2; 1/И2; 0), который эффек- тивным не является. 2.6. a) P(D) = S(D) = Dn£i; б) Р (D) = {(bi, ...; bs)}, S (D) = {и € D | найдется номер /, для которого Uj — bj}; в) P(D)==^u£D| найдутся номера k, j (k^= j), для котрг рых S ut = s— 1, 2 = S(D) = Ju€О| найдется i Ф k i Ф j j ( I номер /, для которого 2 wz= s—1 > *> I I J 150
r) р (£))== U со {a*, aft+1, 6*}, k = 1 S(D) = P(D)U [a, &]U U со {a”, ak+1, с}; д) Р(£>) = {«€Е‘| «4=1-и8, («1, «2) € Р (M3Q1 + (1 — ыз) Qa)} > S(D) = {M€E«|0<m3<1, 0<и4<1—и3, («i, m2)€^(«3Qi + (1—«3) Q2)} U U{«€£ |0^«3d, н4==1—us, (Uj, u2) € w3Qi + (1 u8) Qa}. 2.7. a) P(M0) = [l-l//3-3/2)u{(3 + /T3)/4}, S(M0) = P(M0)U{3/2}. б) Если a = b, то P (Me) = {- а a>b, то S(M0) = P(M0)=[-^ = [°. IT?]- в) S(/W9) = M0, P(M0) = {x£ , S (Af0) = [0, 1]. Если , 1 . Если a < b, to S(440)= U{x€Mo|O<x3<l-l//2, O^x^l/Ks}. г) P (Mo) = S (Af0) — | x € SA | 2 > 01 • к i= 1 / д) Пусть стратегия х£Л40 такова, что для некоторых номеров i, j, k (j =f= k), x{ > xh хк. Покажем, что стратегия x(£S (Л10). Действительно, для стратегии у £ Ма у.= [х* + т=1’ 1 (х,—е, /==/, при достаточно малом е > 0 выполняются неравенства П?'/(г/)> > i (*)>«‘ = 1, . • •, s. Таким образом, если стратегия х £ S(A40), то для некоторого номера / и числа с выполнено xt^c^xj при любых i =£ j. Поскольку сХу = 1—2х/—1—c(s—1), имеем c^l/s. Если при этом Xy<c/fey, то нетрудно пока- зать, что х (£ S (Af0). Поэтому Ху cjkj при х б S (А!о) и, следова- тельно, c^kjl(\ + k/(s—1)). Найденные необходимые усло- вия для стратегий из S (Л40) являются достаточными усло- 151
- - виями эффективности. Итак, ><.--и. , чл- S (Мо) = Р (/Ио) = и i {х | х{ = с, i=£j, l/s<c<Ay/(l 4-fe/(s—1))}. 2.8. Искомым множеством D является S(Q). Для доказа- * тельства достаточно заметить, что любое множество D, удов- I летворяющее условию задачи, содержит не более одного век- | тора в каждом из множеств Q(u), и € Q. 1 2.9. Рассмотрим множество Qj. Пусть без потери общнос- ти а!^аг^а3. Определим множества Dft={(t, k—t)€1max(0; k—a2)<iCmin(ax; &)}, k = 0, 1, ..., Oj-j-aj. При s = 2 очевидно £> = Dft, где ai^k^a^. Пусть s=3; положим D'k=Dkx {at + at~-k}c:E9, k — Q,l, . ..,^4-a^. Если a3^ai-baa, a,+as то D= U D'k; A = 0 если as<ai + a2 и а^аг—a3 = 2tn, то D = U Dk-; k=m если «а < Cia3 и al + a3—a3 = 2m-\-\, to ai+a8~m-i £>= U D'k. k~m Рассмотрим множество Qs при s = 2. Если (|//K2j24- 1/2)24- 4- l/4^r?/2, to Z) = {(иj, u2) | (мй u2) Qa, 4- u3 — 1}; если ([r//2]2 4-1/2> 4-1/4 > r2/2, to D—{ult «2)€Q2|«i4-m2 = 0}- 2.10. 1) Пусть a £S(D). Тогда min (й|'-«()<0 для вёех l<i<s и' £D и для и' — и последнее неравенство обращается в ра- венство. Таким образом, sup min (u't—н,) = 0. Обратно: если m'€D l<i<s 152
выполнено последнее равенство, то u^S.(D), так как в про- тивном случае sup min (u't—ut)>0 (получено противо- u'eD речие). Второе равенство доказывается аналогично. 2) Выберем вектор 0° С Bs такой, что 0? < и_{, i = 1,..., s. Если р€ int£$. и u^.D1(p, 0°), то u^S(D). В самом деле, если и $ 5(D), то найдется такой вектор u'£D, что «•>«,, i = 1, ..., s. Отсюда min pi (и', — 0?) > min р}(и,—0?), K;i<s l<i<s это противоречит тому, что и £ Dt (р, 0°). Обратно: предпо- ложим, что u^S(D). Тогда для pz = 1/(и{—0?), 1=1, . ..,s, и С £>1 (р, 0°). Итак, доказано равенство 5(D) = и DUP, 0°). р 6 int Es+ Аналогично доказывается второе равенство. 2.11. Указание. Воспользоваться теоремой о разделяющей ги- перплоскости [2, 50]. 2.12. Пусть множество Р (D) регулярно в точке u£P(D). Множество D не имеет общих внутренних точек с множе- S ством В (и) — {и' €E*\u't^ut—с (и) 2 (u'k—иьЬ !»• • •, s}. /? = 1 По теореме об отделяющей гиперплоскости найдется вектор S 3 _ h£Es, Х#=0 такой, что 2 Ktut для всех и' € В(и), — _ *' “1 1 — 1 u£D. Положим и = и и выберем вектор и" € В (и) такой, что п/ = Му + е (в > 0), Ut=u{ для всех i=£j. Тогда из нера- S S венства 2м;>2 Xziiz следует, что Х^е 0 и Ху 0. Итак, <=1 i=\ Xz^0, i= 1, .. .,:s. Предположим, что найдется номер /, при котором Ху = О. Возьмем номер такой, что Х71 > 0, и рас- смотрим вектор и": ut=u{, i=£ j, jlt u'j = Uj-\-aj, — —b, a> b. Тогда при фиксированном b и достаточно большом а 5 8’ вектор и"£В(и), но 2 < 2 (получили противоре- чие). Итак, Xz > 0, i = 1, ..., s. Предположим, что для точки u£P(D) найдется такой вектор Х£ intE^., что 2 ^iui^ 2 Xz«; для всех и' (-D. По- 1=1 . (=1 кажем, что в качестве константы с (и) в определении регуляр- на
ности можно взять любую константу, удовлетворяющую условию I),;,;. 0<c(u)< min X,((s—1) max Xz)-i. l<t<s l<i<s Возьмем произвольный вектор и' € D. Положим / = {i | uf < < ut} и без потери общности будем считать, что 111 s—1. Тогда 2 X/min (uj —u(x2Mw;—uz) iez K«s is/ J 2 ^i(ui—min 2 i$l 1</<S if/ j! Отсюда следует, что | min (u’t—u{)^ min Xf mr2 I l<i<s l<i<s \ie/ / ; <2 min Xf((s—1) max Xz)-1 2 («/— l<i<s 1'Ci'Cs ^c(u) 2 («/—«<') < c(u)2 (U{—u’l). ; i$I i=i 2.13. Предположим без потери общности, что множество P(D) < содержит более чем одну точку. Пусть («}; uf), (uii u|)—гранич- ные, а («1; uf)—произвольная внутренняя точка множества j Р (D). Предположим для определенности, что uf < uf < uf и, v следовательно, и}—uf < uf—uf < uf—и|. В силу условия ц регулярности найдутся прямые u2 + X; (иг—u2)=uf+Xf (uf—uf), ft О < Xf < 1, опорные к множеству в точках (uf; uf), i = 1, 2, 3. Тогда uf + Xf(uf—ufXuf-f-Xf (uf—uf), uf + Xf(u{—uf)^ ^uf-(-Xf(uf—wf). Отсюда следует, что 0<Xf«gZ^t Анало- : гично можно доказать, что Xf < Xf < 1. Из полученных не- . равенств следует, что константу в определении условия ’ регулярности можно выбрать независящей от u^P(D) (см. решение предыдущей задачи). Пример. Пусть D = Q\R, где Q = {u€£2|0cSuzsgf 1; i = l, 2}, 1?={u€^2|(u1—l)® + (u2—I)2 < 1/4}. Здесь мно- жество P(D) регулярно, но для любой последовательности | и* такой, что ull^P(D), ик—>-и° = (1; 1/2) при k—>оо, полу- I чаем с(ик)—>-0. | 2.14. Пусть с—константа из определения равномерной | регулярности. Возьмем е, удовлетворяющее условию 0<8<с min/l/(maxuz—Pf)Y l<i<s \ «€ D J Очевидно, что (J De (p)a P (D). Докажем обратное вклю- p e : J 54
чение. Для данного вектора и£Р (Р) выберем в качестве коэффициентов pz = l/(uz—0?), i = l, Тогда для вся- кого и' € Р (D) min р/(«;—Р®)— min pz(uz—0?) = min рг(и- —0?)—1 = l<i<s 1<Z<S (S ч S(w<'—«/)). i= 1 J Полученное неравенство означает, что и £ De (р). 2.15. Покажем, что Для всякого и € Ddp, В). Г1Ли) г2\и) ' В самом деле, пусть, например, < 1. Выбе- Г1 \U) Г 2 \и) рем вектор и £D такой, что max ux. При Xg(O, 1), до- иеР статочно близком к 1, для вектора ы = Аы-|-(1—А) и' выпол- няется неравенство min Ш — Pi • Uj—02\ 'i (D) ’ r2 (D) / ui— Pi r^D) min «1 — Pi , —P2\ Г1 (£>) ’ r2 (D) J что противоречит выбору u£D1(p, 0). Итак, для и выпол- няется неравенство Отсюда следует, что мно- жество Z>x(p, 0) состоит из единственного эффективного вектора. 2.16. а) Положим хх= 1 —К(1/3(1— у2 = (3+КТЗ)^/ 4 —ЗА3/8, Yi_=Aiiri(x1)4-A2ir2(x1). Если < у2, то М[(А)= = {(3 + К 13)/4}, если Yi = Y2, то /И03(А)={х1, (3 + К13/4}, если ?1>у2, то Ml (А) ={%!}. в) Положим х1 — (0; 0; 1), х2 = (2/3;0; 1/3), х3 = (0; 2/3; 1/3), x‘ = (l/j/2; 0; (2—/2)/2), х6 = (1//2; (2—j/"2)/2; 0), х‘ = (0; 1; 0), /=1, ..., 6. Тогда М?(А) = i- 1 = {xk 16 € Argmax уЛ. г) Положим 7 = Argmax czAz. Тогда Kt<s ЛЩА) = Jxg Sft I Sxz>0,xz = 0, i£ {1; . I I € / J 2.17. а) Если P1/p2>(/3 +1)/3, to MJ(p) = {1 -1//3}; если P1/p2 <(/3+l)/3, to Ml(p)={3/2-K 1/4 + P1/p2}. r) (/ s x “1 \ *€SJx,=(cz Sr ) Л»=1, 0</<l[. \ /=1С7/ ) 155
2.18. а) Если ЗИ 3pi> 2р2 ,то Л1£(р)= {1}; если ЗК3; р1=2р2, то MS (р) = {Г— 1/КЗ}; если ЗК3pt < 2р2, то MS(р) = {1 — -1/ГЗ}. б) Положим y1 = max(a;&), у2 = аа₽₽(a + ₽)“(a+₽). Тогда Если P1Y1 < р2у2, то ЛЩр) = ; если р^ = р2уг, то МJ (р) = Ml и ; если р^ > р2у2, то MS (р) = М'в. в) Если min(p2, 2р3/3)>р1/21тоЛ1^(р) = {1}; если min(p2, 2р8/3) < Рх/2, то М‘(р) = [1У2, 1]. г) Положим /(р) = Argmax p/Ср Тогда l<i<s М#(Р) = U {х £ Sft | > О, х7 = 0, /<з, /=/=i}. ‘€/(р) /fey д) Выберем векторы xf$Ss: *1 —x>f = и положим /(р)=а^гйЙй7 • Тогда MS(f>)= и и. /е/(Р) 2.19. 1) Пусть u^P(D). По определению последователь- ности множеств {Dft}r=i найдется последовательность векто-, ров 6 = 1, 2, ..., такая,_что Возьмем после- довательность uk£Р(Dk)-. ик^ик, t = l,...,s. Покажем, что «*—>•« при k—>оо. Действительно, в противном случае найдутся е0 > 0 и подпоследовательность i такие, что р(«**,н)^е0, /=1, 2, ... . Множество {«'£D|p(«', и)^е0} компактно, поэтому без потери общности можно считать^ что uki—+u°GD. Но u}^ut, t==l, ..., s, и p(u°, и)>е0. Сле- довательно, .и и^Р(D) (имеет место противоречие). Утверждение 2) доказывается аналогично. Докажем ут- верждение 3). Положим D (eft) *= со {(0; 0), (0; 1 Ч-eft), (1 0), (1; IJJczE?. При sft—>-0 последовательность компактов .156
сходится в компакт П(0) в метрике Хаусдорфа. Если <>0, £=1,2, ...,то (0; 1 + eft) € Р (D (efe)), но (0; 1)< (£P(D (0)). Если eft < 0, k = 1, 2, ..., то (0; 1) € S (D (0)), но S(D(eft))= {(1; 1)} и не существует последовательности gS(D(eft)), fe= 1, 2, .... такой, что ик—+(0; 1). 2.20. a) R рефлексивно, если [a, b] и [с, d]=i[0, 1]; сим- метрично, если а = с, ft = d (/?#= 0); транзитивно, если либо [а, Ь] И [с, d] = 0, либо Я = Л10х/И0. б) R рефлексивно, если а < 0 < Ь\ симметрично, если —а; транзитивно, если либо ai>l/2, либо 0<а< 1/2, либо —1/2, либо —1/2<Ь<0, а <—1. в) R рефлексивно, если с^0; симметрично, если либо с^1, либо с>/п—1; транзитивно, если либо с^0, либо с>т—1. 2.21. а) п г 10, если а^.Ь, Ur~Cr— j jo, 1]\[с, d], если a>b; VP = Cp = ' 0, если либо а < b, либо a = b£ [с, d], {а}, если а — b £ [с, d], k [0, 1 ]\[с, d], если а > Ь. б) Если R = 0, то CR = VR = M0. Пусть R=£0. Тогда а < Ь. Если а>0, то CR = [0, min (а; 1)]; если Ь^0, то CR = [max(0; 1 + b), 1]; если а<0<6, то CR — 0. Если Ь^0, то УЛ = [0До)и{тт(|а|;1) + 1(&-а), i = 0, .... где |0= min (max (0; а); 1). Если b < 0, то VR = |max (0, b) — -~i(b—a), i — 0, .... |'jj*U(max(0; b), 1]. Множе- ства Cp и Vp определяются аналогичными формулами. в) Определим целое число k из условия k—1<с^&. Если k «С 0, то ядра и решения совпадают с /Ио; если k п, то ядра и решения пусты; если k=l, то CR—0, VR = {1}, Cp~Vp = M0-f если 2 < 2k^.п, то CR — CP = VR= 0, VP = == ^1, "j] + 1} ; если « < 2й < 2п, то CR = CP= 0, VR = ^Ур={1(п—*) + /+!, /=0, !,...,[(£—1)(га-М-1)“х]} U {£}• 2.22. Покажем, что для непрерывного векторного кри- терия W на компакте /Ио множество 5(/И0) является един- ственным решением бинарного отношения >. Если x£S(/We), то найдется стратегия х’ € такая, что х' > х. Рассмот- . 157
рим стратегию х° £ Argmax 2 /(х)> где Л4о= {х 6 Af0|IFf(x)& I хеМдг=1 I >W\(x'), /=1......s}. Тогда x°€S(M0) и W {(х°)$ 1 Wt (х') > Wt (х), /= 1, ..., s. Отсюда следует, что х° > х я и множество 5(Л40) внешне устойчиво. С другой стороны, а множество 5(Л10) внутренне устойчиво, поскольку оно сов- падает с ядром С>. Следовательно, 5(Л40) является реше- нием бинарного отношения >. Его единственность следует из того факта, что всякое решение V> должно содержать j ядро, являющееся решением. 1 2.23. Положим mz = inf Wt(x), r{= sup Wt(x)—m{, i = l, ...,s. A'6zVl0 Г Тогда в качестве искомых можно взять константы а. = £1, = / = 1...s. 2.24. Множества М{ = Argmax 1Г,(х), 7=1,..., $,— 1 непустые компакты в силу компактности множества Мв и непрерывности векторного критерия W. При этом Afs_j = = iex. Пусть критерии W {, 1 = 1, ..., s, попарно одно- S родны. Тогда стратегия х0€ Argmax 2 принадлежит * XtM,i=l ядру С^. i 2.25. а) Положим70={1,...,s}, I{ — {j |aZ; = 0}, i=l,... ,s. 4 Тогда их = {хб Af0|xy = d/t если a/z>0, Xj — Cj, если atj < 0, где i—наименьший номер, при котором j С 1 б) Если 2 с, < 1, то : С>1ех ={х€ Af0|xf>Q, ( = 1, Пусть 2 ci 1 • Определим номер j, 1 ^ / < s, такой, что 4= 1 / /+1 2 ci < 1 2 cf i= 1 i=l Тогда С> lex = ^Cf, ...; о/, 1 — .2 0; ...; O^j . 2.26. а) С> = [0, (-1 + К5)/2]. 158
б) Если 2 сг>1, то {х^Мй\х^с{, i=l...................s}; если S ci < 1 ’ т0 i = 1 для всех перестановок л индексов 1, ...,s}. - _ 2.27. а) Заметим, что А (<р, <р') =— A (<р', <р)—средний выигрыш первого игрока в игре с матрицей А. Нетрудно показать, что <р* £ С % тогда и только тогда, когда А (<р*, <р) ^0 для всех q>€«Sm. Но отсюда А (<р, <р*) = —Д(<р*, ф)=С0. Таким образом, тройка <<р*, <р*, 0> является решением игры с матрицей А, а С %—множество всех оптимальных смешан- ных стратегий первого (второго) игрока. б) Сй = {(1/т; ...; 1/т)}. в) Для и любой стратегии <p£Sm справедливо не- равенство A (i, <р)= 2 Ф/^0. Следовательно, г С Ср. В примере п. б) при /п=4 решение VR=[x1, хг} не пере- секается с Vp=Cp. 2.28. Достаточность. Пусть бинарное отношение R асимметрично и отрицательно транзитивно. Приведем алго- ритмы построения скалярного критерия W, представляю- щего отношение R на множестве Мо. Для каждой страте- гии х£М0 определим множество Мо (х) — {%' £ Мо1 (х, х'), (х', x)$R}. Отношение R отрицательно транзитивно, поэ- тому (х', х"), (х", x')(£R для любых стратегий х', х"£ Af0(x). Таким образом, найдутся элементы x'gyW0, i С1 (множество индексов / не более чем счетно), такие, что множества А40(х') образуют разбиение множества Мо на попарно не- пересекающиеся подмножества. Для любых стратегий х', хЛ i j € I, либо x':Rx>, либо x!Rx‘. Если, например, x'Rx^, то, так как отно- шение R асимметрично и отрицательно транзитивно, x'Rx" для всех стратегий х'£Л10(х'), Л40(х7'). Пост- роим представляющий R скалярный критерий^ W. Опре- делим W (х) = ах для всех х G Л1о (х1). Очевидно, что скалярный критерий W представляет бинарное отноше- ние R на множестве ^„(х1). Предположим по индукции, что определен критерий W, представляющий отношение R 159
на множестве U Af0(xz), где/у= {1, ...,/}. Тогда W (x)—at i € I j для всех стратегий х£ М0(х'), i £ /у, и если x^Rx'i, iit то alt >(1^- Определим критерий W на множестве (J М0(х‘). Представим множество /у в виде /у = /;и//, где и х'1/?х/+17?х'а для всех t\€ //» Тогда min at > maxaz. iei- hi'- Определим критерий W (x) — aJ + i для всех стратегий xCM0(x7+1) таким образом, чтобы выполнялось неравенство minaz > ау+1 > тахйг. Нетрудно видеть, что критерий W i € Ij i € / J представляет бинарное отношение R на множестве U Л10(х'). (el/+t Продолжая описанный процесс далее, определим требуемый критерий на всем множестве Мо. Необходимость прове- ряется без труда. Пример. Пусть на множестве Afo=[O, 1]х[0, 1] за- дан векторный критерий W: Ма—+Е2, №\(хп х2)—хп (*i> xs) — х2- Покажем, что бинарное отношение lex, соответствующее векторному критерию W, не представимо никаким скалярным критерием. Предположим противное, т. е. что найдется скалярный критерий F, представляющий отношение lex на 7И0. Тогда для всех xf € [0, 1] F (xlt 0) < <F(xlt 1) и F (0, 0)<lF(x1, x2)^F(l, 1) для всех страте- гий (х1; х2) Е Мо. Отсюда для каждого натурального k 1 множество P*=|xi€[0, 1]|Г(х\ 1) — F(x\ 0) > -|j. состоит не более чем из конечного числа точек. Поэтому Р = П ([0, —подмножество полной меры отрезка 1 [0, 1] и для всех х^Р F(xit l) = F(x1-, 0) (противоречие). 2.29. Достаточность. Пусть бинарное отношение R асимметрично и транзитивно. Приведем алгоритм построе- ния векторного критерия, представляющего отношение R на множестве Л40 = {хх, ..., х"}. Определим произвольно ’РГДх1). Предположим, что при некотором j < m построен векторный критерий = = (W ..., FS/), представляющий отношение R на мно- жестве М’0={х1, ..., xJ}. Построим векторный критерий U7/+1 = (1V'1, ..., WS/+i), представляющий отношение 7? на множестве s= {х1........х/+1}. Определим следующие мно- 160
жества и величины: M0(x^l) = {x€^+1|(x; V+1), j(*/+1; x)$R}, М+ (х>+1) = {х € М+11 хЯх'+1}, Л40~ (х'+‘) = {х€ М'0+г1 x'+1Rx}; max Wt(x), Мо(х^+1)^= 0, XSMJ-(x/+l) — оо, Afo-(x/+1)=0; min W{(x), (x-'41)^ 0, tf+i = { хбЛ,0 (*/+i) 1 4-oo, МЦх'+1)=0, a{+1 = где i— 1, ...,Sy. Ясно, что a{+l<&{+1, i=l, . ..,Sy, в силу транзитивности отношения R. Если Afe(x/+1)= 0, то опре- делим значения Wf(x/+1), t = l, ..., sJt удовлетворяющие следующим условиям: a{+1 < Wt (х'«) < &{+1, i = 1, ..., sz. Критерий IF/+1 = (IF1; ..WSj), определенный на множе- стве A4j+1, является искомым. Пусть Л4в(х/+1)^= 0. Определим величины с{+1= min WAx), xtM0(A+1) d[+1 — max W Ax). ЩМл(?+1) Рассмотрим следующие случаи. 1) Найдутся номера такие, что flf+l<c{1+1, d<,+x < bi,+1- Тогда определим значения IFz(x/+i), i= 1,..., Sy, удовлетворяющие следующим условиям: is, 4+1 (*/+1) < <+1, 4+1 < wt, (*/+1) < ^,+1- Векторный критерий — WSj), определенный на множестве 7Щ+1, является искомым. 2) Пусть условия п. 1) не имеют места, то найдется номер ii ^.sj такой, что либо а{,+ 1 <с{1+1, либо d{f+1 <^+1. Определим значения 1Гг(х^+1), » = 1, ..., S/, удовлетворяю- щие условиям а{+* < (x/+1) < &{+1,1=5^4; если а?+1 < cjt+1, то а,*1 < lFfi(x/+l) <C;,+1; если < &{,+ 1, то d{,+1 < < ^7/l(x,+1) < 6/t+1. Введем новый частный критерий IFS/+1. » 1904 1 61
Положим №Sy+i (х) = W± (х) для всех стратегий М» (xJ+1) U U М% (х'+1). На множестве 7И0 (х/+1) определим значения U7Sy+1(x), удовлетворяющие условиям а{+1< U^S/+1 (х) < &{+1 для всех х£ Л10(х-7+,)и lTSy+1 (х') < Ws^+1(x"),x', х"g 7И0(х/+1), тогда ц только тогда, когда W1(x') < IF^x"). Наконец, зна- чение wSj+1 (x'+1) определим из условий: если a'*1 <с7+», то max ITs.+1(x)<Fs.+1 (x/+1)<6'i+1; если di.+1 < Ы+1, то 7 7 * a{+1 < WS/+1 (x'+1) < min Ws +1 (x). 7 леЛ10(^+1) 7 Векторный критерий W'+1 = (Wi, ..ITS/+1), определен- ный на множестве Af£+1, является искомым. 3) Пусть условия п. 1) и 2) не выполнены. Определим значения W\(x7+1), i=l, ..., Sj, удовлетворяющие следую- щим условиям: a/+1 < W t(xi+1) < b{+1, / = 1, Введем два новых частных критерия: IFS/+1 и Ws + 2. Определим значения IFS/+1(x), lTS/+2(x) при х$ 2И^+1\{х/+1} таким же образом, как они были определены для критерия FS/+1 в случае 2). Наконец, определим значения FS/+1 (x7+1), (х7’+1), удовлетворяющие условиям max Х/+г (х) <Wif+i (Х/+1) < Ъ[+\ a{+1 < TTS + 2 (x/+1) < min lTs.+2 (x). 7 хем0(/+1) 7 Векторный критерий IT/+1= (W2...W^sy+i, l^S/+2), опре- деленный на множестве Ml+1, является искомым. Повторяя описанный процесс не более чем т раз, по- строим требуемый векторный критерий. 2.30. а) Представляющий отношение R векторный кри- терий № = (№!, 1Г2) зададим в виде матрицы (r,M) = (Zi ? _? -I I). Если бы существовал скалярный критерий, представляющий отношение R, то его значения были бы равны на стратегиях х3, х4, Xs, поскольку (х4, х3), (х8, х4)^/?. Но тогда (х8, x3)(£R (имеет место противоречие). Итак, dimR = 2. 162
б) Представляющий отношение R векторный критерий = ..., Wk) определим следующим образом: ГО, i = j, ( 1, i = /, ’W-U Предположим, что существует векторный критерий W = = (Ц7', .,., ITs), где s < k, представляющий отношение R на множестве Мо. Положим aJ= W (х;), ^= W (у'), j=\.k. Покажем, что среди векторов а1, ак найдется вектор а1 с таким номером I, что ft^maxfej, f=l, ...,s. (1) В самом деле, пусть для каждого I найдется номер 1(1) та- кой, что b[a> > max Ь{(1>. (2) Однако, поскольку s<k, найдутся /х^/2 такие, что i(/x)= = i (Z2), но это противоречит неравенству (2). Итак, спра- ведливость утверждения (1) доказана. Так как x'^t/при всех / I, то а1, > max b{, i = l, ..., s. i&i Отсюда и из (1) следует, что х1>у1 и векторный критерий W не представляет бинарное отношение R (получено про- тиворечие). Итак, dim R= =k. в) Представим отношение древесного порядка в виде гра- фа-дерева. При этом стратегиям из множества Л4о соответствуют вершины графа и xRx' тогда и только тогда, когда вершины х и х' расположены на одной ветке дерева, причем х ближе к корневой вершине дерева, чем х'. Будем строить векторный критерий IF=(IFi, 1F2) так, как это изображено на рис. 16. Проведем на плоскости (иъ и2) значений векторного кри- терия W прямую ЛХВ1, пересекающую оси координат, т. е. имеющую отрицательный угловой коэффициент. Корневой вершине дерева сопоставим точку О, из которой проведем параллельно осям координат штриховые линии. Вершины Дерева первого уровня расположим на прямой А1В1 внутри
прямого угла CiODi. Далее, из каждой вершиных первого уровня проведем штриховые прямые, параллельные осям, и затем построим такую прямую А 2В2, параллельную АгВъ что никакие два треугольника вида C2xD2 не пересекаются. Оче- видно, это всегда можно сделать, если взять А2В2 достаточно близко к Л1В1. На прямой А2В2 внутри угла С2хЬ2 поместим все вершины второго уровня, предшествующие х, т. е. такие вершины х', что xRx' (рис. 16). Аналогично можно построить вершины (/+1)-го уровня, если построены вершины дерева уровня I. Через конечное число шагов процесс закончится, поскольку конечно дерево (число элементов множества /Ио). Для формирования искомого векторного критерия W в силу проведенных построений достаточно каждой стратегии х£М0 сопоставить в качестве (№\(х), №2(х)) координаты соответ- ствующей вершины дерева на плоскости (th, и2). Действитель- но, никакие две вершины одного уровня не связаны отноше- нием >, поскольку они лежат на одной из прямых AtB( (если Wi(x)>Wi(x’), то W2(x')>Wi(x), и наоборот). Вершины х и х' разных уровней связаны отношением > тогда и только тогда, когда они лежат на одной и той же ветви дерева (для этого и построены прямые углы вида C2xD2 на рис. 16). 2.31. Если а<6<а+1, то последовательность хк>Ь, k=\, 2, . . . , сходящаяся к Ь, является лексикографически максимизирующей, а эффективная последовательность не существует. Если а+1=Ь, то последовательность х =Ь, 6=1, 2, . . . ,— лексикографически максимизирующая и эф- фективная. Если либо Ь>а+1, либо Ь<.а, то последователь- ность xft>a, 6=1, 2, . . . , сходящаяся к а, является лексико- графически максимизирующей и эффективной. 2.32. Пусть Л40={х*, 6=1, 2, ...}с£2, 1Г:М0->£2, где ((1 — 1/6, 0), 6 = 2, 4, 6, .... х* = (1, 1), ^ = 3) 5> 7... W1(x)=xi, 1Г2(х) = х2. В этом примере критерий Wi представляет бинарное отно- шение ^1ех, а /И1 = /И2= {х1}. Последовательность хк, 6 = 2, 3, .... максимизирует критерий Wlt но не является лексикографически максимизирующей. 2.33. а) Если СЛо=0, то утверждение очевидно. Пред- положим, что CR^0 и найдется стратегия р'g/(СЛо)\СД1. Тогда найдется стратегия р' такая, что pR1pl- Рассмот- рим стратегию х' £f~1(p,)(}CR. Согласно условию согласо- вания, найдется стратегия х£/-1(р) такая, что xR^x', что противоречит принадлежности стратегии х' ядру CRt. 164
Утверждение б) доказывается аналогично. Соответствую- щие утверждения для решений в общем случае не имеют места. Пример. УИ0={х1, х2, х\ х4}, М1== {р\ р2, р3},/(х1^ = f(x*) = p\ f(x3)=p\ f(x*) = p\ 7?o={(Ax2), (x\x3), (хЪ x3), (X3, x4), (x4, X1)}, R^p1, p*), (p? p3), (p3, p1)}. Можно проверить, что отношение 7?0 согласовано с отноше- нием /?1( ={х2, х4}, УЛ =0 и утверждение а) не верно. 4.34. а) Отношение /?0 согласовано с отношением Rx при а г^2. При любых значениях а отношение не согласо- вано с отношением Ро; С>х = {р2, р3}, {х\ х3}, 2 <а<2^2, {х1, х3, х4}, 2рЛ2<а, {х3}, 1^а^2, {х2, х3}, а<1. б) Отношение согласовано с отношением при 0 > а. Покажем, что отношение /?0 не согласовано с Rt ни при каких положительных значениях а и ₽. Пусть р>р’^Р и (х'и х2) = ((р'—Р)/а, 1). Тогда для любой стратегии (хо х2)С/-1 (р) необходимо выполнено неравенство хх^(р—0)/а, что вытекает из неравенства х,^1. Отсюда —хх + х2 с (₽—р)/а +1 < (р'—0)/а +1 = — х; + xj, т. е. неравенство (xit х2)^0(х[, х2) не выполнено и R9 не согласовано с Rt, С>о = {(х<» x2)gM0|x2= 1}, С>1 —{а + Р}. 2.35. a) C>t = {x*. х2}, С>2 = {х1, х3}, С>3 = Ме‘, б) С>1=С>2 = {х\ х3, х4}, С>з = {х3, х4}. 2.36. а) Покажем, что C>i =С>2 = Afe. Рассмотрим про- извольные стратегии х^х' £МЛ. Поскольку х=#х\ найдется номер i\ такой, что xti < xj. Для стратегии защиты у' такой, что = W{i(x, yXW^x’, у’) при всех следова- тельно, (х, x')^Rt. Для стратегии защиты у1> такой, что у'^ — В, Wtt(x, yil)<Wlt(x', у') при всех у' £N‘, следова- тельно, (х, x')^7?j. Нетрудно показать, что С>3 = {х^Л40| либо х^О, либо xt^ptB для всех 1=1, ..., п}. б) Достаточность. Пусть для вектора и^Еп+ вы- полнено неравенство, содержащееся в условии задачи. Если /(«) = 0, то, очевидно, вектор и достижим. Будем считать, 165
что 1(и)^0. Рассмотрим вектор х'£Е“ такой,'ч гр J Ui + Bpt, i£l(u), 0, Просуммировав х\ по i € / («), получим 2 xi= 2 ui+в 2 pi • t€/(w) i€/(w) i€/(«) Отсюда следует существование стратегии х£Л40 такой, что Xi^x'i, i=l, ..п. Для любой стратегии защиты y£.N имеем TTJ(x, p) = max(xz—ptyt, 0)>max(X-—ptB, 0) = ut для i£l(u), ITz(x, y)^0 = u{ для i(£l(u), что означает достижимость вектора и. Необходимость. Рассмотрим стратегию защиты yf такую, что y'j = B. Тогда W}(x, «р) = тах(ху—pjB-, 0)Z> >Uy>0 для j£/(u). Отсюда Xj—pjB^Uj для /€/(«)• Следовательно, 2 uj^=. 2 xj—& 2 —& 2 Pj- jel(u) iiiw /€/(«) /€/<«) 2.37. а) С>1=С>2 = С>3 = М0. 2.38. а) Стратегия тогда и только тогда принад- лежит ядру , когда для любой стратегии <р' € Sm выпол- нено неравенство ~q PiPt Н" зб РъР» + ]2 Р*Р% “Ь j2 РгРг < у PiPi + Р2Р3 + Т2 РьР* + А р'гр2 ИЛИ Р1 ("б"Р*) + р2 (36 Рз Т2Р*} + Р3 ( 36^) + + P4(iI2P2—6 PiJ^°- Отсюда следует, что C^ = {q>€Sm|p2<2p1, р8 = р4 = 0}. б) С^ = {(1, 0, 0, 0)}. 2.39. Указание. Показать, что стратегии являются оп- тимальными стратегиями первого игрока в матричной игре с матрицей 166
г,д,е aiii2==: 2 ^/1^/2 2 fyifyv h> i*- n . /v /2- „ (Zi> i2. /1, /2) € R {iit ii, /2» /1) &R 2,40. a) C$1 = {(0, 1)}; 6) C$2 = S2. Глава 3 3.1. Критерий эффективности К(%(•)) = J a(s)x(s) ds4-A4, s где M— J c(s)ds; ограничения на стратегию х(-): s 0<x(s) ^b(s) при s$S и x(s) ds С К. s Рассмотрим следующие два случая. 1) b(s) dsC-K. При этом Fo= max F(x(-))=Sa(s)b(s) d s 4- М s *<•> s и оптимальной является стратегия x°(s) = b(s), s^S. 2) $6(s)ds>K. Определим a, 0, OC0C1 так, чтобы s J &(s)ds4-0 J b(s)ds = K, Si (aj S2 (a) где Sj(a)= {s€S| a(s) > a}, S2(a) = {sCS|a(s) = a}. Тогда Fo = $ b (s) a (s) ds + 0 J b (s) a (s) ds -j- M.; S,(a) S2(aj оптимальной является стратегия x° (s) = 'fe(s), seSja), любое значение из отрезка [0, fe(s)] при s^S2(a) и такое, что x°(s)ds = K; Si (ajus2 (a) < 0, s С {s С 51 a(s) < a}. 167
3.2. Если $ ds/a(s)< 1, то Fo== max (F(x (•))=$ ds и ©n- s s тимальна любая стратегия x°(s)^ l/a(s), удовлетворяющая ограничениям. Если же J ds/a (s) > 1, то задачу можно записать в сле- s дующем виде: найти max \ a(s)x(s)ds при ограничениях *(•) s 0<x(s)< l/a(s), Jx(s)ds = l. Решение этой задачи s найдено в 3.1 при b (s) = l/a(s). Решим теперь вариант б). Имеем f ds 2 + 1 J a(s)~ аГС ‘ — 1 Определим^ из уравнения arcctg Vk — Vk /2. Если k < k, то Е0 = 2(1—s), х® (s) = Й-f-S2’ Is I > s» J), | s | s, где s = Kfe(l_—Kfetg(K^/2))/(K^ + tg (/ft/2)). При k^k имеем Eo = 2 и оптимальной является любая допустимая стратегия x°(s)^ 1/(& + s2). 3,3. 1) Пусть х® > О и Ог^е^х?. Введем функцию Ф(8) = /,(х?—e) + Z/W + e)+ 2 7feW)> k=/= i, i Вектор (x?, ...» x?—e, x®4-e, x£) удовлетворяет ограничениям задачи. Так как функция <р(е) имеет макси- мум при е = 0, то <р'(0)^0 или /Дх“) (х®). Если одно- временно х® > 0, то справедливо и обратное неравенство /zWX/Дх?), т. е. /;(х?) = %-при х® > 0. 2) Докажем достаточность условий (3.2). Пусть х°—оп- тимальная стратегия. Тогда для любого распределения ре- п сурсов х = (хх....Х„), Х£^0, 2 xi — X в силу вогнутости 168
fa, имеем 2 Ш)- 2 = 2 [f,(^)-A(x?)]< i= 1 i=1 1 = 1 < 2 fi W) (xt—%?) = 5 f'i W) xt+ i=1 i:xJ=O + 2 2 ^/+ 2 ^(xi—хЪ= i:x®>0 i:x®=0 f:x®>0 = X 2 (xt—x?) = X(X—X) = 0. n 3.4. Задача состоит в максимизации 2 Pi(l—e-6«*') при i = 1 n условии 2 xi = X> xz>0. По лемме Гиббса, Pib^~biXi= X, x{ > 0, ^X, x{ = 0. Если рД-<Х, то X/ = 0. Если же р(Ъ{>К то xz = y-ln-^. Пусть Л(Х)= 21 ‘Г1п^Г£- Можно проверить, что функция h(X) непрерывна и строго убывает при 0< XCp = tnaxp(i>z. При этом Л(Х)>Х для достаточно малого X. Таким образом, вытекающее из огра- ничений уравнение й(Х) = Х имеет единственный корень X, определяющий искомое значение параметра X. При p{bi = const (п \ -1 . •=!..............................."• k= 1 R / 3.5. Критерий эффективности т Г(х(.), «(.))=$[!—n(/)]x(/)d/. о При оптимальна стратегия ы“(/)==0 и F9= max Е(х(>), и (-)) = 4 [1 — е-₽г]. х(’)» «(•) р 169
Пусть а > р. Применим принцип максимума Л. С. Пон- трягина. Сопряженная система имеет вид (/) = —[аи (0-Р] ф(0-[1 -и (/)]. Ф(Т) - О, а гамильтониан—следующий вид: Н = [аи—Р] х (i) ф (t) + (1—u)x(/) = = [ах (t) ф (t)—x (0] и—P* (0 Ф (0 + x (t). Производная -^[ах(£)ф(0—x(£)] в силу системы отрица- тельна, следовательно, w°W = {o, Отсюда находим соответствующую траекторию: Х° = ( ае^»е-₽', значение функционала Fo—функция от /0: f (t,) = | [1 —e-₽<r Оптимальное значение t0 находится дифференцированием: t ={7’+|1п(1-р/а), Т>||1п(1-р/а)|, (О в противном случае. 3.6. Если Т ^1, то u°(t)==—1. При Т > 1 оптимальным является управление u°(/) = | На отрезке [1, Т] оптимальное управление нельзя опре- делить из принципа максимума, так как гамильтониан тож- дественно равен нулю («особое» оптимальное управление). 3.7. Любая последовательность {ип (£)} управлений, для которой |и„(/)| = 1, | уп (01 Мп, является максимизи- рующей. Например, — (—l)ft при k=l, ..., п—1. При этом соответствующие траектории сходятся равно- мерно по t: xn(t)—^x°(t) = t, yn(t)—+ Однако x° U)> У° (0 не являются решением системы. Таким образом, в данной задаче не существует оптимального управления. Существует лишь е-оптимальная последовательность управ- лений, для которой соответствующая последовательность 170
фазовых траекторий сходится равномерно (так называемый «скользящий режим»). 3.8. Пусть К — количество средств, сохранившееся после (/ — 1)-го года; xz, yt—вложения в отрасли 1 и 2 в l-м году; Wt (К)—максимальный суммарный доход, который можно получить за I, /4-1, .... т годы. Уравнение Веллмана имеет вид W\(K) = max [/1(xz)4-f2(//z)4-^/+i(^i(xz)4-^(//i))]- 0<xz<K Здесь i)i = K—xt, Wm+i(K) = 0. Максимальный доход за tn лет равен W\(/Q- а) Оптимальные вложения средств в отрасли: Отрасль Год 1 2 3 4 . 5 1 10,0 7,5 5,6 0 5 2 0 0 0 4,2 1,3 При таком распределении средств остаток в конце пятого года составляет «0,4 и за пятилетку будет получен макси- мальный доход, равный IF°«22,7. б) Оптимальное распределение средств: Отрасль Год 1,60 0,40 1,02 0,62 0,30 0 0,30 0,24 0,24 0,30 При таком планировании будет получен максимальный доход за 5 лет, равный Ц7°« 4,35; остаток средств в конце периода «0,09. 3.9. Задача состоит в нахождении xit ...; хп, миними- п зирующих 2 fk(xk) ПРИ ограничениях fe— 1 I Xf^ bi, [Xi + x^bi + bi... где xi—количество станков i-ro типа. 171
Обозначим через W\(£) значение минимума' функции i 2 fk(xk) с ограничениями &= 1 г Lf . Xt + Х2 ^8* < -ф . . . 4~ Я; ’ s где Ls— 2 bk\ s=l, .... п. Тогда для №,(£) справедлива t= 1 следующее уравнение Веллмана: lF,(g)= min {/,(*,)4-^-!(max[А,-,, В—хг])}, 0<x(<4z(g) Л/(|) = тах[0; g—Lj.J, Lf<KL„. а) Используя полученное уравнение, находим, что опти- мальной является стратегия х° = (3; 0; 7; 0). б) Оптимальная стратегия находится следующим образом. Занумеруем все ак, k = 1, ..., п, в порядке неубывания: aki, akt, .... акп, где ak.^aki+1‘, 1 = 1, .... п—1. Оптимальный выпуск станков типа kr равен сумме потребностей в тех станках, которые могут быть заменены станками типа kv Оптимальное количество станков типа kt равно сумме по- требностей в станках, которые заменяются станками типа kv но не заменяются станками типа и т. д. В том случае, когда а* > >... > а„ (т. е. более совер- шенный станок является более дорогим), решение задачи единственно: хй — (Ьь bit .... bn). 3.10. Пусть с(х)—цена партии цыплят в х штук, г(х) — затраты на недельное хранение; xz—количество цыплят, куп- ленное предприятием в i-ю неделю, 1 С i С 5. Тогда задача отыскания оптимального плана закупок сводится к мини- мизации 5 4 / i \ 2 c(xt)+ 2 42 х/—зоо») i=i i=i \/=i j t при ограничениях хх4>600; 2 х/^>3001; 2 ^1^5. Пред- положим, что за i недель уже закуплено В цыплят. Обо- значим через W\(g) минимальные суммарные затраты на покупку (1500—|) цыплят и их хранение в течение 1+1, ..., 5 недель. Для (£) справедливо рекуррентное соот- ношение FA^minf^x^O+r^+Xj^-SOOG'+lB+Ft^^+x^O}. xi+i 172
Здесь 300i^£^1500, так как потребность в цыплятах должна удовлетворяться и max[0; 300 (г +1)— ^1500—1Г4 (Ej) = c(1500—Ej). Итак, И70 (0)—искомые затраты. Так как х,^600, то решение полученного уравнения Веллмана не выходит за первые шесть строк таблицы, при- веденной в условии задачи. Итак, 1уо(О) = 2ОЗО; оптимальной является стратегия х»«=(600; 0; 300; 600; 0). 3.11. Обозначим через хп число компонент в блоке п, а через рп(хп) вероятность его функционирования. Пусть сп(х„)—стоимость включения хп компонент; s—количество денег, которое осталось для создания блоков п, п 4-1, .... Составим уравнение Веллмана: F„(s)= max W„(s, х„), Хп 5s 1, 2, 3 где IT„(s, хп) = pn(xn)Wn+i(s—с„(х„)). Здесь Wx (100) — иско- мая вероятность. При и = 4 имеем S x° X4 0<s< 19 0 0 20<s<29 0,60 1 30<s<39 0,70 2 40<s< 100 0,90 3 При п — 3 s r3(s, XJ W9(s) 0 1 2 3 0<s<29 0 0 0 30<s<39 0 0,42 0 0,42 1 40<s<49 0 0,49 0 0 0,49 1 50<s<59 0 0,63 0,54 0 0,63 1 60<s<69 0 0,63 0,63 0,57 0,63 1, 2 70<s<79 0 0,63 0,81 0,665 0,81 2 80<s< 100 0 0,63 0,81 0,855 0,855 3 173
При n = 2 S (s x2) X2 0 1 2 3 0<s<59 0 0 0 0 0 60<s<69 0 0,245 0 0 0,245 1 70 < s < 79 0 0,315 0,294 0 0,315 1 80 < s < 89 0 0,315 0,343 0,336 0,343 2 90<s<99 0 0,405 0,441 0,392 0,441 2 100 = s 0 0,4275 0,441 0,504 0,504 3 При n = 1 s Wi (s, Xi) Wt(s) 0 1 2 3 100 0 0,3087 0,2744 0,2835 0,3087 1 Таким образом, оптимально следующее резервирование: х°= =(1; 2; 1; 3). 3.12. Выпуск продукции максимальной суммарной стои- мости находится из решения задачи линейного программиро- вания: Xi + 2ха —» max, ' 2xt + 4x$ sC 11» 4~ 3x2 ^7, 2xi + xt ^10, xit x2^0. Множество решений этой задачи есть отрезок, соединяющий точки (5/2; 3/2) и (29/6; 1/3). Оптимальной является страте- гия х°=(3,1; 1,2) — точка на отрезке, ближайшая к точке (3; 1). При этом стоимость выпущенной продукции равна 11/2, а сто- имость перестройки 0,3. 3.13. max z=10; х°=(4/3; 14/3). 3.14. Двойственную задачу 3^ + ^ —-max, /2^—у2^1, — z/i + 3i/2<l, (31/!—4у2<2, — 2i/i + 4i/2<8, yit у2^0, можно решить графически. На основании теоремы двойственности min г=3. Этому условию и ограничениям прямой задачи удовлетворяет един- ственная точка (2; 1; 0; 0), которая и является решением. 174
3.15. Рассмотрим задачу линейного программирования: max (хх + х2), —x2 + x2^0, (2х2—2х2 0. Здесь Х° = {(1, 1)} и d = 2. Построим следующую задачу: max (Xi + x2), х2—(1—6)Xi^0, \2(1 + 6)Х1—2х2<0. При любом 6 > 0 имеем Х° (6) = {(0, 0)} и d (б) == 0. 3.16. Если бы множество решений Х° задачи (3.3) было неограниченным, то оно содержало бы луч х (/) = х° + tl, / > 0, х° £ Х°, || 11| = 1. При этом (с, (х (/)) = d для всех t 0, т. е. (с, /) = 0. Выберем теперь в задаче (3.4) вектор с(б), удовлетво- ряющий условиям (3.5) таким, чтобы (с (б), /) > 0, и поло- жим А (б) = А, b(б) = 6. Тогда (с(б), х° + //)—> оо при /—<-оо для любого б > 0, т. е. задача (3.4) имеет неограниченную на допустимом множестве целевую функцию. Это противо- речит как устойчивости по решению, так и устойчивости по функционалу. 3.17. 1) Пусть задача (3.3) устойчива по решению. За- дадим произвольное 8 > 0. Пусть б0 > 0 таково, что при всех б 60 множество Х° (б) принадлежит 2 (j| -окрест- ности Х° и, кроме того, 60^mln/1; —8 \. Заметим, r > I 2max[|x|| I \ хеХ° J что в силу утверждения из задачи 3.16 величина r = max||x[| конечна. Тогда М-d (б) |К | (с (б), х»(б)-х’)| + +1 (С (б)-с, х°) К || с (б) ||р + г || с-с (б) И, где р—расстояние от решения х° (б) задачи (3.4) до мно- жества решений Xй задачи (3.3), равное |]х°(б)—х°|]. Так как Р<-g(и4+1) и Иб)1КМ + 1к—<Чб)11<Н+1 всилу выбора б0, то |d—d (б) | е при б б0, что и доказывает устойчивость по результату. 2) Как показано в задаче 3.16, множество решений Х° задачи (3.3) есть многогранник, т. е. ограниченное много- 175
гр энное множество Х°={х|(с, x)^d, Ax^.b}; fia,p='W(s> x)>d—0, Лх<6 + а} также многогранник при любых а, 0 > 0 (доказать!). Выбе- рем такое б0, что при всех б^б0 и всех х£Ва,₽ |(с(б), х)—(с, х)—d(6) + d|<8 (б), ||Л (б)х—6(6)—Лх + &||<е(б), где е (б) min (а/2, 0/2). Это всегда возможно, так как задача (3.3) устойчива по функционалу. Легко проверить, что Х° (б) Ва/2, р/2, т. е. множество Х“(б) ограничено. Пусть x = litn х° (6ft), где 6fc—>-0, х° (6ft) £ Х° (6ft). Тогда i(C, 7)-di<im), x«(6ft)-*)i+ + |(c(6ft)—с, x)j+|d-d(6ft)|< М+1И1№)-dl+M- Правая часть неравенства, по предположению, стремится к нулю при k->-co. Кроме того, ясно, что х—допустимая точка ь задаче (3.3), поскольку многогранники Ва, р при а, 0—>0+ сходятся (в метрике Хаусдорфа) к многогран- нику решений Х°. 3.18. Пусть ог—количество сырья i-ro типа, закупленное предприятием, а Му—количество продукции, произведенной /-м технологическим процессом. Положим v = (vlt .... v„), и = (и1,..., ип). На контролируемые факторы x=(u, v) налагаются следующие ограничения: п ^2 CifUj^v{, Z=l, ..., tn-, (1) т 2 РА В > (2) i = i «у, v,0, 1</<м, 1^1 ^т. Критерий .эффективности п F(x)= 2 <*/«/• / = 1 Найдем оптимальную стратегию предприятия х° = (м°, у0). Вначале покажем, что для оптимальной стратегии х° в (1) и (2) все нестрогие неравенства выполнены как равенства. В самом деле, предположим, например, что найдется номер 176
п i0 такой, что S ci<,lu<i < • Тогда v° > 0 и найдется вектор v с компонентами Ч°.-е, i = ia, ЦО | Р»Л V( + Pi(n— 1) ’ f 5^ ^о> такой, что при достаточно малом е > О п 2 < V[> »= 1» • • •. tn. i = i Отсюда следует, что найдется и, удовлетворяющее (2) и й) > /=1, .... п. Очевидно, что W (х) > W (х°), где х=(и, v). Последнее противоречит оптимальности х°. Ана- логично доказывается, что для оптимального х° неравенство (2) выполняется как равенство. Из равенств (1) и (2) сле- дует, что т tn / п \ п 2 рл = 2 рд 2 %«/ )= 2 Р/«/=в. i=i i = i v=i 7 / = L tn где p;= 2 Pici/< i—^< •••> n>—стоимость сырья, необхо- i - 1 димого для производства единицы продукции / технологи- ческим процессом. п Итак, нужно максимизировать функцию 2 dju/ ПРИ ог’ / = 1 п раничениях 2и/м/ = ®> «/^>0. /=1» •••» п- Оптимальная стратегия предприятия х° = (мв, и°): о_ |0, / ^/в> Ы/-\В/И/„ / = /0; = i=l, ...» т, где /0 определяется из условия dyB dy0B max — = -i— И/ Н/о Отсюда следует, что оптимально производство продукции любого вида при условии dy/py =.const. 177
ja+p+Va“R3vV 3.19. Оптимум тахы(х) =----------a «"У можно 7 x ’ (a+₽+y)a+₽+vp?p24 найти, используя правило множителей Лагранжа; он дости- гается при J _ Р14 _ Р2*2 _ Рз4 « + P4-V — а — — У ’ 3.20. Метод множителей Лагранжа неприменим. 3.21. min z=15; х° = (2,5; 3,5). 3.22. Локальные максимумы достигаются в вершинах многогранника условий. 3.23. Задача распределения ресурсов по подпрограммам состоит в максимизации функции k и) при следующих ограничениях* k = S' (2) 0s^Xi^Pt, i=l, .... k, (3) где k ^Pt>S. (4) i = 1 Пусть числа p/ = P//a/ расположены в порядке возрастания: (5) Рассмотрим последовательность {XJ, k г-i k Xr = Siy a/t ki = S— 2 P/I’Z a/> i=2, (6) i/=l j = i I j = 1 Пусть n—наименьший индекс, удовлетворяющий условию Существование такого индекса вытекает из нера- венства Кк < следующего из (4). Покажем, что распределение Pf, i < n, X„ar, i n, (7) является решением задачи. Для этого докажем сначала, что если уО уО — , то = (8) а/ ay ’ t \ / 178
Допустим противное; тогда существуют два индекса i, /, для которых выполнено неравенство (8), однако x°z < Pt. Рассмотрим набор у = (у±, ..ук), где у{ = $, l=£i, j; + yj = Xj—Д; Д>0 достаточно мало, чтобы у удовлетворял ограничениям (3). При этом /(«/)>/(*“), по- скольку это неравенство эквивалентно следующему нера- венству! Д£_^. + о(Д)/Д>0, Полученное противоречие доказывает утверждение (8). Из (8) вытекает, что множество индексов К = {1, 2, &} раз- бивается на два подмножества K = L(xl>)(jM(xll)l так что х1 = Р{, i£L(x°); xKPi, i$M(x°), и x’/az = xj/ay при i, ]£М(ха). Если же i^L(x°), j£M(x°), то ~а/ а/ (9) Для любых двух решений х°, г/° задачи выполняются равенства L (x°) = L (i/0), М (х°) = М (z/°). Предположим, что это не так. Тогда найдется (^Цх0), i^L(y°). Следовательно, f/“<Pz = x®. Но в этом случае существует /, для которого y°i>x‘j. Отсюда вытекает, что j(-M(xa) и xfya^^.x'jla.j со- гласно неравенству (9). Рассмотрим цепочку неравенств «/®/az < x“/az ^х’/а^ < < tfilaj. Из (8) имеем равенство — Р{, что противоречит условию i£L(y°). Таким образом, решение задачи (1)—(3) единственно. Пусть, далее, Pi Р/ (Ю) № Pi тогда = В самом деле, если х?<Р/5 то р/ и из (8) получаем = Решение задачи (1) — (3) без ограничений xf i= 1, ..., k, как следует из (8), определяется формулой Итак, структура решения х° такова: несколько первых переменных х? (соответствую- щих наименьшим отношениям Pz/az) принимают максимально допустимое в силу (3) значение, а оставшееся количество ресурса S делится между остальными переменными пропор- ционально az. Из (6) и (7) следует, что при распределении остатка ресурса по переменным {хл, хА}, согласно (7), 179
условие (3) эквивалентно требованию j = n, ..., k. В силу (5) для этого достаточно потребовать, чтобы Ал^р„. Действительно, на основании выбора п имеем An_j > pn_t или 2 Р/ > ?п-1 2 a//an-i > ?n-i) i = i .j=n-l откуда получаем (4). ; 3.24. Для задачи линейного программирования решением является х° = (0; 1,75); с округлением—х° = (0; 1), для це- лочисленной задачи—х° = (1; 1). 3.25. a) min г = 708/49, х° = (33/7; 6/7); б) max г = 8 + 3/13; х“ = (2 + 9//ТЗ; 1+6//13); в) max z = 45 + 3 /77; х° = ((9 + /77)/2; (9-/77)/2); г), д) max z=18, х° = (3; 2)., 3.26. а) х° = (3; 2; 0), max 2 = 34; б) х° = (4; 0; 1), при этом 2 = 33. 3.27. х° = (0; 6; 1; 0). 3.28. Решением задачи является, очевидно, некоторая «-перестановка чисел o = <ix; i2; ...; ...; i„>, соответ- ствующая очередности приема посетителей. Обозначим через /До) время начала приема i-ro посетителя. Тогда суммарное время F(o)=2W 1 — 1 Предположим, что a1 = <i1; ...; i; /;...; i„>—оптимальная стратегия, реализующая минимум F (о). Применим переста- новочный прием [61]. Поменяем порядок каких-то двух по- сетителей, принимаемых в стратегии о1 друг за другом: a2 = <i1; ...; /; /; ...; /„>. Тогда F(o1)=X + /f(o1) + //(ol), F(o2) = X + Z/(a2) + //(a2), где А—общая неизменная часть F (о), так как время ожи- дания в приемной посетителей, имеющих номер, отличный от I, /, не изменилось в случае применения стратегии о? по сравнению со стратегией о1. Так как о1—оптимальная стратегия, то F(a‘)<F(a*). (2) 180
Пусть т—момент окончания приема предыдущего посетителя для i-ro посетителя в стратегии а1, /-го—в а2. Тогда ^(а1)==т, i [a1) = x-\-Tt, tA<F) = xt tl{<3i) = x + T/. Согласно (1), (2), т^т}. Последнее означает, что оптимальной является очеред- ность, соответствующая порядку возрастания Т{, i= 1, ..., п. 3.29. Можно считать, что в оптимальном решении поря- док обработки деталей на первом и втором станках один и /тот же и задается перестановкой an = <ix; ig; ...; i„>. Рассмотрим фрагмент графика — <i1; ...; tft>, k < п. Введем следующие обозначения: А (ок)—время окончания обработки деталей в графике ок первым станком, В(ок)— вторым станком. Очевидно, что 4(aft+i) = 4(<r*) + az, B(a*+1) = max[A(oft+1; B(<Jft)]+&z, где = i>. Критерием оптимальности является В(рп). Пусть о£ = = <t\; ...; ik, i-, j; ...; i„> — некоторое решение. Построим о2=<1\; ik, }; i; ...; i„>. Обозначим А(ак) = х, B(aft) = r + &. Тогда в o£: B(<$+1) = max.(x + at; ? + &) + &„ далее имеем Л (ak+i) — T + ai + fi(aA+2) = max(T + az + a/; max(T + az; t + A) + &/) + &/. или 5(^+2) = 't + ^/+max(a/ + a/; az + &z; A + bz). Аналогично для получаем т + ai + aj\ ^(ofe+2) = T-b^/ + max (a/ + ^z; Лу+^/> A-)-ty). Если В (o^+2) В (о|+2), то первое решение «не хуже» вто- рого, так как второй станок освобождается раньше. Это неравенство эквивалентно следующему неравенству: шах(—Ь{, —af; А—at—ay)^max(—bJt —а{; A—at—a/). (1) Неравенство (I) выполняется, если max(—bt\ —aj)^ sCmax(—bf, —dj), что равносильно выполнению неравенства min(az; 6y)<min(ay; bt). (2) 131
Итак, если соотношение (2) имеет место, то I предшествует / в ол. Нетрудно обнаружить, что (2) выполняется, если: a) at^blt af^bj, б) at^bt, a.j > bf, в) a^bi, aj^bj, bt>bf. Это можно сформулировать в виде решающего правила. Пусть имеется k таких i, что Тогда, если att^bt для и, кроме того, при l<k, ati'> bit при />й и, кроме того, btt^b( f при l>k, то решение ол = <11; ...; i\; ik+i- i„> является оптималь- ным. Согласно решающему правилу, сначала выбираются детали I, для которых время выполнения первой операции а{ меньше, чем для второй операции Ь{. Эти детали обра- батываются в порядке возрастания а{. Остальные детали обрабатываются в порядке убывания Ь{. Решение примера: <4; 2; 6; 3; 5; 1>. 3.30. Пусть Ъ, и т)—время, необходимое на процесс плавки и литья для 1 т стали и металлолома соответственно. По- ложим x = (xi, х2), у = (В; т])- Контролируемый фактор х С А40 = {х 10 < Xi С 4, 0 ^х2^6}; неопределенный фактор у£ N— {i/j 2,5 1,5^т]^2}; критерий эффективности W(x, у) = где Q={(x; «/)|x€Ai0, х2/хх<7/8; Xi + x^>5; + < 18}. —3xj — 5xa, (x; y)£Q, —oo. (x; Стратегия: x = xgM = M0. Необходимые и достаточные уело- ; вия гарантированного выполнения условий задачи таковы: xJXt^.7/8, 0<х,<4, 0<х2<6, Xi + x2^5, ЗХ1 + 2х2<118. ' I Оптимальная стратегия х° определяется из решения задачи линейного программирования —Зхх—5ха —> шах при огра- ничениях (1) и равна х° = (4; 1). 3.31. Обозначим через xt число диспетчеров, ежедневно приступающих к работе в период времени t, 1 t 6. Тогда задача составления расписания сводится к минимиза- 6 ции функции г = 2 х* при следующих ограничениях: xt4- / = i + xe>20, х2 + х1>50, х34-х2>80, х4 + х8^ 100, х6Ч-х4^ . 40, xe + x5^30, xt^0—целые /=1, .... 6. 182
Двойственная задача линейного программирования w = 20#1 + 50#2 + 80#з +100 + 40г/5 + 30r/e -> max, 1 о о о о 1 1 1 о о о о о 1 1 о о о о о 1 1 о о z/z>0, 1=1, 6, имеет решение у° = (0; 1; 0; 1; 0;1), max ш= 180. Отсюда, используя теорему двойственности, находим решение пря- мой задачи линейного программирования х° = (0; 50; 60; 40; 10; 20), min z=180, которое оказывается целочисленным и, следовательно, дает оптимальное расписание. 3.32. Проведем доказательство по индукции. При п=1 очевидно, что утверждение справедливо. При и = 2 получаем (аД + аД)— (аД+аД) = (Я1—as) (!h—bt) > О, т. е. аД+аД > a1bi-\-a2b1. Предположим, что утверждение справедливо при i = — 1, ..., j = 1, ..., k; покажем, что оно верно и при А 4-1. Можно записать а{ = ак+1-\- р{, bt = bk+1-\- qt, где р{, qi>0, Pk+i — <7й+1 = 0- В результате подстановки получаем k +1 /г +1 /г+1 /г+1 2 aibj=<ik+Д+1+ S ^+iP/+S aA+i?/+ 2 Pi4j- i, j~l i= 1 /= 1 i, /= 1 Первые три слагаемых в правой части равенства не зави- сят от того, равны i и j или нет; следовательно, являются константами. По предположению, ak+i + = at > ai+f, та- ким образом, p{ > p/+1. Аналогично, q{ > q{+1. Теперь, если A-’+l Лг +1 k . 2t Pi1!) содержит член рк^ ?ft+1 = О, то . Pflj= . 2) Ptij достигает максимума при i = /. Рассмотрим теперь случай, когда два члена в сумме Рл+19$» Qk+iPt* l^s, равны нулю. Тогда сумму можно записать следующим образом: /г+1 k 2 р1<ь= 2 p{qj—ptqs- i,j=l i, /=1 По предположению индукции, сумма в правой части равен- ства максимальна, если i=j, и так как ptqs > 0, то /г+1 k k k+ 1 2 m-= 2 2 Piqj—Ptqs= 2 ры- 1= 1 4=1 Ь/=1 Ь/=1 183
Таким образом, сумма максимальна,; если i — j, что и завер- шает доказательство (52). 3.33. Пусть s,-—количество топлива на i-м складе, i=0, 1, ..., п, d{—расстояние между (i—1)-м и i-м складами; k{—число рейсов между этими двумя складами. Тогда 1= “Ьi=l, ••*, и. (1) ! Нетрудно видеть, что используется минимальное количество топлива, если перед каждым рейсом баки автомобиля зали- ваются полностью. Кроме того, чтобы в конце пути лиш- него топлива не осталось, необходимо, чтобы автомобилист забрал 500 ед. топлива на 500-километровой отметке. Из этих двух условий следует, что i-склад надо расположить | так, чтобы автомобиль сделал ki+1 рейсов между i-м и (i-J-l)-M складами в обе стороны и один рейс вперед пол- : ностью загруженным и не оставил топлива на i-м складе. Однако автомобиль сделает последний рейс между исходной точкой i = 0 й первым складом, загрузив 500 ед. топ- лива. Таким образом, sz = £z(500—2^)4-500—dt, i — 2, 2 8! = ^ (500— 2d1) + c—dp ( ’ 5 Требуется минимизировать функцию ' s0 = 500&J + с. (3) £ Так как s„ = 500, то для этого достаточно разместить склады 1 И \ вдоль 500-километрового пути: 2 ^ = 500. Из формулы (2) j 1 i . 500^z-|-500—Si . п о < I получаем =1 = 2, Заменяя в фор- I -f- 1 муле (1) i на 0*4-1) и подставляя полученный результат 5 вместо в выражение для dh получаем I j 500^-1-500—Sf+1 — 2ki+1di+1—dj+i , __л ’ п+1 ~ I ! Наконец, заменяя s,-+1 по формуле (2), получаем । d.==500gg^±i)) 1=2, I Л . 500(£i — £2)4-c—500 I Аналогично имеем = — ду | 184
Так как dt > 0, то kt > Л/+1. Таким образом, нужно ми- нимизировать функцию (3) при ограничении " п ь. ь i= 1 i= 1 с—500 2^+1 500, которое можно записать в виде V ki~ki+i 1—с/500 _ ! ь __п 2и 2^+1 2^+1 ’ *л+1~и* Так как k± > k2 > kn, то — kj + 1 1 j_____п 2^ + 1 ' 2^+1 ’ П. П k—k- Это соотношение определяет такой выбор kh что i= 1 больше единицы и Jfex принимает минимальное значение. По- кажем, что кг минимально, если kf—k{+1=l, i=l, ...,n, и kn=l. Предположим, что ki0—kt„+1 = tn> 1; тогда ________m_______ 2fe,-o+1 2 (£io+i -1- tn) -H 1 ' Теперь, принимая —Л,-,+1=1, этот скачок можно заме- нить суммой ______!_____+_______!______+... । 1____________. 2 (fy„+i + D+ 1 2 (^o+i + 2) +1 2 (й;о+1 + /п)+1 Эта сумма больше, чем предыдущее выражение. Следова- тельно, минимум kf достигается при k{—ki+1=i, kn—\. Ввиду монотонности k{ число п выбираем так, чтобы fe„=l, &B-i = 2, .... и в конце концов получаем k2 из условия kj— ^i'+i 2^+1 • В нашем случае &2 = 6, п = 8. Затем вычисляем d{ начиная с 500-километровой отметки: dt = 500/(17—2i), t = 2, ...,7. Оставшееся расстояние 500/15 принимаем за dj. Значения ^ = 8 —t, i=l, ..., 7; s0 = 38336,45. 3.34. 1) Достаточность. Пусть х—допустимый век- тор, который удовлетворяет сформулированному условию, 185
п Л а х'п—другой допустимый вектор. Покажем, что 2 я /=1 >2 Ф/Uy)- Пусть l = min[фу(ху + 1)—фу(ху)]. Тогда I /=1 isi I ^^Ф/(*/+1)—Ф/(^/)> /€Л (1) ? ^>Ф/(ху)—фу(ху—1), (2) I Из выпуклости фу следует, что [фу(й-|-1)—фу(й)]— неубы» вающая функция на множестве целых чисел. Таким образом, если k^Xj, из неравенства (1) следует *<Ф/(й + 1)-ф/(й), (3) если 0<й^Ху, то j £ I (х) и неравенство (2) дает Х>Фу(й)— Фу(й— 1). (4) Просуммируем неравенства (3) по всем k таким, что ху-^ СД^х)—1 при х/> Ху, и неравенства (4) по всем k таким, что xj + 1 k Ху при X/ < Ху. Получаем фу(х;)—Фу(ху)>Х(х;—Ху), х/>ху; Ф/(Х/) — Ф/(Х/) =O(*/—Xj), X'j < Ху. В обоих случаях и даже при Ху = х) имеем фу(х})^ Фу (Ху)-|-Kxj—Хху для всех j С /. Суммируя по / = 1, ...,п п п и учитывая, что 2 ^ = 2 доказываем достаточность. /= 1 /=1 2) Необходимость. Пусть х—решение задачи. Предположим, что неравенство min [фу(ху+1)—фу(ху)]> max [фу(ху—фу(ху—1)] (5) / € 1 / 6 / (х) изменено на противоположное. Так как /п>0, то /(х)=0=0 и максимум в правой части (5) реализуется при некотором / = а, левая часть минимальна при / = р. Тогда, по предпо- ложению, Ф₽(*з+1) —Ф₽(*в)<Фа(Ха) —Фа(ха—1). (6) Так как фу—выпуклые функции, то а =0=0. Рассмотрим х'а. = ха — 1, Хр = хР + 1 и x'j — Xj для остальных /. Очевидно, J x' = (xf, ...; х‘п)—допустимый вектор. Кроме того, | 2 ф/(х;)—2 фу(Ху)=фа(ха—1) —фаСх^+фДХрЧ-!)—фр(Хр). I у — 1 / — 1 186
Эго выражение меньше нуля на основании неравенства (6), что противоречит оптимальности х, п 3.35. Задача состоит в минимизации функции 2 п при ограничениях 2 Xj = tn, Ху^О—целые. Так как <£>jp* — = Фу(х)—выпуклые функции, то для решения можно ис- пользовать критерий Гросса (см. задачу 3.34). Положим = 0; j = 1, ..., п. Пусть при k 0 номер / (k) таков, что min [фу (х)й) + 1)—фу (х^>)] = Фу (Л) (х^> + 1)—фу (Л) Тогда положим х}*^}> = х/%)-|-1; х)й+1, = х)й) при j=£j(k). Вектор хм = (x(i"’; ...; х^1’) удовлетворяет ограничениям и минимизирует целевую функцию. Таким образом, решение получается распределением т единиц среди аргументов функ- ций фу, причем на каждом шаге одна единица придается аргументу той функции фу, которая имеет наименьшее при- ращение. 3.36. Если х,= 4, то 4* можно заменить на k-й позиции на 2й, а другой множитель 2Й+1 записать на (&+1)-й пози- ции; тогда получим 4й <2Й-2Й+1. Если х; > 4, то xt = = 3 + (xf—3) и xf<3(xf—3). Этот процесс можно продол- жить, переходя к (х{—3). В этом случае имеем х,-—3 = = 34-[(xz—3)—3], х,-—6 = 3+[(х,—6) — 3] и т. д. Заметим также, что xj < 3' (xj—3)' и т. д. Таким образом, разбиение х,- > 4 на слагаемые, меньшие 4, увеличивает значение це- левой функции. Глава 4 4.2. К функциям / (х) = max Ff(x), ф(х)= max ФДх) I < i < т I < i < m применить неравенство, аналогичное приведенному в за- даче 4.1, п. в) I inf f(x)— inf ф(х)|<8ир |/(х)—ф(х)|. I X € X XGX I XG X 4.4. В силу равномерной непрерывности F на X х Y для любого е > 0 найдется 6 > 0 такое, что | F (х, у)—F (х0, у) е при р(х0, х)^6, y£Y. Отсюда следует, что | f (х)—f(x0) при р(х, х0)<2 6. 4.6. Пусть х„ —>х0£Х и N (х„) Э Уп —* Уй- Тогда из не- 187
прерывности g следует, что g-(x0, у0) — lim g(x^, уп)^0, П -> 00 т. е. у9 е N (х0). 4.7. Из полунепрерывности сверху отображения N сле- дует, что для любой окрестности U множества N (х0), х0 € А", найдется окрестность V точки х0 такая, что N (х) = U при x£V. Далее, для любого е>0 найдется такая окрестность U (а следовательно, и V), что F (х, y)^F(x„, у)—е при x&V, y£U, где у—ближайшая к у точка N(х„). Следойк-' тельно, для всех х£V, y£N(x) справедливо неравенство F (х, y)>_min F(xe, у)—8 = f(x0)—8 и f (x)>f (x0)—в. yeN(x,y Требуемое утверждение доказано, поскольку е произвольно. 4.8. Если хп—*-х0, то в силу результата задачи 4.7 lim f{xn)^f (х0). П -> <Ю С другой стороны, по определению х0 имеем lim f(x„)</(x.). 4.9. а) Допустим противное: Зб0 > 0, Veft > 0 3xft, yki р(хк, x0)<eft, t/ft€JV(x0), но yk£ U6a (N (xft)), где Ut (Л)—6- окрестность множества Л. Пусть ек—>0. Учитывая компакт- ность Y, можно считать, что ук-+ уй- Так как g(x0, yft)>0, g{xk, ук)<0 и хк—<-х0, то g(x0, t/o) = O. Для достаточно больших k имеем у0(£ СЛз0/2 (N (хк)). В самом деле, Зй<такое, что у0 е ^в,/2 (Ук)> Так как ук£ (N(xj), то и У о С ^б0/2 (N (xft)). _ По условию, Ву£ (t/0) П (х0). Из непрерывности g получаем, что g (хк, y)>Q при достаточно больших k, т. е. y€N(Xk)- Но yo€U6,/t(y)> поэтому у0£ U6t/l(N(xk)}. Имеет место противоречие. б) Следует из п. а) и задачи 4.6. Если Л, В—компакты, то из Л (Л, В) = 0 следует, что А = В. В противном случае может быть А(}В — 0. Напри- мер, Л—множество рациональных чисел, В—множество ир- рациональных чисел. в) В условиях задачи № (x) = intAf (х). В общем слу- чае № (х) =/= int Af (х), как показывает следующий пример: 188
x= r = [0, 3]; g(x, y) = у, оsC у <1/2, \-y, 1/2<i/<1, О, 1<у<2, 2—у, 4.10. Непрерывность f(x) вытекает из непрерывности отображения (4.4) в метрике Хаусдорфа (задача 4.9, п. б)). Пример разрывной в точке х = 0 функции (4.4) дают F — = —у, g = x-y, Х==[—1, 1], У=[0, 1]. 4.13. Частный случай задачи 4.14. 4.14. Зафиксируем любые xlt х2£ X, уг£ N (хх), y2£N (х2). Тогда aF(x1( i/i) + (l — a)F(x2, z/2) < F(ax1-|-(1 -a)x2, + —a) У2)) при O^a^l. Функция g вогнута, поэтому g-(axx + (l—a)x2, ott/xH-(1— a) yt)^ag (xlt гл)+(1 — a) g(xityt), t. e. ayt + (1 —a) y^N (axx + (1 —a) x2). Отсюда следует не- равенство <xF(xx, t/!)+(l—a)F(xs, i/2X<p(aXi + (l—a)x2), из которого, так как yY, уг произвольны, вытекает вогну- тость ср(х). 4.15. Воспользоваться формулой (4.2). 4.16. Для всех х функция F сильно выпукла по у и справедливо равенство ^F (х, г/(х)) = 0.,По теореме о неяв- ной функции, у(х)^С1. Отсюда следует, что f(x)^C1 и 4.17. а) Вообще говоря, нет. Например, /(х) =— |x| = min(x; —х)= min (урс—у2х). Vl, Уг> 0 »l+j/2= 1 б) Будет. Это следует из формулы (4.2) и установленной в задаче 4.5 непрерывности функции у (х), реализующей 4.18. а) 1; 0) dgl minF(x, y) = F(x, у(х)). yeY i 1-/5 1, —оо<х<-— ; о 1 —/5 /5—1 2Х, —у— <х<-^у— ; , /5-1 . —1, —2— 189
i i-Кб -1,-00 <х<——; df(x) _ _9г 1-Кб „ Гб-1 . dg2 ’ 2 2 1 Кб-1 1, --§--< Х< °0 ’ в) 0; г) —2; д) —2; е) 0; 0; 1//2; ж) —3; з) —28. 4.19. Доказательство эквивалентности вытекает из ре- шения задачи 4.20 при Х = Еп. Действительно, в этом слу- чае конус К* (х°), сопряженный конусу возможных направ- лений множества X в точке х°, равен {0}. 4.20. Необходимое условие для точки х° sup min у), х—х°) = 0 (1) х€ X ye R (х°) \ох / эквивалентно условию —L(xo)nK*(*°)=£0. (2) Здесь Л?(х°)—конус, сопряженный конусу возможных на- правлений множества X в точке х?£Х, а Л(х°) определено в задаче 4.19. Покажем, что из равенства (1) следует неравенство (2). | Допустим противное. Пусть (1) выполняется, однако —L (х°) П | П К* (х°) = 0. Тогда по теореме отделимости выпуклых мио- । жеств найдется вектор [Л*(х°)]* = К**(х°) = /<(х0), где | К(х°)—замыкание конуса возможных направлений такое, I что min (t>°, z) = a>0. Функция (о, г) непрерывна по v ( Z€L(x°) t равномерно относительно z£.L(xa). Поэтому для и0 можно указать вектор v1 = Xi(xx—х°)€^С(^), для которого min (и1, г)^а/2. Отсюда следует неравенство min (г, zeL(x°) Z€L(X°) (д \ £-F(x°, у), х1—х° )> °х 1 Допустим ^a/2Kit что противоречит (1). Покажем, что из (2) следует равенство (1). противное: найдется вектор и0 € К (х°) S К (х°), для которого min (^-F (х°, у), v°) > 0. ueR(x°)\ox / i 190
Последнее неравенство можно переписать в виде min (v°, z) > О, Z€H (*°) (3) где W) = {*=^W Так как v° € К (х°) = [Л* (х°)]*, то для всех гС^*(х°) выполняется неравенство (v°, г)>0. (4) Сопоставляя неравенства (3) и (4), заключаем, что—£(х°)П пК*(х°)=0. Но это противоречит (2). 4.22. Очевидно, Х(у)аХ, Y(x)cY при х$Х, y£Y. Поэтому sup inf F (х, у) = sup Г<р (х) 4- inf ф (y)1 > хеХ у eY (х) х € X L yGY (х) J > sup ф (x) + inf ф (y) > inf Г sup ф (x) + ф (y)l = xeX yeY J = inf sup F(x, y). yeYxeX (y) Пример выполнения строгого неравенства получается при F = x—у, g=l—x—y. 4.23. б) Так как fn, f0—полунепрерывные снизу функ- ции, то они достигают своих нижних граней на X. Пусть fn (x„)=min/„ (х) и х„—*х*. ТогдаVe>03/n: /0 (х*)—fm (х*)<е/2. хвХ Кроме того, по е, т найдется номер У = ЛЦе, т) такой, что при n^N верно неравенство fm (х‘) < fm (х„) + е/2. Следова- тельно, /и(х*)—/п(х„Х/я(х*)—/я,(х„)<е/2 и /0(х*) — — /»(*») <е при n>max(m, N). Отсюда по определению хп получаем О < min Д, (х)—min fn (х) < /0 (х*)—min fn (х) < е. xtX х€ X хеХ В силу монотонности и ограниченности сверху последо- вательности f minfn (х)1 существует предел lim minf„(x), / п-^ хеХ совпадающий, как показано выше, с /0(х*) = min/0(x). хеХ Следующий пример показывает, что одной монотонности для сходимости минумумов недостаточно. Пусть X = [0, 1], fn (х) = Л ____ 1 1 ' V, X = , 2«+1 » • • •» 1 в остальных точках. 191
Здесь lim f n (x) = f„ (x) 5= 1, n -► 00 lim minf„(x) = 0. n-> oo xeX 4.24. На основании решения задачи 4.7 достаточно пока- зать, что любая полунепрерывная снизу на компакте X функ- ция /(•) представляется в виде (4.4), (4.5). Пусть Q = = {(х, у)\х£Х, y>f(x)}—надграфик функции /(•). Поло- жим g(x, у) = — р((х, у), Q), где р((х, у), Q)—расстояние от точки (х, у) до множества Q. Очевидно, g—непрерывная функция и / (х) = min у, поскольку надграфик Q замкнут. У € N (х) 4.26. На основании результатов задач 4.21 и 4.25 sup inf F (х, у) = sup inf inf sup S (x, у, p, X) XS.A У Ц. > О 0 sup inf 2 (x, y, p, X) *€ X ytY Л 0 ц 0 и, аналогично, inf supF(x, y)^ inf sup 3? (x, у, p, X), ytBxtA yeY xeX ц О К 0 откуда и следует доказываемое равенство. 4.27. Так как ( F (х, у), у&В, lim {F(x, j/) + C[min(0; ф (t/))]2} = I > С -► 00 V Т* w > У то для завершения доказательства следует дважды приме* нить результат, полученный в задаче 4.23. 4.28. а) Для доказательства выпуклости Jq (у) достаточно установить, что суперпозиция F(-) = [($>(•)) выпуклой моно- тонно убывающей функции /(х)= |min(0; х)|« и вогнутой функции ф(у) является выпуклой. б) J;(t/) = <7|min(0; ф(«/))|«“хф'(У) при <7>1- 4.29. Доказательство см. в [15, гл. II, § 8, лемма 2.1]. 4.30. Отыскание лексикографического максимума F(x) равносильно решению задачи /2 (х) —► max при ограничении ft W max ft (*)• Методом штрафных функций ее можно хех свести к поиску Jim max{f5(x) + C„J(A(x)—тахЛ(х))}, (1) Сп -► оо х € X XGX где J(/) = min(0; t)—функция штрафа. 192
Требуемое утверждение теперь следует из теоремы о схо- димости метода штрафов [54], поскольку J (Ji (х) — max fi (х) ) = fi (х) — шах /х (х) и константа max /у (х) не влияет на реализацию х0 (Сл) макси- х е X мума в (1). 4.31. Пусть ф: С (Х)--^Е1 удовлетворяет условиям п. б)—г). Покажем, что функция ср удовлетворяет также условию а). Рассмотрим <р (а) как функцию на прямой. Из п. б) сле- дует, что _ <р(а) = а4-Сф, Сф = const, а из п. в) имеем Ф (2а) = 2а -|- 2СФ = 2а + Сф, откуда Сф = 0. Из п. г) вытекает монотонность ф, т. е. /$ —* ф (Л) < ф (fi), а отсюда из п. а) следует minf (x)^.q>(f)^. max/(x). (I) хех хех Постоим требуемое подмножество Е = X. Для каждой функ- ции f (X) обозначим == {х £ X | / (х) ф (/)} и положим Е = П Ef feciX) Очевидно, что Е замкнуто; покажем, что Пред- положим противное; тогда множества Uf={x € X | f (х) > ф (f)} для всех /€С(Х) образуют открытое покрытие X, содер- жащее конечное подпокрытие Uft, ..., Ufn, На основании п. б) можно считать, что Ф (/0 = ф (/2) = ... = ф(/п) = 0. Положим f* (х) — max [/j (х); ...; /я(х)], тогда в силу п. г) имеем Ф (/•) = (), но, с другой стороны, /*(х)>0 для всех х£Х. Это противоречит неравенствам (1). По определению Е для любой функции f$C(X) выпол- няется неравенство ф(/)^> max/ (х). Если Е = Х, то из (1) х&Е следует требуемое равенство (4.7). Предположим, что Е =f=X и существует /**£С(Х), для которой Ф (/•*) = > max /•• (х); хб X тогда существует окрестность U множества Е и е>0, для которых и° max /•• (х) + е. лей 7 » 1у04 193
Множество -Y\E, и тем более множество покры- вается введенными выше множествами Uf. Рассуждая, как и выше, получаем функцию f*£C(X), для которой при всех x£X\U справедливо неравенство f*(x) ><?({*) = &. Уменьшая, если потребуется, величину s, можно считать, что f* (x)^v° 4-8 для x£X\U. Теперь «сдвинем» функции f*, f**, полагая f0 = f**—max/**(x), — ц°]—ц°. хеи На основании б) имеем ф(/0)^8 > 0, ф(Л) = 0, при этом шах /0 (х) = 0, min (х) е, min (х) 0. Выберем нату- хеЕ xgX\U хеХ ральное п > maxf0(x)8_J; в силу в) справедливы следующие X€ X неравенства: ф (п/j) = Пф (/,) — 0 < 8 < ф (/„). Покажем теперь, что nfi f0; тогда полученное противо- речие завершит доказательство. При х £ U имеем nfx (х) >0>/о(х), а ПРИ x£X\U получаем n/i (х) > ne > max (х) > f0 (х). хех Утверждение доказано [41]. 4.32. Функция Ф1 (/) = у (/ (Xj) 4- f (х2)) удовлетворяет б), в) (а также а)), но не удовлетворяет г); функция ф2(/) = = max [/(Xi); / (х2)—е], 8 > 0, удовлетворяет б) и г) (а так- же а)), но не удовлетворяет в); функция Ф3 (/) = max [/ (Xj); asign f <*»> x f (x2)], 0 < a < 1, удовлетворяет в), г), а), но не удовлетворяет б). 4.33. а) 0; 1/4; б) 0; 0,5; в) —4/27; 0; г) — л; —л. 4.34. Необходимое условие максимина (4.3), как показано в задаче 4.19, эквивалентно условию (4.6) и записывается в случае х^Е1 следующим образом: ^0(ЕЯ(х°): |/(х% z/o) = 0 либо 3t/!, i/2€^(x°): ^(А У1) = Р(х°. У2) = min F (х°, у). УЪУ Чтобы воспользоваться этими условиями, опишем мно- жество R (х). 194
При х£(0, 1] производная равна нулю в точке • В этой точке г < 0; следовательно, множество /?(х)с{0; 1}. Легко проверить, что ^Г(х, 0)#=0 при всех х€[0, 1]. Таким образом, необходимые условия максимина определяют точку х0= , в которой (х, 1)=0, и точ- „ /ТП—1 ку х« = -—1----, которая находится из равенства г (х, 1)= = F(x, 0). Стационарные точки лежат в интервале (0, 1), если либо 0<£zJc j 4fl —-Г , ас ’ * L a J ’ либо = 1+6<(1+с)«. 4.35. х° = л/3. 4.36. Из физических соображений ясно, что оптимальные точки прицеливания (х? (X), х® (X)) симметричны относитель- но 1/2: х1(Х) = х(Х), х2(Х)= 1—х(Х), 0<х(Х)<1/2. Критерий эффективности WK(x, y) = e-b(’‘-i»* + e-bu-x-vP. Для нахождения оптимальной стратегии используем необхо- димые условия максимина в той же форме, что и в задаче 4.32. Легко проверить, что /?(х)с{0, 1/2, 1}. Рассмотрим два случая. 1) Для достаточно малых X имеем /?(х) = {0, 1}. В этом случае необходимые условия максимина приводят к уравнению Если Х^2, то это уравнение имеет лишь один корень х (Х)= 1/2. В противном случае существует еще один корень в интер- вале (0, 1/2). Легко установить, что стратегия х(Х) = 1/2 при X > 2 не оптимальна. 2) Если R (х)={0, 1/2, 1}, то условие равенства №\(х, 0)— = WK(x, 1/2) определяет стационарную точку x(X)=4+4ind-Ki-e-i/2). (2) 7* J95
Данная точка является решением задачи при ' X Хо, тдё Хо—значение параметра X, при котором (2) удовлетворяет уравнению (1), т. е. ЗХо+41п(1-Г1-е-^) = eVg (1 _Kr_e-k,/2v Хо—41п (1 — К1 — е~ Ло/2) Итак, оптимальной является стратегия х°(Х) = ' 1/2, 0< Х^2; корню уравнения (1), если 2^ Х^ Хо « 3,235; величине (2), если Х0^Х. 4.37. Пусть х°—стратегия, состоящая в том, что пожар- ные части располагаются на серединах трех радиусов, углы между которыми равны 120°. Докажем, что стратегия х° яв- ляется оптимальной. Заметим, что IT (х°) = Кз/27? (см. решение задачи 1.9). Предположим, что найдется стратегия х = (х1, х2, х8), для которой W (х) < )/з/21?. Рассмотрим окружность радиуса R с центром в точке О. Пусть радиус ОТ содержит точку х1, точки А, Н, D и S лежат на окружности и / АОТНОТ=/_ SOC = / DOC— Рис. 18 = 60° (рис. 17). Из неравенства W (х) < К3/2/? следует, что круг В (х1, W (х)) не содержит А и Н. Следовательно, точ- ки х2, х3 не содержатся в секторе DOSC. Тогда точка С не будет лежать в объединении кругов 3 U В(х‘, Г(х)), что противоречит определению _F(x). 4.38. а) Как следует из решения задачи 1.4, нужно найти min max р2(х, Ду), где Ait Аа, А3—вершины треуголь- 196
$1ика. Пусть сначала АЛ^9Л9—прямоугольный или остро- угольный. Разобьем его серединными перпендикулярами на три части: Ss, S9 (рис. 18). Очевидно, если точка х лежит в области Sj, то точка Aj является от нее наиболее удален- ной, /=1, 2, 3. Отсюда следует, что искомая точка х уста- новки вышки есть центр 0 описанного круга. Если Д Д1Д9Д3—тупоугольный, то аналогичное построе- ние разбивает его на две части S1( S8 (рис. 19), причем для точек x£St наиболее удаленной является точка А{, 1—\, 3. Следовательно, оптимальной точкой является середина наи- большей стороны AjA3. б) Задача сводится к отысканию min max 2 Р® (-*» (1) x i i з j i Пусть Д Д^Лд—прямоугольный или остроугольный. Разо- бьем его серединными перпендикулярами на три части: Dit Ds, D3 (рис. 20). Так как при x£Dt р(х, Д|)^т1пр(х, Лу), / =# i ТО 2 Р*(х, Лй)= max 2рг(х» ^/)> 2,3. k Ф i f = 1, 2, 3 / #= i Следовательно, отыскание минимакса (1) в области Dt сво- дится к нахождению min 2 Р®(*» ^ft). Рассмотрим эту х € D^k^i задачу, например, для D3. Проведем в /\АгА3х высоту хН. 197
Тогда р2(х, Л1) + р2(х, Л2) = 2р2(х, Я) + р2(/7, Л0 + + р2(Я, Л2) = 2[р2(х, Л)-р2(Я, Л)] + + [уР(Л, Л2)-р(Я, Л)]2 + [4р(Лй Л2) + р(Я, Л)]’ = = 2р2(х, Л)4-1р2(Л1, Л2) и, следовательно, минимизация по x£D3 суммы р2(х, Лх)4- + р2(х, Л2) равносильна минимизации расстояния р(х, Л). .Точка О, очевидно, искомая. Повторяя рассуждения для областей Dlt D2, окончательно получаем, что оптимальной стратегией является точка О—центр описанного круга. Для тупоугольного треугольника А^Аз аналогичные построения (рис. 21) и доказательства показывают, что опти- мальной точкой является середина О наибольшей из сторон. в) Как показано в задаче 1.4, нужно найти minmax[p2(x, Лх)-|-р8(х, Л2); р2(х, Лх)4-р2(х, Л3)]. Пусть X в А А^зАз середины сторон Р, Q и R и QL J_ Л2Л3 (рис. 22). Как. показано в п. б), решение данной задачи сводится к двум задачам минимизации: р (х, Р) —► min и р (х, R) —> min . xeQLA3 x^AtA2QL Возможными решениями первой задачи являются точки L, Q или основание перпендикуляра, проведенного из Р на LQ-, возможными решениями второй—основание перпендикуляра, проведенного из R на QL. 198
4.39. Из решения задачи 3.2 при a (s) = ^p^-^ получаем maxF(x(-), ^(*))=< х (•) J ds, если [й + су (s)] ds 1, s s J ds+9 J ds, если ($)] ds > 1, S, (a) S, (7) S где Si (a) = {s € 51 b 4- cy (s) < a}, S5 (a) = {s £ S | b+cy (s)=a}; a, 9 С [0, 1] определяются из условия $ (b 4- cy (s)) ds + 9 J (b+cy (s)) ds = 1. S, (a) S, (a) Далее найдем min max F(x(«), #(.))s=F0. V(') *(') Если 1 >6 J ds-f-o, то в (1) независимо от y(s) реали- s зуется первое равенство, поэтому F0=Jds и оптимальна s любая допустимая функция y(s). Если b J ds4-o > 1, то в (1) реализуется второй случай. s Представим величину (1) в виде maxF(x(-), t/(.))= \ ds, где х(-) Г множество Т определяется из условий \ (Ь 4* су (s)) ds = 1; inf у (s) > sup у (s). г s€S\r S6T Выделение T из S в общем случае производится неодно- значно. Для любой допустимой функции у (s) значение max F (х (•), *<•) у(-)) не изменится, если заменить ее функцией — (Уь S$T, y(s)= s^T. где уь i/2—константы, у^у^ и У1 $ ds = \у (s) ds, yt $ ds = $ у (s) ds. T T S\T S\T Таким образом, при отыскании минимакса Fo можно рас- сматривать только функции y(s) указанного вида, прини- мающие два значения. Обозначим R = ds. Тогда с учетом т .199
сделанных замечаний поиск Fo сводится к минимизации 7? по ylt у2, R при ограничениях Rtp + cyJ^l, у^у2, y^ds + y2 J ds = l. Т S\T Решение данной задачи достигается при уг — у^ и равно —х с F<>= Н Оптимальной является стратегия s Уо (s) = il $ ds- s 4.40. Пусть х°^М0—оптимальная стратегия. Обозначим через J множество реализаций минимума min ft (х°) и пред- l<i<n положим, что /#=/ = {!, .... п}. Тогда (х“) > при xz = Докажем, что найдется i\ £ /\<7 такое, что х“ > 0. Если бы х’ = 0 для всех то х“, > 0 для некоторого ji^J- Тогда ft (х°) — f{ (0) > fi, (х?) > fjt (0), что противоречит усло- вию //(0) = //, (0). Далее, х°<В для всех j£J. Действительно, если х^ — В для некоторого j2£ J, то g/s(x°s)> А. Отсюда и из доказан- п ного выше получаем — имеет место противо- i = 1 речие. Построим теперь вектор х с координатами 4 —8ц, хЧ, X°i + 8;, J, п где 8г > 0 достаточно малы и выбраны так, что 2 ёАх^^ А, i = 1 О^х^В. Из непрерывности и монотонности функций g{(t) и доказанного выше следует, что такие г{ всегда найдутся. Из непрерывности и монотонности ft(t) и определения вектора х £ Ма следует неравенство min ff (х.) > min f, (x“), К i < n 1 < i < n которое противоречит оптимальности вектора х° € УИ0. Тем самым принцип уравнивания доказан. 4.41. а) Разделим единичный квадрат на четыре квадрата со стороной, равной 1/2. По крайней мере один из этих квад- 200
ратов содержит две из пяти точек. В нем максимальное рас- стояние, равное 1/К2, наблюдается между двумя точками, расположенными на противоположных концах диагоналей. Такая же величина расстояния получается для единичного квадрата в случае, когда пять точек являются вершинами и центром квадрата. б) Разделим треугольник на четыре равносторонних тре- угольника со стороной, равной 1/2, и расположим точки в пяти из шести вершин треугольников со стороной 1/2. в) Разделим круг на пять конгруэнтных секторов и рас- положим точки по окружности на равном расстоянии одна от другой. Если две точки попадают в сектор с дугой а^2л/5, то наибольшее расстояние между ними max [1; 2 sin(a/2)]^ <12 sin (л/5). г) Поместим точку Pi на северном полюсе, а другие — на экваторе со сдвигом 90° одна от другой. Если четыре точки удалены более чем на л/2 от Рх, то они лежат в южном полу- шарии; если поверхность сферы разделить на четыре конгру- энтных области, то максимин для этих четырех точек был бы меньше чем л/2. _ 4.42. 1.6 а), б) 1/2; 1.6 в) 1/4; 1.7 а)— в) (3—/ 5)/2. 4.43. ?:х? = 3/4, = 1/4; 1F(M)=1/16. 4.44. a) v = amn, i° = m, j° — n; б) = max f(i), g(/°) = min g(/); 0 = / (i°) + g(j°). l</<n в) При любом соотношении между величинами a, b, с и d найдется строка, доминирующая все остальные; i°— номер этой строки. г) При любом соотношении между величинами а, Ь, с, е, f, g найдется столбец, доминируемый всеми остальными; /°— номер этого столбца. д) Рассмотрим функции f(t) = max —Cjt) и §(/) — 1 < = max {djt—bi). Функция f непрерывна и убывает от 1 < / < п 4-оо до —оо, а функция g непрерывна и возрастает от — оо до 4-оо. Поэтому f(tB) = g(tB) для некоторого t°. Для соответствующих индексов i°, /° имеем а,»—с,»/0 = = djo t°—bjo, откуда /° = (at-o 4- bj«)/(c{> 4- dj<>). По определению функции f имеем at—— — djot*—bj« и, следовательно, (af4-fyo)/(cz 4-dyo) Аналогично получаем /0^(al<.4-6/)/(ci<>4-d/). Последние два неравенства означают, что <t°; /°; /°> — решение игры. е) При / — k = i условие, связывающее atJ-, aJk и ак1, при- нимает вид Зап = О; таким образом, a{i = 0, i=l, ..., п. 201
Поэтому не являет- ^2/2 ^0/2 /;/2 • * * 4 • . . Oigjj = 0^=0^ V/ A^v/ 4 Рас, 23 а<Л аЫ1 Пусть k — j^i-, тогда а^+а^ + а^ — 0 и а{} = — aJ{-, I, п п j = 1, ...,п. Наконец, 0=2 + «*/) = паи + 2 а^— k=t 1 k — 1 ” 1 V? — 2 а1к- Обозначая /, = —z. а,ь: t = l> •••»«, получаем aij~tt—tj и <i°; /°; 0>—решение игры, где /(» = max tt. l^i^n 4.45. Предположим, что А = [а1/)тхп не имеет седловой точки. Пусть ай = min max min a{J. Поскольку (i0,/\) 1</<п не является седловой точкой, > а,,/, для некоторого i\. Пусть aitj2— min а^. Очевидно, что /2#=/1- Имеем 1</<п >aW1>all/s, atoll^aiol2. Если бы а1<)Ь < а^,, то а<0/2 > а,-1/г /а- , а- . \ и матрица ( ’ ‘ „ ° ) не имела aitls‘ бы седловой точки. (рис. 23). Поскольку (i0, /2) ся седловой точкой, для некоторого i2, причем i2=/= =5^11. Пусть ai2i, = min a,s/. 1</<п Очевидно, что Кроме того, /8 =/= j\. Действительно, если бы ai,/t = min aitj, то K/<n (рис. 23) ai,h’^atJt и матрица I ’*'* ‘‘М не имела бы седловой точки. Теперь ' ^’2/1 4/2 ’ так же, как и выше, можно показать, что «(„/, = «/„/,• Про- водя те же рассуждения в третий раз, получаем, что = = /4 =/= /\» /«» /з- Проводя их в Л-й раз, придем к про- тиворечию: k^.n. 4.46. Искомая вероятность равна 2^{({> /)—седловая точка} (Р означает вероятность указанного события), по- скольку вероятность пересечения любых двух таких различ- ных событий равна нулю. Введем следующие обозначения: ал = Ьи ..., a(_ 1(} = bt_lt а1 +1, f — •••> aij — bm< аЦ — ^т+й • • • f ai, J-l~ = ba+j_it alt j+i = bm+j, .... Обозначим через {tx, ...»событие, состоящее в том, что • • • 202
^.bi Заметим, что: любые два таких различных события равновероятны; вероятность их пересечения равна нулю; объединение всех таких событий достоверно. Отсюда следует, что вероятность любого из них равна 1)! Теперь заметим, что событие {(i, /)—седловая точка} равно объединению событий {t\, .... im_i, т, im+i, ..., im+n-i}, где i\, ..., im_i—произвольная перестановка чисел 1, .... т—1, a im+i, .... произвольная пере- становка чисел т -f-1, т-\-п—1. Таких событий (т—1)1(п—1)1 Таким образом, Р {(i, /)—седловая точка} —» а вероятность искомого события (т—1)1 (п—1)1 mini тП (т-Ь-п—1)1 (m-f-n—1)1 4.47. а) Если пт, то (( —; ...; —); (—; ' m ’ ' т) \т \ т ' 0; ...; о); решение; если п < т, то <(0; ...; 0; 1); q; 1> — решение, где стратегия q£Sn произвольна; в) <(6/11; 5/11), (3/11; 0; 0; 8/11); 4/11>; г) «5/8; 3/8; 0); (3/4; 1/4); 7/4>; д) <(0; 0; 6/7; 1/7; 0; 0); (0; 0; 4/7; 3/7; 0; 0); 13/7>; е) <(1/2; 1/3; 1/6); (1/2; 1/3; 1/6); 0>; ж) <(1/8; ,1/2; 3/8); (1/12; 5/12; 1/2; 0); 13/4>; з) <(11/20; 4/20; 5/20); (8/20; 7/20; 5/20); 37/20>; и) <(1/2; 0; 0; 1/2), (1/2; 0; 0; 0; 1/2); 1/2>; к) Положим of==(i—1)/(аг’+ • • • + «Г1). Пусть < ... ... < vlt, a v{i^Vii+i или ii= п. Тогда v = v{,—значение игры; ' (Pi’, •••; Pt,’, Pi,+i, •••; Рп)~ ---o’; — оптимальные стратегии игроков. 203
Докажем это утверждение. Непосредственно можно про- верить, что Vi<vi+i^v{<ai+1^vi+i<ai+1\ / = 1, п— 1; (1) п п ^р{=1, 1 = 1, .... п; (2) i= 1 /= 1 п 2a<ypz=v, (3) п llaijpi=j^nv>v< />ч+1; (4) n ^a^v, i^it. (5) /= 1 Используя условия at>aj> ... > О, vti^vti+i, и (1), получаем п 2 aijqj = ai<<xt+i <о, (6) Запишем, наконец, цепочку эквивалентных на основании (1) неравенств, первое из которых справедливо согласно опре- делению числа i\: <«/,<-»v < ati<r->qti >0. Отсюда и из неравенств а4 а8 ап > 0 получаем, что <jy > 0, / = 1, ..., 1\. Это вместе с соотношениями (2)—(6) доказывает утверждение. 4.48. а) <(1/3; 2/3; 0); a (1/5; 3/5; 1/5)+ (1 — а)(0; 2/3; 1/3); 1>, 0<а<1; б) <(1/3; 1/3; 1/3), «1(1/3; 1/3; 1/3; 0; 0; 0) + а2(1/2; 1/3; 0; 1/6; 0; 0) + а8(4/9; 4/9; 0; 0; 1/9; 0) + а4(1/3; 0; 0; 1/2; 0; 1/6)+а6(0; 4/15; 0; 0; 7/15; 4/15)+а„(0; 1/9; 7/9; 0; 0; 1/9)+ + а, (0; 0; 2/3; 1/6; 0; 1/6) + а8 (0; 0; 0; 1/3; 1/3; 1/3); 10/3>, («и ...; а8)€$8. /—2 3 -4\ 4.49. ( 3 —4 5)—матрица игры; <(1/4; 1/2; 1/4); \—4 5 —6/ (1/4; 1/2; 1/4); 0>—решение игры. , 4.50. У первого игрока 15 чистых стратегий (а, р); а = 0, 1,2—записанное число, 0 = 0, 1, 2, 3, 4—названное число1. У второго игрока 3-45 — 3072 чистых стратегий (у; 60, 6ц 62, 68, 64), у = 0, 1, 2—записанное число, 6ft £ {0, 1, 2, 3, 4}\{£} — названная сумма при условии, что первый игрок назвал k, fe = 0, 1, 2, 3, 4. Значение игры равно нулю. 204
Первый игрок гарантирует себе свой выигрыш, например, используя стратегию: выбирать с вероятностью 1/3 чистые стратегии (0; 2), (1; 2), (2; 2). Второй игрок гарантирует себе нуль, например, при помощи стратегии: выбирать с вероятностью 1/3 чистые стратегии (0; 2, 2, 1, 2, 2), (1; 2, 2, 1, 2, 2), (2; 2, 2, 4, 2, 2). ( п 4.51. X = \x = (x1; ...;x„) 2xz = I -•_ 1 п i = l n?—множество чистых стратегий первой сто- роны; п Y = {y = (y1\ •;уп) Hy^s, yt— V i = 1 выигрыша. —множество чистых стратегий второй стороны; п W (х, у)— 2 max.(x{—yt; 0)—функция г= 1 Введем следующие обозначения: , . ( k, х' = (х{; ...; х‘п), xj = < 0 Is, y‘ = (yi', •••; Уп)\ У/=10( /=I, t Произвольная стратегия х£Х доминируется следующей смешанной стратегией рх: с вероятностью xt/k выбирать стра- тегию л/. Действительно, для любого y£Y W(px, y) = Yi^max(k—yl-, 0)> i=i й > 2 max y(Y, 0) = W (x, y). Аналогично можно показать, что любая стратегия y£Y доминирует некоторую «смесь» стратегий у1, ..., у11. Таким образом, достаточно решить матричную игру с матрицей («//)пХл» az/=IT (х‘, у‘) = k, 1=5^=/. max (k—s; 0), i = j, 205
Итак, нетрудно видеть, что //_£. . J_\ . (J_ . . . &(я—l)-|-max(fe—s; 0)\_ \\~п ’ я/’ \п' ’*’ п]' п / решение этой игры. 4.52. Нет. Рассмотреть случай Л = р=^у; у)* 4.53. Да. Положим А(р, j) = a, A(i, q) = b; тогда А(р, q)=f ~a=b и эта величина является значением игры. 4.54. Нет. 4.58. a) A = (J В = ; кч Л 3\ о /° 1\. б) А — оj ’ В\3 2/ ’ . . D /0 0\ в) А — В — 0J . 4.59. Так как т т t>=max min 2 anPiQ/ — max min 2 (—Яп)/М7 = piSmQSSmi. /=1 peSm qeSm I, j= 1 m = —min max 2 ajt4iPi — ~~v> pqSm qeSm i, /=1 то, следовательно, o = 0. Если p°—оптимальная стратегия, например, первого tn tn игрока, то 2ai/P?^0, / = 1, .... т, откуда 2а//Р<^0, i= 1 1= 1 что означает оптимальность р° для второго игрока. 4.60. Каждый из игроков имеет конечное число крайних оптимальных стратегий (не превосходящее число квадратных подматриц матрицы игры). Далее, легко показать, что мно- жества оптимальных стратегий выпуклы, замкнуты и огра- ничены. Отсюда следует, что каждое из множеств оптимальных стратегий натянуто на свои крайние точки, т. е. является выпуклым ограниченным многогранником. /2 0 4\ 4.63. а) Да. Например, Л = (° 2 б V 1, стратегия п / 1 1 1 \ р° = (у; у; у] оптимальна. б) Нет. Если в 10-й строке все элементы не превосходят о и некоторые меньше о, а стратегия р оптимальна: р^2/=0, то р/о=£ 1 и стратегия р° = (р?; ...; /4), где p°k = pj 2 Рп I i iQ k Ф it, р^ = 0, также оптимальна. 206
4.64. а) Нет; б) нет. 4.65. Нет; рассмотреть, например, матричную игру из задачи 4.48 п. а). 4.66. Стратегия (1/т; ...; 1/т) гарантирует первому игроку положительный результат; следовательно, v > 0. Матрица 0 удовлетворяет второму варианту условий, но v = 0. 4.67. а) Пусть m = 3; (pi, р3, р3)—оптимальная стратегия первого игрока, pz^=0, i=l, 2, 3. В этом случае если рз^Р1> то стратегия (0; pa + 2pi< ра—pt) оптимальна, а если р1^р3, то стратегия (рг—р3\ ра + 2р3; 0) оптимальна, т. е. первый игрок, а следовательно, и второй всегда имеют оптимальные стратегии, использующие не более двух чистых стратегий. Предположим, что утверждение справедливо при т = = k—1, и докажем его при tn — k. Сложив при фиксирован- ном / данные k—2 неравенств, получим aij+akj ^aij 4* + ak-i, j- Отсюда, рассуждая аналогично, можно показать, что у первого игрока имеется оптимальная стратегия, исполь- зующая первую или fe-ю чистую стратегию с нулевой вероят- ностью, откуда по индукции получаем доказываемое утверж- дение. б) Полагая az = (azl, .... аг„) последовательно имеем: аа < (1 /2) + (1/2) а8; а8 < (1 /2) at + (1 /2) а4 < (1/2) ((1/2) at + + (1/2)а3) + (1/2)а4; а3< (1/3) ^ + (2/3) а4; а4<(1/2)а8 + + (1/2)а6<(1/2)а5((1/3)а1 + (2/3)а4); а4<(1/4)а4 + (3/4)а5 и т. д., т. е. строки аа, а8, .... можно последовательно вычеркнуть из матрицы игры. 4.68. а) Пусть Ак —>Л, pk€f(Ak), qk€g(Ak), рк — р0, qk—+q0. Достаточно показать, что р0€ f(A), q0€g(A). Имеем 4(Р. ЯкХАк(Рк< ЯкХАк(Рк> ?)> Р€$т> Переходя к пределу, получаем А (р, q0) С А (р0, q0) С A (р0, q), что и требовалось доказать. б) Нет. Положим Л = Н Jj, Ле = 0+8 1‘J'8^. Далее имеем /(Л) = 5а, /(Л8)={(Г, 0)} при е > 0; /(Л8)={(0; 1)} при 8 < 0. 4.71. а) Пусть p£S и е > 0. Выберем п так, чтобы п - 1' 00 п - 1 2 Pi> 1—8- Тогда А(Р> «)= 2 sign(i—п)р, = —2р/ + 1=1 1=1 1=1 00 + 2 Pt<—14-28, т. е. sup inf Л (р, п) =—1. Аналогии- i=n + l но можно показать, что inf supA(n, </)=1. q €S п > 1 207
б) Можно проверить, что sup inf А (р, п) = —1, inf sup А (п, д) = 1. pes 1 qes п > 1 4.72. Игра имеет единственное решение <(1/2; 1/2); (1; 0; 0; ...); а>. 4.74. Определим точечно-множественное отображение g: X х Y —► 2ХХ у следующим образом: g(x, {/) = {x0€X|F(x0, у) = = maxF(«, у)\ [yt$Y\F(x, t/0) = min Л(х, v)\ . ueX I ( veY f Очевидно, что множество g(x, у) выпукло. Воспользовав- шись непрерывностью функций maxF(«, у), minF(x, и) UG X VGY (см. задачу 4.4), нетрудно проверить, что отображение g(x, у) полунепрерывно сверху. По теореме Какутани, отображение g имеет неподвижную точку. Эта точка, очевидно, является седловой точкой функции F на X х Y. 4.75. Пусть хх, х2$Х, y£Y, ag[0, 1]; тогда F(aX1 + (1 -а)х2, у) = У}> v 1 v ’ 2 у’ g(axi + (l—а)ха, У) >«/(*! у) + (1 —«) / (х2, У) > ^ag(xi, у) + (1 —a)g(x2, у)=^ Г(%2> п т. е. функция квазивогнута по х (см. задачу 4.73). Анало- гично можно показать, что F квазивыпукла по у. Следова- тельно, F имеет седловую точку (см. задачу 4.74). 4.76. Решение аналогично решению задачи 4.44, п. д.). г - 1 2 4.77. Функция Ф(А, /)= /(/)—2 а1^ выпукла по А. L I = 0 J ‘ г Следовательно, по теореме XLV, из [3] для оперирующей стороны, выбирающей вектор А, оптимальной является чи- стая стратегия. Для природы оптимальна смешанная стра- тегия, состоящая не более чем из п-^2 чистых стратегий Ту. Если ру—вероятность применения Ту, то платеж в игре с функцией выигрыша Ф совпадает с F 208
4.78. Положим f(x) = (/i(x); fm(x)), g (у) — (gi (у)', •••; g«(y))> 1 / 1 1 \ $f(x)dq>(x) = ($/1(x)dq>(x); ...; J fm(x) d<p(x)), 0 \o 0 / 1 / 1 1 \ («/)=( $gdy)^(y)-. $gn(*/)dW)); 0 \o 0 . Z Q—множество всех функций распределения на [0, 1], 1 •г = (Г1, .... r„) r=(f(x)d<p(x), I о Я = {г | г = f (х), х€[0, 1]}, ( 1 ) G= <s|s= J g(t/)d4>(i/), \ о J S = {s\s — g(y), i/€[0, 1]}. Используя определение интеграла, устанавливаем, что F = coR, G = coS. Затем в игре с функцией выигрыша A'xCr, s)= 2 2az/rzs/> r^F, s^G 1=1 / = 1 находим седловую точку (r°, s°)€FxG. Поскольку r9£coR, s°£coS, существуют такие xlt ..., xm\ ylt .... z/ng[O, 1], что r0 = 2 Pif (xt), ^'Zqjg (yj), i= 1 /=1 (PG Pm)esm, (qt-, ...; qn)esn (CM. [29, c. 783, 784]). Нетрудно, наконец, показать, что смешанные стратегии т п Фо= ^0=2 Q/iиt оптимальны в исходной игре. 4.79. а) <(1/2)/0+(1/2)(1/2)/, + (1/2) 7я/в; 0>; б) </i/2; (l/2)/0+(l/2)/f, /2/2>; в) <(211/243)/0 +(32/243)/f, /1/3; 16/729>; г) <(1/6)/0 +(5/6) Л; /1/2; 13/4>; Д) <(1/2)/1/8 + (1/2) Л/3> Л/2> 1/72>; 209
e) <7./12; (l/2)7l/8 + (l/2)71/2; -1/144>; ' ж) <71/2; (3/4) 71/4 + (l/4)78/4; 19/16>; з) игра имеет бабочкообразное ядро. Используя методы, изложенные в [29], можно показать, что <(1/2) 71/3 + (1/2) 72/3; (1/2) 71/3 + (1/2) 72/3; 1/6>—решение; и) <(1/2)71/2 + (1/2)7i; (1/2)71/2 + (1/2)71; 1/4>. 4.82. а) Пусть <р0—оптимальная смешанная стратегия первого игрока в игре с функцией выигрыша К. Тогда г * min $/(7((х, у)) dtp0 (х) > у € [о, 1] 5 se[0. 1J \о , 1 ( min $ К (х, t/)dtp°(x) \»е[0, б) Функции К и /(/С) выпуклы по у, поэтому v = min max 7<(х, у)-, vt= min max f(K(x, у)) yg[0, l]xg[0, 1] »g[0. l]xg[0. 1] и i»i = /(u) (cm. [29, c. 486] и задачу 7.12, п. a)). 1 I X I 4.83. Пусть — = I J , таково, что 1—v' < Vh Vi* < 'Н~н~И1 < L Тогда Ф0Т+7z'“*; 1 —Т+т)~ решение игры. 4.84. Если <(a; 1—a); (0; 1—0); u> — решение матрич- нои игры с матрицей ( 0' ^1, то <а7?+(1—a) 7f, 07о + (1-0) 7 х; о> — решение исходной игры. 4.85. Сначала следует показать, что для любой страте- гии ср первого игрока существует такое у € [0, 1], что § А" (х, у) dtp (х)< 1/3 (рассмотреть два случая: tp (1/2) 1/3 о и <р (1/2) > 1/3). Затем надо убедиться, что для любой стра- тегии ф второго игрока существует такое х£[0, 1], что §7С(х, у) dtp (у) 3/7 (рассмотреть три случая: а) ф(1)> о >3/7; б) ф(1) < 3/7, ф(1/2)<1/7; в) ф(1)<3/7, ф(1/2) > 1/7). 210
Глава 5 5.1. Для каждой вершины составим в порядке возрастания длин таблицу длин дуг и самих дуг, выходящих из этой вер- шины. При этом из рассмотрения можно исключить дуги, входящие в а0, и дуги, выходящие из а8. Имеем «о ao0i — 2 a4d2 — 2 аоа3 — 4 — 7 а0«2—5 #2 О3 а2а3 — 1 а3а2—1 a20i—2 а3аб—4 6Z2 ^5 — а2 ^4—4 ^4 d3 d3 а4аб—1 аба4—1 а4а2— 4 аъа2—3 #4 #8 — 5 #5^3 — 4 G4 di — 7 d3d3 — 7 На первом шаге, просмотрев столбец а0, устанавливаем, что «1— ближайшая к aQ вершина. Отметим это, выделив в таблице элемент а0Д1—2. Кратчайшее расстояние от aQ до укажем над столбцом а*. Все элементы таблицы, соответ- ствующие дугам, ведущим в а19 вычеркнем: 2 d0 di d2 d3 d& d3 dQ | a0at—2 aia2—2 ага3 — 1 asa2 — 1 atas— 1 asa4 —1 aoas—4 —7 О3Л5—4 u^a3—4 e2a2—3 Л0*о2—5 ^2^5 — 3 ^4^6 — 5 й3О3— 4 d2G&— 4 *7 На втором шаге исходными являются а0 и а^. Кратчайшей дугой с а» соединена новая вершина а3, с вершиной at— вер- шина а2. Сравнивая длины кратчайших путей к а3 и а3, соот- ветственно 4=0+4 и 4=2+2, видим, что они равны. Выделяем в таблице элементы а0Лз—4 и —2, указываем кратчайшие расстояния до а3 и а2 над соответствующими столбцами и вы- черкиваем элементы таблицы, соответствующие дугам, веду- щим к а3 или к а2: 2 4 а0 di d2 a3at—2 a±d2—2 a0a3— 4 aia4—7 a2a5—3 a2a4 —4 4 d4 а3а5--4 а4а5—1 d5a4— 1 а4ав—5 а6аб—7 d3 На четвертом шаге исходными являются вершины а3, ait а2, а3. Вершина а0 не соединена ни с одной из новых вершин. Кратчайшей дугой с at соединена новая вершина а3, с верши- нами а3 и а3— вершина а6. Длина кратчайшего пути к £11
равна 9=2+7, длина кратчайшего пути к а6 равна 7 (мини- мальному из чисел 7=4+3 и 8=4+4). Следовательно, бли- жайшей к ай новой вершиной является вершина а6. Перед пя- тым шагом таблица принимает вид 2 4.4 7 00 а1 02 а3 — 21 0102 — 2 0оа3—4 0ia4—7 0205—3 0204 —4 04 05 0504— 1 040g — 5 050в —7 ав Далее, можно легко установить следующую ближайшую к а0 вершину а4, причем кратчайшие пути к а4 проходят и через вершину а2 и аъ. Длина обоих путей равна 8. После пяти шагов получаем следующую таблицу: 2 4 4 8 7 Др |0o0i— 2 0р0з — 4 0i 02 | 0102 — 2 03 04 05 0р 0504— 1 2 0205—3 0204— 4 040б — 5 050б—7 После шести шагов имеем окончательно До 0рО1— 2 2 01 0102— 2 4 02 4 03 0003— 4 0205— 3 0204— 4 8 7 13 04 05 00 0504— 1 040в— 5 Итак, длина кратчайшего пути из а в 08 равна 13. Крат- чайший путь легко восстанавливается по выделенным эле- ментам полученной таблицы начиная с вершины 06, а именное 06 —> 04 —> а2 —> at —> 0О или 06—*04—>05—>02—>01—>0О- Таким образом, имеются два кратчайших пути: 0О— ^2 * ^4 ** ^6 И 0у >• 01 ^2 * ^5 * ^4 > &в* 5,2» a) 0q > 01 > 02 ^4 ^6» ^0 * * ^2 > ^5 ** — а4— б) 0О 03 -* «6 а1 Я1Р‘> в) 0о->02—>03— 212
п Рис, 24 5.3. Пусть вершина ak соответствует концу А-го года; — полные расходы, связанные с использованием автокара с конца года i до конца года /. Получаем сеть, изображенную на рис. 24. Кратчайшим явля- ется путь а0-> л3, его длина равна 14. Итак, авто- кар следует заменить после двух лет эксплуатации. 5.4. Нетрудно убедиться, что следующий алгоритм по- зволяет решить задачу по- строения минимального остовного дерева для данной сети.* 1°. Выбирают произвольный узел и соединяют с ближай- шим узлом. 2°. Для каждого из уже «соединенных» узлов выбирают дугу минимальной длины к одному из «несоединенных» узлов. Из выбранных дуг выбирают дугу минимальной длины. Узлы, являющиеся ее концами, соединяют. Этот шаг повторяют до тех пор, пока все узлы не окажутся соединенными. 5.5. Телефонная сеть строится с помощью алгоритма, при- веденного в решении задачи 5.4, и изображена на рис. 25 5.6. Минимальные остовные деревья изображены на рис. 26, 27, 28. 5.7. Максимизировать 2хо/» гДе сумма берется по всем / дугам вида (а0, aj). при следующих ограничениях: 2xz/“ — 2х/й = °» / = Ь •••» п~ 5.8. Пусть начальный поток задан числами у=х02=х25= =х56=5 (потоки по остальным дугам равны нулю). После изменения пропускных способностей дуг (вычисления не- доиспользованных пропускных способностей) получаем сеть, изображенную на рис. 29. С помощью алгоритмов 1а, 16 находим путь а0-> аг+ aQ. пропускная способность которого равна 3. После изме- нения пропускных способностей дуг получаем сеть, изобра- женную на рис. 30. В этой сетй выбираем путь а$-+ ^а^а^. пропускная способность которого равна 1. Изменяем пропускные способности дуг и выбираем путь я0-> а2-> я4-> ав, пропускная способность которого равна 2. Еще раз изменяем пропускные способности дуг и получаем сеть, изо- браженную на рис. 31. После двух итераций, добавив единичные потоки по путям а0-> ^5^ я4-> ач, а0-> Дз-* а6, получаем сеть, изо- браженную на рис. 32. 213
214
215
Наконец, выбираем путь а<г^~ а3-+- а5-+ а2-*- at, изме- няем пропускные способности дуг и получаем сеть, изобра- женную на рис. 33. В этой сети не существует пути из а0 в ав, пропускная спо- собность которого была бы положительна. Таким образом, величина максимального потока (максимальное за один день число групп) равна 14. 5.9. а) и=9; б) v=21. 5.10. Пусть узел (i, /) представляет станцию dt в момент времени /; 1=0, 1, . . . , п, где / пробегает значения с 0 ч до 23 ч 55 мин с интервалом 5 мин. При этом узел (0; 0 ч 00 мин) является источником, узел (п; 23 ч 55 мин) — стоком. Дуга пропускной способности 1 соединяет узлы (i; /) и (t'4-l; /+ , если товарный поезд, отправленный со станции di в момент /, не помешает до прибытия на станцию di+i движению пасса- жирских поездов. Дуга пропускной способности гг соединяет узлы (i; /) и (*; /+^) . ' 5 Так, например, для случая, когда и товаРные поезда, отправленные со станции i в 7 ч 25 мин, 7 ч 30 мин, 7 ч 45 мин, не помешают движению пассажирских поездов, а товарные поезда, отправленные со станции i в 7 ч 35 мин, 7 ч 40 мин, помешают движению пассажирских поездов. Соот- ветствующий участок сети изображен на рис. 34. 5.11. Сетевой график изображен на рис. 35. Первое число на дуге (обведенное кружком) — номер работы, второе — ее продолжительность. 5.12. См. рис. 35. 5.13. Утверждение можно легко доказать методом индук- ции по рангу события. 5.14. Tj=tn—ру, где ру—максимальная длина пути из pj в рп. Величины ру можно найти с помощью алгоритма Форда. 216
5.15. a) Tj = t}-, это равенство эквивалентно равенству = tn\ б) ty — Tj—tj, это равенство эквивалентно ра- венству tn = /,+ tjj + fy. 5.16. Отыскивается последовательность событий pio, ph, Pi.......P(k + i ТаКИХ’ 4T0 l‘o=0- ^ = Г'Н'М’ / = 1....k'+ 1; ift+1 = n. Путь pt> -+ pt, -+pit — ... Pik —> P‘n+1 является критическим (см. задачу 5.15). Рис. 34 5.17. При нумерации событий, как на рис. 35, получаем: /j=10, /2 = 30, /3 = 20, /4 = 35, /, = 40, /, = 50, /, = 50, /8 = Т8 = 70 (критическое время проекта), 7, = 50, Т, = 65, 7\ = 40, Т4 = 35, Т3 = 20, 7'2 = 35, 7\=15; а, аа at -+ —* а5 —► а, —а,—критический путь. Рис. 35 5.18. Сначала находится критический путь a, b, f, i и сокращается на один месяц продолжительность работы i (наиболее дешевый вариант), затем дважды сокращается (каж- дый раз на один месяц) продолжительность работы а и т. д. Порядок сокращения времени выполнения отдельных работ, критические времена и стоимости получающихся проектов представлены в таблице: S17
Продолжи- тельность Стои- мость, млн. руб. Продолжительность работ, мес ния плана, мес а ъ с d е f g h i 37 350 4 6 4 12 10 24 7 10 3 36 353 4 6 4 12 10 24 7 10 2 35 358 3 6 4 12 10 24 7 10 2 34 363 2 6 4 12 10 24 7 10 2 33 376 2 6 4 12 10 23 7 10 2 32 389 2 6 4 12 10 22 7 10 2 31 402 2 6 4 12 10 21 7 10 2 30 415 2 6 4 12 10 20 7 10 2 29 433 2 6 4 12 9 19 7 10 2 28 452 2 5 4 12 9 19 7 10 2 5.19. а) Сетевой график изображен на рис. 36. Фиктивные работы (работы нулевой продолжительности) изображены пунктирными стрелками. Первое число на дуге (обведенное кружком) — номер работы, второе — продолжительность ра- боты. Критическое время проекта равно 50; рг+ -* рл— критический путь. б) Новый срок завершения всего комплекса работ при условии, что критический путь не изменится, равен ^(1—0,2xx)4-t4(1—0,Зх4)+т8(1— 0,1х8)=50—4хх—6х4—хй. (1) Задача минимизации суммы вложений при этом является задачей линейного программирования Xi+x4+x8-> min, 0<Х1<2, 0<х4<2, 0<х8<5, 50—4хх—6х4—х8<40. Решая ее, получаем Xi=x8=0, х4=5/3. Продолжительность выполнения 4-й работы теперь равна 10. Однако критический путь остается прежним. Поэтому новый срок завершения комплекса работ при найденных значениях хь х<, х8 опреде- 218
ляется формулой (1); эти значения, следовательно, являются решениями задачи. в) Обозначим через rt момент начала i-й работы, а через S;—момент ее окончания, i=l.........8. Тогда задачу ми- нимизации суммы вложений можно записать в следующем виде: Xi+. . .+х8-> min, г^О, $й>0, i=l.........8, Si<re, Si<r„, S2<r4, s2<r6, s2<re, S3<r5, S8<r„ S4<fe, (6) S5<rg, s8<r„ (8) s7<r8, Si=Ti(l—biXi)+ri, 1=1, . . . , 8, 0<Xi<Ci, 1=1.........8, (11) Si-cT, i=l, (1) (2) (3) (4) (5) (7) (9) (10) . , 8. (12) Ограничения (3) — (9) соответствуют семи строкам табли- цы, приведенной в условии задачи. К ограничениям (2) можно было бы добавить условия г1=га=г3=0. Условия (10) опре- деляют зависимость времени выполнения работы от вложенных средств. Наконец, условия (12) означают необходимость за- вершения всего комплекса работ в срок (из них можно было бы оставить лишь последнее s8<T). Итак, получена задача линейного программирования с переменными хг, rt, $ь i= = 1, . . ., 8. Глава 6 6.1. х€Ч = {1. 2}, y£N = {l, 2}, (W(x, y)) = (* °). 6.2. x€Me={l, 2, 3}, y£N = {l, 2, 3}, (W (x, y)) = (1 2 2\ 0 13). ° 1 6.3. xa—любая функция такая, что W Сха (у), у) = max W (х, у), y^N\ W (М.) = min max W(x, у). ~ y$N XGMO 6.5. Нет; стратегия х0:х0(1) = 2, х0(2) = 3, например, яв- ляется оптимальной, но не абсолютно оптимальной в опе- рации с критерием (Г(х, ^)) = (з -0. 219
6.6. а) х0 = 2, ТГ(Л4О) = 2; седловых точек и абсолютно оптимальных стратегий нет. б) IT (Л4) — 3; оптимальные стратегии (х0 (/), i — 1, ..., 4) — = (3; 2; 1; 2), (3; 2; 3; 2), (3; 2; 1; 5), (3; 2; 3; 5); абсо- лютно оптимальные стратегии (3; 2; 1; 2), (3; 2; 3; 2); 12 сед- ловых точек. в) Г(Ф) = 7/3, <ро = (О; 2/3; 1/3; 0; 0). г) 1Г(МЯ)=3; оптимальная стратегия (3; 2; 3; 2); абсо- лютно оптимальная стратегия (3; 2; 3; 2); седловые точки ((3; 2; 3; 2); 1), ((3; 2; 3; 2); 2), ((3; 2; 3; 2); 3). 6.8. xt— любая функция такая, что min W (ха(у), г) = ге {г€ N | R (z)=R (у)} = max min F (х, г), у £ N-, хе Мо 2€{Z€ N I R (z) = R (#)} W(MR) = min max min IT (x, y). reR (N) xeM0 ye{ye N \ R (y) = r} 6.9. (x0, y0)—седловая точка в MxN для //0 такого, что max W (x, //0) = min max F (x, //); множество M может xe Mo ye N xe не содержать абсолютно оптимальных стратегий (см. за- дачу 6.2). 6.10. a) 1Г(М0) = -1, №(Л4) = 3, №(A4J=1; ^(//) = 2, //=1; 2; 5; х0 (3) = 1; 3; х0 (//)=!; 2; // = 4; 6; седловых точек и абсолютно оптимальных стратегий нет. б) Г(/Ио) = -1, Г(Л4) = Г(Л4«) = 3;х'0(//) = 2, ?в1;2;5; х0(3)=1; 3, х0(4) = х0(6)= 1; абсолютно оптимальных стра- тегий нет; (х0; 6)—седловые точки. в) R(1) = R (5), R(3) = R(4) = R(6). г) R(1) = R(2) = R(4) = R(5), R(3) = R(6); R (1)= R (2)= = R(5), R(3) = R(4) = R(6). 6.11. a) W(x, y) = \x—y\, M0=N = [G, 1]; F(d4o) = O, все стратегии оптимальны в Л40/ 1 1, //< 1/2, W(M) = l/2, x0(y) = { Q> y>X[2 Функция W (x, у) выпукла по у, поэтому имеем W (Ф) =s — W (M) = 1/2. Смешанная стратегия ф0= (/0+1i)/2 является оптимальной, так как W (<р0, i/)=l/2, у € [0, 1]. 1 1, //<1/2, . ( 1,//<1/2, 6) = \ 2, у> 1/2; W ™=1/2; Х^\ 0,у>1/2. 220
f 1, wg[l/4, 1], B>*MoJe[o, 4 ^=1/4: - z °- ^1/4> 1K x°(y>\ 1, ^[O, 1/4). г’КМГЛ'Х); Г‘М«>“1/2; f \,y <1/2, M10 = j0> y> 1/2. , n f \ I У’ Р + аЬ д) Ыу)-[ 2( ^[Р( p+a]. 1 min (a, 1/2), 0 = 0, 1—a, a/2,0<B<l-a. Наилучший гарантированный результат max 1F(/WRb) = 0<3<l-a ₽ = min (a, 1/2). 6.12. а) Пусть стратегия x0 £ M оптимальна по критерию IT. Тогда для любой стратегии х£М справедливо неравенство inf W(x(y), t/)< inf W (xQ(y), у). По определению нижней ye N yeN грани, для всякого е > 0 найдется уг € N такое, что W (х (у^, i/jXinf W (xQ(y), у) + е. Отсюда inf f(W (х (у), (/))< <f(IF(x(i/1), г/ОХ/7 inf IF(x0(z/), Устремляя хуе N ) в последнем неравенстве е к нулю, получаем inf f(W(x(y), y))<f(mf W(x0(y), у\\ = ye N \yt N J = /(IF(Af))< inf/(IF (xu(z/), y)). ye N Следовательно, стратегия x0 оптимальна по критерию IFV Пусть, наоборот, х0 оптимальна по критерию 1FX; тогда, повторяя проведенное выше рассуждение с функцией /-1 (обратной к /), докажем, что стратегия является оптималь- ной по критерию /-1 (W\) = IF. Подставляя в последнее не- равенство х = х0, получаем F1(/H)</(U7(M)X т. е. f(W = Если во множестве стратегий М нет оптимальных стратегий, то приведенное доказательство легко модифицировать, используя е-оптимальные стратегии. б) Из п. а) и равенства IF (Ф) — min max IF (х, у) = IF (М) yeN хе м9 221
получаем, что оптимальные стратегии здесь те же, что и в задаче 6.11, а наилучшие гарантированные результаты можно получить из соответствующих результатов задачи 6.11 воз- ведением в квадрат. 6.13. а), б) W (Л4) = 0. Действительно, W (Л4) 0. С дру- гой стороны, для произвольной стратегии по теореме Брауэра [45, с. 91], найдется x(f/o) = f/o- Поэтому min W (х, «/)< F (х (ув), у&) = W (уй, у0) = 0, откуда IT (М) = 0. 6.14. а) 1Г(Л10) = —1; хо = О; б) Г(Л4) = 0; xa(yt, yt) = 1, у2 > 0, ха (уи yt) = — 1, уг < 0; в) W (Мк) = 0; х0 (ylt уг) = — yt-, ( 1. Уг>0, г) Г(/Ид) = 0; xt(ylt у2)= { . п. д) Г(/Ид) = —1, хо = 0. Действительно, пусть x$.MR и х (z/lt —t/j) = x. Тогда min W (х, t/i, t/2)< min W (x, yv y2) = (J/,. y2)<£N (ylt l/i + yi=0 = min (^i(x—t/i))=—1 —|x|<—1; — 1 •C yt •С 1 e) W (ЛТд) — 0; xe (t/j, i/2) — Действительно, У 2—Pi* —1, 1, \Уг~ У1—У2> 1. У1—Уг< — 1. 0 < W (х0. У» У2) = ’ У» у2(—1+1/1). У2^+У1), 11/1— Л|<1. У1 — Уг > 1. Уг~ Уг<~ Il ж) W —1, хо = О. 6.15, Критерий эффективности т (X, У)= 2 Р(х{< у), i= 1 / 1, 11—у\ Се, где pit, 1/)=^ 0> ц_^|>8> х = ^ а) Если е>1/2, то х0 = (1/2, .... 1/2), W(M9) = m. Если е < 1/(2т), то любая стратегия оптимальна, так как гарантирует 0 попаданий. 222
Пусть <8 < 2, где /—целое, 2^/<т. Опти- мальной стрельбой по мишени является стрельба с прице- лами 1/(2/), 3/(2/)....(2Z—1)/(2/) по Lm^J выстрелов на каждом, остальные т— [_ m/l JI выстрелов не увеличи- вают эффективность стрельбы. Наилучший гарантированный результат равен [_ m/l J . Оптимальная стратегия не единст- венна, если ± < е < 2(1—гу б) Если С в < 2(Z—1) * —Целое, 2^/^т, то наи- лучший гарантированный результат равен т—/+1. 6.16. < 8 < 2 (Д1), /=1,2, .... Обозначим через ср0 смешанную стратегию оперирующей стороны (соответствую- щую функцию распределения), состоящую в том, что с рав- ными вероятностями 1/1 производится по т выстрелов по мишени с прицелами , .... . Обозначим через ф0 функцию распределения неконтролируемого фактора у, соот- ветствующую нахождению у с вероятностью 1/1 в точке i/(l— I), /==0,1, ..., I—1. Нетрудно убедиться, что W (х, (<Ро. У)> х£Мв, у £N. Отсюда следует, что <р0—оптимальная стратегия, a т/1— наилучший гарантированный результат. 6.17. Пусть 2e, = d, l/l^d<, 1/(/—1), /—целое, причем п < I, a=|_m//J, b = m—al. а) Оптимальной является следующая стратегия: в каж- дую из точек 0; 1/(/—1); 2/(/—1); ...; (Ь—1)/(/—1) на- правляют а+1 подразделений в точки b/(l—1); ... ...; (/—1)/(/—1)=1 — по а подразделений. Наилучший га- рантированный результат равен т—k, где k = па 4- min (п; Ь). Действительно, если применяется описанная стратегия, то одно укрепление может уничтожить подразделения со- средоточенные лишь в одной точке, поэтому общее число уничтоженных подразделений не превышает k. С другой стороны, обозначим для произвольной фикси- рованной стратегии через mit т2, ..., mf_i, tnt количество боевых единиц, сосредоточенных на промежутках [0, 1//); [1//, 2//); ...; [(/—1)//, 1]. Имеем = и пусть (без 1 = 1 ограничения общности) . . ^тг. Тогда «против- ник», разместив укрепления в точках 1/(2/); 3/(2/); ... 223
п (2n—1)/(2Z), уничтожит не менее 2 подразделений. 1= 1 п п Осталось доказать, что 2 mt^k. Пусть 2 mi < тогда i= 1 i= 1 П 2 /nz<n(a + l) и, следовательно, та<(а + 1), откуда i=i i i . .^tni и 2 —п)а. Имеем 2 mi < i=n + 1 i= 1 <& + (/—n)a^.la + b = m; получено противоречие. б) Пусть ф0—смешанная стратегия оперирующей стороны (соответствующая функция распределения), состоящая в том, что все т подразделений направляются в точку 1/(1—1) с вероятностью 1//, i = 0, 1, ..., I—1. Обозначим через ф0 функцию распределения неконтролируемых факторов, соот- ветствующую нахождению укреплений в точках одного из I л /13 2п— 1 \ / 3 5 2п4-1 \ следующих наборов: ; ... (21— 1 1 2п—3\ . , ..., I —2j— ; 2/; • • •, 2i )» причем каждый из наборов может встретиться с вероятностью, равной 1/1. Пусть, как обычно, х = (Х1, ...; хт)£М0—контролируемые факторы; у = (yt; ...; уп)£ N—неконтролируемые факторы; W (х, у)— критерий эффективности (число прорвавшихся «боевых еди- ниц»). Тогда W (х, ф0) < т —г < W (ф0, у), х£ Мо, у € N. Это значит, что ф0—оптимальная стратегия, а т—(тп)/1— наилучший гарантированный результат. в) Пусть оперирующей стороне стало известно, что бое- вые укрепления находятся в точках yif ..., yni. Пусть мно- жество [0, 1]\ и [у{—е, t//4-e] состоит из р промежутков (аг, р,) (может быть, [а,, pz) или (а,, р,]); $? = Р/—af>0; 77 . //—целое; 6г = ; xti — at + 8r, x,s = =aj-|-26^-j-d, •••» X(i^ =tXf 4- //8/4* (If— 1) d — pz 6p i = l, .... p, / = //+.. a = b = m—al, k — — (n—tif) a + min (n—b). Оптимальная стратегия состоит в том, чтобы в & из точек xtj, l^j^lf, l^i^p, на- править по а -}-1 подразделений, в оставшиеся I—b точек — по а единиц. Наилучший гарантированный результат равен т—k, где I минимально, т. е. соответствует, например, 224
следующему расположению известных укреплений: ^«8, t/a = 3e..уп=(2щ-\)ъ, т. е. г) Наилучший гарантированный результат равен max (m—n; 0)., 6.18. Согласно результатам, полученным при решении задач 1.7 и 1.8, необходимо найти W!(M)= min min max max (Л—p,u,—qfi; 0) 0<C<B«6V(C) l<i<n и . , IFa(Al)=min max тах(Л—р£тт(В; wj + e,); 0), и' € U' 1 < i < n где V = \u'£En n n 2 «(=£+ 2e/» J=r» i= 1 7=1 П Если 1F1(A1)> 0, to IF1(Af)= min min max (Л——qtC). 0<C< B«e У (C) 1 < 1 < n Без потери общности будем считать, что qi^qi^... .^qn. При фиксированном С, согласно принципу уравнивания [3, с. 267], для минимизирующего u£U(C) найдется номер k такой, что А—ptut—qtC = A—р^ — q^C; i = 2, ..., k, Ui = Q, i = k-[-l, ..., n. Отсюда имеем W\(/W)= min max o< c< в k Если У1 — 1. k—\..........n, to i= 1 Pi (M) = max (A—ргВ-, 0); k если 5, — sCl, k = \, ..., n, to Pi l^i(Al)=max/ A 8 № 190+ 225
если найдется номер такой, kQ-l k9 то WЦМ)= тах/А =к—..Bqkt--; о\. ( £(V')+I ) \ i=l 4 ' / Пусть теперь без ограничения общности .. п п Если р{В: /=2 ИЧ W^(M) = max(A—p{iB- 0), п п а если p{tB-±-> то /= 2 Pii 1 i=l TO lYz2(A4) = max max 1 < k < n ' п п ^+^2 8/"i" 2 . f=l /=Л+1 Л g • l^pt ; 0 : 6.19. Указание. См. решение задачи 1.2. Наилучший гарантированный результат в играх для первой страны одинаков и равен т rh. \ p и p max jr)» 7х...7m KiJ где максимум берется по всевозможным перестановкам индек- сов 1, ...,т. 6.20. a) U7! (Л4) — max (min (К; D—Д); 0)0—а). б) Если 2тш(Д; D)>D, то W (М)= ,рг.(&~а)пГ; 1 ' ' 4 min (К; £>) ’ если 2 min (Д, D) < D, то Wi (М) = 0—с) (D—min (Д, D)). 6.21. Наилучший гарантированный результат первого игрока в игре Р равен sup inf F (х, у), где В (х) = хем уев(х) — {У € Д | G (х, у)— max G (х, м)}. «€ЛГ 226
а) Максимум функции inf'F(x, у) легко найти графически. У^В(х) р Он равен 2 и достигается при х0 = 3. . < б) Функция inf F(х, у) терпит разрыв при ха= 4. Оптй- мальной стратегии нет, существует лишь е-оптимальная стратегия хе = 4-(-е, е > 0. Наилучший гарантированный результат первого игрока равен 5. 6.22. Используя теорему 6.1, для игры Г* находим: • -а) у? ==3/2, -ч - : •1 ( 1, у— 1/2—е, Хе: Хе^)= ( 0, j/^l/2-e, 8>0; б) и2 = 2; оптимальной для первого игрока является стратегия х0: х0(1) = х0(2)=2, х0(3) = х0(4)=И. Из теоремы 6.2 получаем решение игры Г8: а) то же, что и для игры Г?; „ . ( 2, у = 3, б) u’=l; x8:xe(f/)=| ь 6.23. а) Решением является оптимальная стратегия в игре Г1, где Мо = [0, оо); AF=[O, а), т. е. х0 = /сЬ/а. Наилучший гарантированный результат, «центра» равен (/щГ—ply. б) Оптимальное премирование находится из игры Р, где 7V = [0, а); Л7о = [О, оо), так как «центр» будет знать объем сверхпланового продукта к моменту выплаты премии. При- меняя теорему 6.1, получаем ( b\n(ac/b) + e, y = a—blc, Л8(у)—q уфа—Ь/с: Наилучший гарантированный результат «центра» равен ас—Ь—b\n(ac/b). 6.24. В игре Г? (Г3) первый игрок, сообщая второму стратегии вида х2=х1$М0 (х3 = х1 £ М0), может обеспечить себе результат и1. Следовательно, о1^^2, о8. Докажем неравенство v3 о?, Заметим, что у2, а Р3 у1 у2. Отсюда v3 — шах (Х3, Р8) у2. 6.25. Решим игру Г1. Положим I— {1, ..., т} и для х € Af0 введем множество 7 (х) = {i £ 71 xz > 0}. Пусть первый игрок сообщает второму стратегию х такую, что 11 (х) | < т. в* 227
Если у* € Arg max G (х, у), то у\ > 0 для всех i <£ / (х). У S N Действительно, предположим, что для некоторого номера / (х) имеем у*, = 0. Тогда G (х, у*)^Ь, < min (af+b{) Определим стратегию ye второго игрока такую, что ( *С(е^.. , i£/(x), I ai+bi— С (в) с ' >’ { 8 ----ПТТГ. k n—|/(х)|’ > ' где е>0 и достаточно мало, а С (в) —решение уравнения Е ^=с-в— til (X) Можно проверить, что При достаточно малом 8 > О G (х, min (С (8); min что противоречит определению стратегии у*. Итак, у*( > О для всех if£l(x). Тогда F (х, у*) —0 и оценка эффективности стратегии х равна нулю. Если Arg max G(x, у)= 0, то У € N нетрудно показать, что найдется е-оптимальная стратегия второго игрока у такая, что yt > 0, i £ I (х). Следовательно, в этом случае первый игрок не может гарантировать, что второй игрок не применит стратегию у, и поэтому оценка эффективности стратегии х равна нулю. Рассмотрим стратегию х первого игрока такую, что xt > О, i= 1, ..., т. Согласно принципу уравнивания Ю. Б. Гермейера (формулировку принципа см. в решении задачи 8.4), опти- мальный ответ второго игрока у(х) удовлетворяет равенствам у/(^+^ = С(х), i=l, ...,m. Xi+Vi(x) v Отсюда находим, что а/+^-С(х) ’ I=1> 228
a C(x)—решение уравнения m Далее, из выражения F(x, z/(x))== min (flt + bi—C (x)) 1 < i<m и неравенства cW>rk min (ai+bi) Л -f- D j следует, что ,min (a{+b{), а 8-оптимальная стратегия x6 первого игрока имеет вид ( г/(т—1), i^i9, X • s= { 1 I Л-8, i=ie, где i0€Arg min (at + b{). 1 < i < m Наилучший гарантированный результат первого игрока в игре Г? равен (А \ -ту в max (at + b{)-, min (ar-|-fy)). 6.26. $= sup max min F(x', y). x6Mtx'iMtyQN (x) 6.27. a) u|=5; оптимальная стратегия—сообщать Xх < 1/2, а применять zl = l; 6) t$==7; оптимальная стратегия—сообщать xx = 3, а применять г‘= 1. 6.28. Обоим предприятиям не имеет смысла производить продукцию на сумму, превышающую покупательную спо- собность С, поэтому в дальнейшем без ограничения общности будем предполагать, что рх^.С, qy^.C. Ч П7/ \ ( рх—ах, p<q, a) w (х, р, у, q)= 1 . . . / \ л'» ( ппп(/щС—qy)—ах, p^q\ б) min W (х, р, у, <?) == min (рх; max (С—рК‘, 0))—ах; V.9 в) max min W (х, р, у, q) = х.р у, я (/С — /аКУ, С <4аК, ~ аК, С > 4аК; 229
г) miri max IF (х, p, у, q) a* —aK; y,q x,p £ a>° Xx lt3 где t ч ( Я 8» > ^2> '><!'•»>=( b. л,<л„ (p К; P<Q A,, = sup W (x, p, y, q) = (C—qy) (1 — у ) x. p \ U / P>4 . p} в случае отсутствия информации наибольшая гаранти- рованная прибыль—0,16 млн. руб., оптимальное производ- ство—0,6 млн. банок, оптимальная цена—2/3 руб. В слу- чае полной информированности наибольшая гарантирован- ная прибыль составляет 64/225 млн. руб. 6,29 .6) Пусть F = у, G = f(x), Afo = /V=[O, 1]. Здесь tA(F, G) = 0. Положим Ge(х, у) = G(х, у) + ъ(у—1), где 8—сколь угодно малое положительное число. Тогда v1(F, Ge)= 1 и, следовательно, сЛ(Г, G^-^v1 (F, G) при е—>0. 6.30. а) IF(M0) = — 2, Г(М) = 3, Г(/ИЯ1) = —2, W(MR,) = 0, W(Mr>) = V, б) F.(Af,)-l, х0 = 2, F*(M) = 4, х‘0(1) = х;(3) = 1, х0(2) = 2: 1Г.(/ИЯ1) = 3, x10(l) = xie(2)=l, xw(3) = 3-, 1Г.(Л4л,) = 4, \о(П = хй(3)=1, хм(2) = 2; IF.(M*,)=1, ^зо(1)= I» *^зо (2)Хдо (3)2j в) 1Г.(Л4о) = О, х0=1; г) 2, х0 =2; Г.(Л)-4, х0(1) = х0(3) = 1, х0(2)-2; ----2, х10 = 2; F.(Af«|)»4, 4(1) = =^го(3)=1, XgO(2)=2; IF,(Af^e)= 1, х30(1)=1, х$0(2)=х90(3)=2. 6.31. a) IF,(Afo) = O, х0=1; W,(M) = 3, х0(у)=у, . У-1,2,3; W,(MRi) = 3, Xio(l)“4(2)=l, xft(3)-3; 4 IF.(AU) = q, 40)-4(3)-l, 4 (2)-2; IF,(Af^=l, •^зо (1)= 1, Я30 (2) = Xj0 (3) == 2. 230
б) Обозначим 1Г«(Л1.) = Г0, Wt(MRl)=Wkt k = 1, 2, 3. . Решение задачи приведено в следующей таблице: 8 w. *0 w x0(l), £ssl« 2 X0 (3) £o(l)=S = *1O (2) *10 (3) 0 < e < 1/2 1 2 4 i 1 3 1 1/2<8 < 1 0 1 3 i 3 3 1 3 1<8 < 5/2 —2 2 3 i 3 3 1 3 5/2 <e —2 2 3 i 3 ^-2 1 2 8 w. *»0 (1)ш*20 (3) *oo (2) uza *06 (0 *80 (2)в*зо (3) 0 < e < 1/2 4 1 2 1 1 2 l/2<8 < 1 0 1 2 1 1 2 ' К 8 < 5/2 0 1 2 1 1 2 5/2 e 0 1 2 1 1 2 6.32. Информационная функция позволяет во время опё- рации точно установить интересы противника. Для г £ Rk положим Lk — max min max Wk(x, «/); r « Rk* 8 №tttNk (r) Dk^Kx; r)GMtxRk\ max Wk(x, y) > Lk\ • I J RQk= (r $Rk\Lk= min max Wk(x, y)\ ; \ x € MoV® Nfe (?) J Nk (r, x) = fy e (/•) | wk (x, y)= max Wk (x, yt)\ ; 231
( max min W (x, y), Dk^=0, KkS=i(x,r)'.Dk yeNk(r,y) ( — oo, £>ft=0; Tk= min max min W(x,y). '6Rk X e Mt у (Nk(r,x) Наилучший гарантированный результат равен min max(/C4; Tk). Доказательство этого факта аналогично l<k<s доказательству теоремы 6.1. 6.33. а) Положим A1J={1,3, 5}, Л4§ = {2, 4}; тогда W (М) = max min max W (x, y) — 3. «=1.2 yeN xeMa б) Положим N1 = {1, 3, 5}, №={2,4, 6}; тогда W7 (Af) — max min max min W (x, y) = 2. a=l, 2 0=1, 2 x g м&у g N& в) Пусть Ea — операция нахождения математического ожи- дания случайной величины, зависящей от случайного пара- метра а, который принимает значения 1,2 с вероятностью 1/2; Еу, Е% — операции нахождения математического ожидания случайной величины, зависящей от случайного параметра у, который принимает с вероятностью 1/3 значения из множеств №={1, 3, 5} и №={2, 4, 6}. Тогда W (Л4) = Еа min max E$W (х, t/) = 3. ₽=Ь2хбЛ1а 6.34, Докажем, что ' maxminaiy, пг^п, i € М I е N min max a,,, m> п. , /елам Пусть для определенности m > п. Очевидно, что второй игрок, выбрав на первом шаге /, реализующее minmaxaf/, jeN ieM обеспечивает себе проигрыш не более v. Остается указать стратегию первого игрока, обеспечивающую ему выигрыш не менее v. Обозначим через »0(/) одну из реализаций max atJ. Удалим из множества М какое-нибудь i {I | i — i„ (/), 7 € Л/} и обозначим полученное множество через МР Обозна- чим через 1\(7) одну из реализаций max af/. Удалим из ieMt множества какое-нибудь {/{»= Ч (/); и обо- значим полученное множество через Л18 и т. д. Из про- 232
цесса построения множеств Мк следует, что max atj — = шахагу для Последнее означает, что первый i е м игрок, выбирая на k-м шаге множество Мк, обеспечивает себе выигрыш не менее v.. 6.35. а) Можно. Утверждение легко доказать, применив несколько раз известное неравенство где f — произвольная функция, зависящая от xf и у,. б) Нельзя. Пусть = —1, 1}, F(х, у, г)= х^^у^. Тогда S1/172S2F=1>— 1 = Если же = { 1» 1}> ^2 ~ ^2 ~ {0> 1}» F (xlt Х2, У}, у±, Zj, Zt)= =x1z/1 + x2y2, то Si/tW—. в) Для доказательства кроме неравенства, приведенного в решении п. а), следует использовать неравенства S:Ekf^ ^EkStf, EJjf^Ifrf. 6.36. а) Пусть n = 2m+l; положим уО ( V®. • уО. • • у® • * уО \ , Х — I/1’ m+1 > *8> т+1... m_|_ j » "гт+iy » где •*2<+1 ^2/- т_|_ | » i - Л 1 • Л 1 ^p<4/+i<^qn» ... Тогда W (х°) = . Если же предположить, что существует стратегия х=(хх; ..х2я+1), гарантирующая результат, меньший 1/(т+1), то 1 _ 1 _ 1 Х2 Х2 < m_j-l » • * ••X2l» + 2 Сложив эти неравенства, получим 1 = х2я+2—х0<1. Пусть теперь n = 2m; положим , / 1 1 . т т Х \«+1 ’ m-4-l"^8’ " т+1 ’ т+1~1"/‘ Тогда IF (х8) = + 8. Предположим, что стратегия x=(xlt .. .,х2„) гарантирует результат, меньший или рав- ный 1/(т+1). Тогда хг1—х2(_2 l/(m+1), t=l............т. Сложив эти неравенства, получим x2m С w/(m+1). Так как xtm-i < х»т> то 1—х2я_х> 1/(/и + 1), а это противоречит предположению. 233
б) Если и = 2,то Х1=1/2, х2 = 1/2-|-8. Если п = 3, то xt= 1/3,' х2 = 2/3, р/3 + 8, f(xl)>f (х2), к 2/3 4-е, f (хг) </(*.)• Если n = 4, х1 = 2/5, х2 = 3/5, _fl/5, f(x1)>/(x2), 7s-(4/5, /(хг)</(х2), (Л» 4- e. f (xa) max {f (xt), f (x2)}, ’ *$=={ Xi + e, /(Xi)>/(x2), /(xs)</(x2), /(XjX/ta). 6.37. а) Пусть Xi^x2^.. Xx„. Тогда имеем sup IF(x, f) = -^-max{2x1; x2—xr; хп_г; 2(1—x)J, teUK) z min sup IF(x,/) = §-, = x i.6L(K1 M \2Я M M J 6) Пусть x—произвольная последовательная стратегия; х = (х2;... ; хп)—результат применения х к функции, тож- дественно равной нулю на отрезке [0, 1] (пусть хг^х2^... .•XxJ. Положим fx(t) — K min 11—xj. Тогда, поскольку 1<К» fx£L(K), fx(Xi}=0, i=l, ..., n, в результате применения стратегии х к функции fx получаем вектор х; следовательно, sup W (х, W (х, fx) = 4- max {2xf, х2—х^ ...; х„—xn_2; Таким образом, никакая последовательная стратегия не может гарантировать результата лучшего, чем /</(2п). 6.38. Задачу отыскания оптимальной квадратурной форму- лы можно записать следующим образом. Вычислить величину 1 tn— inf sup inf sup —J , *<=[0, Ц» yelx JeE1 izLx,v $ где LJt,„ = {f€^(X)lf(x<) = F„ i=l, = {У I ^ЛГ, У 0} » а также значения x0 и I (x, у), на которых достигаются нижние грани. 234
Для произвольной функции f£Lx< v имеем . <й.Л0С/(0<<й.Л0» *€io. п. где = max {yz—K\t—xz|}, 1</<п , ^.v{t)= min (t/z + /<p—xz|}. I<f<n Нетрудно убедиться, что ф1.„, ср*, у € LXt у. Следовательно, 1 1 sup = max f € Lx, v Q Предполагая, что < х2 Ф1, ДО df—J , —J 1. |о :л, имеем 1 J , Jvk лоа*+-£<й.>(о<1* о п yj+Vf-i , Z1 ; 2 4“ О У п» 1 inf sup J € £l f € L%, у о о п 1 — J <й.,(0<и н о К /=2 Для доказательства последнего равенства достаточно вычис- лить полусумму площадей двух равнобедренных треугольников с вершинами (хх; i/i), (хп; уп), основаниями, лежащими на прямых /=0, /=1, и боковыми сторонами с угловыми коэф- фициентами а также п—1 параллелограммов, /-й из которых определен двумя вершинами (xz_x; yj-i), (xf, уj) и угловыми коэффициентами сторон ±К, /=2, . . ., п. Теперь найдем х0. Очевидно, что sup inf sup ув lx J 6 В* 1в Lx> у 1 0 =-H+т L 4 a /=2 верхняя грань при этом достигается при таких у, что = = ...:=уп. Максимизируя по х правую часть равенства, и /1 3 2п—1\ найдем х0 = ; ...; . 235
6.39. Пусть г = ^~, целое i определяется из условия (2/-1)4<|, (2i+l)-J->l. Тогда г0_1_ г0_ Зг а_(2«—1)г Л1-- £ > Л2 - £ ’ * ‘ * Л* - k ’ , (2«+1)г— х?+1 = -j Н j , V» _ vO М— Y° __ Г® I 2(n—/—1) r . Л/+2---4+1 “Г I....... — л{+1 Т ".."j > наилучший гарантированный результат равен г. 6.40. Для доказательства достаточно рассмотреть такую функцию /, что f (xt+1)f(at) < 0, если х{+1—at^bt—х/+1; f (xl+i)f(b{) < 0, если х{+1—а{<Ь{—х/+1, где (at, ^—ин- тервал локализации корня после I шагов поиска, xz+1— выбор оперирующей стороны на (/+1)-м шаге. 6.41. ’/, 0</<1/4, 1/4, 1/4 </<1/2, 1/2, 1/2 i 1/3, 2/3 </<2/3, < /<1; (1, 0</< 1/16, 1/16, 1/16 < / < 1/8, 1/2, 1/8 < I < 1/3, ' 1/6, 1/3 < /<1/2, Z/3, 1/2 < /<3/5, 1/5, 3/5 < /< Г; I, 0 < /< 1/8, vs = 1/8, 1/2, (1/4, 1/8 </<1/4, 1/4 </<1/2, 1/2 < /< 1; (I, 0</<1/32, 1/32, 1/32 </<1/16, 1/2, 1/16 < / < 1/4, 1/8, 1/4 < /<3/8, 1/3, 3/8 < / < 1/2, 1/6, 1/2 < /<1. Глава 7 7.1. a) F(A40) = 7/3, х0=1; F(A4)=14/3; Ха (1) = Ха (5) = 2, ~ха (2) = 3, хо (3) = ха (4) = ~ха (6) = 1; F(Mr) = 4, х0(1) = х0(2) = х0(5) = 2, x0(3) = i0(4) = x0(6) = l. б) F (Л40) = 17/6, х0 = 3; F (/И) = 13/3, стратегия ха та же, что в п. а); F(MR) = 37/12, x0(z) = 3, z-l, 2, 5, х0(г)=1,г = 3,4,6. 236
7.2. a) F(M0) = max Clx—z|dz= max 0<x<l j 0<х<1 X Z r- xo = O; 1—оптимальные стратегии в Л40, fl,z<l/2, x0(z) = { о г > 1/2 —оптимальная стратегия в М\ 1 F(Af)=C max |х—z|dz = -^-- jf 0<х<1 4 1 4 1 б) F(/Wn)= max С lx—zldz-f- max С lx—z|dz=^> o<*<i J 0<х<1 у «» , U 1/4 ГО, z€ [1/4,1], о() U,z€[O, 1/4). -fl, z<l/2, в) F (MR) = 3/4, x0 (*) = [ 0> г > 1/2> 7.3. a) F(/W0)=l/3, xo = O; 1—оптимальные стратегии; _____________ - f 1, z<l/2, . Г(Л4) = 7/12,хо(2)=(Ог>1/2 f 0, z€ [1/4, 1], 6)fW = 25/48,x0(z)= (1>г€[0>1/4). .fl, z<l/2, в) Р(/ИЛ) = 7/12, x0(z)=^0, 2> 1/2 7f4« a), 6) F(A4) = F(/W); стратегия x(z) = '1, 0^z<a, Vo, P<Z<1 является e-оптимальной при достаточно близких к 1/2 над- лежащим образом выбранных а, 0. 7.5. а) Г(/Ио)= 1/4, х0= 1; ___ . fl, z.>0, б) F(M) = l/2, x0(Zi, z3)=^_^ Za<0; в) F(MR)=l/4, x0 = 1; - - fl. *2>0. r) F(M/j) = l/2, Xq (Zj, z3)— _। z2 < 0 237
7.6. a) W (Mo) = max min -~£ A (x, у + z) = , x0 = 2; ' . <e|>2' 2=0 ' 1 6) iF0f)= min у £ max^ A (x, y + z)=-~, x„(l; 0) = xe(2; 1) = 2, x0 (2; 0) = xo(l; 1) = 1; i в) ^(Мл)= max min 4S A (x«(z), y + z) = ^ / Z->M9} У~ 1» 2 z=0 х#0 (0) =* -^»o (0 = 2; r ; ' 1 . r) IF (A4n) = min max 4 $2 A (x, y+z)=* 2, ff=l, 2>=1, 2 * 2 = 0 x.(l; O) = xo(l; 1) = 1, xe(2; 0) = £e(2; 1) = 2; А) Г(Л4л)=4,х0(1;0)=х0(2; 1) = 2, x0(l; l) = x0(2; 0)= 1. 1 7.7. a) F(M0)= max min A (x, y-\-z) = — 4 ,x#=l; x=l,'2 g_Q£A=l,2 1 : 6) W (M) = 4 У1 min max A(x, y + z)=*3, i г=0»=Ь 2*=1,2 xe(l; 0) = x„(2; 1) = 2, xe(l; l) = £0(2; 0) = l;, в) W (Mg) =4^2 max min A(x, z + y) = 0, г=0«=1,2«»1,2 x0(l; O) = xo(2; 0) = l, x0(l; l) = xe(2; 1) = 2; i г)^(Л1л)= max 4S min A(x,(y), y+z) = l, *»б{л»: N-+Mt} z=0^_l>2 i» ^»q(2) = 2; А) Г(МЙ) = 3, ;0(l; 0) = x0(2;l) = 2,xo(l;l)=;o(2;0)=l. 7.8. a) 7/3; б) 3; в) 8/3; г) 8/3; д) 3; e) 8/3. 7.9. a) W = max min S (x> 2) = № 1, ...» 4 ® €$4 2= 1 = max min Fix, z) = l; x= i...0=1,.... 4 4 16 6) W = min max V «>г F (x, z) = -g- (необходимо решить ©€S*X= 1, ...» 4-“ 2=1 238
матричную игру F); в) 1Г= max min (^-F(x, z)+4-F(x, 4)^ = 4-; x= 1.4 2= 1,2, 3 V 4 (3 \ z)4-4-F(x, 4) ) = 4 2=1 4 / 3 == min max S сог (4- F (x, z) 4- 4-^ (x, z)) = ( необходимо (d eS8r= 1, ...^ 4 z— i > v ’ * ' • / *v?A ' (3 j \ \ уF(xt z) + -^F(x, 4) \ j; г=1,’2'.’з ' Д) W= max 4 min ^F(xt 2) + ^ F (x, 3)4-^F(x, 4)^= __n. ” 4 ; (2 ... A 4-52®гГ(х, z)+^-F(x, 3)4- 2=1 ’ \ 2 4-4-/7(*> 4) j = min max У1 ®г f 4 F (x, z) 4- -7 F(x, 3)4- 4 / (О€58х=1...4Z=sl * 4)^=-j ^необходимо решить матричную, игру (lF(x, z) + ^F(x, 3)4-1F(x, 4)\=i ж) W = max (4- min F(x, z) + 4- min F(x, z)^ = 2; x=l, ...,4 \ 2=1, 2 2 2=3, 4 / 4 з) IF= min max г) = to€S4 *=U...,42=1 <01+<0»= (08 + ®4 = min max 1)4- (4 — ®/г(х, 2)4- ()<«>!< 1/2 X=1.4 \ \ z / о < Ю, <1/2 4-(o3F(x, 3)-|/-|—©j)/7!*, 4)} = (17 » min max<3®i-]-(i)34--5-’ —3®s4--n-; 5®!—®34-2; 0 < <o, < 1/2 I z z 0 ©s 1/2 3®!—3®в4-з1= min < — 3®8 + X, 5<»x—®34-2, J 0<4>,< 1/2 1 z 0 co 8 <1/2 239
f 7 \ = min.{ min (—3u>8+ ?•), . ц«„<ч>)еa \ </ min (5g),—(0,4-2), min (3(o,—3®,4-3)I = 2, (®„м,)ев «o„ <e,)eC 7 где Л = {((0р (08) 10 < (0j < 1/6, 0^(o8 1/2, 10(0x4-4(03^3}, B={((o1, ®8)|0<®i<1/2, (ossg^l/2, 1O(Oi4-4(o8> 3, 2(0x4-2(03 > 1}, C={((Ox, (o8) | (Ox1/6, (Og^sO, 2«>i4-2(o8 1} (таким образом, вычисление W сводится к решению трех простых задач линейного программирования). 4 7.10. а), б) W = min 2 ®z max F(x, г) = 4; (0€S4 2= 1 X= 1, ...» 4 B,r)F = 4 min max. Г(х,г)4-| max F(x,4) = -^; ’z=l,2, 3x=l..............4 ,4x=l,...,4 4 д, e) W = -I min max F (x, z) 4- 4- max F (x, 3) 4- z 4=1, 2x=l.............4 4 x=l, ..., 4 4-| max F(x, 4) = -^; ж, з) TF = 4 min max Fix, z)4- 2 г=1,2»=1....4 4-4 min max F(x, г) = 4. z z=3, 4x=l...4 7.11. a) lF = min/ max min Fix, г); lx=l......................4z=l,3 max min F(x, z)\ = 2; X=l, ...» 4 2=2, 4 / 6) W = min ( max (ti^Fix, 1)-|-®8F(x, 3))4- CO€S4 1, ...» 4 4- max (g)2F(x, 2)4-(o4F(x, 4))1 = x=l......4 J = min min min fs max (axF(x, l)4-asF(x, 3))4- (s, t) e Sg (a18 a8) € S2 (a2, a4) € Sa I x= 1.4 4-/ max (a8F(x, 2)4-a4F(x, 4)) j = = min /s min max (a^Flx, 1)4- (s.OeSil (an a8)eSax=l, ..4 4- a3F (x, 3)) 4-1 min max (a8F (x, 2) 4- a4F (x, 4))1 -g (a8, a4) € S8 x= 1, ..., 4 / = min (sv'+to) = min(y, oy) = ~, (s, 0€S8 6 240
где . $==<О1 + о)й, = + = 0^$, со2 = а2/, (o3 = a3s, со4 = а4/, v= min max (о^/Цх, l) + a3F(x, 3))==-^ (at, ав)€$2ж» 1, ..4 ° — значение игры с матрицей (F (х, z))x=i......4; г= 1, 3 31 и>= min max (aaF(x, 2)4-a4F(x, 4)) = -^ (a2 ,а4)€$2л= 1, .. 4 . У — значение игры с матрицей (F (х, ?)),*= ।....4; 2 = 2, 4 в) W = шах min f©jF(p, 1)4- ®aF (v, 2)4- ц, v= 1, . . 4 (Oj, <d8, <o8 > 0 \ (01+(dj4-(03= 3/4 4-co3F(p, 3)4-|F(v, 4)) = = jnax ^{-|min(F(p, 1); F (v, 2); F(p, 3))4--^-F(v, 4)| = = max /4- min I max m>n (Н« 0> F(p,, 3)); F(y, 2)1 4- v=l.....4 1 4 I|A= 1, ...» 4 J I 1 f / Л \ 1 9 ' 4-tF(v, 4)J=t; r) W = min / max («^(x, 1)4-®8F(x, 3))4- (On (0«, O3 > 0 1» ...» 4 (Oi+<o4+ct)8=3/4 4- max f®aF(x, 2)4-4-F(x, 4)^1 = x=l.......4\ 4' !} = min min /s max (axF (x, 1)4-а3^(х> 3))4- s, co, > 0 (ab a8) gSa I x= 1, . . ., 4 s+w,= 3/4 4- max f<»aF(x, 2)4--j-F(x, 4)^1 = 2=1, .... 4 \ 4 /) = min |s«4- max fo>aF(x, 2)4-4-F(x, 4))l = s» ©2 > o I x=l,...»4\ 4 ') s+(o2s3/4 = -|- min max {s'(104-F(x, 4))4-®a(3F(x, 2)4- (s*, G)2)6S2*= ** • • 4 ' +/(X. 4))}=lv'=^, где s, a/, as, t>=10/3—обозначения из п. б) решения, s = = (3/4) s', <оа = (3/4)(оа, u' = 203/15—значение игры с матри- 241
цей (104-F(x, 4), 3F(x, 2)-f-F(x, 4))x=i..4; д) W= max min /©^(p,, 1)4-®2F(v, 2)4- Д, v= 1, ..., 4 (Olt ©a > 0 \ ©i+©,= l/2 +1F(H, 3) + lF(y, 4)) = == max J-i-min(F(n, 1); F(v, 2))-f- 3)+lf(v, 4)}=£ e) W — min . / max (©^(x, l)+.4-F(x, 3)}+ ©i, ©a > o |xs 1, . . ., 4 \ 4 / (01 +(D 2= 1/2 +*_max ^©3F(x, 2) + yF(x, 4))| = = min {max(3©i+1/2; 4©4; 6®4 + 1/2; 2сэ<-4- 1)-U 0 < ©i < 1/2 + max (1/4; — 4©j-|-ll/4; | ®21 + 5/4)} = 7/2; ж) F= max min {©jFfp., l) + ®3F(v, 2)4- ц, v=l, ..., 4 © €$4: ©i + ©a=©8+®4 4-©sF(H, 3) + ©4F(v, 4)} = = ^- max {min(F(p,, 1); F(v, 2)) + 4-min(F(p,, 3); F(y, 4))} = 3; a) W = min / max (©jF(x, l)+©3F(x, 3)) + © €S4: 1, ...» 4 ©l + ©i=©8 + ©4 . + max (®aF(x, 2) + ®4F(x, 4))1 = №1.......4 f min {max(3®1 + 2©3; 4®x; 6©44-2®g; 2©1+4®<) + 0 •< ©v ©3 < 1/2 + max(l/2—©s; 7/2—4®4—3©8; 2—®f—3©3; 3 + ®x—7®3)}= = min/ min (—2©i + ©3 + 7/2), \(O, ©з)€Л min (2©x—©3 + 7/2), min (7©4—5®34-3)\ = 7/2, (©!,©«)€ в (©!, ©8)€C / где 4 = {(®i, ®3)[0<2©1<®3<1/2}, B = {(©1, ®3) 10sC©3 1/2, ©j ^2©1( 5®j—4©3 ^l/2}, С={(®4, ®3)|®x^l/2, ©3 0, 5©x—4©3 > 1/2}
(таким образом, вычисление W сводится к решению трёх простых задач линейного программирования). 7.12. a) W= max min $ (х—z)2do(z) = 0<x<1(0€Qq = max min (x—z)2 = 0. 0<X<10<Z<1 Здесь Q—множество всех функций распределения на отрезке l<>. > К б) W = min max \ (х — г)2 do) (z) - 1/4—значение игры (О €ЙХ€[0, 1] о на единичном квадрате с функцией выигрыша (х—г)2 (оно вычислено в решении задачи 6.12); / 1/2 в) ТГ = max min \у ? (х—z)4dz-|- 0<х< 1 о < *г< 2 \ о ' 1 л. + (2—4/) 5 (х—z)4dz] = 1/2 / = max min (А ух-±- у+ х^—Лх +£} ==ъ'> O<X<1O<0<2. 4 Z 1Z/ 1Z / 1/2 г) IF = min max (у С (х—z)4dz-j- О<0<2О<Х<1\ J ; 1 \ + (2—У) f (х—z)4dz ) = 4: 1/2 J 1 д) U7 = max min \ (х—г)? do (z), где Q—множество таких о < х< 1 «о ео о 1 функций распределения о> на отрезке [0,1], что J z do (z) = 1/4. о В силу выпуклости функции (х—z)4 по z и неравенства Йен- сена минимум достигается на функции распределения о=/1/4, т. е. IF = max (х—1/4)4 = 9/16; 0<х< 1 1 е) W— max min\(x—z)4 do (г) — 1/16, где Q—множе- 0<x<1g)€Q() ство таких функций распределения о на отрезке [0, 1], что $ z do (z) 1/4; о ’ ' 243
р / 1\2 9 ж) «7= max min \ (х—z)2dco(z)= max х—т/=тк> 0<л<1шеаЛ 1/4<х<1 \ * / 10 где й—множество таких функций распределения со на от- 1 резке [0, 1], что J z dco(z) <2 1/4. о , 1/2 7.13. а), б) «7=1/4; в), г) W= min | у С (1—z)2dz+ ' 0<(,<2\ч J 1 + (2—У) § 22dz j — ^2- Для д), е), ж) . 1/2 ) / 1/2 1 \ «7 = min( С (1 — z)2dco(z)+ С zsd<»(z) ), “б0\0 1/2 / где й—множество функций распределения на отрезке [0, 1], удовлетворяющих соответствующему интегральному ограни- чению. д) «7=9/16; е) «7=1/4; ж) «7=9/16. Указание. Принять во внимание, что подынтегральная функция представима в виде max(z2; (1—z)2), и воспользоваться неравенством Йенсе- на. 1 7.14. а) «7 = 4 max min С z(x-f-i/)dz = O; i х€[-1. 1]»е[-1,1] Jj / 0 6) «7= max min min \p \ z(x-f-i/)dz-|- X6[-l, l]p€[0, l]ffg[-l,l]k J \ — 1 1 x + (1— p) jz(x+y)dz j =—-i-. *o = O; ° / V 0 в) Г = min max min (p \ z(x+f/)ds + P€[0. 1 ] XG[-1, 1Ь€[-1, 1] \ J, 1 \ + (1 — p) $ z(x + y)dz )=0, 0 / ( 1, 0<p<l/2, *o(p> y> z)=] . ^„^I.
/ 0 г) W = min max ( p \ z(x + y)dz + pe[O, 1], i]xe[-l. 1] \ 1 >. + (1—p)$z(x4-y)dz) = 0, о / ( 1, 0<p<l/2, x0(p, y, z)=| 1/2<j9s-1; / о д) IT = min ( p \ max (z (x + y)) dz 4- pe[O. U 1 + 0— P)\ max (z(x4-t/))dz) = 0, О X€[-l. 4 ( —1, — 1 , 0<г<1. 7.15. Пусть Xi—количество леса (в тоннах), предназна- ченное для получения полиматериалов; х2— для изготовления фанеры; х3— количество леса (в тоннах), не подвергающееся переработке. Тогда подлежащая максимизации целевая функ- ция (средняя прибыль) имеет вид z=10xi+15x24-3x8. (1) Ограничения на количество имеющегося в наличии леса: Х1+х2+хз=10, xj>0, /=1, 2, 3. (2) Условия на реализацию продукции: PlSx.cDJ^Q.S; P[5x2<D2l>0,8. (3) От вероятностных ограничений (3) перейдем к эквивалентным детерминированным [1]: 3X1 *^*3, 5х2 <3. (4) Решение задачи линейного программирования (1), (2), (4) определяет оптимальную стратегию х°=(1; 3/5; 42/5), позво- ляет получить максимальную среднюю прибыль 44,2 усл. ед. 7.16. Плотность случайной величины х есть f (х, а) = —2=г- ' 7 /2л а 245
Вероятность того, что деталь будет выброшена, равна *». f (х, a) dx, а вероятность того, что деталь поступит для о т дальнейшей обработки, равна $/(х, a)dx. : ; хг Таким образом, критерий эффективности (средний доход) ' Xt т " ^(а) = (р—k)— p\f(x, a)dx+(p—p^f(x, a)dx . - о ' X, . Абсолютный максимум F{a) не достигается на границе при а = 0 или а = т. Следовательно, оптимальное значение а, должно быть решением уравнения . т = a)dx— (P—Pi)^af(x, a)dx = 0. О x, Учитывая замечание к условию задачи 7.16, можно считать, что X, о. С- Дх, a)dx=-^U- f е-”би =---, J да v ' К 2л a J /2л а ’ О “® т оо С - f (х, a) dx=-Д=- Сё-’du=-«)’/(2а)* J да ' ' ’ к 2naJ /2л а ’ х2 vt , где Таким образом, уравнение dF/da = O принимает вид ре-(Х1 -a)V(2a«) = (p—pi) e-(x,-a)«/(2a«)t 2°г 111 (тзУх) = (xt—ay—iXi—ay.. Отсюда получаем единственное решение = + ln _Р_\> . 2 х2—Xi \р — pt) 2 7.17. Величину Х>0 можно интерпретировать [16] как среднее число автолюбителей, прибывающих на станции за 246
единицу, времени, а 1/% как среднее время прибытия одного автолюбителя. Величина р имеет смысл среднего количества обслуженных автомобилей в единицу времени (если оборудо- вание АЗС не простаивает), а 1/р — среднее время обслужи- вания. Следует рассматривать вариант 1/р<1/1, так как в про- тивном случае очередь будет расти до бесконечности. Обозна- чим через Р (п) вероятность того, что в системе (т. е. в очереди и в процессе обслуживания) находится п автомобилей. Последовательность Р={Р(0), Р (1), . . .} называется рас- пределением длины очереди. Рассмотрим малый промежуток времени длины х. Если в на- чальный момент этого промежутка имелось распределение длины очереди Ро={Р0(0), Ро(1), • . то распределение дли- ны очереди Рх в конце промежутка равно Р,(О)=Ро(О)(1-Лт)+Р,(1)рт, (1) Р,(1)-1Р.(0) Хт+Р0(1)(1-1т)] (1-рт)+ +Р0(2) (1—Ат) рт. Так как х мало, то, пренебрегая слагаемыми с х2, получаем Pt(l)=P.(0) Лт+Ро(1) (1-(р+Л) т)+Р0(2) рт. (2) В стационарном случае, когда распределение длины очереди не изменяется со временем, Pt (п)=Р0(п)=Р(п), н=1,2, .... Используя этот факт, из формул (1) и (2) имеем —1Р(0)+рР(1)=0, %P(0)-(W)^(l)+^(2)=0. (3) Аналогично при любом п выводим уравнения ЬР (п—1)—(Х+р) Р(н)+рР(п+1)=0. (4) Из формул (3) и (4) следует, что Р(1) = £Р(0), г* Р(2) = ±(Ь+И)Р1-1 Ро = (£)2Р (0), . р('оЧгУр<0)- <5> * * - \ г* / 247
00 (Пусть р = А,/р; тогда, поскольку 2 р (п)= 1» из (5) имеем п=0 Р(0)2р" = 1; л=0 при р < 1 получаем. Р(0)—L=l. ' ' 1— р Отсюда Р(п) = р"(1—р), п=1, 2, .... Величина р называется нагрузкой системы. Теперь можно вычислить критерии работы АЗС: ,V4-/>(0)-l-p, 00 00 ' SпР(п) = U — Р) S пРп = Т^р n=0 п=0 W1 = 0-P(0)+ 2 (П—l)/’(n)= 2 nP(n)_ 2 P(n) = /1=1 . П = 0 П=1 ;__p___P=-±L 1-p p 1-p ’ W — 1 W — — P 3~p— V —V 7.18. Результаты оценки вариантов АЗС по критериям Wt, i — l, , 5, приведены в следующей таблице: Номер варианта Л 1Д 1/ц Р 1 0,25 4 мин 0, 5 мин 1,25 2 0,25 4 мин 0,286 3 мин 30 с 0,875 3 0,25 4 мин 0,5 2 мин 0,5 4 0,25 4 мин 1 1 мин 0,25 5 0,25 4 мин 2 30 с 0,125 Номер варианта. 1Г» 1 2 6,13 , 24 мин 30 с 28 мин 0,125 7 . 3 0,5 2 мин 4 мин 0,5 1 4 4 1/12 20 с -1 мин 20 с 0,75 1/3 5 1/56 4 с 34 с 0,875 1/7 248
Рис. 37 Для первого варианта АЗС очередь автомобилей растет до бесконечности. Второй вариант хорош своим высоким по- казателем загруженности оборудования АЗС р=0,875, однако в нем возникают большие очереди (в среднем семь автомоби- лей) и в связи с этим большие средние потери времени авто- мобилями: Ц73=28 мин. Третий вариант приводит к тому, что оборудование в среднем половину времени простаивает, однако среднее количество автомобилей в системе равно только одно- му, а средние потери . времени равны 4 мин з1 (при среднем времени обслуживания 2 мин). « В остальных случаях очереди практически нет, 0 но оборудование АЗС большую часть времени простаивает. 7.19. г(/)=г(0)—kt+V(f), где V(/)— суммарные поставки за период [0, t}. Очевидно, V(t)=qn(f), где n(t) — число зая- вок за этот период. В момент получения заказанного продукта его количество на складе достигает величины S=s—qe+q, где qe=M). Поскольку z(0)=S, а интенсивность потребления постоянна и равна к, уровень запаса достигает в первый раз величины s в момент Ti=(S—s)/k. В этот момент подается заказ, который удовлетворяется через промежуток времени 0, т. е. z(xi-|-0) становится равным S и все повторяется сначала (рис. 37). Для того чтобы определить общее число поставок п (t) к мо- менту t, надо определить, сколько отрезков длины т=Т!-|-.0 укладывается в отрезке [0, /], т. е. Выражая т через Т1 и 0, получаем . . . _ _ ! а 5—s , fi S—s-He _ q . т = т1 + 0=— + 0=-------------т, поэтому n(t)=[kt/q\ и окончательно имеем z(t) = S—kt + q[kt/q\. 7.20. a) s° = — So= 1/"(рИс. 38). ’ V atai + a3 0 V a2ai-j-a3 ' б) Большие издержки при неудовлетворении спроса соот- ветствуют случаю —>-+оо. В этом случае из п. а) следу- ет, что s°—*Х0, S0 —► К2кс0/а^. Таким образом, оптимальная стратегия состоит в следующем: в момент достижения запа- сом уровня qe, необходимо подать заказ на количество про- 249
дукта <7=S* = K2Xr0/a2. При этом заказанный^ продукт по- ступит в тот момент, когда уровень запаса достигнет нуле- вого уровня (рис. 39). z(t)L 7.21. Пусть состояние 0 означает, что теннисисту пред- стоят две попытки; состояние I—что осталась одна попыт- ка. Пусть решение подавать «сверху»—это решение 1, «снизу»—решение 2. Тогда г). '»8)> '•“Шс-о+т-1]—I- „ _7Г1/ П-1- 2 ll— 7 с°а 8 [ з ' *1+ з ’ 1J 24 ’ = ^-4[4(-i)+4-i]+4-i-4, ci. = "g [у(“0 +у 1] ’ 1 = Пусть первоначально выбрана стратегия (1, 2), т. е. при первой попытке теннисист подает «сверху», при второй — «снизу». Система (7.1) принимает вид g = —1/8 + (3/8) v0 4- (5/8) vt—v0, g=5/12 + t»o—vi- Полагая Vf = 0, найдем g=sl/12, t>0 = —1/3. Далее, по фор- мулам (7.2) убеждаемся, что (s0; Si) = (l; 2). Таким образом, (Г; 2)—оптимальная стратегия. 7.22. Положим yft=sjrfdlft. Тогда nf= 2 !/»»• Средние расходы за единицу времени в рассматриваемой ситуации 25Q
определяются формулой . м к м к 2 2,лt с« = 2 2,crt^tt« f=OJfe=l f=0fc=l M !M к i Из условия 2 nt = 1 получаем 2 2 У Ik = 1 • /=0 i=0*=l Как известно из теории марковских цепей,. Л/—2 niPij> где рц—вероятность перехода системы из состояния! / в состояние j. Для управляемого процесса с применением сме- шанных стратегий это условие можно записать в виде •’ к м к ' ' ' - ‘ ' Ъу^=Ъ 2 *=) Z=04=l Таким образом, задача отыскания оптимальной смешанной стратегии принимает вид < ? м к 2 2 i=o/?=l м к 2 2 1 = 0, 1, .... М; k=l, ..., Я; .к м к ^yiftpt}(k) = o, j = 0, 1, .... м. k= 1 i =0 k- 1 Можно показать, что решение обладает следующим свойством: неравенство выполняется ровно для одного k при каж- дом I, т. е. оптимальная смешанная стратегия является детер- минированной. 7.23. Будем считать, что система в момент t находится в состоянии 0, 1, 2, 3, если в конце месяца t в водохранилище содержится соответственно 0, 1, 2, 3, усл. ед. воды.. Пусть решения 1, 2, 3 означают, что в начале месяца производится попуск соответственно 1, 2, 3 ед. воды (если нужного коли- чества воды нет, то расходуется вся имеющаяся в водохра- нилище вода; решение <не расходовать воду» исключается из рассмотрения в силу его очевидной нецелесообразности). Тогда матрица расходов, выраженных в сотнях тыс. руб., имеет вид 7 3 3 3\ (. V _1 — 1 — 1 —1 ) (crth=o, 1, 2. з — I _1 —2 —2 Г \—1 -2 —3/ 251
Применим для решения задачи алгоритм улучшения стра- тегий. Пусть вначале выбрана стратегия R=(2, 2, 2, 2), т. е. если в водохранилище содержится О, 1 или 2 ед. воды, то расходуется вся вода; если же содержится 3 ед., то расходу- ются две из них. Система уравнений (7.3) в рассматриваемом случае принимает вид ¥.(₽)= 3 + 0,99 [1 Vo (R) + у Vx (R) +1 V2 (R)+± V8 (R) ] , Vt (R)= -1+0,99 [ | Vt(R) +1 VX(R) +1 V,(R) +1 V3(R)] , V, (R) - -2 + 0,99 [1 V0(R) +1 VX(R) +1VJR)+-1 V,(R)] , Vs(R)±=_2 + O,99[4vi(R) + 4vi(R) + lV8(R)]. Решая ее, находим: V0(R)=—103,881, VX(R)=—107,881, V»(R)=—108,881, V8(R)=—110,358. По формулам (7.4) опре- деляем новую стратегию S=(l, 1, 1, 2) (если в водохранилище 1, 2 или 3 ед. воды, то в соответствии с этой стратегией расхо- дуются соответственно 1, 1 или 2 ед. воды). По аналогии с (7.3) получаем систему уравнений Vo (S) = 3+0,99 [1 У. (S) +1 Vi (S) +1V4 (S) +1V3 (S) ] , Vt (S) = -1 + 0,99 [1 Vo (5) + у Vx (S) +1V8 (S) +1V8 (S)] , V8 (S) = —1+0,99 [lVi(S) + 4v8(S) + lv8(S)] , ' V. (S) - —2 + 0,99 [j Vx (S) +1V8 (S) +1V8 (S)] . Решая ее, найдем: V0(S)=—119,642, VX(S)=—123,642, V2(S)= =—125,119, V8(S)=—126,119. ДаЛёе убеждаемся, что 7’=S и; таким образом, найденная стратегия является оптимальной. 7.24. Пусть состояния 0, 1 означают,’ что в текущем месяце химический комбинат производит соответственно продукты 0 и 1. Пусть решения 1 и 2 означают, что в следующем месяце для очистки будут использованы соответственно процессы 1 и 2. Очевидно, что з1). сох = (1/5)1ОО + (4/5) 10 = 28, с08 = (1/5) 10 + (4/5)30 = 26, Сц = (2/5) 100 + (3/5) 10 = 46, сХ8 = (2/5) 10 + (3/5) 30 = 22. 252
Пусть сначала выбрана стратегия (2, 2), означающая; что в следующем месяце будет использоваться процесс 2 незави- симо от того, какой продукт производится в текущем месяце. Система уравнений (7.3) принимает вид V0=26+(l/2)((l/5) Vo+(4/5) УЭ, V1=22+(l/2)((2/5) Vo+(3/5) Vi), откуда Vo—49,091, Vi=45,525. По формулам (7.4) получаем, что (s0, Si)=(2, 2). Таким образом, (2, 2) — оптимальная стратегия. . 7.34. а) Обозначим через v(fl число требований, посту- пивших в систему в интервале времени [0, fl; v(0)=0. Согласно основному свойству экспоненциального распределения, v (fl — стационарный случайный процесс с независимыми прираще- ниями. Задача состоит в определении распределения вероят- ностей Ph(t)==P(y(t)==k), k=Q, 1, 2, ... . Покажем, что для любого t>b случайная величина v (fl имеет пуассоновское распределение с параметром at, т. е. £zv<o = e-a'<'-*), P*(fl = ^e-et, й>0, £v(i)=a/, Dv(t) = at. Можно проверить, что P0(/) = e-ef. Для k 1 интересующая нас реализация случайного про- цесса v(fl изображена на рис. 40. В некоторый момент времени и, и £ [0, t), в систему по- ступило &-е требование («—значение случайной величины Уг, имеющей распределение Ек_1 Эрланга порядка k — 1, = k a~\ при этом следую- щее требование, поступающее через случайный интервал вре- Рис. 40 мени а (случайная величина а имеет пуассоновское распределение с параметром а до момен- та t (за время t—и)), не успело поступить. Необходимо учитывать все возможные реализации случайного процесса v(fl. Формализованная запись дает искомое распределение при k1: Pft(0 = P(v(0 = Afl = P(^</, |* + а>0 = t =jr“l-4dEt.1(u)=(jfe-il. о Заметим, что Ра(А = Ел_х(0—Ek(t). 253
б) Если теперь учесть, что реализация случайной ве- личины a; v(/)—число требований, поступивших в СМО за время а, то £zv<«> = £a£v (а) 2v (а) = £>v <«) d Я (и) = О QO = d А(и) = а(а—аг), о . . 7.36., а) Обозначим моменты поступления требований в п СМО через t„, ta — 2 Zk< h — Функция распределения 1!'u ' k=i Случайной величины гк, k^l имеет вид А (Х) = Р (гк < х). Если v(/)—число требований, поступивших в СМО за интер- вал [0, /), то необходимо найти распределение Рк (t) = =P(v(t) = k). < Распределение случайной величины t„ можно записать л . / « \v в виде А „(х)=Р(/„<х)=Р( 2гь< х )=Л*"(х)=Л*.. .*Л(х) \Л=1 / *—V— п раз или, используя преобразование Лапласа—Стилтьеса, в сле- дующем виде: £ехр(—s/„)==[a(s)]'’, a(s) = £exp(—szft), Легко проверить, что Ро(/)=1— A{t). При k реализации v (t) имеют такой же вид, что и k в задаче 7.34, если считать £* = /*= 2 г„, поэтому Pft(/) = =ДИО-Л+1(О- Перейдя к преобразованию Лапласа—Стилтьеса, имеем 00 s J e~st Рк (t) dt=E exp (—stk)—£ exp (—stk+1)=t о =a*(s)(l—a(s)), ^>1. Искомое распределение можно представить в виде : s\e-st£2vWdf = sK-sty. РД/)гЧ/= ,1~<X(,SV • 254 J
б) Учитывая, что в приведенных выше рассуждениях t— реализация случайной величины 0, получаем = Ee£v(p)Zv(3> = J Ezv<“> d (1 —e-6") = о =f> C e-4Ezv<«) du = J 1— za(b) о 7.38. Обозначим через длину интервала, начинаю- щегося в момент времени t и оканчивающегося моментом, прихода ближайшего после t автобуса. Необходимо найти lim Р (£ (t) < х), т. е. распределение £(оо). Заметим, что /—►00 КО—регенерирующий процесс, моменты прихода автобусов tk—моменты регенерации. > Определим искомое распределение на отдельном цикле регенерации: р,(/, х) = Р (£(/)<*, г1 > 0 = ^(zi—t<x> > t)=P (t < zt< x+1)=A(x-\-t)—A{t—0). Среднее время между приходами автобусов равно a~1 = Ezk — j /dA(/), a ° . ч 9 t ... искомое распределение F(x) = limP(5(/)<x)=aJ p(f, x)d/ = /-►co 0 X = aj[l — A(u)]du. о Преобразование Лапласа—Стилтьеса имеет вид <p(S) = Ee-E<*> = ^^, где a(s) = Ee-s**. Среднее время ожидания автобуса равно =»)—ф'(0)=£^+^. (Объяснение «парадокса времени ожидания» см. в [4].) 7.40. Обозначим через l(t) количество пассажиров на остановке в момент времени t. Требуется определить lim P(l(t))=k), k—G, 1, ..., или Ezr(+<®)=2zft^G(+00)=^)> /-►со Л>0 255
Положим и (Л г) = 2 zkP (I (0 = k, 21 > t) = со J <1Л(^) = е-«п-ф<г))[1— Л(О]. t Искомое распределение имеет вид со Ez*<+») = (EZ1)-1 J — A (u)]du^ о 1—а(я—дФ(г)) Ezi (а— аФ (г)) а($) = £е_®г» (см. 7.38). 7.41. Предположим, что при / = 0 в системе начинается рабочий период at. Введем в рассмотрение случайный про- цесс o(Z):o(Q = 1, если в момент t система в рабочем состоя- нии, и о(/) = (), если в этот момент времени происходит ее восстановление. Искомая вероятность—lim 1). t-^co Процесс <г(/)—регенерирующий, моменты регенерации tB, п /п= 2 (аб+Рл)> п = 1» 2, ...» длительность цикла регене- рации равна ай + рй. Предельное распределение <т(/) в случае конечности мате- матического ожидания Е(а£ + 0Л) <оо и неарифметичности распределения А »В(х) = Р (aft + pfe < х) можно определить из предельной теоремы для регенерирующих процессов: ОО ШпР(о(0 = 1)=£^р^JP(o(«)=l, aj+p1>«)dM = __ Eat “£a14-£p1‘ так как Р(о(ы) = 1, «i + Pt > ы) = Р(ах> u, «1-|-Pl >н) = — Р (а£ > ц)= 1 — А (и) и , 00 J [1 —А(ы)] бы = Еах. о 7.42. Приведем два решения Задачи. Решение А. Обо- значим через v(i) количество требований в системе. Тре- буется определить вероятности Pk(t) = P (y(t) = k), k = Q, 1. 258. .
Случайный процесс v(t)—процесс гибели и размножения, для которого / = {0, 1}; время пребывания в нулевом состоя- нии имеет распределение интервалов входящего потока 1—е-вх, т. е. а0=а, pQ = 1; время пребывания в первом состоянии — время обслуживания — имеет распределение 1—е~цх, т. е. «! = ц, Pi = 0; v(t)—цепь Маркова с непре- рывным временем и конечным числом состояний. Вероятности Pfe(/), k = Q, 1, удовлетворяют следующим дифференциальным уравнениям: р;(/)=—аРо(0+|*Л(0> (I) Р'1 (0=^о(0-рЛ (0- (2) Действительно, согласно уравнению Колмогорова — Чепмена, Ро (t + h) = Ро (t) Рй0 (h) + Рх (0 Р10 (А) или при h—> 0 P0(t + h) = P9(t)(l-ah + o(h)) + P1(t)(lih + o(h)) + o(h), откуда легко получить (1). Аналогично можно обосновать (2). Стационарное распределение = lim Рк (t) существует, /->00 не зависит от начального состояния процесса и определяется из системы алгебраических уравнений —ал0 + рл1 = 0, n0 + n!=l. Действительно, легко убедиться, что цепь Маркова v(t) — сжимающая с конечным числом состояний; следовательно, существует стационарное распределение. Систему алгебраи- ческих уравнений можно получить, учитывая условие л0 4- 4-л1= 1, предельным переходом в (1), (2), доказав, что в дан- ном случае limP*(/) = 0. /->00 Решая эту систему уравнений, окончательно имеем ц а «ПС л — . , «ГС-| — . • 0 а + р* 1 а + р Решение Б. Процесс v(t) (количество требований в си- стеме)— альтернирующий с чередующимися длительностями а и р—поступлением и обслуживанием требований. Поэтому согласно результатам, полученным в задаче 7.41 на основании предельной теоремы для регенерирующих процессов, вероятности лк = lim Р (v (/) = k) равны соответст- /->00 венно и "1 = ^£р.где£а=а-1,£р = р-1, что совпадает с результатом решения А. 9 № 1904 ” 257
7.43. Повторяя этапы решения А предыдущей задачи, для вероятностей Рк (t) = Р(у (/) = k), k € I, получаем систему дифференциальных уравнений р;(0=-«Л(0+Ь1Л(0. P'k (О=Л-i (0-(«*+М (0+^+Л+1 (0. 0 < k < П, P'n(t) = an_1Pn_i(t)-bnPn(t), . где ак = акрк и Ьк = акдк, kgl. Стационарное распределение существует при любом на- чальном распределении и п лА = Шп/\(О = рЛло>О, 2л*=1, /->оо /г=0 где p*=X.aV; fe==1...... 7.46. Повторим этапы решения А задачи 7.42, обозначив Рк (t) = Р (v (t) — k), kg 1. Вероятности Рк (/) удовлетворяют системе дифференциальных уравнений P;(/)=-a.Pe(0+MM0. Р;(0=а»-1^-1(0-(^+МЛ(0+^+Л+1(0; *>1. где aft = aA₽ft, bk = akqk, fc>0. Из сжимаемости и неразложимости цепи Маркова v (t) следует существование limPs(£) — лк, k^O, ИтРД/) = 0. /-> оо /-> 00 Далее получаем систему алгебраических уравнений для лк, kg/, которая имеет решение Я*“РЛ. Р* = » *>°> Ро=1- Существование стационарного распределения такого, что лк > 0, 2 пк— 1 (эт0 и определяет константу л0), равно- сильно сходимости ряда 2 Рк- Если ряд 2 Р* расходится, то лй = 0 для всех &>0. Последнее утверждение доказы- вается с помощью предельной теоремы для регенерирующего процесса v (t). Конечность математического ожидания дли- тельности цикла регенерации равносильна сходимости ря- да 2 Рк- 7.55/ Заметим, что длительность периода занятости не зависит от порядка обслуживания требований. Будем счи- тать, что порядок обслуживания требований инверсионный 258
(LIFO). Структуру периода занятости можно изобразить в виде схемы (рис. 41). v(U) Величина л = р + 2 я*> гДе v (Р)—количество требова- & — 1 ний, поступивших в систему за время р обслуживания одного требования, имеет распределение Пуассона с параметром ар. Здесь лй—случайные величины, имеющие такое же распре- деление, как л—период занятости системы. Тогда л(«) = / / v<p> \\ =Е ехр(—sn) = E ехр( — s( Р + 2я* ) )=Ер[ехр(—styE^x х exp (— sn)v <₽>] = Е3 [exp (— sp) Ev(₽) [л (s)]v <₽>] = Р (s-f-a — — ал($)). Следовательно, n(s) удовлетворяет уравнению z=P(s+a—az) (*) . —j------—?--------r— С другой стороны, по- теоре- ме Руше, уравнение имеет единственное решение z= Рис- 4 = л (s) при Re s > 0, причем | г | 1, | л (s) | 1. Согласно тео- реме о неявной функции, это решение аналитическое при Res^O. Решение уравнения (*) является преобразованием Лап- ласа—Стилтьеса некоторой случайной величины; следова- тельно, случайной величины л, если л(4-0)=1; в нашем случае при аЕР 1. 7.56. Решение можно сразу же получить из соотношения типа (*) предыдущей задачи, если учесть, что Ел =—л'(0); Ьл=л"(0)—[—л'(О)]2. Поэтому получаем! Ел=Ер/(1—аЕ$), если аЕ$ < 1, и Ел = оо, если aEp^sl. При аЕр < 1 имеем Пл = £>р 4-а (Е₽)8/(1 —аЕР)«. 7.57. Рассмотрим следующий случайный процесс! v(/)=0, если в момент t система свободна, и v (/)==!, если в мо- мент t система занята обслуживанием требований. Процесс v (/)—альтернирующий с интервалами аил (а—интервал поступления требования, л—период занятости). В соответствии с решением задачи 7.41 Я°= Р = °) = fa-t-Ел e a-i-|-£P/(l—а£Р) ~ 1 ~аЕ$- 7.59. Обозначим последовательные моменты времени через tn, nZjsl, а через Ln—количество требований в системе в момент tn. Имеем Рп(г) = Ег£»; р—время обслуживания требования; а—интенсивность входящего потока. Найдем lim Pn(z)=Ezb. П-»-» 9* 259
Величины Ln образуют однородную неразложимую сжи- мающую цепь Маркова. Можно убедиться, что при аЕ$ < 1 существует стационарное распределение, например такое, как предельное распределение регенерирующего процесса (моменты регенерации—моменты освобождения системы от требований). Поэтому существует предел P2(z) — 1imP„(z), причем Р2(1) = 1. В данном случае справедливы соотношения, ^+i(2) = ^^^₽(a-az)+P„(0)z; п>1, где р (s) = Е ехр (— s0). В пределе имеем Р2 (г) = Ра (0) —= 2' ' 2X7 г—р (а~аг) = Р* (°) z-l~a-az) Р ^~аг) + (0) г, | г |< 1; из условия Р2(1) = 1 получаем Р2 (0) = 1—2—адр • Среднее число требований определяется соотношением р г р' /1 \ д2£>р-|-2 (а^Р)2 л;~2(2-а£Р) (1— аЕ$)‘ 7.60. Сохраняя обозначения, принятые в предыдущей задаче,^аналогично проверяем, что существует предел Рг (z)= = limP„(z), Р1(1) = 1. Следовательно, справедливы соот- п->оо ношения (z) = [?„ (г)—Р„ (0) + Рп (0) г] ₽ (а—аг) И Р1(г) = Р1^г_р\~1аг^(а-аг), |г|< 1. (1) Из условия Р2(1)=1 имеем (0) = 1—аЕ$. Отметим, что среднее число требований в системе в этом случае равно ЕР = Р;(1) = а£р , a2D8 + (a£p)2 + 2(1- а£$) • 7.61. Пусть L(t)—количество требований в СМО в мо- мент /; Р(г, t) = EzL(r>. Найдем lira Р (г, t) = P (г). Процесс /—►00 260
L(t) — регенерирующий с зависимыми циклами регенерации марковского типа, при этом tn—вложенные марковские мо- менты задач 7.59 и 7.60—можно рассматривать как моменты регенерации t,n = Ln. Применим сформулированную выше предельную теорему, используя различные системы вложенных марковских мо- ментов задач 7.59, 7.60 (называемых соответственно А и Б). В обоих случаях легко убедиться, что выполнены пред- положения а)—в) теоремы. Заметим, что Wk = E$, k>0, и Fo —а-1 (в случае А), 1Гв = а-х + £Р (в случае Б). Далее, подставляя ло = £2(О) из 7.59 (в случае А) и ло = Р1(О) из 7.60 (в случае Б), имеем: (A) (Б) 2 ^W,ft = n0(a-14-£₽) + £₽(l—л0) = а-1. k>0 Кроме того, вероятность перехода, из состояния 0 в со- стояние 1 р01 > 0 и при переходе из 0 в 1 цикл регенерации содержит абсолютно непрерывную независимую составляю- щую—интервал а поступления требования в свободную си- стему; а ~ М (а), поэтому абсолютно непрерывен. В обоих случаях при k 1 имеем т) = Р(гп+1 > у, L(tn-\-y) — tn\Ln = k)=* = Рт-к(У)[1-В(у)]’, Р{(у) = е-“У^-, i>0; г) = 2 гУ/АУ’ m) = [l— B(y)]e-a<i-^zk. m>k При соответствующем выборе марковских моментов для слу- чаев А и Б соответственно получаем ' МУ> г) = е-а«', У |л0(у, z) = e~ay + я $ [1 —В (у—u)] du. о Окончательно имеем Р(г)= 2 аЛнИУ. z)di/ = =о-^)т4(^)р(а-аг)=Р1(г)- 261
7.62. Пусть простейший поток требований имеет интен- сивность а, время обслуживания Р, искомое время ожидания W, число вызовов в СМО в момент окончания обслуживания требования L, причем производящая функция распределения вероятностей L есть Р(г) (определена в задаче 7.60), v(a) — количество требований поступивших в СМО за интервал длительности а, соответствующая производящая функция определена в задаче 7.34, п. б). Заметим, что справедливо соотношение L=v(F)+v(p), причем случайные величины v(F) и v((J) независимы. Переходя к производящим функциям, получаем Р (г)—со (а—az) Р (а—аг), где <o(s)=£exp(—sF), p(s)=Eexp(—sp). Подставляя выражения для Р (г) и заменяя а—аг на s по- лучаем преобразование Лапласа — Стилтьеса функции рас- пределения случайной величины: Ю(5) = Л>^2С ' ' s—а + «р (s) Из последнего выражения можно найти числовые характе- ристики распределения вероятностей F: EW ——©' (0), DF =©" (0)—[а/ (О)]2. 7.63. Сохранив обозначения предыдущей задачи, найдем распределение случайной величины W. Если требование поступает в свободную СМО, вероятность этого события Р(0)=1—аЕР, то F=Fi=0. Если требование поступает в СМО, когда система занята, вероятность этого события 1—Р(0)=аЕр, то время ожидания начала обслужи- вания представляется в виде F = Fj = q> + nj-]- ... + Лу(ф), (1) где <р—время завершения обслуживания требования ^со- гласно решению задачи 7.38, ф (s) —1 ; '’(ф)—число SjC р j требований, поступивших в систему за время ср; . ..v(<p), стохастически независимы и эквивалентны периоду занятости системы. Если теперь перейти в (1) к преобразованию Лапласа — Стилтьеса, то, учитывая решение задачи (7.62), получим п /.х 1—+ ап ($))____________1—JT(s) ' [$4-а-~ал; (s)]/ф [s-(-a—an(s)]£p‘ 262
Окончательно имеем или ш (s) - Е exp (— slT) = [1 -сЕН+сЕР 7.64. Обозначим через р(/) число занятых приборов в мо- мент времени t. Для определенности будем считать, что |i(0) = 0. Пусть а—интенсивность потока, b—время обслу- живания одного требования. Как обычно, v(x)—число тре- бований, поступивших в систему за время т. Если t^b, то p,(f) = v(/). Если t > b, то g(/)==v(6). Окончательно получаем p,(Z) = v(7'), где T = min(/, b), т. е. имеет пуассоновское распределение с параметром аТ: Глава 8 8.2. а) Для всякой стратегии x£2W0 оценка эффектив- ности удовлетворяет неравенству inf Ф(х, у)= 2 (f/Дх)— sup yeN fe=1 \ yk^Xk ) где равенство достигается на оптимальных стратегиях опе- рации О—ситуациях равновесия игры Г. б) Заметим, что v sup inf Ф (х, у) 0 inf sup Ф (х, у). x$MayeN y$N хвМо Если (х°, «/’)—седловая точка критерия Ф, то последние неравенства выполняются как равенства и inf Ф(х°, г/) = 0. yiN В силу п. а) это означает, что х°—ситуация равновесия игры Г. Обратное утверждение в общем случае не имеет места. Рассмотрим пример биматричной игры с матрицами 4 = Bs=^0 j^. Здесь ( 2, у±=(1; 1), (2; 2), тахФ(х, £)*=( . zj. 2, (2. п «ем. \ Ъ У — \ч ")> ("» *)• 263
Следовательно, т1птахФ(х, i/)=l >0>тах ттФ(х, у) Z yGNx£M0 x£Moy£N и критерий Ф не имеет седловой точки на произведении | Л40 X N. % 8.3. а) Е (Г) = 1 (i0, /„) € Ххх Х81 ato/o = max а,7о = max а,0Д; ' I zex, /ех, / б) £(Г)= |(i0, /0)€Х1хХ»|а,Л=тахау„ /0=1........nj; в) £,(Г)={(г; i), i=l, ..., т}; г) £(Г)={(2; 2)}; д) Е (Г) = {(1; 1)}; е) £(Г)=0. 8.4. а) х° = (1; тах(1—а/2; 0)), если а > 6/5, х° = тах(а; 0) (5/6; 1/3), если а ^6/5; б) х° = (-—^=-, \ 1/ Cfe k= 1, ..., si. Указание. Воспользоваться принципом уравнивания Ю. Б. Гер- мейера (см. [3, с. 267]): если ф,(/)— непрерывные, возрастающие на от- резке [0, Л] функции и ф/ (0) = 0, t=l, п, то стратегия х°, максими- / п \ зирующая критерий min фДх/) на множестве » 1 < i < п ( ) единственна и удовлетворяет равенствам Ф/ (х°) = const, i = 1, ..., n. 8.5. Х = п =-а х£Еп+ 2 х{ i = i п п п F=:%w (если Xi + yi ; = 1 Х‘ + У{ Xi/(xt + у() = у{/(х{ + у,) = 0)—функ- и второго объединений соответст- множества стратегий, а х{ = у{ = 0, то полагаем ции выигрыша первого венно. Все ситуации равновесия (х°, у0), по определению, являются решениями системы F(x°, у0) = max F (х, уа), хе X G(x°, y°) = max G (х°, у). Заметим, что для любой ситуации у^у равновесия х?, у? > 0, i=\, ..., п. Действительно, если х^у^ — О, то каждому из объединений при неизменной стратегии другого выгодно при достаточно малом 8 > 0 затратить на t-м месторождении сумму е, уменьшив на е затраты на любом другом месторождении. Если же, напри- мер, х? > 0, у?=0, то первое объединение увеличит свою • прибыль, переведя сумму е, 0 < е < х? с i-го месторождения * на любое другое. На основании этого все ситуации равно- 264 1
весия находятся из системы (п п ч п У--------, —-----xt) = О, У*„ х, — а. &Х‘+У‘ ‘ (п п. ч п У1 hS У11~ Hi^b, i = 1, ..., n. Из последних уравнений следует, что yt =— xt\ далее , Iх ~—, i = 1, ..., п. Полученное находим X? ас/ 0 7Г-> 2 9 i = 1 решение действительно является ситуацией равновесия, по- скольку функция F(x, у) вогнута по х на Л, a G(x, у) — по у на Y. 8.6. Xf={l, ..., п}—множество стратегий, /£(/\, ...» jm)= =—kcij. (k—число радиостанций с номерами /, для которых /z=/p l=£i)—функция выигрыша i-й радиостанции. Найдем ситуацию* равновесия при и =2. В этом случае ситуацию игры можно отождествить с разбиением множества I всех радиостанций на подмножества /п /2, где —множество радиостанций, выбравших /-ю рабочую частоту, /= 1, 2. Без потери общности будем считать, что си < с12 g21 С22 С ml ст2 Пусть найдется номер радиостанции k 2 такой, что (k—\)cki^.(m—k)ck2. Пусть, далее, k0—наибольший из номеров k^m—1, при котором выполняется последнее неравенство. Тогда (^о О (т *о) ^Л02’ (т—fe0 1) Cko+12 < ^ocft„+ii и разбиение Ц={\, .... fe0}, /2={60+1, .... т} является ситуацией равновесия. Предположим, что для всех номеров k^2 выполнены неравенства (k—l)cftl>(/n—k)ck2. Тогда разбиение Ix = {1}, /2={2, ..., т} образует ситуацию рав- новесия. 8.7. Ситуации равновесия в игре существуют тогда и только тогда, когда найдется множество номеров J с: {1, ..., т} такое, что для всех номеров i £ J, J выполнены нера- 265
венства £ (1) (2) При этом все ситуации (х°, t/°), удовлетворяющие условиям x°i = (В/A) y°t> 0, i£J, x!i = yt—Q, i(£ J, являются ситуа- циями равновесия. Указание. Пусть (х°, if) g M0XN —ситуация равновесия игры. Сначала показать, что при'каждом номере i компоненты х?, у* либо по- ложительны, либо равны одновременно нулю. Положим J — {«| х?, #?>0}. Далее показать, что для всех номеров if $ J выполнены неравенства х? (ai+bj) mln —0,0 <аЛ> isJ Xi+yi min <b is J Xi+yi С помощью принципа уравнения Ю. Б. Гермейера (см. решение задачи 8.4) установить х* (а;+6/) _ уЧ (а;+bi) _ О . О 0 г 0 —Ь2, х1~\~Уь А В что для всех номеров i g J. Отсюда Ci=~ (aHA‘), Bx? = y4i/? для всех Из последних соотношений и из неравенств (1) и (2) получить необходимые условия для ситуации равновесия (х°, if). Проверить достаточность этих условий. 8.8. Пусть xk—доля количества отработанной воды, ко- торую k-e предприятие собирается сбрасывать без биоло- гической очистки. Тогда Xft = [0, 1]—множество стратегий и I —(1—хк)ак, если 2 xt^a, — (1—xk)ak—ck, если 2 xi > a> — функция выигрыша k-ro предприятия. Ситуация х° = = (1; 1; ...; 1) является ситуацией равновесия, когда либо s, либо а < s—1, либо s—1<а<$'и ак^ск, k = 1, ..., s. Если a < s, то 6=1, S °* I A=f — множество ситуаций равновесия игры (помимо х°). Других ситуаций равновесия в игре нет. 266
8.9. а) Пусть xk— количество товара, которое произ- водит k-e предприятие. Тогда Хк = [0, -(-оо)—множество / / S \ \ стратегий, a fk(x) = \ ( а—b 2 xt )—сь )х*—функция выиг- \\ <=• / / рыша k-ro предприятия. Без потери общности предположим, что Ci ск cs. Пусть k0—наибольший из номеров k^s, при которых выполнены неравенства k «+ 2 Ci Гн ^Ск' Тогда ( / *0 \ / а+ 2 Ч | к | т\ й0-н ckJ > ( 0, k > k0 (при k0 < s), —ситуация равновесия. Указание. Воспользоваться дифференцируемостью и строгой вогнутостью каждой функции по переменной х^ при фиксированных остальных переменных. б) Предприятия с номерами fe0 +1, ..., s следует считать нерентабельными, поскольку их равновесные стратегии со- стоят в отсутствии производства товара. Пример. Пусть s = 3 и e^l, Cj = 7, cg=10. Предполо- жим, что в результате падения спроса величина а умень- шила свое значение с 30 до 11. Нетрудно проверить, что при новом значении величины а выполняются неравенства a + ci + ca г «+^1+^2 + ^ „ 3 < Ч <ч J < ^з- Эти неравенства означают, что нерентабельность третьего предприятия влечет за собой нерентабельность второго. 8.10. а) Из определения ситуации равновесия следует, что A (i, q°) < А (р°, q°)9 i == 1, m. (1) Если р®, > 0 для некоторого номера и А q°) < А (р®, р®), то, умножая неравенства (1) на р® и складывая их (i\-e не- равенство—строгое), получаем А (р®, <?°) < А (р®, р°) (имеет место противоречие); п. б) доказывается аналогично. 267
8.11. a) ((0; 2/5; 3/5), (9/13; 4/13; 0))—ситуация равно- весия; б) (р®, q9}—ситуация равновесия, если (т \ -1 У—) а» ) 1=1, ..., т\ /=1, ..., т. 8.12. Отыскиваем сначала такие ситуации равновесия (р, <?), что р{, q/>0, i, j=l, 2, 3; затем такие, что рг = 0, и т. д. Окончательно получаем: ((0; 1; 0), (0; 1; 0)); ((2/3; 0; 1/3), (2/3; 0; 1/3)); ((8/23; 11/23; 4/23), (8/23; 11/23; 4/23)). 8.13. Пусть pz€ [0, 1], i=l,2, 3, — вероятность, с которой i-e предприятие выбирает стратегию 1. Возможные ситуации в игре составляют множество Р = {р — (pf, р2; р3) | pt € [0, 1], i=l, 2, 3}. Функция выигрыша первого предприятия Л (р) = Pi [— РзРз—Рз (1 —Рз)—(1 —Pt) Рз— — 4(1 — Pt) (1 — Рз)] + (1 — Pi) [—Зр2 (1 —р») — — 3 (1 —Рз) Рз—3 (1 —Pt) (1 —Рз)] = = (—6р2р3 + Зр2 Зр3—1) Р1 + 3р2Рз—3 = = Мр2. Рз)Р1+МР2. Рз)- Аналогично, f2(p) = MPi. Рз)Рз + 4(Р1. Рз). /з(Р)= = ^з(Р1. Р2)Рз + /з(Р1. Рз). где (р2, р3) = — 6р2р3 + Зр2 + + 3рз— 1, МР1. Рз) = —6р1Рз + Зр14-Зрз—1, МР1< р2) = = —SpiPt + 3Pi + 3Рз— 1 • Пусть р° = (р?; р“; Рз)—произвольная ситуация равнове- сия. ПОЛОЖИМ £? = МРз» Рз), $ = МР1. Рз). &з = &з(Р1. Р°)- Заметив, что если &® > 0, то р® = 1, а если k°{ < 0, то р“ = 0, рассмотрим все возможные случаи. Пусть £® > 0, t = l, 2, 3; тогда р®=1 и £® =—1 — про- тиворечие. Пусть k9, k9 >0, < 0. В этом случае ситуация равно- весия (1; 1; 0). Аналогично, (1; 0; 1), (0; 1; 1) также ситуа- ции равновесия. Пусть kt > 0, /г", 6® < 0; тогда р? = 1, р2 = Рз = 0 и &? =—1 — имеет место противоречие. Аналогично, нет и других ситуаций равновесия, соот- ветствующих случаю одной положительной и двух отрица- тельных величин k9. Пусть fe® < 0, i=l, 2, 3; тогда ситуация равновесия (0; 0; 0). 268
Пусть &’ = 0, Z=l, 2, 3. Решая полученную систему, найдем две ситуации равновесия: 3; 3; 3~^ 3^ /з+Кз. з+Кз . з+Кз\ и V 6 ; 6 ’ 6 /' Пусть ki — kl = Q, ka3 > 0; тогда рз = 1. Решая соответст- вующую систему, получаем р? = р£=2/3, ^=1/3, т. е. (2/3, 2/3, 1)—ситуация равновесия. Если &? = Z>“ = 0, kl < 0, то р° = 0, Pi = P2=l/3, &з=1/3—имеет место противоречие. Аналогично, (2/3; 1; 2/3), (I; 2/3; 2/3)—ситуации равно- весия. Наконец, рассуждая аналогично, убеждаемся, что нет ситуаций равновесия, соответствующих одной из величин k}, равной нулю, и двум, отличным от нуля. Итак, в игре девять ситуаций равновесия. 8.14. Упростим обозначения. Вместо max и т. п. будем писать max; обозначим через {Pt}/6L, где L = {г, r-|- 1, ..., /},. 4 запись вида Рг ... Pt, где Pt — последовательность, состоя- щая из символов вида max или min. 4 4 Определим следующую ситуацию у исходной игры Г. Рассмотрим произвольное значение у\ € Argmax rnin 1 max min 1 ft (x). 4 4-k> 11 4 ft>Moi Пусть последовательность у], ...» y‘k-< определена; выберем произвольное значение у^ из множества Argmax min rmin max min \ fk (уЬ-и x!k, .... xl). xk xr 1 xf xk XP I r> fe V < fe Ситуацию равновесия у игры Г определим следующим обра- зом. Положим у\ — у\. Пусть функции у} определены при всех т / — 1, 1=1....... и т = /, 1=1....k— 1. Положим ^(4-0= И’ ^-1 — 269
где считаем, что Xi—yf при —1, /= 1, ..s и т=/0 /х=1, k0 1, Xk0 =^= у£*, 4“0+1 ё Argmin { min max min }т > /J», (yfa-i, x£........xsr); 4” 4 4. 4 r > k0 r < k0 r > k0 Argmin max min {min max min}T>^ xr XjiQ xr xr XIO xr k^r<kQ r > k0 r < k0 r > kQ xk0> Zk0+it •••» Zk-it •••> Xs) при k < &0; 4 € Argmin { min max min }T > t xr xr xk0 xr r^k r < k0 r > kQ £ Yto J* Y^ Y1’} I\Уко — 1 > Xk0 i Zk0 + l, • • •, —1> Xfcy • . . , Xs ) при k > k0, . . . . 8.15. Положим X} = {1, 3}, Xf={2, 4}, %! = {!, 3}, X3 = {2, 4}, L — {1, 2}. Стратегия первого игрока в игре Г—пара (a; i), где a£L, i; LxL->-X1, i(a, ₽)£ X?; стра- тегия второго игрока в игре Г—пара (0; /), где 0:L —> L, j-.LxLxXi—t- Х2,/~(а, 0, i)gXf. Ситуация равновесия ((a°; Г°), (0°; /®)): a°=l, Г°(1,1) = 3, Г»(1,2)=1, Р(2, 1) = = ?(2, 2) = 2, 0°(1) = 0°(2)= 1, /»(1, 1, i) = l, /°(1, 2, i)=2, t = l, 3; ]°(2, 1, 0 = 3, i = 2, 4; f°(2, 2, 2)=2,/"°(2, 2, 4)=4. 8.16. В игре Г: Х1={1, 2}, Х4 = {1, 2}, Х3 = {1, 2}. Стратегия первого игрока в игре Г—i£Xit стратегия вто- рого игрока—отображение /: Х4 —»-Xit стратегия третьего игрока—отображение k: ХгхХ±—>Х3. Ситуация равновесия (i°, k°)-.i0=2, 7°(1) = 2. /°(2)=1, l) = k°(2, 1) = = &°(2, 2) = 2, 2)=1. 8.17. а) Пусть i школьников уже сделали разрезы, 1 —1, в результате торт разрезан на доли величиной х\, ..., х{’; ... гОь 2Х»=1- Положим xr = /= 1 == (xj; Стратегию (i+l)-ro школьника можно тогда описать как выбор вектора xf+1(x/) = xz+l = (x|+1; ... ; xf+i1) такого, что х}+1, ..., х#}—упорядоченные в порядке воз- растания числа х}, ... , х?-1, а, х{—a, x{+t, ... , xj, где 0^а^х{, При этом можно считать, что, выби- 270
рая кусок торта, каждый школьник берет наибольший из оставшихся. Функция выигрыша i-ro школьника (х) = = х£~‘+1, »=1.....п. Опишем одну из ситуаций равновесия. Второй школьник отрезает долю х\=\/п. Если все предшествующие отрезали доли 1/п, то (&4-1)-й школьник отрезает долю 1/п. Если А-й школьник сначала отрезал не 1/п, то в случае х| < 1/п остальные школьники делят долю х\ на п—fe-f-1 равных долей; в случае х|-1 > 1/п остальные школьники делят х£ на п—&4-1 равных долей х„ < 1/п. б) Для простоты пусть х—наименьшая из долей, на кото- рые разрезает торт второй школьник. Если х > 1/3, то выигрыш третьего школьника максимизирует единственная стратегия—разделить долю 1—х пополам. При этом второй школьник получит долю (1—х)/2. Отсюда следует, что ни одно значение х> 1/3 не входит ни в одну ситуацию равно- весия. Пусть х^1/3. Тогда максимальный выигрыш х третьему школьнику доставляют лишь те стратегии, которые состоят в разрезании доли 1—х на две доли, меньшая из которых больше или равна х. Обозначая эту меньшую долю через у (х), имеем х у (х) (1 —х)/2, 0 х 1/3. Выберем любую долю у, определенную и имеющую . максимум на отрезке [О, 1/3]. Положим у(х) = (1—х)/2 при х£ [1/3, 1]. Выберем далее любое такое х0, что t/(x0)= max у(х). Проведен- О < X < 1/3 ные рассуждения и тот факт, что у(х)—выигрыш второго игрока, показывают, что (х0; у)—ситуация равновесия, си- туаций равновесия другого типа не существует. в) Наилучший гарантированный результат первого школь- ника равен 1/п, второго—1/(2 (п—1)), остальных—нулю. 8.18. Положим / л-i \ ( А~ 2) Xl г* Хь-i, уь ук-!) = ----------- k-1 А+В- 2 (х.+к) = Г( /'-ту --у—X*. i-f- - / । ^2 j (А"~~ xi) I/ \* = /г +1 / \ 1=1 / V 271
ypk{xit .... xk, уь ...» fc-1 /?—1 A — 2 Уь Bft> A— 2 Уь k i = 1 Отображения xj, yk, fe=l, ..., n, образуют ситуацию равно- весия многошаговой игры с полной информацией. Доказа- тельство проводится методом индукции по числу п. 8.19. л (Е (Г1)) = 1 (х®, t/®) | F (х®, {/*) > max min F (х, у), I хеЛ10 yeN G (х®, у°) = max G (х®, у)\ , yeN I л (£ (Г2)) = f (х®, if)\F(x^t j/°) > min max Г(х, у), I z/€ N x eAf0 G(x®, i/®)>max min G(x, y)\. y*N xeM0 f Выведем второе из соотношений. Напомним, что в игре Г2 стратегия первого игрока—отображение xgM, x:N—*M0; стратегия второго—отображение y£N, у: М —► N’, функции выигрыша игроков F, G определены на произведении MxN. Например, F (х, ~у) = F (л (х, у)), где л (х, #)=(х, у), ~у= у (х), х=х(у). Пусть (х®, г/°)—ситуация равновесия в игре Г2. Положим (х®, у®) = л(х®, «/°), г/ = у°(ха), где ха—абсолютно оптималь- ная стратегия первого игрока. Тогда имеем F (х®, у®) — = F(x°, y°)^F(xa, y°)=maxF(x, у) min max (F (x, у). хем9 у в N хе м о Аналогично доказывается неравенство G (х®, у9) > max min G(x, у). yQN x€Af0 Пусть ситуация игры Г(х®, у0) удовлетворяет двум последним неравенствам. Определим ситуацию (х°, у0) игры Г следующим образом! ( х°, у=у°, х° (У) — 1 z£ArgminG(x, у), у^= у°, ( хв Мо у0, х«=х®, У* € Arg min tnax F (x, у), x x®. y^N \ 6Me 272
Можно проверить, что (х°; у®)—ситуация равновесия и л(х°, У°) = (х°; у°). 8.20. Положим N (х) = Arg max G (х, у), х £ УИ0. Тогда У€ N п (Е' (Г1)) «= I (х®, у0) | у® € Argmin F (х®, у), и если F (х®, р°)= = max min F (х, у), то для любой стратегии х* € Argmax х х€ Mq ye N л€М0 xmin/'Xx, у) найдется стратегия у(х*) € Argmin F(x*, у) ytN VtN такая, что б(х*, у (x*))2>G(x°, //®)|. 8.21. Возьмем произвольные в>0 и два множества S, Ttzl, S(\T = 0. Пусть (xf, iСS), (xf, i€ T)—8-оптималь- ные стратегии коалиций S и Т. Тогда для стратегии (xf, i $ U Т) коалиции S и Т выполняются неравенства o(SuT)> inf 2 fkixf, i^SuT, xt, i£SuT)^ xi€X/ Ш U T i ( S U Г > inf 2 *€$» xt, + x i a X k € S i $ S '+ inf 2 fk(xf, i£T, xt, i^T)>o(S)4-o(7’)—2e. r H т Полученные неравенства справедливы при любом е > 0. Сле- довательно, o(SU7’)>i/(S)-|-i»(7’). 8.22. Покажем, что для любой коалиции S выполнено равенство o(S) = 2 у (О- Действительно, согласно условию i € S супераддитивности выполнены следующие неравенства: 2 0(0, v(/\S)> 2 f(0- Если первое из неравенств zes iei\S выполнено как строгое, то o(/)^o(S)-|-o(/\S) > 2 v(i) в/ (имеет место противоречие). 8.23. Если min ermine,, то o(S)s=0; если mine, i«/\s its as ^2 min c,—a, io ie/\S v(S) = ^(a-minc,y; если 2 min ct—o<mincr< min ct, то '«/\S i»S ttixs v{S) -t((° -ft e -T.'ro-c-.s.e-)’) • 273
8.24. Утверждение следует из того факта, что’ домини- рование дележей по одноэлементным коалициям и коалиции всех игроков невозможно. 8.25. Если дележ у удовлетворяет неравенствам 2 ieS (S) для всех Sczl, то он не будет доминируемым. Обратно: пусть у—недоминируемый дележ. Предположим, что 2 У/< i es <v(S) для некоторого множества Sc/. Тогда найдется номер i0^S такой, что y/o>y(f0), поскольку в противном случае приходим к противоречию: 2 yt< 2 y(o+«(S)<u(/). i£I i(S Определим вектор z: _ ( У1— e> » = »o. При достаточно малом е > 0 вектор г является дележом и доминирует дележ у по коалиции S, что противоречит выбору у. 8.26. Если дележ у принадлежит ядру, то справедливы неравенства yt + t/2>o(12), yt;+ys>о(13), t/2 + «/s>v(23). Складывая эти неравенства, получаем 2о(/) о (12) +о (13) + + о(23). Обратно: пусть выполнено последнее неравенство. Если v (12)+о (13)—v(I) :> о(1), то дележ (о (12)+о (13)—о(7); и(1)—v(13); о(7)—о(12)) принадлежит ядру. Если о(12) + +о(13)—о(7)<о(1), то дележ (о (I); о (7)—о (13); о (13)—о(1)) также принадлежит ядру. 8.27. а) Ядро С—четырехугольник с вершинами (2; 2; 5), (2; 5; 2), (0; 4; 5), (9; 5; 4). Докажем, что множество V = = CuV2UV8, где У2 = {у € А | + ys = о (13)}, Va = = {1/С-Л |^i + yt = y(12)}, является решением. Если z, y£V и у у г, то и» соображений оимметрни можно считать, что z£V3 и у>{1, 3} г. Тогда yt > zit уя> zs и необходимо f/i + & = s(j^- Отсюда следует, что 4 = o(12)^z2 > уг = = 9(1)—»(1*8) = 5 (имеет мевто иротиворечие). Внутренняя устойчивость множества V доказана. Докажем теперь внеш- нюю устончмвовть этого множества. Если у$¥ и i/x + у3 < < о(13), то дележ у(7)-»(13); р3 + и(13)~У1'-у8) принадлежит У2 и доминирует дележ у по коалиции {1, 3}. 274 "
Случай, когда t/i + */2 < v(12), аналогичен. Предположим, что y1 + yi>v(\2),y1 + y3>v(\3) и y3 + y3<v(23). Тогда дележ г z1 — v{I)—о (23), _ (v(23)-i/2-i/8)(v(Z)-v(13)-(/2) 2v(I)—v(l3)—v(l2)—y3—y3 (v (23)-у3-у9) (v (I)—v (12)—у,) s~ 2v {I)—v (\3)—v (\2)—y3—y3 принадлежит ядру и доминирует дележ у по коалиции {2, 3}. б) Ядро пусто. Множество V= и У2 и V3, где = = {у € А 10 < yt < 2, уу— 8~yi , j =£i | i = 1, 2, 3, является решением кооперативной игры. 8.28. Множество всех решений V представляет собой семейство непрерывных кривых, соединяющих ядро С = == {(0; 0; 6)} с множеством V3={y£A\y3 = 0} и удовлетво- ряющих следующему условию: если у, z € V и у3 > г3, то необходимо yt г1( у3 га. Указание. Каждая кривая из указанного семейства является решением. Обратно: пусть V—решение кооперативной игры. Показать, что множество У пересекается с каждым из отрезков Уз ~ {у£ А | уз=к], О^Х^б, в единственной точке. Следовательно, У—кривая, непрерыв- ность которой следует из замкнутости решения в множестве дележей А. 8.29. Предположим, что ядро С не пусто и дележ у$С. Тогда 2. У/ > v (S\{i})=v (7)—v (i) для всякого i£l. Отсюда следует, что yt^.v(i). Таким обра- S S збм, yt = v (i) для всех i £ I и 2 У{ = 2 v (0 < » (/)> что 7 = 1 7 = 1 противоречит определению дележа. 8.30. Если неравенства из условия задачи выполнены, то ( v(I) v(I)\ ' , дележ z = ...; —^-1 принадлежит ядру. Обратно: пусть ядро С кооперативной игры не пусто и уй £ С. Рас- смотрим дележи г/, l^i^s—1, полученные из дележа у* циклическим сдвигом вправо на i компонент. Тогда все дележи у‘ в силу симметричности игры принадлежат ядру С. 275
s-T В силу выпуклости ядра дележ г = — У, у‘ £ С и s 1=0 i€S S для всякой коалиции S. 8.31. Пусть решение V кооперативной игры состоит ровно из двух дележей у и z. Поскольку y=£z, найдется такой номер /, что yj>Zj. Рассмотрим дележ у', для которого { У/—&, i=i, где 0 < е < у}—Zj. Дележ y'(£V, и в силу внешней устой- чивости V он может доминироваться только дележом z из V по коалиции S, не содержащей номера /. Но тогда z > Sy (имеет место противоречие). 8.32. Пусть V—выпуклое решение кооперативной игры. Обозначим через aff V и ri V соответственно аффинную обо- лочку и относительную внутренность множества V (см. [50]). Докажем следующую лемму. Лемма. Если y£V, z £ (Л\У) П aff V и r/>Sz, то yffcriV, а гиперплоскость 2 = v (S) является опорной к множеству ieS V в точке у. Доказательство. Предположим, что у g ri V. Тогда дележ h из отрезка [у, г], достаточно близкий к у, принад- лежит V и y>Sh, что противоречит внутренней устойчиво- сти V. Следовательно, у 4 ri V. Покажем, что v(s) 2 Для ъ ies любого дележа h£V. Предположим, что для некоторого де- лежа h° 6 V выполнено неравенство v (S) > 2 Поскольку ieS y(S)^2//z» дележ h° можно взять из ri V и достаточно its близким к у, чтобы h°>Sz. Это противоречит доказанному выше утверждению. Итак, y(S)^ 2^/ для любого дележа t€S h£V и, в частности, Лемма доказана. Обозначим через 0 множество всех коалиций S, для ко- торых найдутся дележи у и z, удовлетворяющие условию 276
леммы. С помощью леммы нетрудно доказать, что решение V представимо в виде многогранника: V^JytAl Zyi^v(S), Se&lnaffV. ( lies J 8.33. Предположим противное, т. е. что v (/) < min у,. Z/€V ‘ Пусть у0—дележ из V, для которого min у, —у]. Определим дележ у f£V: ( У^«> i = h ";"1й+гЬ. ;#/. где 0 < е < t/°—v(t). В силу внешней устойчивости V най- дется такой дележ z£V, что z>Sy'. При этом jgS и г^ = у° (иначе z>Si/°). Поскольку решение V не дискриминирует j-го игрока, найдется такой дележ h С V, что hj > Дележ (1 — t) у° +1 ((1 — t) z 4- th) при достаточно малом t > 0 доми- нирует дележ «/° по коалиции S, что противоречит внутрен- ней устойчивости V. 8.34. Предположим противное, т. е. что решение V не дискриминирует ни одного игрока из /. Для каждого номера i через у‘, г‘ обозначим пару дележей из V, для которых y‘i Ф г-. Тогда при достаточно малом 8 > 0 дележи удовлетворяют условию y?=#z? для всех i£7. Положим Г = {«С/| У? < г?}. Тогда либо 2 У? < у (Л > либо 2 2°< ie?' l€/\T <у(/\Т), так как в противном случае приходим к проти- воречию: п(/) = п(Т) + п(7\Т)<2у?+ 2 2?< iе т (е/\т < 2у?+ 2 у?=«(/). i € Т ie/\T Пусть без потери общности и(Т)< 2 У?- Дележ (1 — 0У°+ IG Т + tzQ С V при достаточно малом t > 0 доминирует дележ z/° по коалиции Т, что противоречит внутренней устойчивости V. 277
8.35. Необходимость. Докажем условие ,1). Предпо- ложим противное, т. е. что а4 > и (4). Тогда а, > о(3). Рассмо- рим дележ z/ = (z/i, у2, а3, о(4))^У. Он должен быть доми- нируемым некоторым дележом из V либо по коалиции {1, 4}, либо по коалиции {2,4}; при этом либо #х + а4 < v(14), либо у2 + а4 < v (24). Отсюда, поскольку y2 = v(I)—а3— — yt—v(4), необходимо выполнено неравенство ф(г/4) = = шах (и(14)—г/j—сс4; с; (24)—а (7) + а3 + t/i + v (4) —а4) > О при всех z/i из отрезка £> = [о(1), и(7)—а3—о(4)]. Послед- нее, в свою очередь, выполнено тогда и только тогда, когда тахф(1/1) = ф(«/*) > 0. Далее, т/„*\ _H14)-W24) — t>(/) + as-H(4) « Ф \У1) — 2------------- Отсюда имеем ц(14)4-у(24) > и(/)—a3—u(4)4-2a4. (1) Рассуждая аналогично, можно получить неравенство v (13) + v (23) > v (/)——ос4——ц (3) + 2а3. (2) Складывая неравенства (1), (2) и используя супераддитив- ность характеристической функции, приходим к следующим неравенствам: 2v (7) > о(14) + v (23) + v (13) + v (24) > > 2t>(7) + a3 + a4—v(3)—о (4) > 2u(7). Полученное противоречие говорит о том, что a4 = v(4). Не- равенство 3) также доказано (см. (1)). Если бы нарушалось неравенство 2), то множество V не было бы внешне устой- чивым, поскольку доминирование по коалиции {1, 2} было бы невозможно. Необходимость доказана. Достаточность. Пусть выполнены условия 1)—3). Покажем, что множество V является решением кооператив- ной игры. Пусть дележ y(£V. Если yt + у2 < v(/)—а3—а4, то дележ у доминируется некоторым дележом из V по коа- лиции {1, 2}. Предположим, что yi-\-yi^v(h—аз—а<- При этом необходимо у9 < а3 (иначе V) и либо t/i + a3 <v(13), либо у2 + аз < (23) (иначе о (7)—v (3)—v(4)4-2a3^z/1 + 4- f/2 + 2a3^o(13)4-y(23) > v(7) + 2a3—1>(3)—1»(4)). Если, например, у± + а3 < v(13), то дележ г = (о(7)—а3—о(2)—и(4), v(2), а3, v (4)) доминирует дележ у по коалиции {1, 3}. Внешняя устойчивость множества V доказана. Внутренняя устойчивость проверяется без труда. 278
8.36. Покажем, что множество дележей У = {У € А | у! + у2 = у3 + у 4 = у.а 4- у e = 1} является единственным решением, не совпадающим с ядром. Заметим, что отрезок, соединяющий дележи (1; 0; 1; 0; 1; 0) и (0; 1; 0; 1; 0; 1), принадлежит ядру и доминирует все дележи вне множества V. Следовательно, всякое решение должно быть подмножеством V. Множество V внутренне устойчиво и является решением, так как содержит упомя- нутый отрезок. Очевидно, V—единственное решение, по- скольку одно решение не может быть собственным подмно- жеством другого решения. 8.37. а) Введем следующие множества: Vi = {«/€ А\у1 — у3=\ — а/2, у8>1—а/2, yt + yf> 1}, У» = {У € А | yt+уг + у3 = 3 (1 —a/2)}\Dom где Dorn — [у £ А | для некоторого г € У г > у}. Множество дележей V’ = V1uVz2 является решением. б) V={yeA\y1 + yi = l—a, yi + yi+i>^, 1 = 3, 5, .... 21— 1}. 8.38. Покажем, что n-ядро N не пусто. Пусть —се- мейство наборов of=|S1, ..., SJ, состоящих из t попарно различных коалиций. Тогда компонента векторного крите- рия 0 с номером t представима в виде ©t(y) = max min е (S, у). Sea* Отсюда следует непрерывность векторного критерия 0 на множестве дележей А. Следовательно, n-ядро не пусто. Пусть у, z—различные дележи, принадлежащие N. Не- трудно показать, что 0 s^lex 0 (у) = 0 (г). Последнее противоречит определению п-ядра, и, следовательно, это ядро состоит из единственного дележа. 8.39. Запишем для дележа у® необходимое, а в силу ли- нейности e(S, у) по у на выпуклом компакте А и достаточ- ное условие (см. решение задачи 4.20): min max уп), у—y°\s=O, уча sefnyjwy V ' где R (у0)—множество коалиций .... Sk, для которых maxe(S, y°) = e(Sf, у°), i=l, ..., k. Очевидно, ^e(S, у)== = (0; ...; —1; ...; —1; ...; 0). Здесь на i-м месте стоит 279
—1, если Z-й игрок входит в коалицию S. Тогда условие оптимальности у0 имеет вид min max 2 (f/“—Уг) = О- (О у € А 1 ,< / < k i 6 Sj Если теперь j-й игрок не входит ни в одну из коалиций Slt ..., Sk£R(y°), то минимакс в (1) равен нулю, если только y°j = v(j). Коалиция SjU {/'} также не входит в ^(по- следовательно, «(SjUf/}, y°)<e(S1, у0) или «(SiU{/})— 2 Уг~2«/?- i eSt is St Из последнего неравенства следует, что ^(SjU {/}) < w(Sj)4- + v(/); последнее противоречит супераддитивности характе- ристической функции. Таким образом, каждый игрок входит хотя бы в одну коалицию из /?(у°). 8.40. Условие принадлежности дележа у ядру можно записать в виде maxe(S, у)^0. Отсюда следует, что мно- s с / жество Argminmaxe(S, у), которому принадлежит п-ядро, ye A s с.1 содержится в ядре. 8.41. Пусть N={y*}—n-ядро, а К—A-ядро. Предполо- жим противное, т. е. что Тогда найдутся такие но- мера I, /, что — Sji (у*) > 0> у! > V (/)• Пусть Arg max e(S, y*)={S*[t l—l.....k} и без потери общности se£z/ предположим, что при некотором натуральном /* справед- ливо неравенство e(S’, у*) = ©/» +1-1 (у*) >©/•+* ({/*)> 1=1, •••> k. Определим дележ у. - ( У/~8> P=h ур = < У* + Р — ( Ур, Р 1> /» где 0<6<у;*. Тогда при / = 1, .... t*—1 имеем 0f(y) = = 0t (у*), поскольку 0t (у), 0/ (у*), t — 1, .... t*—; 1 являются эксцессами коалиций, либо включающих, либо не включаю- щих i-ro и /-го игроков одновременно. При достаточно ма- лом 6 >0имеем 0z.+/_i(y) = e(S’, y)<e(Sj, y*) = ®t»+i_i(y*), I — 1, ..., k. Следовательно, 0 (у) lex 0 (у*), что противо- речит определению и-ядра. 280
8.42. Рассмотрим произвольный дележ t/°, принадлежа- щий Л-ядру К, и покажем, что y°i>v(i), i=\, 2, 3. Пред- положим противное, т. е. что z/® = u(l), 1/®>о(2). Тогда Si2 (t/°) = шах (и(1 v(13)— г/®—yl) > 0 > max(v(2)—yl\ v (23)—v (/) + v (1)) == max (и (2)—yh v (23)—у%—у*) = $21 (г/®), что противоречит определению fe-ядра. Докажем, что &-ядро состоит из единственного дележа. Предположим, что у®, у* уа=^=у* и без потери общно- сти г/? <у*, yl> У г- Нетрудно проверить, что s2i («/*)> > S21 (У°) =S12 (f/°) > s12 (г/*), что противоречит определению Л-ядра. 8.43. Из результатов двух предыдущих задач следует, что Л-ядро состоит из единственного дележа и совпадает с n-ядром. При этом Л-ядро удовлетворяет следующей си- 3 стеме уравнений: s/y (z/) = s/1(z/), i=£j, i, j=l, 2, 3, 2«/,= = y(/). Пусть &-ядро K={y*}. Тогда: а) у* —(7; 8; 6); б) у» = (7; 7; 4); в) «/* = (4; 11/2; 11/2). 8.44. Пусть без потери общности, сг с2 cs. По- ложим t0 = min {«|Cj^2c,—а} и N = {y*}—n-ядро. Тогда при a—c1<4(t0— 1)(с2—ct) j 4d(f0-I) ’ (О, i = i0, .... s, а при a—Cj > 4(i0— l)(c2—cj имеем ' (l/b)(a — Ci)(c2—Ci), i=l; 1 ((а-сЦ)* _(a—ci) (c2—ci)' \ Z/’= «o-2 \ 4b b )’ i = 2, .... i0— 1 (i0 > 2); ч 0, i i0. 8.45. Пусть A—множество дележей с целочисленными компонентами дискретной кооперативной игры четырех лиц. Для дележа х обозначим через Sym х множество дележей, полученных из х всевозможными перестановками компонент, а через Сус х —множество дележей, полученных из х цик- лическим сдвигом влево на несколько компонент. Заметим, что дележ х принадлежит множествам Sym х и Сус х. Лемма. Пусть х £ А и х, < х$ < ха < х4. Тогда для мно- жества дележей Sym х множество Vi— {(^4> Х3> Х2, Xi), (Х2, Xi, Х4, Xg), (Xj, Х2, Хд, Х4), (Хд, х4, х4, х2)} (J Сус (х4, Хд, х4, х2) и Сус (х4, х2, х4, Хд)} является решением. 281
Доказательство. Нетрудно видеть, что множество Hi внутренне устойчиво. Проверим внешнюю устойчивость для Vj. Имеем: Xg, Xg, Xg) (Xg, Xg, Xg, X4), (Xg, Xg, X4, Xg) x* (Xg, X4, Xg, Xg), (Xj, Xg, Xg, x4) (Xg, Xg, X4, Xg) , (Xg, X4, Xg, Xg) (Xg, Xg, Xg, Xg). Далее, дележи из множества Сус(х4, х2, х3, Xg) доминиру- ются дележами из множества Сус (х4, х2, xi( х3), а дележи из множества Сус (х4, х4, х3, х2) доминируются дележами из множества Сус (х4, х3, xv х2). Лемма доказана. Определим множество дележей Уг = {х £ А | Vi € /3/ € I» x{ = Xj}. Представим множество Уг в другом виде. Рассмот- рим дележи х(а) = (а, a, v(7)/2—a, v(7)/2—а), где а—целое число, принадлежащее отрезку [0, v(/)/2J. Ясно, чтох(а)СУ2 и V2= U Symx(a). При целом а, удовлетворяющем неравенствам и (/)/4+1 ^a^v(7)/2, определим дележ y(a) = (v(7)/2—a, v(7)/2—а + + 1, а—1, а). Пусть v(7) не делится на 4. Тогда а > u(/)/4 +1 и всегда уг (а) < уг (а) < у3 (а) < yt (а). Рассмотрим множество дележей Sym у (а) и по аналогии с решением Vg из леммы построим для него решение Vt (a). Определим множества дележей: V3= U Vita), V (Z)/4 <а<0(П/2 V't — {(a, a, v(I)/2—а—1), v(7)/2—а+ 1), (a, a, v (/)/2—a-f-l, v(7)/2—а—1, 0^а^о(/)/2—J}, V"={(u(/)/2—а— 1, v(I)/2—a + 1, а, а), (о(/)/2—a-H, v(I)/2—а—1, а, а), 0^а^о(/)/2—1}, Справедливо следующее утверждение! при четном v(7), не делящемся на 4, множество V* = V2 (J Vs и У4 является ре- шением дискретной кооперативной игры </, о>. Ограничимся проверкой внутренней устойчивости мно- жества V*. Нетрудно видеть, что множество L(a) = = Sym х (а) и Vj (а) внутренне устойчиво. Если x£L(a), y£L(a’), а>аг, то компоненты а, а—1 дележа х не мень- ше, чем max у,, а компоненты и(/)/2—a-f-l, о(/)/2—а 1 < 4 282
не больше, чем min у{. Поэтому дележи х и у не не могут 1 < i< 4 доминировать друг друга. Пусть xgVaUVs» Ограничимся случаем, когда xgVx(&), уг = у2 = а, у3 = — v(I)/2—а—1. Если a^v(J)/2—а + 1, то b — 1 > а, v(I)/2—b-{-\>v(I)/2—а—1. Следовательно, b—1>а> > b—2 и получено противоречие (а и b—целые числа). Если а>о(7)/2—а 4-1, то b>a, b—1>у(7)/2—«4-1, у(7)/2—b 4- 1 > v (7)/2—а—1. Отсюда & >а>Ь—2. В этом случае x$V\(b), поскольку либо х = (а4-1, и(7)/2—а, v(J)/2—а4-1> а), либо х = (о(7)/2—а, а 4-1, о (7)/2—«4-1, а). Имеет место противоречие. Если число v (7) четное и делится на 4, то решением игры является множество дележей V = V*uSymx°, где х° = (v (7)/4 4-1, v(I)/4, v(J)/4, v(I)/4—1). Пусть и (7) четное. Тогда решением игры является множество дележей V= и Sym z (а), О < а< (о (/)—1)/2 где г (a) —(a, a, (у[Г)-\-\)12—а, (о (7) 4- 1)/24-а). В заключение отметим, что предложенные задачи и упраж- нения помимо закрепления знаний по теории исследования операций должны, по мнению авторов, побудить студентов к самостоятельной научной работе. Задачи, связанные с ана- лизом конкретных моделей, могут стать основой для курсо- вых и дипломных работ.
ЛИТЕРАТУРА Основная 1. Вагнер Г. Основы исследования операций,—М.: Мир; т. 1, 1972.— 336 с.; т. 2, 1973.— 488 с; т. 3, 1973.— 504 с. 2. Васильев Ф. П. Численные методы решения экстремальных задач.— М.: Наука, 1980.— 520 с. 3. Гермейер Ю. Б. Введение в теорию исследования операций.— М.: Наука, 1971.— 383 с. 4. Климов Г. П. Стохастические системы обслуживания.— М.: Наука, 1966,— 243 с. 5. Оуэн Г. Теория игр.—М.: Наука, 1971,—230 с. 6. Подиновский В. В., Ногин В. Д. Парето-оптимальные решения много- критериальных задач.—М.: Наука, 1982.—254 с. Дополнительная 7. Айзекс Р, Дифференциальные игры.— М.: Мир, 1967.— 479 с. 8. АкофР., Сасиени М. Основы исследования операций.— М.: Мир, 1971.—534 с. 9. Алексеев В. М., Тихомиров В. М., Фомин С. В. Оптимальное управ- ление.— М.: Наука, 1979.— 432 с. 10. Ашманов С. А. Линейное программирование.— М.: Наука, 1981.— 340 с. 11. БеллманР. Динамическое программирование.—М.: ИЛ, I960.— 440 с. 12. Вателъ И. А., ЕрешкоФ. И. Математика конфликта и сотрудничест- ва.— М.: Знание, 1973.— 64 с. 13. Вентцель Е. С. Исследование операций.— М.: Советское радио, 1972.— 552 с. 14. Воробьев Н. Н. Теория игр. Лекции для экономистов-кибернетиков.— М.: Изд-во ЛГУ, 1974.— 159 с. 15. Гермейер Ю. Б. Игры с непротивоположными интересами.— М.: Наука, 1976.—328 с. 16. Гнеденко Б. В. Курс теории вероятностей.— М.: Наука, 1965.— 400 с. 17. Гнеденко Б. В., Коваленко И. Н. Введение в теорию массового обслу- живания.— М.: Наука, 1966.— 431 с. 18. Гольштейн Е. Г., Юдин Д. Б. Новые направления в линейном про- граммировании.— М.: Советское радио, 1966.— 534 с. 19. Грень Е. Статистические игры и их применение.— М.: Статистика, 1975.— 176 с. 20. Давыдов Э. Г. Игры, графы, ресурсы.—М.: Радио и связь, 1981.— 112 с. 21. Данскин Дж, М. Теория максимина.— М.: Советское радио, 1970, — 200 с, 284
22. Демьянов В. Ф., Васильев Л. В. Недифференцируемая оптимизация.— М.: Наука, 1982.— 384 с. 23. Демьянов В. Ф., Малоземов В. Н. Введение в минимакс.—М.: Наука, 1972.— 368 с. 24. ДюбинГ.Н,, Суздаль В. Г. Введение в прикладную теорию игр.— М.: Наука, 1981.—336 с. 25. Зуховицкий С. И., Радчик И. А. Математические методы сетевого пла- нирования.— М.: Наука, 1965,—296 с. 26. Иванилов Ю. П., Лотов А. В. Математические модели в экономике.— М.: Наука, 1979.— 304 с. 27. Исследование операций, т. 1. Методологические основы и математиче- ские методы.— М.: Мир, 1981.—712 с. 28. Исследование операций, т. 2. Модели и применение.— М.: Мир, 1981.— 677 с. 29. Карлин С. Математические методы в теории игр, программировании и экономике.—М.: Мир, 1964.— 838 с. 30. Карманов В. Г. Математическое программирование.—М.: Наука, 1980.— 256 с. 31. Карр Ч., Хоув Ч. Количественные методы принятия решений в управ- лении и экономике.— М.: Мир, 1966.— 464 с. 32. Кемени Дж, Конечные цепи Маркова.— М.: Наука,. 1970.— 271 с. 33. Кини Р, Л., Райфа X. Принятие решений при многих критериях: пред- почтения и замещения.— М.: Радио и связь, 1981.— 560 с. 34. Киру та А, Д., Рубинов А. М., Яновская Е. Б. Оптимальный выбор распределений в сложных социально-экономических задачах.— Л.: Наука, 1980.— 166 с. 35. Климов Г, П. Теория вероятностей и математическая статистика.— М.: Изд-во МГУ, 1983.—328 с. 36. Корбут А, А., Финкельштейн Ю. Ю. Дискретное программирование.— М.: Наука, 1969.— 368 с. 37. Кофман'А,, ДебазейГ, Сетевые методы планирования и их примене- ние.— М.: Прогресс, 1968.— 182 с. 38. Кузьмин В. Б. Построение групповых решений в пространствах четких и нечетких бинарных отношений.— М.: Наука, 1982.— 168 с. 39. Кукушкин Н. Н. Морозов В. В. Теория неантагонистических игр.— М.: Изд-во МГУ, 1977.—84 с. 40. Мак-Кинси Дж. Введение в теорию игр.— М.*. Физматгиз, 1960.— 420 с. 41. Математические методы в исследовании операций: Сб. статей под ред. Н. Н. Моисеева, П. С. Краснощекова.— М.: Изд-во МГУ, 1981.— 192 с. 42. Меньшиков С. М, Инфляция и кризис регулирования экономики.— М.: Мысль, 1979.— 368 с. 43. Моисеев Н. Н., Иванилов Ю. П., Столярова Е, М. Методы оптимиза- ции.— М.: Наука, 1978,— 352 с. 44. Нейман Дж, фон., Моргенштерн О, Теория игр и экономическое пове- дение.— М.: Наука, 1970.— 707 с. 45. Никайдо X. Выпуклые структуры и математическая экономика.— М.: Мир, 1972.—520 с. 46. Нурминский Е. А. Численные методы решения детерминированных и стохастических минимаксных задач.— Киев: Наукова думка, 1979.— 161 с. 47. Оре О, Теория графов,— М.: Наука, 1980.— 336 с. 48. Подиновский В. В., Гаврилов В. М. Оптимизация по последовательно применяемым критериям.— М.: Советское радио, 1975.— 192 с. 49. Понтрягин Л, Сп Болтянский Bt Fti Гамклидзе Р, В,, Мищенко Е, Ф. 285
Математическая теория оптимальных процессов.— М.: Наука, 1969.— 384 с. 50. Рокафеллар Р. Выпуклый анализ.— М.: Мир, 1973.—469 с. 51. Рубальский Г. Б. Управление запасами при случайном спросе.— М.: Советское радио, 1977.— 159 с. 52. Саати Т. Целочисленные методы оптимизации и связанные с ними экстремальные проблемы.— М.: Мир, 1973.— 302 с. 53. Тихонов А, Н., Арсенин В. Я. Методы решения некорректных за- дач.— М.: Наука, 1979.— 288 с. 54. Федоров В. В. Численные методы максимина.— М.: Наука, 1979.— 280 с. 55. Феллер В. Введение в теорию вероятностей и ее приложения. Т. 2— М.: Мир, 1967.— 752 с. 56. Фшиберн П. Теория полезности для принятия решения.— М.: Наука, 1978.— 352 с. 57. Форд Л. Р., Фалкерсон Д. Р, Потоки в сетях.— М.: Мир, 1966.—276 с. 58. Ху Т. Целочисленное программирование и потоки в сетях.— М.: Мир, 1974.—520 с. 59. Черников С, Н. Линейные неравенства.— М.: Наука, 1968,— 488 с. 60. Чжун Кай-лай. Одномерные цепи Маркова.—М.: Мир, 1964.— 425 с. 61. ШкурбаВ. В, Задача трех станков.—М.: Наука, 1976.— 92 с. 62. Aumann R. J.t Ре leg В. Von Neumann — Morgenstern solutions to cooperative game without side payments.— Bull. Amer. Math. Soc., 1960, v. 66, №3, p. 173—179. 63. Davis M., Maschler M. The kernel of a cooperative game.—Nav. Res. Logist. Quart., 1965, v. 12, №3/4, p. 223—259. 64. Dermun C. Sequential decisions and Markov chains.— Management Science, 1962, v. 9, № 1, p. 16—24. 65. Isbell I. R. An optimal search pattern.— Nav. Res. Logist. Quart., 1957, v. 4, №4, p. 357—359. 66. Jentzsch G. Some thoughts on the theory of cooperative games.— Annals of Math. Stud. 1964, v. 52, p. 407—442. 67. Hillier F. S., Lieberman G. J. Operations research.— San Francisco: Holden — Day, 1974.— 800 p. 68. Howard R. Dynamic programming and markov processes,— Cambridge: Technology Press, 1960. 69. Marchi E. Pseudo — saddle — points for non — zerosum two — person simple and generalized games.— Proc. London Math. Soc., 1968, v. 18, № 1, p. 158—168. 70. Owen G. Discriminatory solutions of n-person games. Proc. Amer. Math. Soc., 1966, v. 17, №3, p. 653—657. 71. SchmeidlerD. The nucleolus of characteristic function game. SIAM J. Apple. Math., 1969, v. 17, № 6, p. 1163—1170. 72. Shapley L. S. A symmetric market game.— Annals of Math, Stud., 1959, № 40, p, 145—162.
ОГЛАВЛЕНИЕ Предисловие................................................. 3 Основные понятия и определения.............................. 4 Глава L Составление моделей операций и оценка эффективности стратегий.................................................. 9 Глава 2. Операции при наличии векторных критериев и бинарных отношений предпочтения..................................... 29 Глава 3 Оптимизационные задачи............................ 41 Глава 4, Задачи на минимакс и седловые точки .............. 52 Глава 5, Сетевые задачи................................... 70 Глава 6. Оптимальные решения при различных вариантах инфор- мированности ............................................ 79 Глава 7. Стохастические модели в исследовании операций , \ » 93 Глава 8. Неантагонистические игры.......................... 114 Ответы и решения........................................... 125 Литература . ,........... . 284
Учебное издание Владимир Викторович Морозов Алексей Григорьевич Сухарев Вячеслав Васильевич Федоров ИССЛЕДОВАНИЕ ОПЕРАЦИЙ В ЗАДАЧАХ И УПРАЖНЕНИЯХ Зав. редакцией Е. С. Гридасова Редактор Ж. И. Яковлева Мл. редактор С. А Доровских Художественный редактор В. И. Пономаренко Технический редактор Л. А. Муравьева . Корректор Г. И. Кострикова ИБ № 5418 Изд. № ФМ-813. Сдано в набор 19.11.85. Подл, в печать 28.04.86. Т-08780. Формат 84Х 108/32. Бум. кн.-журн« Гарнитура литературная. Пе- чать высокая. Объем 15,12 усл. печ. л. 15,12 усл. кр.-отт. 15,40 уч. изд. л. Тираж 22000 экз. Зак. № 1904. Цена 95 коп. Издательство «Высшая школа», 101430, Моск- ва, ГСП-4, Неглинная ул,, д< 29/14. . Ордена Октябрьской Революции и ордена Трудо- вого Красного Знамени МПО «Первая Образцо- вая типография» имени А. Жданова Союзпо- лиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книж- ной торговли. 1 13054, Москва, Валовая, 28.