Text
                    Ю. П. ЗАИЧЕНКО
/«ІіЛ і Ч її

Міністерство освіти і науки України Національний технічний університет України «Київський політехнічний інститут» Ю. П. Зайченко Теорія прийняття рішень Підручник Затверджено Міністерством освіти і науки, молоді та спорту України як підручник для студентів вищих навчальних закладів, які навчаються за напрямом підготовки «Системний аназіз» Київ НТУУ «КПІ» 2014
У ЯК М‘> ХІ(.(()7* X) ЬЬК 22.1 Хя7' 3-17 Гриф надано Міністерством освіти і наспи моїоді та (порту України {Лист Л? Г 1 1-1X63$ від 03.12 2012 р. ) Рецензенти: О Ф Воіошии, д-р тсхн. наук, нроф , Київський національний університет імені Тараса Шевченка О. К Лопатні, д-р фіз.-мат. наук, нроф , Національна академія управління Відповідальний редактор В. Д Раминелко. д-р тсхн. наук, проф.. Національний технічний університет України «Київський політехнічний інститут» Зайченко Ю. П. 3-17 Теорія прийняття рішень : підручник / Ю. П. Зайченко. - К. : НТУУ «КІП», 2014. - 412 с. - Бібліогр.: с. 398-401. - 500 пр. І$І^ 978-966-622-616-0 Детально розглянуто моделі та методи прийняття рішень в умовах дії випадкових факторів, прямі та непрямі методи розв'язання задач стохастнчного програмування. Багато уваги приділено описанню моделей та методів прийняття рішень в умовах невизначеності. Подано апарат нечітких множин і відношень, показано його застосування в задачах прийняття рішень. Викладено методи розв'язання заіальної задачі нечіткого математичного програмування. Детально розглянуто метоли прийняття рішень за наявності декількох критеріїв оптимальностт, викладено сучасний математичний апарат вирішення баї атокрнтеріальннх задач в нечнких умовах, а також розглянуто задачі прийняття рішень в умовах конфлікту (протидії). Викладено математичний апарат теорії ігор двох осіб, матричних та бімагрнчннх ігор, метод вирішення кооперативних ігор на основі теорії Неша. Розглянуто також задачі прийняття рішень на основі теорії кооперативних ігор п осіб. Для студентів вншнх навчальних закладів напрямів «Системний аналіз» і «Комп'ютерні науки», може використовуватися як довідник із сучасних моделей та метолів прийняття рішень в умовах рнзнку, невизначеності та багатокритсріальносгі. УДК 519.816(075.8) ББК 22.|8я73 15ВИ 978-966-622-616-0 Є’ Ю. П. Зайченко. 2014 С НТУУ «КІП»(111СА),2014
ВСТУП З проблемами прийняття рішень стикається кожна людини як у своїй професійній діяльності, так і в повсякденному житті. Як краще вкласти свої іроші, куди поїхати відпочивати, як спланувати бюджет, як вибрати вищий навчальний заклад для отримання вищої освіти - такі питання виникають по- стійно і треба прийняти або найкраще, або раціональне рішення, яке влаштує особу, що приймає відповідне рішення. Першим в історії людства, хто прий- мав рішення, був, згідно зі Святим Письмом, Бог, який створив план побудо- ви Світу, а також обрав представників фауни та флори для Землі. Задача прийняття рішень виникає лише тоді, коли є декілька альтерна- тив, з яких необхідно зробити відповідний вибір, а також критерій або крите- рії, за якими можна їх оцінювати. Крім того, кожна задача прийняття рішень мас різні обмеження, зокрема на матеріальні та фізичні ресурси, на кошти, на час, за який необхідно прийняти відповідне рішення тощо. Людство прийма- ло рішення протягом своєї тисячолітньої історії та накопичило значний арсе- нал механізмів та способів пошуку адекватних рішень у різних сферах діяль- ності, проте довгий час пошук найкращих або хороших з точки зору практики рішень значною мірою лишався мистецтвом. Як науковий напрям теорія прийняття рішень почала формуватися лише в середині XX ст. У цей час виникла і почала інтенсивно розвиватися нова нау- кова дисципліна «Дослідження операцій», мету якої її творці Р. Акоф, Л. Ар- ноф, Т. Сааті та Р. Чсрчмси визначили як «наукове (кількісне) обгрунтування рішень, що приймаються, у системах організаційного керування (фірмах, кор- пораціях, галузях промисловості, в мікро- та макроскономічних системах» [3]. З іншого боку, Т. Сааті жартома визначив дослідження операцій як «ми- стецтво давати погані відповіді иа такі питання, на які інші методи дають ще гірші відповіді». Він мав на увазі властивість дослідження операцій знаходи- ти найкращий компроміс за наявності декількох суперечливих критеріїв та обмежень на ресурси та час, відведений на прийняття рішень. Перші роботи у сфері теорії прийняття рішень розглядали досить прості задачі прийняття рішень в умовах визначеності. Вони грунтувались на теорії корисності, в розробленні якої та методів її використання в різних З
задачах прийняття рішень брали участь Дж. фон Нейман та П. Фішберн; вони розробляли та удосконалювали методи оптимізації, зокрема лінійного про- грамування (ЛІТ) та нелінійного програмування (НП). Також значний внесок у розвиток сучасних методів ЛП та НП зробили Г. Данціг, акад. Л. Канторо- вич, М. Моіссєв, Н. Шор, Г. Кун, Е. Таккср. Математичний апарат прийняття оптимальних рішень у багатокрокових динамічних процесах прийняття рішень, зокрема в задачах планування на п періодів, у динамічних задачах управління запасами грунтується на динаміч- ному програмуванні, розробленому в роботах Р. Беллмана, а також на прин- ципі максимуму Л. Понтрягіна. Надалі було досліджено задачі прийняття рішень в умовах дії випадко- вих факторів, що описуються моделями стохастичного програмування. Знач- ний внесок у розвиток теорії та методів стохастичного програмування зроби- ли такі вчені, як акад. Ю. Єрмольєв та Д. Юдін. Багато задач прийняття рішень у плануванні, розподілі ресурсів, кален- дарному плануванні описуються моделями дискретного програмування. Ва- жлива роль у розробленні нових методів розв’язання комбінаторних задач дискретної оптимізації належить українським вченим В. Михалсвичу, Н. Шору та В. Шкурбі. Створений ними метод послідовного аналізу варіантів широко застосовується у розв’язанні багатьох задач теорії розкладів, проек- тування мереж, розташування нових виробництв тощо. Значний внесок у розробленні наближених методів дискретної оптиміза- ції та їх впровадження для вирішення задач планування і проектування зро- били акад. І. Сергієнко та його учні. У багатьох практичних задачах прийняття рішень, зокрема проектуванні складних систем, виникає проблема прийняття оптимальних рішень з ураху- ванням декількох критеріїв оптимальності. Значний внесок у розробку мето- дів багатокритеріальної оптимізації, а також їх застосування в задачах управ- ління та проектування, зробили проф. В. Волкович, О. Вснтцсль, Ю. Гсрмеєр, О. Ларичсв, Р. Кіні, X. Райфа та ін. Широкий клас задач прийняття рішень становлять задачі, в яких рішен- ня необхідно приймати за наявності протидії, коли існує декілька учасників, 4
інтереси яких протилежні або не збігаються. Математичним апаратом опису таких задач є теорія ігор. Значний внесок у створенні основ теорії ігор та роз- витку її напрямів належить Дж. фон Нейману, О. Моргснштсрну, Г. Оуену. В їх роботах було створено апарат вирішення антагоністичних ігор двох осіб. Сформульована Дж. фон Нейманом теорема про мінімакс визначила метод пошуку оптимальних стратегій гравців у матричних іграх двох осіб. В остан- ні роки увагу вчених привертають більш складні й важливі для практики за- дачі теорії кооперативних ігор багатьох осіб, в яких інтереси учасників не є прямо протилежними і вони можуть вступати в коаліцію для підвищення сво- їх доходів. У таких задачах досліджуються умови виникнення коаліції, її стійкість та найкращі стратегії гравців. Зазначимо, що такі задачі часто вини- кають в економіці. Важливу роль у розв’язанні кооперативних ігор двох осіб відіграли у свій час роботи Дж. Неша. Важливу роль у постановці та формалізації задач прийняття рішень віді- грає системний аналіз, який служить методологією якісного та кількісного аналізу задач прийняття рішень, визначення їх структури, критеріїв, вхідних та вихідних змінних, встановлення основних факторів, які впливають на розв’зок задачі. Значний внесок у створення та розвиток системного аналізу та розробку методології його застосування для вирішення задач прийняття рішень зробили М. Месарович, Р. Лкоф, Д. Мако, Я. Такахара, вітчизняні вчені акад. М. Згуровський, Н. Панкратова та ін. В останні роки однією з головних проблем у теорії прийняття рішень стала проблема прийняття рішень в умовах невизначеності, неповної та нечіткої інформації. Теоретичний апарат прийняття рішень в умовах невизначеності теорія нечітких множин та відношень - був вперше розроблений в роботах Л. Заде й розвинутий у численних роботах його учнів та послідовників Л. Кофмана, Д. Дюбуа, Дж. Менделя, Л. Ванта та ін. Видатну роль у розроб- ленні методів прийняття рішень за наявності нечіткої та якісної інформації ві- діграло введення Л. Заде поняття лінгвістичних змінних і створення на їх ос- нові систем із нечіткою логікою. Значний внесок у розвиток цього напряму зробили Л. Ванг, Дж. Е. Мендсль, Е. Мамдані, М. Сугсно, Б. Коско та інші вчені В останні роки було опубліковано декілька монографій, підручників та 5
навчальних посібників з теорії прийняття рішень (зокрема, підручник авторів Л. Катренко, В. Пасічник та В. Пасько «Теорія прийняття рішень» (К.: Вид-во ВНУ, 2009. - 448 с.) та навчальний посібник авторів О. Волошин, С. Мащенко «Моделі та методи прийняття рішень» (2-ге вид., перероб. та допов. - Вид.- поліграф. центр «Київський університет», 2010. - 336 с.)), в яких досить ґрун- товно викладено основні напрями, методи та моделі теорії прийняття рішень. Проте в них поверхово викладено важливий сучасний напрям теорії прийняття рішень -- прийняття рішень в умовах невизначеності, за наявності якісної ін- формації на основі лінгвістичних змінних та систем із нечіткою логікою. Сис- теми з нечіткою логікою та нечіткі нейронні мережі стали потужним та гнуч- ким інструментарієм прийняття рішень в умовах невизначеності, неповної та якісної інформації, зокрема в задачах класифікації та розпізнавання образів, кластерного аналізу та прогнозування в економіці та фінансовій сфері. Окрім юго, в опублікованих виданнях не було відображено динамічних задач прий- няття рішень, в яких процес прийняття рішень складається з багатьох етапів на деякому часовому плановому інтервалі, а рішення, прийняті в поточний мо- мент часу, впливають на результати наступних рішень. Такі задачі складають широкий клас задач планування виробництва, управління запасами, управлін- ня проектами, ремонту та заміни обладнання тощо; для їх розв’язання застосо- вують методи динамічного програмування, марковські моделі та методи управління марковськими процесами. У пропонованому підручнику в систематизованому вигляді викладено як класичні підходи, моделі та методи прийняття рішень, так і сучасні важливі напрями та методи прийняття рішень: в умовах невизначеності, нечіткої та якісної інформації, а також динамічні моделі прийняття рішень як у чітких, так і в нечітких умовах. Підручник складається з восьми розділів. У першому розділі подано за- гальну характеристику задач прийняття рішень, розглянуто моделі прийняття рішень в умовах визначеності, ризику та невизначеності, наведено основні критерії прийняття рішень в умовах невизначеності, викладено основи теорії корисності, наведено характеристику етапів процесу прийняття рішень. У другому розділі розглянуто експертні методи та технології прийняття 6
рішень, наведено класифікацію задач експертного оцінювання, викладено методи та алгоритми строгого та нестрогого ранжування об’єктів. Третій розділ присвячено методам прийняття рішень в умовах дії випад- кових факторів. Відповідні задачі описуються моделями стохастичного про- грамування. Викладено одностапні та двохстапні задачі стохастичного про- ірамування та методи їх розв’язання. Розглянуто прямі методи стохастичного програмування, зокрема метод стохастичних квазіградігнтів та стохастичної апроксимації, які широко застосовують у задачах навчання систем в умовах дії випадкових факторів. У четвертому розділі розглянуто проблеми прийняття рішень в нечіт- ких умовах. Для формалізації цих задач введено нечіткі множини, описано операції над ними, а також нечіткі відношення та операції над нечіткими множинами. Розглянуто нечітке відношення переваги, його властивості. Ви- кладено метод багато кри г еріального вибору альтернатив на основі нечітко- го відношення переваги. Наведено принципи узагальнення Л. Заде та С. Ор- ловського, узагальнено нечітке відношення нестрогої персваїи. Сфор- мульовано загальну задачу нечіткого математичного програмування та викладено метод її розв’язання. Задачі прийняття рішень з використанням нечіткої експертної інформа- ції розглянуто в п ятому розділі. Наведено постановку багатокритеріальної задачі та її властивості, визначено поняття «парето-оптимальнс рішення» та «найкраще компромісне рішення багатокритеріальної задачі». Дано огляд методів багатокритеріальної оптимізації. Розглянуто багатокритеріальні за- дачі ЛП в чітких та нечітких умовах та викладено методи їх роз’язання. На- самкінець запропоновано найбільш загальну постановку та модель задачі ба- гатокритеріальної оптимізації в нечітких умовах - баї атокритеріальну задачу нелінійного програмування з нечіткими параметрами та метод її розв'язання. У шостому розділі розглянуто динамічні задачі послідовного прийняття рішень, основні ідеї та особливості обчислювального методу динамічного проірамування, процеси послідовного прийняття рішень та методи їх оптимі- зації на основі динамічного програмування. Викладено особливості застосу- вання методу динамічного ироірамування для задач з декількома обмежен- 7
ними, розкрито сутність явища «прокляття вимірності» динамічного програ- мування та метод його заниження. Розглянуто динамічні задачі управління запасами та метод їх вирішення, а також задачі послідовного прийняття рі- шень для нескінченного планового періоду та методи знаходження оптима- льних стратегій. Розглянуто марковські процеси прийняття рішень та метод оптимізації управління ними на основі динамічного програмування. Застосу- вання методу проілюстровано прикладом розв’язання динамічної задачі управління запасами з імовірнісним попитом та нескінченним плановим пе- ріодом. Розглянуто також нечіткі постановки задач та моделі планування для скінченного та нескінченного планового періоду та методи знаходження оп- тимальних стратегій для таких задач. Сьомий розділ присвячено моделям та методам прийняття рішень у кон- фліктних ситуаціях. Викладено основні поняття в області теорії ігор, зокрема стратегії гри, стратегію рівноваги, нормальну форму гри. Розглянуто метод вирішення антагоністичних ігор двох осіб на основі теореми про мінімакс Дж. фон Нсймана, метод розв’язання матричних ігор двох осіб з викорис- танням ЛП; біматричні ігри з наведенням їх властивостей; кооперативну те- орію біматричних ігор, умови виникнення коаліції, аксіоми та теореми Нс- ша, викладено метод знаходження найкращого компромісного розв’язку кооперативної біматричної гри - точки Неша. Подано моделі та методи розв’язання матричних та біматричних ігор в нечітких умовах. Основи теорії колективного вибору та кооперативні ігри N осіб розгля- нуто у восьмому розділі. Викладено принципи розподілу корисностей, поряд- ки колективного добробуту, функції колективної корисності та їх властивості. Розглянуто теорію кооперативних ігор п осіб із розподілом витрат та прибут- ків. Визначено поняття «ядро гри» та умови його існування, викладено умови існування коаліцій. Розглянуто важливі задачі розподілу витрат на колектив- ний проект, основні механізми розподілу колективних витрат та види подат- ків. Наведено застосування теорії кооперативних ігор п осіб в економіці, для моделей економіки виробництва суспільного продукту. Подано аналіз мето- дів голосування, викладено парадокси правил та методів голосування. 8
Наприкінці кожного розділу наведено питання для самоконтролю, а та- кож задачі та вправи для самостійної роботи студентів. Для полегшення са- мостійного вивчення курсу в підручнику після теоретичного матеріалу, ме- тодів та алгоритмів прийняття рішень наводяться приклади їх застосування для конкретних практичних задач, які в багатьох випадках доведені до чисель- ного ров’язку. Підручник орієнтовано насамперед на студентів бакалавратів «комп’ютерні науки» і «системний аналіз та управління», він буде корисний також усім науковцям та фахівцям, що займаються проблемами розроблення та впровадження систем прийняття рішень в різних галузях економіки та ви- робництва. 9
1. ЗАГАЛЬНА ХАРАКТЕРИСТИКА ЗАДАЧ ПРИЙНЯТТЯ РІШЕНЬ 1.1. Історія розвитку методологи прийняття рішень Проблема прийняття рішень існує стільки часу, скільки існує людство. Ще печерні люди замислювались, як правильно поділити після вдалого по- лювання мамонта. Легендарний Ной під час вселенського потопу вирішував, яких тварин відібрати у ковчег і врятувати від повені. Довгі роки прийняття рішень лишалося мистецтвом, іцо ірунтувалося на інтуїції, набутому досвіді. Протягом багатьох століть людство намагалося розробити принципи та пра- вила прийняття «розумних» рішень, що особливо актуальним було на держав- ному рівні, оскільки результати цих рішень стосуються всього населення держави. Тому принципи та основні положення підготовки та ухвалення державних рішень зажди привертали увагу мислителів і вчених починаючи з сивої давнини. Значний внесок у розроблення теорії державного управління зробив Илаїон, а пріоритет в розробці концепції ухвалення рішень належить Арісто- тслю, який розробив первісний категорійний апарат та виконав аналіз про- цедур ухвалення рішень. Мислитель виділив категорії «розсудливість» та «свідомий вибір», вважаючи, що існує два типи розумових здібностей люди- ни: теоретична мудрість та практична «розсудливість», на яких грунтуються фундаментальні та прикладні знання. Розсудливість пов’язана з практичною діяльністю людей (зокрема, з державним управлінням) і має бути властива людським вчинкам, орієнтованим на досягнення користі у формі суспільного або особистого блага. За Арістотслсм, розсудливість у державному управлінні відрізняється від інших її проявів тим, що вона має двоїстий характер: і одного боку - ке- рівний (законодавчий), а з другого - пов’язаний з окремими питаннями. Цс наука про державну, що досліджує вчинки та процеси ухвалення рішень, 10
оскільки все, вирішене за допомогою голосування, реалізується у вчинках. Ухвалення державних рішень ірунтується на практично-політичному прик- ладному типі знання, що містить постановку цілей та способи їх реалізації (вчинки, дії). Інша базова категорія - «свідомий вибір» - відображає певну невизначеність людської діяльності, що спрямована на пошук способів до- сягнення певних цілей. «Предмет рішення», як зазначав Арістотсль, стосу- ється не лише остаточної мсти, але й способів та засобів її реалізації. Отже, ухвалення державних рішень за Арістотелсм - цс прикладна наука та прак- тично-розумова діяльність, які орієнтовані, по-перше, на свідомий розумний вибір засобів, адекватних до сформульованих цілей, а по-друге, на виявлен- ня можливих раціональних дій (вчинків) окремих осіб для досяшення таких цілей в умовах невизначеності та свободи вільного вибору. Питання раціонального державного управління та ухвалення державних цілей досліджували політичні діячі та філософи епохи Відродження (Н. Маккіа- вслі, Ж. Боден) і Просвітництва (Т. Гоббе, Б. Спіноза та Ж.-Ж. Руссо). Зокрема, вони досліджували такі проблеми: види державних актів (Т. Гоббе), роль рад- ників і рад при правителях (Т. Гоббе, Н. Маккіавслі), особливості голосування у представницьких органах і народних зборах (Б. Спіноза, Ж.-Ж. Руссо), ураху- вання ресурсів та соціальних обставин під час ухвалення рішень (Ж. Боден) [ЗО]. Передумови теорії раціонального вибору виникли в середині XVIII на початку XIX ст. у працях представників шотландської школи моралі, які впе- рше запропонували індивідуалістичну концепцію раціональної поведінки людей та звернули увагу на її плідність для пояснення інших суспільних явищ. Основоположник класичної політичної економії А. Сміт, який належав до цієї школи, використав цю концепцію для пояснення ринкових відносин. Індивідуалістичний підхід до економічних явищ та процесів А. Сміт переко- нливо продемонстрував у фундаментальній праці «Дослідження про природу та причини багатствв народів»: «Кожна людина має лише власний інтерес, орієнтована лише на власну вигоду, причому в цьому разі вона невидимою рукою прямує до мсти, яка не входила в її наміри. Відстоюючи свої приватні інтереси, вона часто дієвіше служить інтересам суспільства, ніж тоді, коли вона свідомо прагне служити їм». 11
Метафора «невидима рука» означає механізм ринку, який регулює ціни та встановлює рівновагу між попитом та пропозицією. Така рівновага, або спон- танний порядок, виникає внаслідок взаємодії багатьох продавців та покупців на ринку, які беруть участь у ринковому обміні. У створеній в працях А. Сміта та його послідовників класичній економічній теорії раціональною вважається така поведінка індивіда, яка дає йому найбільшу користь чи вигоду. На думку А. Сміта та інших класиків політичної економії, раціональна поведінка індиві- да має сприяти багатству та добробуту всього людства. На цьому тезисі грун- тується уявлення про «економічну людину» (Ното ссопотісиз), яка завжди діє розумно, не схильна до емоцій, не зважає на сторонній вплив і прагне досягну- ти якнайбільшої вигоди, приймаючи власні рішення. Класична економічна теорія А. Сміта існувала майже до Великої депре- сії 1929-1933 років, після якої цю теорію було піддано радикальній ревізії, проте основні принципи, на яких грунтусгься раціональна модель вибору, лишились незмінними. До них належить, насамперед, фундаментальний принцип раціональності, який викликає багато дискусій. Якщо прихильники класичної економічної теорії вірили в об’єктивність раціональності, то їх по- слідовники неокласики припускали можливість її суб’єктивної інтерпретації (одним із перших М. Вебер). На думку М. Вебера, суб’єктивна інтерітретація важлива для розкриття мотивів вчинків дійових осіб, проте він не відмовляв- ся від можливості об’єктивного обгрунтування вчинків. Між тим, В. Парето вважав раціональність об’єктивним критерієм вчинків та дій, оскільки вона характеризує досягнення мсти з погляду ие тільки активного суб’єкта, але й тих, хто має більш повну інформацію. Однак за такого погляду на раціональ- ність чимало дій у суспільстві виявляються нсусвідомлсними, тому що без- посередні учасники дії звичайно не мають повної інформації. Поняття раціо- нальності та принципів раціональної поведінки отримали подальший розвиток в сучасній науці, зокрема економіці. У соціально-економічних та гуманітарних дослідженнях раціональність виявляється як певна форма цілеспрямованої розумної діяльності та поведін- ки людей у найрізноманітніших суспільних умовах. Якщо фізичні закони природи не залежать від волі та прагнень людей, то суспільні закони, зокрема 12
економічні, хоча й опосередковано, але відображають їх загальні потреби та цілі. Раціональний вибір пов’язаний з логічними міркуваннями, оскільки він описує індивідуальний спосіб вибору варіантів з максимальною корисністю або вигодою. Наприклад, якщо мета підприємця - досягти максимальної ви- годи від власного бізнесу, то саме її досягнення він вважає за раціональне зі свого суб’єктивного погляду. Однак такий підхід може суперечити суспіль- ним цілям. Із принципом суб’єктивної раціональності нерозривно пов’язаний прин- цип методологічного індивідуалізму, згідно з яким саме індивідам відведена вирішальна роль в економічному житті суспільства. Соціальні інститути та структури, що встановлюють правила гри в економіці, вторинні, тому що їх встановлюють та змінюють реальні індивіди. Такий підхід відіграв свого часу позитивну роль, оскільки був спрямований проти «телеологічного підходу», який домінував у житті суспільства протягом багатовікової історії. Згідно з телеологічним підходом розвиток суспільства залежить від цілей та ідеалів, заданих йому ззовні (Богом). На противагу такому підходу прихильники теорії вільного вибору дово- дять. що кожен підприємець, суб’єкт господарювання чи політик, по-перше, встановлює свої цілі, пріоритети, визначає можливі альтернативи дій і впоряд- ковує їх за пріоритетністю; а по-друге, за всіх умов він поводиться раціонально, тобто намагається досягти максимальної індивідуальної вигоди. Згідно з цим принципом на реальну поведінку індивіда впливають не якісь високі ідеї та сус- пільні інтереси, а лише прагнення максимізувати свою вигоду чи інтерес. Захисники свободи ринку та раціонального вибору, починаючи з А. Сміта та закінчуючи Ф. Гайєком, завжди утверджували переваги індивіду- ального вибору та порядку, що виникає на його основі. Вони твердили, що оптимальний вибір індивідів завжди сприяє зростанню суспільного багатства та добробуту громадян і тому рішуче виступали проти втручання держави в регулювання ринку. Проте ця теорія була повністю спростована в період Великої депресії 1929-1933 років, коли її принципи не змогли пояснити причин цієї кризи, а головне, вказати шляхи виходу з неї. 13
Теорія свободи ринку та раціонального вибору була суттєво перероблена та розвинута після другої світової війни. На основі інтеграції різних галузей знань: політичної економії, соціології, філософії, менеджменту, теорії організа- цій, державного управління, а також інформаційно-комунікаційних досліджень та кібернетики, - було створено новий напрям у науці та практиці державного управління політичне управління. Піонером цього напряму став видатний вчений Г. Саймон, який у 1947 р. опублікував моноірафію «Адміністративна поведінка: дослідження процесів ухвалення рішень в адміністративних оріані- зацтях», що отримала Нобелівську премію (1978 р.). Найбільшу популярність йому принесли праці в галузі теорії корпоративного ухвалення рішень. У монографії «Управлінська поведінка» Г. Саймон запропонував замінн- ій спрощений підхід до ухвалення рішень на такий, який враховує багато чин- ників. Теорія Г. Саймона розглядає вплив на ухвалення рішень психологічних мотивів, які класичною теорією ігноруються. У пізніших роботах він дедалі більше уваги приділяє створенню систем штучного інтелекту та його застосу- ванню для розв’язання проблем. Зокрема, Г. Саймон разом з А. Ньєллом та Дж. Шоу став засновником нового напряму в галузі штучного інтелекту - еври- стичного програмування, яке протягом багатьох років успішно використовува- лось для вирішення складних задач у різних сферах людської діяльності. Г. Саймон пов’язує поняття розумного вибору не з отриманням макси- мальної вигоди, а з досягненням задовільного результату. Підприємця може не цікавити максимізація, він може просто мати бажання отримати той дохід, який вважає достатнім для себе. Для обгрунтування своїх висновків учений посилається не лише на економічні факти, але й на результати емпіричних досліджень психологів, згідно з якими спонукання до дій виникає внаслідок незадоволених прагнень і зникає після їх задоволення: «Якщо ми хочемо по- яснити поведінку на основі цієї теорії, то маємо вважати, що мста фірми - не максимізація, а досягнення певного рівня прибутку, утримання певної части- ни ринку та певного рівня продажів» [ЗО]. Принцип досягнення задовільного результату Г. Саймон застосував не лише до ухвалення рішень в економічних науках, але й надав йому універсаль- ного характеру. 14
Застосування методів раціонального вибору в політичних дослідженнях почалося у 60-х роках XX ст. з книги К. Ерроу «Соціальний вибір та індиві- дуальні цінності» (1951 р.). Для того, щоб політичний вибір сприяв добробу- ту всього суспільства, К. Ерроу пропонує реформувати суспільство на заса- дах конституційного та контрактного підходів. Якщо в конституції визначено основні загальні правила поведінки всіх громадян на довгий період часу, то контрактний підхід встановлює правила гри для учасників контракту на не- тривалий термін (наприклад, ринкові контракти). Основна ідея такого підходу до політики полягає в тому, що правила, якими користуються у виборі, доступні для суспільства і тому їх можна змі- нити за допомогою колективних зусиль індивідів, які складають громадянсь- ке суспільство, хоча індивідуальний вибір та його результати можуть бути непідконтрольними суспільству. Щоб запобігти корисливим та іншим неба- жаним діям груп, що можуть проникнути до владних структур, треба запро- вадити конституційні закони, які гарантуватимуть безпеку суспільству від таких посягань. Важливі дослідження у сфері механізмів ухвалення рішень виконали представники вірджинської школи на чолі з її засновником - лауреатом Но- белівської премії в галузі економіки Дж. Бьюкененом. .Вони вважають, що індивідуальний вибір і ухвалення рішень відбуваються на мікрорівні, а вста- новлення загальних правил вибору - на макрорівні. Завдяки цьому громадян- ське суспільство може впливати на політичні процеси. На думку Дж. Бьюке- нена, методи аналізу ринкової поведінки можна застосувати до будь-якої діяльності, пов’язаної з вибором особи. Проте Дж. Бьюкенсн і Г. Бренан зауважують, що ринкові методи не можна механічно переносити з економіки на політику. Політика, за Дж. Бьюкененом, - це складна система обміну між індиві- дами, в якій вони прагнуть досягти своїх цілей колективно, оскільки не мо- жуть реалізувати їх за допомогою звичайного обміну на ринку. Успіхи раціо- нального вибору в економіці, стверджує Дж. Бьюкенсн, дають змогу не лише встановити аналогію між економікою та політикою, але й виявити істотну відмінність між ними. Основна відмінність між ринком та політичною систс- 15
мою полягає не у відмінних типах цінностей та інтересів людей, а в умовах, в яких вони реалізують свої переконання. Політика грунтується на ухваленні колективних рішень щодо суспільних благ, які вигідні для багатьох. Виборець голосує за якогось кандидата чи пар- тію, програма якої відповідає його інтересам. Політичні партії максимізують свій інтерес, прагнучи здобути якомога більше голосів на виборах. У парла- менті утворюються коаліції та блоки різних партій, щоб досягти своїх цілей. Тому раціональний вибір у політиці багато в чому аналогічний ринковому, коли учасники також прагнуть досягти максимальної вигоди і для цього та- кож можуть об’єднуватись у коаліції. Ініціатором створення нового підходу не лише для трактування поняття раціональності, але й до засад соціального управління, став Г. Саймон. Замість моделі «економічної людини» він висунув модель адміністративної людини, згідно з якою управлінець або адміністратор, спираючись на відому інформацію, ставить за мету знайти не оптимальний, а лише задовільний розв’язок проблеми. Такий підхід краще відповідає дійсності, оскільки особа, яка приймає рішення (ОПР), вимушена враховувати випадкові та непередба- чувані обставини, тобто приймати рішення в умовах суттєвої невизначеності, що не дають їй можливості ухвалити оптимальне рішення. У такій ситуації ОПР вимушена обмежуватись пошуком лише раціона- льного, задовільного з її погляду рішення. Зазначимо, що при прийнятті рі- шення як в економіці, так і в політиці, потрібно враховувати обмеження, що висуває середовище, зокрема, наявність колективів або організацій, які фун- кціонують у цьому середовищі та мають цілі, що не збігаються з цієї ОПР, а можуть бути протилежними. Тому виникає проблема пошуку раціонально- го компромісу між учасниками (гравцями на ринку) або різними політични- ми групами. Взагалі, дослідження умов виникнення коаліцій а також їх стій- кості є однією з ключових проблем для досягнення успіху в економіці та політиці. Незважаючи на довгий, тисячолітній період свого розвитку прийняття рішень як наука мала емпіричний характер. Як самостійна дисципліна із вла- сним математичним апаратом теорія прийняття рішень сформувалась лише 16
у 50-60-х роках XX ст. після появи дисципліни «Дослідження операцій» (Орегайопя КезеагсЬ). Ця дисципліна виникла на початку Другої світової вій- ни у Великій Британії і була спрямована на моделювання та оптимізацію рі- шень у військовій справі для управління військовими операціями. Одна з ти- пових задач, яку потрібно було вирішувати в той час - як розташувати зенітну артилерію, щоб забезпечити найкращу протиповітряну оборону стра- тегічних об'єктів від ворожих літаків. У процесі вирішення конкретних прак- тичних задач управління військовими операціями було сформульовано основ- ні методологічні принципи дослідження операцій, також розвивався її математичний апарат. Після закінчення Другої світової війни методи та під- ходи дослідження операцій були з успіхом застосовані для прийняття чис- ленних рішень у промисловості. На початку 50-х років Р. Черчмен, Р. Акоф та Л. Арноф видали перший підручник з дослідження операцій, було відкрито підготовку фахівців з дос- лідження операцій у провідних університетах США. Основоположники цієї дисципліни визначили дослідження операцій як «науку, яка займається кіль- кісним обґрунтуванням рішень, що приймаються». Вони сформулювали ос- новні принципи дослідження операцій: 1) оптимальності (пошук найкращих рішень, можливих у певній ситуації); 2) системного підходу (кожна задача розглядається з позиції її впливу на загальносистемні критерії, а кожна система складається з багатьох підсистем, які взаємодіють між собою, а також має зв’язки із зовнішнім світом); 3) міждисциплінарного підходу (аналіз поставленої задачі з позицій різ- них наук чи галузей знань). З тих часів було створено та удосконалено математичний апарат дослі- дження операцій - сучасними методами оптимізації є лінійне, нелінійне, дис- кретне та динамічне програмування. В розробку математичного програму- вання зробили суттєвий внесок також і вітчизняні вчені: академік Л. Канто- рович ще 1939 р. розробив метод вирішення задач лінійного програмування, який було з успіхом використано для розв’язання задач в економіці. Введені Л. Канторовичем «відносні оцінки» - розв'язуванні множники - відіграли важливу роль в оцінюванні впливу обмежених ресурсів на оптимальне зна- 17
чсння цільової функції та дослідження чутливості оптимального плану до варіації обмежених ресурсів. За видатний внесок у розроблення нових мате- матичних методів та їх застосування в економіці академік Л. Канторович був удостоєний Нобелівської премії. Видатні вчені Інституту кібернетики академіки НАН України В. Миха- левич та Н. Шор ще в 60-х роках XX ст. розробили метод послідовного аналі- зу та відсіву варіантів (ПАВ) для розв’язання комбінаторних задач дискрет- ного програмування. Цей метод з успіхом застосовується в задачах опти- мізації структури газопроводів, планування виробництва, складання роз- кладів тощо. Для оптимізації прийняття рішень в умовах дії випадкових факторів ака- демік Ю. Єрмольєв розробив метод стохастичного програмування - стохас- тичних квазіградієнтів, який широко застосовується в задачах, в яких потріб- но враховувати стохастичні фактори. Оскільки більшість задач дискретної оптимізації мають комбінаторний хара- ктер, а точні алгоритми їх вирішення мають експоненціальну складність, важливо- го значення набуває розроблення ефективних наближених методів їх розв’язання. Значний внесок у створення ефективних наближених методів дискретної оп- тимізації зробив академік І. Сергієнко, який запропонував метод вектора спаду. Вагомий внесок у розроблення методів прийняття рішень на основі ідей самоорганізації належить академіку О. Івахненку, який ще наприкінці 60-х років розробив метод індуктивного моделювання - метод групового ураху- вання аргументів (МГУА). Цей метод, на відміну від інших методів моделю- вання, дозволяє автоматично будувати модель невідомого процесу (об’єкта) за експериментальними даними. Метод широко використовується в економі- ці та техніці для побудови аналітичних моделей на основі вибірки даних. Досить часто на практиці необхідно приймати рішення в умовах неви- значеності, нечіткої або неповної інформації, а також за наявності крім кіль- кісних, ще й якісних факторів та критеріїв. Такі задачі належать до класу по- гано структурованих задач. Для вирішення таких задач Л. Заде розробив апарат нечітких множин та нечітких відношень (1965 р.). Л. Заде ввів поняття лінгвістичних змінних та описав їх значення за допомогою нечітких множин. 18
що надало можливість розв'язувати широкий клас задач в умовах нечіткої та якісної інформації, які раніше вважались нерозв’язними. Крім того, викорис- тання лінгвістичних змінних дозволило формалізувати нечіткі знання експер- тів та використати їх для побудови систем з нечіткою логікою. З розвитком методів дослідження операцій та значним розширенням класів задач деякі напрями цієї дисципліни виділилися в окремі самостійні дисципліни. Так, в останні роки теорія прийняття рішень виокремилась у са- мостійну дисципліну, хоча ідейно, методологічно та за своїм апаратом вона нерозривно пов’язана з дослідженням операцій і є його сучасним напрямом. Теорія прийняття рішень має такі основні напрями досліджень: 1. Прийняття рішень в умовах дії випадкових факторів (стохастичне програмування). 2. Прийняття рішень в умовах невизначеності (нечіткої інформації). 3. Багатокритсріальні задачі прийняття рішень. 4. Прийняття рішень на основі лінгвістичних змінних та систем з нечіт- кою логікою. 5. Експертні технології прийняття рішень. 6. Прийняття рішень у конфліктних умовах - антагоністичні та неанта- гоністичні ігри двох осіб та їх застосування в економіці. 7. Ігри л осіб; умови виникнення коаліцій гравців та їх стійкість. 8. Колективний вибір та методи прийняття колективних рішень. Саме ці розділи, моделі та методи прийняття рішень складають зміст пі- дручника. 1.2. Загальна характеристика та класифікація задач прийняття рішень Елементи задач прийняття рішень. Будь-яка задача прийняття рі- шень включає такі елементи [25]: 1. Особа, що приймає рішення, повинна нести відповідальність за нас- лідки цих рішень, або колектив ОПР. 2. Набір змінних, значення яких обирає ОПР. Називатимемо їх керівними впливами або стратегіями. 19
3. Набір змінних, значення яких залежать від вибору стратегій; назива- тимемо їх вихідними змінними (характеристиками прийняття рішень або наслідками рішень). 4. Набір змінних, значення яких не регулює ОІІР. Ці змінні можуть ли- шатися визначеними під час розв’язання тієї або іншої задачі, і тоді їх нази- вають параметрами задачі. В інших випадках вони можуть змінюватися не- залежно від ОПР і тоді є збуреннями (зовнішнім середовищем). 5. Заданий інтервал часу Т, на якому приймається рішення в певній зада- чі (ситуації). 6. Математична модель задачі прийняття рішень, яка являє собою суку- пність співвідношень, що пов’язують стратегії (керівні впливи) та параметри задачі з вихідними змінними. 7. Обмеження, що відображають вимоги, які накладаються ситуацією прийняття рішень на вихідні змінні та стратегії задачі. 8. Цільова функція (ЦФ) (критерій оптимальності), яка дає змогу оціню- вати властивості обраного рішення. При цьому ЦФ має залежати від страте- гій згідно з математичною моделлю задачі прийняття рішень. Проведемо формалізацію задачі прийняття рішень. Позначимо для обраної задачі через X множину векторів стратегій; Р - множину векторів параметрів задачі; О - множину векторів зовнішніх збу- рень (станів зовнішнього середовища); У - множину векторів вихідних змін- них. Тоді математичну модель задачі прийняття рішень можна описати відо- браженням у вигляді <р:ХхРхії—>У. (1.1) Залежно від вигляду відображення існують різні типи моделей. Так, залеж- но від ступеня змінювання парамегрів та зовнішніх збурень моделі можуть бути статичними або динамічними. Якщо параметри Р і зовнішні збурення (1 незмін- ні в часі, то математична модель є статичною, інакше маємо динамічну модель ситуації прийняття рішень. Відображення, що описує динамічну модель, може бути задане різними класами диференціальних та різницевих рівнянь. Математичні моделі різняться одна від одної також виглядом зовнішніх збурень, які можуть бути як детермінованими, так і випадковими. 20
Якщо збурення невипадкові, то їх можна віднести до параметрів задачі Р, і тоді детермінована модель описуватиметься відображенням вигляду <?:РхХ-+Г. Якщо ж збурення є випадковими, то маємо стохастичну модель задачі прийняття рішень, яка описується загальним відображенням (1.1). У цьому випадку вихідні змінні будуть також випадковими, їх розподілення за зада- них параметрів Р визначатиметься розподіленням зовнішніх збурень. Залежно від умов зовнішнього середовища та ступеня інформованості особи, що приймає рішення, є така класифікація задач прийняття рішень (ЗПР): а) ЗПР в умовах визначеності; б) ЗПР в умовах ризику; в) ЗПР в умовах невизначеності; г) ЗПР в умовах конфліктних ситуацій або протидії (активного супро- тивника). 1.2.1. Прийняття рішень в умовах визначеності Прийняття рішень в умовах визначеності характеризується однозначною або детермінованою залежністю між прийнятим рішенням та його результа- том. Головна складність - це наявність декількох критеріїв, за якими слід по- рівнювати результати. Отже, виникає проблема прийняття рішень прн вектор- ному критерії оптимальності [33; 9], яку розглянуто у розд. 5. Розглянемо проблему вибору найкращих рішень - вона виникає тоді, коли є деяка скінченна або нескінченна множина допустимих стратегій, які задовольняють обмеження, що входять в математичну модель задачі. Називатимемо сукупність стратегій (керівних впливів), що задовольня- ють обмеження задачі, множиною допустимих альтернатив А, з яких ро- биться вибір. Надалі позначатимемо альтернативи через х і, якщо потрібно, вказуватимемо обмеження, що їх визначають. Для порівняння різних альтернатив та вибору найкращої з них спочатку вибирають певну властивість (або сукупність властивостей) оцінюваних аль- тернатив і будують її кількісну міру (оцінку), за значеннями якої можна 21
порівнювати альтернативи між собою, й обирають найкращу. Таку міру на- зивають функцією корисності. Є відповідні правила прийняття рішень на ос- нові теорії корисності, розробленої Дж. фон Нейманом та О. Моргенштер- ном [36]. Ця теорія грунтується на системі аксіом, в яких стверджується, що існує деяка міра цінності, яку називають функцією корисності (результатів), вона дає змогу упорядкувати альтернативи. Практичне використання теорії корисності ґрунтується на таких аксіо- мах, які визначають властивості функції корисності [3; 42]: 1) результат (альтернатива) хі виявляється переважаючим стосовно аль- тернативи х; (що записується як х,->-х), тоді й тільки тоді, коли 6,(хі) = = /(хі)>и(х^),ас Ї7(х,), Щху) - корисності альтернатив хі та ху відповідно; 2) транзитивність: якщо х,- >~ x^,а х^ >- хк, то хі >- Хд і £7(х,)>£7(х*); (1.2) 3) лінійність: деякий результат х можна записати у вигляді х = Лх, + (1-£)х2,де О^Л^І.тоді ї7(х) = Ш(Х|) + (1-Л)і/(х2); 4) адитивність: якщо 17(Х|,х2) - корисність від досягнення одночасно результатів х1 і х2, то властивість адитивності функції £/(х(,х2) можна запи- сати як Ї7(х|,х2) = 17(х1) + 17(х2). Аналогічно, якщо маємо п результатів х,,х2,...,хя, яких досянуто одно- часно, то ...хл)=Ег7(х<)- і=І Визначимо в термінах функції корисності /(х) такі відношення на мно- жині альтернатив: відношення слабкої переваги - «не гірше», яке позначаєть- ся знаком «>-»; відношення строгої переваги, що позначається знаком «>-» і відношення еквівалентності (рівноцінності), яке позначаємо знаком «~». Для двох альтернатив Х|, х2 говоритимемо, що / х( >-х2 тоді й тільки тоді, коли /(Х|) > /(х2); / х( >-х2 тоді й тільки тоді, коли /(Х|) > /(х2); 22
X] - х2 тоді Й ТІЛЬКИ ТОДІ, КОЛИ /(Х|) = /(х2). Знаки «>» або «<», «>» або «<» для порівняння значень цільові функції (ЦФ) для різних альтернатив беруть залежно від того, чи є альтернатива кра- щою за більшого або меншого значення ЦФ. Для визначення функції корисності можливих результатів створено ме- тодику, яка запропонована в [3]. Розглянемо декілька варіантів методики ви- значення корисності для різних випадків. Випадок І. Магмо тільки два результати. Методика визначення корисно- сті включає три кроки: 1) визначаємо, який результат є більш переважаючим для ОПР. Нехай х,>х2; 2) визначаємо таку ймовірність а, для якої досягнення результату X] ек- вівалентне результату х2, що отримується з імовірністю 1; 3) оцінюємо співвідношення між корисностями результатів X] і х2; для цього беремо корисність Ї7(х2) = 1,тоді аї7(х1) = ї7(х2); Ї7(х,)= * . а Випадок II. Маємо п можливих результатів Х[, х2,..., х„, між якими вста- новлено відношення переваги: X! >х2 >...>х„; для цього випадку методика визначення корисності результатів така: 1) визначаємо величину а з умови а1(7(х1) = £/(х2); 2) аналогічно визначаємо а2СДх2) = £7(х3), ая(7(хя) = Сг(хя_1); 3) беручи корисність найгіршого результату х„ такою, що дорівнює оди- ниці, знаходимо: Ї7(хл) -1; 1 “-ґ 1__ «и-2аЯ-1 ’ ^(х,) = 1 «1«2"«и-1 ^(Х„_2 23
Випадок 111. Окремі критерії є якісними і використовується методика ви- значення корисності, запропонована Р. Акофом та Р. Черчменом [3; 25]. От- же, припустимо, що маємо п результатів хр х2, ..., хп . Методика складається з таких етапів: 1) упорядковуємо усі результати щодо спадання (убування) відношення переваги. Нехай х, - найкращий, х„ - найгірший результат; 2) складає таблицю можливих комбінацій результатів, а відтак встанов- люємо їхню перевагу щодо окремих результатів Х|,х2,...,х„ (табл. 1.1). Цю інформацію про переваги результатів отримуємо від експертів; 3) приписуємо початкові оцінки корисностям окремих результатів Ц’цСх,), Ц0(х2), ...,Ц0(хл). Підставляємо початкові оцінки в останнє співвід- ношення табл. 1.1. Якщо воно задовольняється, то оцінки не змінюємо. Інак- ше коректуємо корисності так, щоб цс співвідношення задовольнялося; 4) переходимо до наступного співвідношення. Процес коректування про- довжується ДОТИ, ДОКИ не утвориться система ОЦІНОК 11 (х,),Ц (х2),..., І/ (х„), яка задовольнятиме всі наведені у табл. 1.1 співвідношення. Коректування слід виконувати так, щоб змінювати оцінки для якнайменшого числа результатів. Таблиця 1.1 1 і! або х2+х}*... + х„ Я Х2 або X} + х4 + ... + Хя 2 X! або х2 + х3 + ... + х„ , л + 1 Х2 або Ху + х4 +...+ Хя.| 3 х1 або х2 + х} + ...ч хя 2 п+ 2 х2 або X} + х4 +...+хя_2 п-1 X, або х2 + X, X хя _2 або хя_і + хя Приклад 1.1. Нехай експерт упорядковує п’ять результатів х1,х2,.... х5, надаючи їм такі оцінки: 110(х1) = 7; І70(х2) = 4; І/О(х3) = 2; І70(х4) = 1,5; ЇУ0(х5) = 1. Розглянувши можливі варіанти, він висловив такі твердження щодо цін- ності тих або інших комбінацій результатів: х, чх2 + х3 + х4 + х5; (1.3) X]-< х2+х3+ х4; (1.4) 24
х,чх2+х3+х5; (1.5) х,>х2+х3; (1.6) х2чх3 + х4 + х5; (1.7) х2>х3 + х4; (1.8) х3>х4+х5. (1.9) Треба оцінити корисність результатів так, щоб задовольнити всі нерівності. Підставимо початкові оцінки у нерівність (1.9): і/0(х3) = 2<(/0(х4) + [/0(х5) = 2,5. Отже, нерівність (1.9) не задовольняється. Змінюємо корисність резуль- тату х3: Ц(х3) = 3 і перевіряємо нерівність (1.6): ЇУ0(х2) = 4<Ц(х3) + (/0(х4) = 4,5. Ця нерівність також не задовольняється. Покладемо С/1(х2) = 5. Тоді нерівність (1.7) справджується. Перевіримо нерівність (1.6): (70(х1) = 7<^(х2) + Ц(х3) = 8. Вона не виконується, тому візьмемо ї/1(х1) = 8,5, тепер нерівності (1.3), (1.4), (1.5) задовольняються. Перевіримо ще раз нерівності (1.8) і (1.9) зі зміненими значеннями кори- сностей: 5 > 3 +1,5; 3 > 1,5 +1. Обидві нерівності виконуються. Запишемо остаточні оцінки корисності результатів: Ц(х1) = 8,5; Ц(х2) = 5; Ц(х3) = 3; Ц(х4) = 1,5; Ц(х5) = 1. Таку методику визначення корисності можна застосовувати, коли кіль- кість результатів п обмежена, п £ 7. У випадках, коли п > 7, Р. Черчмен та Р. Акоф запропонували модифі- кований спосіб корегування оцінок [3, 25]. Множину результатів розбивають на підмножини, які містять п’ять-сім результатів і мають один спільний ре- зультат, наприклад х,. Відтак записують початкові значення корисності для всіх результатів, причому корисність спільного результазу х1 однакова в усіх підмножинах. Далі застосовують спосіб корегування оцінок корисності неза- 25
лсжно в кожній підмножині за обмеження 17(хІ) = соп5і. У результаті отриму- ють систему ОЦІНОК корисності ЗІ СПІЛЬНОЮ мірою ДЛЯ ВСІХ ПІДМНОЖИН ). Після того, як функція корисності всіх альтернатив визначена, правило (процедуру) вибору найкращої з них в умовах визначеності можна записати так: знайти такий х0, що /(х0) = шах/(х). хеЛ Очевидно, що ЦФ (корисність), на основі якої обираються найкращі альтернативи, може бути побудована різними способами. Цільові функції /](х) * /г(х)’ ЯКІ характеризують ту саму властивість обраного рішення і задані на одній множині альтернатив, називатимемо еквівалентними, якщо вони визначають на ній одне й те саме відношення слабкої переваги, тобто /. л якщо для двох довільних альтернатив х, і х2 із х^>х2 випливає, що х,>х2, і навпаки. Тут індекс /, над знаками слабкої переваги «>» вказує функцію, за допомогою якої задається це відношення. Із цього означення випливає, то еквівалентні ЦФ визначають на множинах А одні й ті самі відношення стро- гої переваги та еквівалентності. 1.2.2. Прийняття рішень в умовах ризику Задача прийняття рішень в умовах ризику виникає в тому випадку, коли з кожною стратегією хі пов’язана ціла множина можливих результатів {Уі.У;,-.., з відомими ймовірностями Р(уу(х/)). Формально модель задачі можна подати у вигляді такої матриці (табл. 1.2): де Му - корисність результату у разі використання альтернативи хі. Таблиця 1.2 я У1 У) 1 ••• Д 1 ч “11 “12 “0 ... “т : ч “.2 “V ... 1 д_ > .1 Н--" “ті ит2 - |_ДД □ їаа -і 26
Нехай задано умовні ймовірності Р(у} їх,), і = 1,т, і = 1,л. Введемо «очікувану корисність» для кожної стратегії: = X ЧуР{у} | х.), і = 1,т. у=1 Правила для визначення оптимальної стратегії запишемо так: £{м(х,)} = тах£{м(хЛ)}. 1.2.3. Прийняття рішень в умовах невизначеності Одним із вирішальних факторів у задачах прийняття рішень в умовах невизначеності є зовнішнє середовище (або природа), яке може перебувати в одному з кстанів: 8к, - невідомих ОПР. Тоді математичну модель задачі прийняття рішень в умовах невизначе- ності можна сформулювати так. Є деяка матриця V розмірністю [ихл] (табл. 1.2). Елемент цієї матриці можна розглядати як корисність результату у, якщо використано стратегію л,: и^=н(уу, х,), І = \,п,і = \,т. Залежно від стану природи 8к результат у, досягається з Імовірністю Р(8к, УрХ,). Крім того, ОПР невідомі апріорні ймовірності Р(8к). Особа, що приймає рішення, може висловлювати певні гіпотези щодо можливого стану природи, її припущення називають суб'єктивними ймовірностями: Р(8к), * = ІЛ. Якби величина Р(8к) була відомою ОПР, то довелось би розв’язувати задачу прийняття рішень в умовах ризику. У цьому випадку правило прий- няття рішень можна визначити як птах £ Ци{уі,х,)Р[у] х„5*)Р(5д). Насправді ж поточний стан природи невідомий ОПР, невідомий також розподіл ймовірностей {Р(8к)} к_р*- Є декілька критеріїв для вибору опти- мальної стратегії. 27
Критерій Вальда (критерій обережного спостерігача-пссиміста) оптимі- зує корисність за припущення, що природа (зовнішнє середовище) перебуває у найневиїтднішому для спостерігача стані Згідно з цим критерієм правило прийняття рішень має такий вигляд: тах тіл (7(х,, ), ч Ь де = І «(Уу X, *, ,8к). (1.10) у=1 За критерієм Вальда обирають стратегію, яка дає гарантований виграш за найгіршого варіанта стану природи, його називають критерієм гаранто- ваного результату. Критерій Гурвіца грунтується на таких двох припущеннях: природа мо- же псрсбувазн у найневигіднішому стані з імовірністю 1 - а і в якнайвигід- нішому з імовірністю а, де а - коефіцієнт довіри. Тоді правило прийняття рішень запишемо так: шах [а тах(7(х,,54) + (1 - а) тіп(7(х,,5Л)], 0 а $ 1. ч Якщо а = 0, то отримаємо критерій Вальда. Якщо а = 1, то маємо пра- вило вигляду тахтіп (7(х ,5ї), яке називають стратегією оптиміста, котрий ч х* вірить у свою удачу. Критерій Лапласа: якщо стани природи (середовища) невідомі, то всі вони вважаються рівноймовірними: Р(51) = Р(52) = ... = Р(5*). У результаті правило прийняття рішень визначаюіь співвідношенням (1.10). Критерій Севіджа (критерій мінімізації втрачених вигод): втрачена ви- года - це величина, яка дорівнює зменшенню корисності рішення (результа- ту) за певного поточного стану стосовно найкращого можливого стану (для цього рішення). Щоб оцінити втрачену вигоду виконують такі процедури: 1) обчислюють матрицю І/НІ «дії. де и,к = м(х,,54), і = 1,/л, к=1,К. У кожному стовпці цієї матриці знаходять максимальний елемент: мі=тахн|Л, к=1,К: 28
2) максимальний елемент віднімають від усіх елементів стовпця. Відтак будують матрицю втрачених вигод: Ці =11 «д* II» Де Правило вибору оптимальної стратегії згідно з критерієм Севіджа записують так: тах тіл и^ (хі, 5ц). ч Розглянемо використання критеріїв Вальда, Гурвіца, Лапласа і Севіджа в умовах невизначеності у такій практичній ситуації. Приклад 1.2. Судова компанія планує організацію перевезень пасажи- рів на літній сезон. Кількість пароплавів (лайнерів) які мають бути зафрах- товані, а також кількість команд, які треба найняти і підготувати до наступ- ної весняно-літньої навігації, є величинами змінними і визначаються фактичними потребами у пасажироперсвезеннях у цей сезон. Припустимо, що кількість пароплавів може набувати значень 10, 20, ЗО, 40 і 50. Фактично потреба в пасажироперсвезеннях є величиною випадковою, яка залежить від множини невідомих факторів. Нехай судова компанія склала кошторис екс- плуатаційних витрат і визначила величину очікуваного доходу від виконан- ня плану перевезень залежно від кількості зафрахтованих пароплавів х, і фактичної потреби в них для повного задоволення потреб пасажирів у пере- везеннях 5. Обчислені значення очікуваного доходу для усіх можливих зна- чень хі і 5* наведено в табл. 1.3. Таблиця 1.3 ч з» ! 10 20 ЗО 40 50 10 60 60 60 60 60 20 10 ПО ПО ПО ПО зо -4» зо 160 160 160 40 -100 -50 200 240 240 4 50 -150 -100 50 200 ь 340 Потрібно визначити оптимальну кількість зафрахтованих пароплавів хОІП, яка максимізує очікуваний дохід. Обчислимо цю величину, послугову- ючись критеріями: - Критерій Вальда: я.™ = ти 1^=60, хОІГТ=х1=10; Ч 29
- Критерій Лапласа: тах * £ ия = тах {60; 90; 92,4; 106; 68} = 106, хт = х, = 40; 5 4.1 - Критерій Гурвіца-. тах[а тах ил +(1 -а) тіп ий]. і, 4 « Побудуємо таблицю очікуваних прибутків за критерієм Гурвіца (табл. 1.4): н =|| II, л,а = [а тах ил + (1 - а) тіп ил ]. $4 Таблиця 1.4 Л, а 0,1 0,2 0,5 0,8 0.9 10 60 60 60 60 60 20 20 зо 60 90 100 зо -27,2 -6,4 56 118,4 139,2 40 -661 -32 70 172 206 50 -101 -52 95 242 291 Тоді оптимальну кількість пароплавів залежно від а визначимо з табл. 1.5. Таблиця 1.5 а 0,1 0.2 0.5 0.8 0,9 20 20 50 50 50 За критерієм Севіджа будуємо матрицю втрачених вигод ис =Цл^г) ||, а результати заносимо у табл. 1.6. Таблиця 1.6 . _ . ! 10 20 зо 40 50 10 0 -50 -140 -180 -280 | 20 -50 0 -90 -130 -230 зо -108 -80 -40 -80 -80 40 -160 -160 0 0 -100 50 -210 -210 -150 -40 0 Обчислимо: тах тіп і/Р =тах {-280,-230,-108,-160,-210}. Звідси хот = 30. 30
Отже, потрібно зробити вибір між такими рішеннями: за критерієм Вальда слід зафрахтувати 10 пароплавів, за критерієм Гурвіца - 20 паропла- вів, якщо керівництво компанії є песимістами, або 50 пароплавів, якщо вони оптимісти; за критерієм Севіджа слід зафрахтувати ЗО пароплавів. Якому ж із можливих рішень слід віддати перевагу? Це залежить від вибору відповідно- го критерію в умовах невизначеності. Вибір критерію є найбільш складним і відповідальним етапом у процесі прийняття рішень, при цьому немає якихось загальних рекомендацій. Вибір критерію має робити замовник на найвищому рівні ієрархії й максимально узгоджувати його зі специфікою конкретної задачі та своїми цілями. Зокрема, якщо приймається дуже відповідальне рішення і навіть малий ризик непри- пустимий, то слід використовувати критерій Вальда - буде гарантований ре- зультат. Навпаки, коли ризик припустимий і керівництво фірми (замовник) готове вкласти у плановану операцію стільки коштів, скільки потрібно, щоб потім не шкодувати за втраченою вигодою, то обирають критерій Севіджа. Якщо немає достатньої інформації для вибору того чи іншого критерію, можливий альтернативний підхід, пов’язаний з обчисленням ймовірностей (шансів) успіху та невдачі на основі попереднього досвіду. 1.3. Основні етапи процесу прийняття рішень Процеси прийняття рішень незалежно від конкретного змісту розв'я- зуваної задачі проходять кілька етапів, основними з яких є такі [46]. 1. Попереднє дослідження об’єкта (процесу) моделювання та аналіз його результатів. Цс початковий етап, на якому проводиться обстеження об’єкта, з’ясовуються множини вхідних і вихідних змінних, набір можливих обмежень і факторів, набір критеріїв, ЦФ, які повинні враховуватися під час оцінювання якості отриманих рішень. Далі аналізується зібрана інформація, виявляється ступінь її повноти, ві- рогідності, дається класифікація різних даних за л ипами: якісні, кількісні, ло- гічні, а також за місцем в інформаційному процесі обробки - вхідні й вихідні. Усі вхідні змінні поділяються на зовнішні (екзогенні) і внутрішні (ендогенні). Зовнішня нсконтрольована інформація належить до збурень, а внутрішня 31
до параметрів. Виділяються також керовані змінні, значення яких визнача- ються у процесі розв’язання задачі - стратегії. Визначається набір суттєвих обмежень і критеріїв, які слід враховувати під час прийняття рішень. 2. Розроблення змістовної постановки задачі, П якісний і кількіс- ний аналіз. Це дуже відповідальний етап, тому що правильна постановка задачі це 50 % успіху всього розроблюваного проекту. Змістовна поста- новка задачі формується за результатами аналізу матеріалів даних обсте- ження об’єкта (процесу), у ній дається перелік вхідних і вихідних змінних з аналізом ступеня повноти й вірогідності інформації, набір критеріїв і класифікація типів даних - відповідно кількісні та якісні. Для кількісних змінних вказуються інтервали значень для неперервних змінних або набір можливих значень для дискретних змінних, а для якісних, які розгляда- ються як лінгвістичні змінні, - набір термів (значень лінгвістичної змінної, наприклад, «низький», «середній», «високий», або «слабкий», «сильний», «дуже сильний»). Значення лінгвістичних змінних, зазвичай, задаються на універсальній шкалі [0,1]. Далі наводиться критерій (ЦФ) або множина критеріїв (для багатокрите- ріальних (БК) задач прийняття рішень); в останньому випадку можуть вказу- ватися ваги критеріїв. Описується множина враховуваних обмежень. У зада- чі, як правило, використовуються обмеження на матеріальні й трудові ресурси, виробничі потужності, часові обмеження. Після цього вказується набір можливих рішень (стратегій, або альтерна- тив), з яких доцільно обрати оптимальне або субоптимальне (прийнятне з по- гляду ОПР) рішення. У висновку формулюється змістовна постановка задачі: знайти таке рі- шення (стратегію), яке б задовольняло всі обмеження і забезпечувало екс- тремум деякого критерію (у випадку однокритеріальної задачі) або найкраще компромісне рішення (дія БК задач). Зазначамо, що початкова постановка задачі для складних об’єктів (систем) зазвичай не буває остаточною й згодом вона уточнюється і коректується після отримання додаткової інформації та результатів виконання наступних етапів. 32
3. Формалізація задачі й розроблення математичної моделі. На цьому етапі на основі змістовної постановки задачі виконується її формалізація і розробляється модель задачі. Зокрема, для задачі в умовах неповноти й невизначеності вихідної інформації для змінних, значення яких точно невідомі, проводиться відповідна формалізація. Для кількісних змінних визначаються інтервали можливих значень, які в цьому випадку описуються як нечіткі множини (або числа) за допомогою оброб- ки експертної інформації й для них визначаються функції належності (ФН). Для якісних змінних, виходячи з потрібної точності подання, використо- вується опис у вигляді лінгвістичних змінних; задається перелік термів (зна- чень) і за допомогою експертної інформації будуються ФН для відповідних термів на універсальній шкалі [0,1]. Далі на основі аналізу змістовної постановки задачі формалізується кри- терій (ЦФ) або множина критеріїв (для БК задач прийняття рішень): Д(см),1£*£/Г, та обмежень ^(х,у,), \<.і<т, де х=^х7^,1^у<л множина можливих стратегій (рішень); у, =[уіг],1<г<Л, - набір вхідних змінних або параметрів обмежень, наприклад, норм витрати ї-го ресурсу на одиницю випуску продукції, об’єм ресурсів у системі й т. п.; сА = ] 7=І „ коефіцієнти критерію. Як приклад математичної моделі прийняття рішень (ГІР) в умовах неви- значеності можна навести модель багатокритеріальної задачі ПР із нечіткими ЦФ й обмеженнями. Задача визначення оптимального плану виробництва у разі обмежень на ресурси має таку математичну модель: знайти тіпД(х, с^) = = Т!)=\скіхр к = \,К за обмежень на ресурси &,(х, а,) = £"=1 ЦуХ7 < />,, і = 1, т, > 0, у = 1, л, де - нечіткі множини (НМ) із ФН ц(С^ ); - НМ із ФН у(а17); Ьі - обсяг ї-го ресурсу на підприємстві. 4. Пошук розв’язку математичної моделі. Залежно від виду математич- ної моделі обирається (або розробляється) відповідний метод і алгоритм її розв’язання. 33
Наприклад, для задач із нечітко заданими критеріями й обмеженнями можна застосувати метод Белмана-Заде, побудувати нечітку множину розв’язків і знайти найкращу альтернативу [25]. Для задач із нечіткими параметрами в цільовій функції та обмеженнями з одним критерієм можна застосувати метод розв’язання загальної задачі не- чіткого математичного програмування (НМП) [25; 44]. Для багатокритеріа- льних задач із нечіткими параметрами (пункти 1-3) можна застосувати ме- тод, оснований на знаходженні Парето-оптимального розв’язку рівня а [25]. Нарешті, для тих задач прийняття рішень, дія яких недостатньо інфор- мації в ОПР для побудови критеріїв оптимальності й зведення задачі до зага- льної задачі НМП, а с лише можливість порівнювати різні альтернативи за деякими відношеннями нестрогої переваги (чітких або нечітких), можна за- стосовувати метод знаходження альтернативи з максимальним ступенем не- домінованості за всією сукупністю нечітких відношень переваги [25; 44]. Після отримання розв’язку моделі слід перевірити його чутливість до варійованих параметрів. Нехай варійовані параметри такі: с,,с2,..., с,, тоді значення критерію, що оптимізується, Д°, буде функцією від них, тобто А°=А(С1>С2.....сл)- Тоді чутливість розв’язку до параметра с визначається як Л0(Ч.с2. — сп) 5су Для визначення функцій чутливості можна використовувати методи планування багатофакторних експериментів. Для тих параметрів, для яких чутливість ЦФ буде малою, можна використовувати як значення нечіткого параметра найбільш очікуване значення с^, а для тих, для яких вона велика, можливо, будуть потрібні додаткові експерименти для їхнього уточнення або більш точного визначення ФН р(су) та у(аіу). 5. Перевірка адекватності та коректування моделі Така перевірка є дуже важливим і відповідальним етапом усього проекту, оскільки, якщо мо- дель неадекватна вихідному об’єкту (системі), то висновки й розв’язки, отримані з її допомогою, можуть виявитися невірними. 34
Стандартним підходом до перевірки адекватності моделі є оцінювання її прогнозних властивостей. Якщо виходи моделі ум та реального об’єкта (процесу) уо збігаються (у межах допустимого відхилення е в широкому діа- пазоні варійованих факторів С, X, У), то модель можна вважати адекватною, інакше потрібне її корегування. Як критерій адекватності можна обрати один із таких: а) середньоквадратична похибка (СКП): є2= 1 Е&Су,0-^)2; Мф б) середня абсолютна відсоткова похибка (САВП): 1 100 Есдвп ~ , £<=? о У, де - обсяг перевірочної вибірки, на якій перевіряють адекватність моделі; в) максимальна похибка: Ешах=тах1'у,0-уІ*/ . На основі бажаної точності ОПР задає граничні значення 2 Е доп> ЕСЛВП доп’ Ет« доп" 2 2 Якщо виконуються умови е £ едоп ; Есдвп < єСАВП доп; Ешах £ Е^ доп, ТО розроблена модель вважається адекватною, інакше потрібне корегування моделі. Корегування моделі може бути різним (наведемо найбільш типові види): 1)ускладнення виду залежностей /(х,с,)та&Дх,а,у). Наприклад, перехід від лінійних залежностей до нелінійних або підвищення порядку не- лінійності полінома; 2) зміна набору вхідних та вихідних змінних; 3) додавання нових обмежень або виключення несуттєвих; 4) уточнення вигляду ФН для нечітких параметрів; 5) уточнення лінгвистичних змінних. Збільшення або зменшення кіль- кості їх значень (базових термів) та уточнення вигляду ФН; 6) зміна набору критеріїв, перехід від однокритериальної до багатокри- териальної постановки. 35
Зазначимо, що процес корегування моделі найчастіше багаторазовий і продовжується доти, поки не буде забезпечений необхідний рівень адекватності. 6. Практична реалізація знайденого рішення та аналіз отриманні результатів. Після завершення процесу корегування моделі й отримання розв’язку на остаточній моделі об’єкта необхідно здійснити його практичну реалізацію. Для цього шукану оптимальну стратегію розписують у вигляді послідовності вирішальних процедур, які повинен виконати менеджер. Оскільки, як правило, процес ухвалення рішення на тому або іншому об’єкті (системі) за відповідним напрямом діяльності має багаторазовий характер, то здійснюється дослідна експлуатація створеної моделі, методу й відповідних процедур під час прийняття конкретних рішень і фіксуються результати їх реалізації. За цими результатами робиться аналіз ефективності розробленого методу ГІР і даються відповідні рекомендації щодо його застосування у промисловості й тиражуванні на інші об’єкти керування як типовою проект- ного рішення (ТПР) або необхідності його корегування. 1.4. Основи теорії корисності Прийняття рішень в умовах визначеності й ризику ґрунтується на теорії корисності, основи теорії були розроблені Дж. фон Нейманом і О. Морген- штерном [42]. Нехай є множина подій (результатів) А, В, С. На цій множині можемо ввести такі відношення: 1) байдужості (еквівалентності«-»); 2) строгої переваги «>». Розглянемо аксіоми теорії корисності, на яких грунтується теорія корисності: А1. Повнота: для будь-яких двох подій А, В виконуються умови А > В або А- В, або В > А. А2. Рефлексивність: А~ А для кожного А. АЗ. Симетричність: якщо А - В, то В ~ А. А4. Транзитивність щодо операцій еквівалентності: якщо А~ В і В ~ С, то А ~ С. А5. Якщо А>~В і В>-С,то А>-С. 36
А6. Якщо А>- В і В~С, то А>-С; А7.Якщо А~В і В>С, то А>-С. Аксіому 1 називають трихотомічним законом, аксіоми 2—4 означають, що «~» є відношення еквівалентності, аксіома 5 разом з 1 означає, що «>» є відношенням строгого порядку, аксіоми 6 та 7 означають, що відношення «>-» транзитивне відносно «~ ». Нехай є дві події: А і В, та число г є [0;1]. Визначення 1.1. Лотерея — деяка подія С, яка еквівалентна комбінації події А з імовірністю г і події В з імовірністю (1 - г): С ~ гЛ + (1 - г)В. Також існують складені лотереї. Лотерея підкоряється всім законам лінійної алгебри, тобто виконуються такі аксіоми: А1. Комутативність: гА + (1 - г)В - (1 - г)В + гА. А2. Дистрибутивність: гА + (ї — г)[зС + (1 - 5)Д] = гА + (1 - г)зС + (1 - г)(1 - з) І). Враховуючи властивості лотерей: 1) якщо А ~ С, то гА + (1 - г)В ~ гС + (1 - г)В; 2) якщо А>-С,зо гА + (1-г)В>- гС + (1-г)В; виконується аксіома АЗ (неперервності): нехай А і В, С такі, що А > С, С>-В, тоді Зг, г є [0; 1], така, що виконується умова С~гЛ + (1-г)В. (1.11) Теорема 1.1 (сдиності). Якщо А>С, С>В і Зг, гє[0;1], таке, що С~гА + (1 — г)В, то г - єдине. Доведення. Припустимо, що це невірно та існує інше з, для якого вико- нується умова (1.11). Нехай 5<г<1, і маємо 0<(г-5)<1-5. Оскільки В = {(г-з)І (1 -5)Л + (1 -г)/(1 -з)В}, то лотерея (г-з)/(1 -з)А + (1-г)/(і-з)В>- В. Розглянемо лотерею гА + (1 - г)В, яка еквівалентна такій лотереї: гА + (1 - г)В = зА + (1 - ^)[(г - х) / (1 - з)А + (1 - г) І (1 - 5)В] > зА + (1 - з)В. Звідси слідує, що г - єдине. 37
Теорема 1.2. (про існування функції корисності). Існує функція корис- ності и, яка відображає множину всіх подій (результатів) у дійсні числа, така, що для кожних двох подій А, В та г е[0;1]: - и(А) > и(В) тоді й тільки тоді, коли А > В; (1.12) - лінійність и(гА + (1-г)В) = ги(А) + (1-г)и(В); (1-13) - функція и є єдиною з точністю до лінійного перетворення, тобто якщо існує інша функція И, яка задовольняє умови (1.12)-( 1.13), то И(Л) = ап(Л) + р, а>0. (1.14) Доведення. За А~ В доведення очевидне. Розглянемо доведення для А>- В. Введемо дві події: £0 й £,, такі, що £, >£0 та и(£,) = 1, и(£о) = О. Розглянемо декілька можливих ситуацій для події А: 1) А > £,, тоді лотерея А >- £, > £0 і за теоремою 1.1 про неперервність існує такс г, що £, ~ гА+(\-г)Е0, корисність результату «(£,) = ! = ги(А), звідки випливає и(А) = 11 г; 2) £| > А >- £0, тоді існує г, таке, що А ~ г,£, + (1 - г,)£0. звідки и(А) = г,; 3) £0>Л, тоді £0 ~ ^£] +(1 -з)А ->н(£о) = О = $ + (1 -з)и(А)=>и(А) = = (-5)/(1-5)<0. Доведемо співвідношення (1.12). Нехай Е^А^Ец. Позначимо и(А) = 5|, и(В) = 52 і $| > -$2. тоді А ~ з1Е^ + (1 -5])£0; В ~ 52£, + (1 - -*2)£о • Оскільки 5] > 52, то можна показати, що (^|£| + (1-5,)£о) > (52£і + (1 -з2)Е0). Звідси випливає, що А > В. Можна довести також обернене твердження. Доведемо співвідношення (1.13): и(гА + (1 - г)В) = ги(А) + (1 - г)и(В). Розглянемо г є [0; 1] та и(А) = , и(В) = з2 > Т°ДЇ А - і|£| +(1 -5|)£о; В~52£] +(1-52)£о. Утворимо з них лотерею: гА + (І - г)В = г(^Еі +(1-^)£0) + (1-г)х х(52£! + (1 - 52 )£0) = £, (ге, + (1 - г).ч2) + £0(г(1 - з2)). 38
Тепер запишемо функцію корисності: и{гА + (1 -г)В} = (гї,+(1 - г).т2)и(£,) = ги(А) + (1 - г)и(В) і покажемо її єдиність з точністю до лінійного перетворення. Нехай м(Л) = г та подія Е, >- А >- Ео. За доведеним вище справедливе А~гЕ1+(1-г)Е0. Доведемо третє твердження теореми (співвідношення (1.14)). Нехай И(Е0) = р, И(Е,)-К(Е0) = а: У(А) = К(гЕ, + (1 - г)Е0) = гК(ЕІ) + (1-г)К(Е0) = г(а + Р) + (1-г)Р = = га + р = а(м(Л)) + р. Отже, теорему 1.2 доведено повністю. Запитання для самоконтролю 1. Назвіть основні елементи задачі прийняття рішень. 2. Наведіть класифікацію задач прийняття рішень. 3. У чому полягає метод прийнятії рішень в умовах визначеності? 4. Поясніть аксіоми теорії корисності. 5. Розкрийте зміст властивостей адитивності функції корисності. 6. Поясніть зміст властивості лінійності функції корисності. 7. Як працює методика оцінювання корисності результатів? 8. Опишіть метод прийнятті рішень в умовах ризику. Які критерії використовують- ся для вибору оптимального рішення? 9. Опишіть метод прийняття рішень в умовах невизначеності. Які критерії при цьо- му використовуються? 39
2. ЕКСПЕРТНІ МЕТОДИ ТА ТЕХНОЛОГІЇ ПРИЙНЯТТЯ РІШЕНЬ 2.1. Системний аналіз проблеми експертного оцінювання Задачі експертного оцінювання (ЕО) поставали перед людством у практиці прийняття рішень протягом століть, проте систематичне наукове дослідження цих задач та обґрунтування методів ЕО почалось у XX ст. Передумовами роз- витку ЕО стало прискорення науково-технічного прогресу, ускладнення вирі- шуваних проблем та подорожчання ціни помилки під час прийняття рішень. Основні принципи системного підходу, на яких грунтусться система ЕО, такі [13]: - вирівнювання інформаційної неоднорідності, яка властива експертній групі на стані формування моделі аналізованого явища; - забезпечення незалежності експертів при формуванні їх суджень, збе- реження анонімності експертних висновків або взаємне обговорювання аргу- ментів у експертній групі під час обгрунтування суджень; - обмеження різноманітності суджень експертів через інтерактивне уточ- нення колективної думки групи експертів на основі надходження нової інфо- рмації із зовнішнього середовища; - забезпечення обміну інформацією в експертній групі «без перекручу- вання» за рахунок створення психологічного клімату, який дозволяє виявити індивідуальні можливості кожного експерта; - вимірюваність наборів ознак оцінюваних об’єктів, з якими, відповідно, можуть бути зіставлені деякі числа у встановлених шкалах вимірювання. Учасники та етапи експертного оцінювання. Зазвичай виділяють кілька груп суб’єктів, що беруть участь у процесі вирішення проблем ЕО: - особа або група осіб, що приймають рішення - ОПР; - експерти та аналітики (консультанти). Особа, яка приймає рішення, формулює постановку задачі ЕО і використовує його результати у процесі прийняття рішень та несе відповідальність за їх наслідки. 40
Експерт (від лат. ехрегіиз - досвідчений) - людина, яка має практичний досвід у відповідній предметній області, до якої звертаються за оцінками та прогнозами результатів тих чн інших рішень. Консультант (аналітик) - особа, що допомагає ОПР в організації ЕО - формалізації задач, організації роботи з експертами, аналізі структури пере- ваг експертів тощо. Для отримання якісної експертної інформації має бути забезпечена наявність: - кваліфікованої експертної комісії; - професійної аналітичної групи, яка знає технологію організації та про- ведення експертиз; - процедур отримання експертної інформації; - алгоритмів коректної обробки та аналізу експертної інформації. Процес ЕО з урахуванням функцій основних груп суб’єктів можна пода- ти у вигляді етапів, наведених у табл. 2.1 [13]. Етапи експертного оцінювання Таблиця 2.1 Епа Зміст етапу експертного оцінювання Суб’єкти оцінювання 1 Визначення мети ЕО ОПР 2 Діагностика проблеми, формулювання задачі ЕО, попередній аналіз та виявлення проблем, постановка задачі ОПР 3 Формалізація задач ЕО: складання переліку для критеріїв, обмежень задачі, побудова шкал вимірювання, формування множини об’єктів ОІІР, консульта- нти, експерти 4 Вибір класу математичних моделей, в якому найзручніше (найадекват- ніше, найефективніше) формалізувати досліджувану проблему Консультанта 5 Формування експертної групи. Формування правил роботи експертної ірупи ОПР, консуль- танти 6 Визначення (знаходження, виділення, іеиерація) множини допустимих об’єктів Консультанти, експерти 7 Отримання початкових даних - вимірювання, багато критеріальне оці- нювання об’єктів Експерти 8 Формування правил оцінювання компетентності експертів ОІІР. консуль- танти 9 Формування правил підготовки колективного судження ірупи ОІІР, консуль- танти 10 Оброблення даних та розв’язування конкретної задачі з використанням математичних методів та обчислювальної техніки Консультанти II 12 Аналіз узгодженості експертної інформшііі, <аглад«лваіііія>>_результатів Організація зворотного зв’язку для підвищення достовірності експер- тних оцінок Консультанти Консультанти, експерти 13 Пояснення методів та способів вибору остаточної експертної оцінки об’єктів, ілюстрація отриманих результатів Консультанти. ОІІР 14 Прийняття остаточної екснерпюї оцінки ОІІР 41
Зазначимо, що для вирішення конкретних задач ЕО не всі етапи можуть обов’язково використовуватись в явному вигляді. У реальних задачах деякі етапи можуть агрегуватися в окремі блоки, а інші, навпаки, деталізуватися у більш дрібні процедури. Стандартний алгоритм ЕО складається з етапів, наведених в табл. 2.1. Під час аналізу експертних оцінок, навіть якщо вони отримані від кваліфікованих спеціалістів, виникають задачі подання цих оцінок у система- тизованій формі, порівняння та агрегування оцінок. Використання математичних методів під час аналізу експертних оцінок дозволяє узагальни- ти судження спеціалістів та виявити приховану інформацію. 2 .1.1. Шкала вимірювання Під час використання процедур ЕО експерти порівнюють різні об’єкти (або альтернативи) за їх властивостями в різних шкалах. Для формального опису шкал вимірювання введемо ряд визначень. Визначення 2.1. Емпіричною системою з відношенням називають сис- тему І] = {И, Р}, де V - множина властивостей об'єктів; Р -- множина від- ношень між об 'актами за властивостями V. Визначення 2.2. Шкалою називають трійку елементів 17,С,(р , де V- емпірична система, (з - числова система, ф - відображення, ф: (7 —» С. Шкали (7,01,ф1 та С,С2,<р2 належать до шкал одного типу, якщо О,=ф,(1/); С2=ф2(Т/), С,сС, 62сС та існує таке перетворення /, що 6,=/(С2)таС2=/1(С1). Перетворення / називають допустимим перетворенням для шкал цього типу. Шкали найчастіше розрізняють за рівнем глибини вимірювання - від «найелабкіших» до «найсильніших». Виділяють п’ять рівнів шкал: номіналь- ні, порядкові, інтервальні, шкали відношень та абсолютні шкали. Інтервальні шкали та шкали відношень часто об’єднуються в один тип - метричні шкали. Абсолютною шкалою називають впорядковану трійку І’, О, ф , якщо її допустиме перетворення є тотожним: /(О) = 6. Цс кількісна шкала. Резуль- тами вимірювань у такій шкалі є раціональні або дійсні числа. 42
Шкала відношень є слабкішою, ніж абсолютна шкала. Допустимим пе- ретворенням результатів вимірювань у цій шкалі є множення результатів па одне й те саме число, тобто зміна масштабу: С2 = = аСІ, а>0. Це, на- приклад, шкала вимірювання фізичних величин: маси, довжини тощо. Шкала інтервалів (інтервальна) допускає додатні лінійні перетворення, тобто для кожного С виконується співвідношення С2 = /(О,) = аС] + р, де а > 0, р - дійсне число. Шкала порядку’ (порядкова) - це шкала, допустимими перетвореннями якої є монотонні перетворення, тобто такі, за яких не змінюється упорядку- вання чисел. Під час вимірювання у шкалах такого типу отримують інформа- цію лише про порядок об’єктів за деякою ознакою. Прикладами є шкали з бальними оцінками, які використовують у спортивному суддівстві. Шкала найменувань (номінальні шкали). Від шкали найменувань вима- гається лише взаємна однозначність її допустимих перетворень. Для номіна- льної шкали числа, якими позначаються класи об’єктів, використовуються виключно для ідентифікації об’єктів із множини та їх класифікації. Ці числа відіграють роль символів-лпрапорців», які за потреби логічно замінити ін- шими символами. Крім порівняння на збіг, будь-які інші арифметичні опера- ції над цими символами неприпустимі. Прикладами номінальних шкал є зна- чення атрибутів у документах, професіях, стать, посада тощо. Шкала найменувань є найелабкішою з-посеред інших шкал вимірювання. Якщо інформація, яка міститься у вимірюваннях, рознесена у двох шка- лах різного типу, то для розв’язання конкретної задачі доцільно використо- вувати вимірювання у більш слабкій шкалі, проте перехід до більш слабкої шкали може привести до втрати дослідником деякої інформації. 2.2. Бінарні відношення У разі використання порядкової шкали в задачах ЕО для порівняння пар об’єктів (властивостей) використовуються бінарні відношення. Визначення 2.3. Бінарним відношенням К, заданим на множині об ’єктів А, називають довільну підмножину декартового добутку А *Л. Факт знахо- дження пари об’єктів аІ,а) у бінарному відношенні В позначимо як аІ,Ка}. 43
Є чотири основних способи задання відношень: безпосереднє задання усіх пар, графи, матриці та перетини. Найбільш поширеним способом подан- ня бінарних відношень є використання орієнтованих графів, вершини яких відповідають елементам а„а)г а дуги (а(,а?) відповідають відношенням між ними аІКа). Такі графи є геометричним поданням відповідних відношень. Для бінарних відношень, заданих на скінченних множинах А, часто ви- користовують матричний спосіб задання. Бінарне відношення В с А х А бу- демо позначати матрицею В = гу і, і = 1,и, елементи якої задаються так: [1, якщо а^а, ; Г- - = 5 1,7 10 в іншому випадку а,Ва^ Для бінарних відношень справедливі всі операції, які визначаються для мно- жин: а) об’єднання «о»; б) перетин «гл»; в) включення «с»; г) обернення й'1; д) двоїстість ; е) добуток або композиція; ж) транзитивне замикання та інші. Основні операції над бінарними відношеннями та їх назви наведено в табл. 2.2. Таблиця 2.2 Властивість відношення Означення властивості 1. Рефлексивність аЛа, Х/аєЛ (^=1,Х/«) 2. Аіггирефлоссиніпсть аКа, Х/а є А (ги = 0, V/) 3. Симетричність Якщо <\Ла2, то Х/а,, а. є А, тобто а,Ка2 а2Каі^ 1 4. Асиметричність а,Ла2 => а2Ка,, Х/а,,а2 є А кг}) = О,Х/і,у) 5. Аіписимсіричнкть а,Яа2 л а2Ка, => а,(Гу л г = 0,Х/і * у) 6. Транзитивність і а,Ка2 ка2Ка2 а1КаіХ/аІ,а,,аі є А (лгу2) <.гЛ,і,ї,к = 1,и) 7. Від’ооа (нашивна) транзитивність Доповнення В є транзитивним 8. Ациклічність а,Яа2 /\щКа, к...какКа2 *а2, Х/а,,а2,щ є А 9. Повнота ( ш'яиость) а,Ка2,х/а,,а2 о А 10. Лінійність або слабка повнота VаІ,а2 є А,а2 * -V 11 Порожність а,Ка2 ,>іа,,а2 є А Розглянемо властивості бінарних відношень. Визначення 2.4. Бінарне відношення В називають симетричним, якщо аіВаі => ч]Ва,, тобто г - г Бінарне відношення називають антиеиметрич- ним. якщо а,Ва] => а,Ва, 44
Визначення 2.5. Бінарне відношення називають рефлексивним, якщо для всіх а^О', для всіх а, є А, тобто ги =1, і = 1,и. Бінсрне відношення називають антирефлексивним, якщо аІЯаІ, тобто га =0. Симетричні відношення, у свою чергу, розбивають на підкласи: рефлек- сивні відношення подібності (толерантності) та еквівалентності й антирефлек- сивні відношення відмінності (двоїсте до схожості). Асиметричні відношення називають псредпорядками: підклас рефлекси- вних відношень - нестрогі порядки «і», підклас антирефлексивних - строгі порядки «>». Відношення К називають транзитивним, якщо з а,Каі а^а^ для всіх а(, , а4 є А. Властивості різних типів відношень у задачах порівняння об’єктів наведено в табл. 2.3 (знак «+» означає наявність властивості у відно- шення, порожні комірки - відповідної властивості у відношення немає) [13]. Властивості відношень Таблиця 2.3 Типи відношень Симетричність Аятжсвметрвчність Асиметричність Рефлексивність Антирефлексивність Трвкмггивністьність Антитраяіитивнкть Повнота (тв’ятпість) Неповноті Подібність (толерантність) 4 4 Еквівалентність 4 4 4 4 Частковий нестрогий порядок (нестрогий порядок) 4 4 4 Лінійний (повний, досконалий) нестрогий порядок 4 4 4 4 Неповний нестрогий порядок 4 4 4 Строгий порядок 4 4 4 Досконалий (повний) строгий порядок Неповний строгий порядок 4 4 4 4 4 4 — 4 Відношення предикації 4 4 4- Повний порядок 4 4 4 Неповний порядок 4 4 Домінування 4- 4 Строгий частковий порядок Строгий лінійний порядок 4 4 4 4 4 4 — -- -і 45
Закінчення табл. 2.3 2.3. Класифікація задач експертного оцінювання Задачі ЕО можна класифікувати за такими ознаками: - за способами отримання та подання експертної інформації; - за моделями та методами, які використовуються для моделювання за- дач ЕО. 2.3.1. Класифікація задач експертного оцінювання за способами подання даних Класифікація задач ЕО за способами подання даних залежить від виду даних, які отримує дослідник. Більшість операцій з оброблення інформації в методах ЕО можна поділити на три групи: операції з об’єктами, операції З об’єктами і критеріями, операції з критеріями. Доцільність застосування тієї чн іншої інформації визначається параметрами задачі: кількістю критеріїв, характером шкал вимірювання інформації, кількістю об’єктів, характером оцінювання об’єктів за шкалами критеріїв (кількісні, вербальні, наближені, точні). Потреба в оцінюванні об’єктів виникає у випадках, коли, по-перше, їх кількість є невеликою (до 20), а по-друге, проблема є погано структурованою ,і об’єкти леппе оцінити як цілісні образи. За способами оцінювання всі об’єкти можна поділити на два класи: отримання абсолютних та відносних оцінок об’єктів. У погано структурова- них задачах для отримання абсолютних оцінок об’єктів використовують. 46
зокрема, вербально-числові шкали, в яких разом з кількісними оцінками зна- чень градації шкал застосовується їх вербальна інтерпретація. Тут перспек- тивним напрямом є використання лінгвістичних змінних та їх значень (тер- нів), яке ґрунтується на апараті нечітких множин. Методи проведення групової експертизи поділяють на очні, заочні, ін- дивідуальні та колективні, зі зворотним зв’язком та без зворотного зв’язку. Загальну схему класифікації задач ЕО за наявними даними та експер- тною інформацією наведено в табл. 2.4 [13]. Таблиця 24 Схема класифікації задач експертного оцінювання 1. Формуванні множини об’єктів. Проблемне наповнення - кількість об’єктів - можливість появи нових об’єктів у процесі розв’язання задачі - характер оцінок об’єктів: об’єктивні, експертні - без параметрів - з параметрами: - кількість параметрів; - характер шкал (дискретні, неперервні); - кількість оцінок на шкалах (для дискретних параметрів); - фіксовані параметри в різних шкалах (номінальних, порядко- вих, іитервальних); - інтервальні задання параметрів у різних шкалах; - параметри з обмеженнями 2. Вагові коефіцієнти параметрів * не виділяються - виділяються - задаються в порядковій шкалі: - ранжування параметрів; - нетранзитивна матриця парних порівнянь - фіксовані значення: - вектор вагових коефіцієнтів; - матриця парних порівнянь - інтервальні значення (бальні, нормовані, центровані) 3. Спосіб задання множини для вибору - серед заданих експертами об’єктів - дискретна множина: - без обмежень; - з обмеженнями: • лінійні; • квадратичні; • паралелепіпед; • монотонні; • опуклі, ввігнуті - неперервна множина: - без обмежень, - з обмеженнями (паралелепіпед, лінійні, нелінійні, опуклі тощо) 47
Закінчення табл. 2.4 4. Вигляд вхідної інформації - задані строгі ранжування - задані иестрогі ранжування - бюлетені для голосувань - матриця парних порівнянь - побудовані ранжування 5. Форма задання матриці парних порівнянь - якісні в різних шкалах - кількісні: - процедура метризації; - безпосереднє задання - задані перетворення в шкалах 6. Заданих інформації про експертів - кількість можливих експертів - спосіб отримання інформації від експертів - визначення компетентності експертів, вибір процедури 7. Вагові коефіцієнти компетентності експертів - експерти рівноцінні - вагові коефіцієнти задаються: - вид задання; - форма задання - обчислюються або читаються з бази даних: - тестування (за заданими ранжуваннями); - задання матриці взаємооцінок; - процедура самооцінки 8. Вибір метрики. Ранжування метрик - евклідова - хемінгова - манхетенська - ланцюгова -інші 9. Вибір агрегуючого критерію. Вибір голо- якого та допоміжних критеріїв - мінімаксний - лінійна згортка - максимінний інші 10. Параметри задачі - термін між отриманням інформації та наданням рішення - час, який ОПР може виділити для роботи над проблемою - наявна кількість ОПР із незбіжними цілями 11. Підхід до розв’язавдания задачі - лексикографічний вибір - метод обмежень - метод послідовних поступок - метод головного критерію - лінійна згортка - нелінійна схема компромісів - правило знаходження розв'язку: Кондорсе, Борда, Нансоїіа та ін. 12. Завдання дослідника - визначення ваг об’єктів - визначення кращої підмножини (за Парсто, Еджвортом та ін.) - вибір критеріїв оптнмальності - визначення компетентності експертів - задачі класифікації та кластеризації - задача узгодження розв’язків в ієрархічній системі - обчислення коефіцієнтів ранжованосп 13. Аналіз реіультатів - узгодження думок експертів - прогноз (або екстраполяція) - порівняння різних експертів за ефективністю та іншими показниками порівняння результатів у різних метриках порівняиня ефективності різних критеріїв - розробка рекомендацій та висновків 48
2.3.2. Математичні моделі експертного оцінювання Основними характеристиками, за якими класифікують методи розв’я- зання задач ЕО, є такі: 1. Наявність чи відсутність об’єктивної моделі ЕО. Існує широкий клас проблем, для яких можна побудувати адекватну кількісну модель. 2. Вигляд кінцевого розв’язку задачі ЕО: - виділення одного найкращого об’єкта; - розділення досліджуваної множини об’єктів на декілька класів; - упорядкування об’єктів за якістю; - комбінація наведених варіантів. 3. Новизна проблеми для експерта. Якщо проблема повторюється, екс- перт може вибрати типові правила ЕО. До нових належать проблеми, для яких експерт формулює правила у процесі їх розв’язання та для яких типові правила ще не побудовані. 4. За інформованістю експерта проблеми експертного оцінювання поді- ляють на два класи: - якщо в експерта є цілісне уявлення про об’єкти - «гештальт» (образ), який значно ширший і глибший від його загального подання за сукупністю оцінок за багатьма критеріями; - коли експерт не має цілісного уявлення про об’єкти до початку проце- су оцінювання: це уявлення виникає в нього лише як сукупність оцінок об’єктів за багатьма критеріями. 5. Розмірність проблеми експертного оцінювання: кількість критеріїв та кількість об’єктів вибору (альтернатив). Перші три характеристики, наведені в табл. 2.4, є основними й описують умови ЕО, дві останні пов’язані з вибором методу розв’язання для ситуацій ЕО. 2.3.3. Цілі експертного оцінювання Із множиною цілей (С = {С,,С2.С,}), що стоять перед дослідником, ви- діляють такі класи задач ЕО: - лінійне впорядкування об’єктів; - виділення кращого об’єкта; 49
- виділення невпорядкованої підмножини кращих об’єктів; - виділення впорядкованої підмножини кращих об’єктів; - ранжування (упорядкування) всієї множини об’єктів; - знаходження колективного (групового) ранжування об’єктів за індиві- дуальними ранжуваннями експертів; - впорядковане розбиття об’єктів (стратифікація, групове впорядкування); - невпорядковане розбиття об’єктів (класифікація); - визначення вагових коефіцієнтів об’єктів; - колективний вибір. За цілями, що стоять перед дослідником, можна виділити такі класи за- дач ЕО [13]. 1. Задачі ранжування (упорядкування) об’єктів, в яких потрібно визна- чити порядок на множині об’єктів. У загальному випадку умова впорядку- вання об’єктів означає, що треба визначити відносну цінність кожного з об’єктів. Часто для розв’язання задачі досить визначити квазіпорядок, де не всі об’єкти можна порівняти між собою, при цьому деякі об’єкти мають од- накові ранги (нестроге впорядкування). Деякі задачі строгого та нестрогого ранжування розглянуто в наступних параграфах. 2. Виділення невпорядкованої підмножини кращих об’єктів або одного найкращого як окремий випадок. Нехай А - непорожня множина об’єктів вибору, що складається з А об’єктів. Задача полягає у виділенні в А деякої підмножини об’єктів Ао, А^с А за певними ознаками. 3. Задачі кластеризації та класифікації об’єктів полягають у розбитті за- даної множини об’єктів на групи (класи, таксони, блоки), що складаються зі схожих об’єктів. Це задачі кластерного аналізу. 4. Задачі визначення вагових коефіцієнтів об’єктів полягають у припи- суванні об’єктам деяких чисел - вагових коефіцієнтів їхньої важливості. 5. Задачі визначення компетентності експертів можна вважати окремим випадком класу задач визначення вагових коефіцієнтів об’єктів. 6. Задачі відновлення пропусків у даних. Часто виникають ситуації, коли значення деякої ознаки є визначеними для одних і невизначеними для інших 50
об’єктів, що справедливо і для значень параметрів об’єктів, і для деяких еле- ментів матриці відношень, коли вона є неповною, тоді необхідно на основі наявної інформації про об'єкти з повними даними відновити пропуски даних відповідних об’єктів. 2.4. Методи та алгоритми строгого ранжування об'єктів 2.4.1. Задачі колективного ранжування об’єктів та їх формалізація Ранжування об’єктів - це спосіб оцінювання об’єктів у порядковій шкалі, коли кожному з них приписується деяке місце в послідовності об’єктів. Строгим ранжуванням об’єктів називають таке їх упорядкування, за якого ступінь прояву деяких властивостей, за якими вони упорядковуються, не може бути однаковим, тобто всі об’єкти мають різні ранги. Серед задач ЕО об’єктів проблема упорядкування є, безумовно, актуальною, його широко застосовують для розв’язання численних задач. Для підвищення об’єктивності ранжування об’єктів цю процедуру прово- дить група експертів або застосовують різні методи, і тоді потрібне узгодження суджень експертів або знаходження колективного ранжування об’єктів. Знаходження результуючого ранжування об’єктів за індивідуальними ранжуваннями експертів - одна з найпоширеніших задач лінійного упоряд- кування об’єктів. Нехай к експертів із множиною індексів І є .....*} задають свої переваги на множині об’єктів А у вигляді строгих ранжувань К1,1 є Ь ви- гляду ау-Ьу-с>-.... Індивідуальні переваги кожного експерта на множині об’єктів можна подати у вигляді матриці переваг В1 = (Ь1^), і, у є І, І е Е, де Ьу = І тоді й тільки тоді, коли, на думку 1-го експерта, і -й об’єкт переважає у-й об’єкт. Якщо 1-й експерт вважає, що а -< а), то Ь'}, = - І, і,] є І, І є Ь. До того ж, Ь' +Ь'}1 =0, Ьи =0. Щоб задати матрицю В', І є Е, експерт повинен порівняти кожний об’єкт з кожним, тобто здійснити л(и — 1) 2 порівнянь на множині об’єктів А. 51
На множині ранжувань або відповідних їм матриць парних порівнянь вводиться поняття міри їх близькості. Для вимірювання відстані між ранжу- ваннями застосовують різні метрики: - метрику незбіжності рангів об’єктів у індивідуальних ранжуваннях: </(лЛя')=ї;г/-г/, (2.і) де г/ - ранг і -го об’єкта у ранжуванні І -го експерта В1, 1 £ г‘ <, п; - метрику Хемінга: (2-2) * 1*1 1*1 - евклідові метрики: </£(ЯЛя') = Л2(Яу,я'); (2.3) ^(в1 ,в')=<і1{ві ,в‘), в яких значення <ЦВ',В'), В(В},В') визначаються з формул (2.1), (2.2). Задача полягає у визначенні результуючого (колективного, компроміс- ного або інтегрального, агрегованого, узгодженого) ранжування, яке є най- ближчим відносно деякого критерію до всіх індивідуальних ранжувань, зада- них к експертами. Це ранжування має також бути оптимальним за Парсто і задовольняти аксіому одностайності. Розглянемо деякі найпоширеніші мето- ди знаходження результуючого ранжування об’єктів. Одиним із найвідоміших методів знаходження результуючого ранжу- вання об’єктів вважається обчислення медіани заданих ранжувань у вигляді ВКС є Аг£шіп^2^(Я,Я'), (2.4) де <^Я, В1) - відстань між ранжуваннями об’єктів Я є П та Я/, / є і; П - множина всіх можливих строгих ранжувань об’єктів. Відстань між ранжуваннями задається формулами (2.1)-(2.3). Для класу ранжувань задачу (2.4), в якій використовується метрика Хемінга, вперше сформулювали Дж. Кемені та Дж Снсл, а розв’язок цієї задачі для вказаної метрики називають медіаною Кемені-Снела [13]. Специфіка задачі знаходження строгого компромісного ранжування по- лягає в тому, що елементи вектора розв’язку, що відповідає ранжуванню 52
об’єктів, мають бути попарно незбіжними натуральними числами в інтервалі від 1 до п, тобто мають виконуватися умови г, * гу, Уі * у. Взагалі знаходження порядку на множині об’єктів є складною ком- бінаторною задачею, КР-повною «в сильному сенсі» [13], тому для по- будови результуючого ранжування К* використовується алгоритм дис- кретної оптимізації - метод гілок та меж, методи послідовного аналізу варіантів (ПАВ), а також алгоритми локальної оптимізації та генетичні алгоритми. Хоча серед задач знаходження результуючого ранжування найбільш поширеною є задача знаходження медіани Кемені-Снела, проте вона має деякий недолік, оскільки це ранжування думки окремих експертів згла- джує ранжування «експертів-дисндентів», думки яких різко відрізняються від середнього. Тому для вибору ранжування, яке більшою мірою врахову- вало б думки усіх членів експертної групи, доцільно ввести «егалітарний» критерій: Квг є Аг£тштах/7(Я,В'). (2.5) Для метрики Хемінга цей критерій називають ВГ-медіаною, а для мет- рики незбіжності рангів об’єктів ГВ-медіаною [13]. Розв’язок задачі (2.4) є ефективним (оптимальним за Парсто) і таким, що задовольняє аксіому одно- стайності. Для коректності ВГ-медіани або ГВ-медіани вигляду (2.5) мають вико- нуватися такі умови: якщо ранг і -го об’єкта у ранжуванні кожного експерта не нижчий за ранг / -го об’єкта, то в колективному ранжуванні ЯИІ співвід- ношення рангів має зберігатися. У загальній постановці задаються або визначаються нормовані коефіці- єнти компетентності експертів р/, /є/., такі, що £р„ р, >0, ІєЬ. Тоді мо- жна записати: Я*сєАг8тіп£(у/(Я, В'), або №г є Аг2ппптах^б7(/?,В/). 53
2.4.2. Послідовний алгоритм розв’язання задачі строгого результуючого ранжування об’єктів Задача знаходження результуючого ранжування об’єктів з використанням метрики незбіжності рангів має такий вигляд у класі однокритеріальних задач: тіп /(х) = X /, (х) = X р, X г/ - х,. (2.6) /є2 1-І >«7 Якщо розвязок, отриманий за критерієм (2.6), не єдиний, тобто побудо- вано множину варіантів, еквівалентних за критерієм (2.6), то результат ран- жування можна обирати із зазначеної множини розв’язків із застосуванням додаткового критерію. Інтервали зміни рангів об’єктів за такими ранжуваннями експертів ви- значають за формулами г" = тіл//; = тахт/ ,ієІ. /є£ /єі Для розв’язання задачі (2.6) на початковому етапі будується матриця Хи, що відповідає області допустимих розв’язків {1 < < и, і є і} з елемен- тами х* є Хо, і, і є І, які визначаються таким чином: [б, якщо г? > і або г? < у; [ ], якщо і? 5 5 г/. Для кожного вектора експертних ранжувань К1, І єЬ генерується мат- риця втрат, кожний елемент якої визначається числом А'і, =(г' -ху), /, у є І, І єЬ. Елемент А\ є величиною «неузгодженості» рангової оцінки експертом об’єкта а, є А, і є І з рангом цього ж об’єкта, поданого елементом у матриці Хо. Сутність методу полягає в послідовному відсіюванні з початкової мат- риці Хо тих елементів ху є А'о, які мають найбільшу розбіжність з індивіду- альними елементами ранжування. Отже, мінімізується сумарна матриця «не- узгоджен пості» вигляду А'і/ = X гї ~ ху' • є 54
У результаті відсіювання деякі елементи матриці Х„ фіксуються, змен- шуючи розмір задачі, а в окремих випадках отримуються розв’язки у вигляді строгих результуючих ранжувань, які мінімізують критерій (2.6) на множині всіх можливих розв’язків. Процедура відсіювання недопустимих варіантів ураховує те, що розв’язок має бути строгим ранжуванням. На кожному кроці процедури знаходження розв’язку задачі (2.6) будується матриця X3 = 5 = 1,2,... відсіюванням безперспективних ш елементів матриці А'5-1. Рядки та стовпці матриці X5, 5 = 1,2,... будемо називати відповідно рядками та стовпцями рангів. Звуженою матрицею Xі, 5 = 1,2,... називатимемо матрицю, яка порівняно з матрицею X5'1 має меншу кількість ненульових елементів. Варіантом розв’язку задачі (2.6) називатимемо вектор довжиною и, еле- ментами якого є елементи відповідних стовпців матриці X5, 5 = 1, 2,.... Допустимим (повним) варіантом задачі (2.6) називатимемо вектор Х = [х1,х2.хя] довжиною и, який не містить нульових значень і всі його елементи є попарно різними. Справедливими є такі твердження [13]. Теорема 2.1. З елементів допустимої матриці X5, 5 = 1,2,... завжди можна вибрати вектор довжиною п, який відповідає ран.жуванню об ’єктів. Під час побудови строгого ранжування об’єктів потрібно дослідити випадки, коли кожен із стовпців рангів та жоден із рядків об’єктів не містять усіх нульових елементів, а також випадок, коли у стовпцях та рядках матриці X5, 5 з 1,2,... залишається єдиний ненульовий елемент, тобто ранг об’єкта фіксується Твердження 2.1. Ранг об ’єкта фіксується у груповому ранжуван ні, якщо : - усі інші допустимі значення рангів для цього об'єкта відсіялись у результаті застосування процедури відсіювання на попередніх ітераціях, тобто у відповідному рядку матриці X3, 5 = 1, 2,... залишається єдиний не- нульовий елемент; 55
- у відповідному стовпці матриці X5, 5 = 1,2,... залишився єдиний не- пу льовий елемент. Твердження 2.2. У результаті фіксування результуючого рангу об'єкта зменшується розмірність початкової задачі Твердження 2.3. Фіксування рангу об 'єкта в колективному ранжуванні може бути як результатом відсіювання із застосуванням класичних проце- дур ПАВ, так і результатом застосування однієї з умов твердження 2.1. Твердження 2.4. Умовами недопустимості відсіювання варіантів розв язків задачі за алгоритмом (процедурою) . 5 = 1,2,... є такі: Зі: хч = 0; V/ е /, тобто наявність нульового рядка матриці X5; Зі: ху ~ 0; Уіє І, тобто наявність нульового стовпця матриці А'*; З/,/: гГ = г*, де г* = х" = х®; г* = х" = х»; і * у, і, ],1 є І; Зі,),Г.г^ = г1*), тобто існування стовпців, в яких індекси єдиних не- нульових елементів збігаються: - х" - х&; = х^І} = х,®,; і * у, і,), І є І 2.4.3. Процедура \¥г відсіювання безперспективних варіантів у задачі строгого ранжування об’єктів Для розв’язання задачі (2.6) строгого ранжування об’єктів застосуємо процедуру 1Г2 алгоритме ПАВ [13]. На кожному кроці процедури за к0 = перевіряється сумісність системи нерівностей: (2.7) /а де величину ) визначають за формулою /‘(А ) = р + Ло(/ї'-/О'\ / є/> (2.8) ' ° ' Р, а величини /°5, /‘5 є відповідно мінімальним та максимальним значеннями функції і є І на 5-му кроці алгоритму ПАВ, х = 1,2,.... які знаходять за- стосуванням алгоритму мінімаксу [13]. 56
Введемо такі позначення: Xі ЦА''; ні X, ~ Е агв тіп /,(*,). ' є /; ує/ Х,\х}= (Хр х2, .... х’ч, х'+1, .... х‘п). І, )ЄІ. Тоді умови відсіву елементів множин А'у, у є І, які не дозволяють по- будувати колективне ранжування об’єктів, що задовольняє обмеження (2.7), будуть такими: де Г(к^ = /,(Х,\Х/) = /’№)-X/, (агЕтіп), /є/. Розглянемо модифікацію процедури для випадку розв'язання задачі визначення строгого ранжування об’єктів. у" -4- У" Крок 1. Визначають початкове значення У’* _ 7 7 2 Крок 2. Перетворюють елементи матриці А”, 5 = 1,2..... таким чином: х^і=1х'7’якщоЛ«-Л*5; 17 0, якщо А,; > /*5. Крок 3. Перевіряють допустимість матриці Xі, 5 = 1,2..за умовами твердження 2.1. Якщо матриця є недопустимою, то переходять до кроку 4, інакше - до кроку 5. Крок 4. Збільшують значення /*5, наприклад методом дихотомії. У’1 + /’ / = Переходячі до кроку 2. Крок 5. Якщо матриця А'5, 5 = 1,2,..., є допустимою, то перевіряють умови твердження 2.1. Якщо деякі елементи матриці А'5, 5 = 1,2, .... фіксу- ються, то зменшують розмірність задачі. Якщо матриця А'Л. 5 = 1,2,.... є не- допустимою, то переходять до кроку 4, інакше - до кроку 6. Крок 6. У разі, коли не здійснюється відсіювання і матриця є допус- тимою, визначають верхню оцінку кількості варіантів: „5 _ г~Т І 5 У - 11 шах х- — тлю х,- їв/ І 1 •' \ /«7 /*/ / (2.9) 57
Коли верхня оцінка (2.9) с великою для прямого перебору, то зменшу- ють значення : Ґ5'1 = 7 7 2 Переходять до кроку 2. Крок 7. Здійснюють пряме перебирання варіантів розв’язку з ураху- ванням вимоги попарно! незбіжності елементів розв’язку, які інтерпретуються як ранги об’єктів. У результаті застосування описаного алгоритму визначають найкраще значення адитивної функції вигляду (2.6) на елементах множини Х!, 5 = 1,2,.... які відповідають строгому ранжуванню об’єктів. 2.5. Послідовний алгоритм розв'язання задачі визначення колективного ранжування за мірою незбіжності рангів об'єктів (ГВ-медіани) Задачу колективного упорядкування об’єктів можна розглядати як бага- токритеріальну, отже, формалізуємо задачу знаходження колективного ран- жування як таку багатокритеріальну задачу дискретного програмування: /(х) = —>пііп, іеі; (2.10) хє.Г0=П*,°,х,єХ°, уе/, (2.11) ху * х„ ] , І, і є/. (2.12) Розв’язок задачі (2.10)- (2.12) будемо називати ГВ-медіаною. Зазначимо, що у цьому випадку немає єдиного розв’язку задачі визначення строгих ран- жувань об’єктів (2.10) (2.12), отже, необхідно розглядати не єдиний розв’я- зок цієї задачі. Щоб звузити підмножину отриманих розв’язків чи визначити єдиний розв’язок, на цій підмножині можна шукати медіану Кука- Ссйфорда за ін- шими критеріями. Задача (2.10} (2.12) не є дискретною сепарабсльною задачею, оскільки є умова (2.12). 58
На основі сформульованих тверджень та наведених у попередньому під- розділі процедур опишемо алгоритм відсіювання недопустимих варіантів та пошуку строгого ранжування [13]. Крок І. Присвоюють початкові умови нульових значень елементам вектора розв’язку Х:х = 0, у є І. Обчислюють мінімальне та максимальне значення ЦФ, застосувавши алгоритм мінімаксу. Крок 2. Обчислюють величину за формулою (2.8). Крок 3. Застосовують процедуру И7/. Якщо відсіювання є допусти- мим, то переходять до кроку 9, інакше - до наступного кроку. Крок 4. Після застосування процедури відсіювання будують матрицю X5, 5 = 1,2,..., яку також перевіряють на допустимість відповідно до твердження 2.3. У випадку недопустимості матриці X* збільшують пара- метр к„ та переходять до кроку 9, інакше беруть 5 = 5 + 1 й переходять до наступного кроку. Крок 5. Перевіряють умови твердження 2.2. Якщо деякі ранги об’єктів фіксуються, то отримують частковий розв’язок задачі (2.10) (2.12) і змен- шують розмірність матриці X5, 5 = 1,2,... . Крок 6. Обчислюють межі зміни ЦФ /т,/к, застосувавши процеду- ру мінімаксу [13]. Якщо межі змінилися, то переходять до кроку 2, інакше до наступного кроку. Крок 7. Розробляють висновок про здійснення допустимого відсію- вання. Якщо на множині X5, 5 = 1,2,..., існують допустимі повні варіанти й загальна кількість можливих варіантів, обчислених за формулою (2.9), є ве- ликою для прямого перебору, то переходять до наступного кроку, інакше - до кроку 10. Крок 8. Зменшують значення У*5 - обирають /*5“, наприклад мсто- дом дихотомії: У’1’1 = 7 } Персходя гь до кроку 2. Крок 9. Збільшують /*5, обирають у'*'1 = 7 7 . Переходять до кроку 2. 59
Крок 10. Якщо кількість можливих варіантів розв’язків на множині X5 невелика, то прямим перебором знаходять розв’язок X , який є допустимим варіантом і мінімізує ЦФ (2.10). Якщо знайдений розв’язок не є єдиним, то експертові пропонується виб- рати серед розв’язків, еквівалентних за ЦФ (2.10). той розв’язок, який йому найбільше підходить, або використовувати додатково інший критерій для остаточного вибору розв’язку. 2.6. Методи й алгоритми нестрогого ранжування об'єктів Розглянемо тепер задачі нестрогого ранжування об’єктів, нагадаємо, що ці задачі виникають, коли деякі об’єкти можуть мати однакові ранги. Розглянемо задачу побудови результуючого (узгодженого) нестрого- го ранжування об’єктів за матрицями відношень між об’єктами вигляду В — Ь‘у , які задані експертами у вигляді медіани Кемсні-Снсла. Нехай задані нормовані коефіцієнти компетентності експертів. Коефіцієнти відносної компетентності експертів можна визначити за методами, наве- деними в [13]. Така задача формалізується у класі однокризеріальних комбінаторних задач: /(*) = Х.Л (А) = Е Е сч - х, ->тіп • (2-13) де Х) еХ° = {-1;0;1}; (2.14) хєГ>?,сА'0;АгО = П^70- (2-15) 2.6.1. Процедура послідовного аналізу та відсіювання варіантів за обмеженням на цільову функцію Розглянемо процедуру пошуку розв’язку задачі (2.13)--(2.15), яка грунтується на методі ПАВ. Введемо такі позначення для множини, які міс- тять компоненти початкових векторів вигляду 60
с,= Ь^, х,=г^, (2.16) ДЄ ,. 0 + о» . . і = (і-\)п + у — , 1<і < у < п. „ п(п -1) Позначимо через л = кількість елементів векторів вигляду (2.16), а через Н - множину індексів цих векторів. Тоді відстань між відно- шеннями В та В запишемо у вигляді </(/?,/?)= . І*Н Введемо такі позначення для множини, які містять компоненти початко- вих векторів Су —> с,: Я; = {/: = -1; V/ є Т}; Я;° = {у: с, = 0; V/є /.}; Н] = {/: с„ = 1; V, є /.}. Очевидно, що Н‘ + Н* + Н* =к. Введемо також позначення для сум відстаней до у -х компонені: Ц = Н° + 2Н* ; Л' = Н] + Я; ; й/ =2 Я; +2 Н* . Введемо обмеження на ЦФ задачі: . (2-17) ЛЯ ні / Де /№ ’ /“відповідно мінімальне та максимальне значення ЦФ на 1-й ітера- ції, 5 = 1,2,...: /ю = їтіп^с,-х/ ; /“ = £тах£с, ~х; . (2.18) у«Я НІ /«Я «/«X* Умова відсіювання елементів множини X5 V/ єН, які не можуть брати участі у побудові розв’язку х є X5 задачі (2.13)-(2.15), с такою: ^сг-х7 >/’І-^Есг-аг8тіпсв-х, . (2.19) <<І г«Я <*£ 61
Якщо отримана в результаті відсіювання елементів множина залишається великою, то значення /*' збільшується, наприклад вибирають + /" значення /*'*' = 2 Коли на множині Xх не існує допустимих варіантів, які б задовольняли умову (2.18), то значення /*х зменшуємо, покладаючи, наприклад, Г.. = г+ /'в 7 2 Алгоритм, який реалізовує процедура відсіву Ж/, складається з такої послідовності кроків [13]. Крок 1. Обчислюють допуски на елементи х) за формулою ^ЕЕ^-агетіп^-х, . Крок 2 Якщо значення /*'*’ = /‘х - > тах{й,';й2';й/}, то відсіву не відбувається, коли ж й,7 < /'"* < й/2 та й7 < /'"*< й7,, де /,,/2,/} є {1,2,3}, то а ’' = А‘ \ х1' < й/2 та й7 < й7. Крок 3. У випадку /°г < тіп(й/, й/, й,7) або коли всі елементи бодай однієї множини, які повинні залишитися після кроку 2, вже відсіяні попередньою процедурою ИлХ 1, то процедура И,х приводить до неприпустимого роз’язку. 2.6,2. Алгоритм знаходження результуючого ранжування Опишемо алгоритм аналізу та відсіювання недопустимих елементів у задачі знаходження результуючого ранжування [13]. Крок 1. Обчислюють значення /’х за формулами (2.17) та (2.18). Крок 2. Застосовують процедуру Ж/. Якщо відсіювання недопустиме, то переходять до кроку 6, інакше - до наступного кроку. 62
Крок 3. Обчислюють границі зміни ЦФ: /Н5, . Якщо вони змінилися, тобто /№ > /ю 1 або /“ > , то переходять до кроку 1, інакше - до кроку 5. Крок 4. Допустимим є відсіювання X' для )єН. Якщо на мно- жині X5 існують допустимі повні варіанти і загальна кількість можливих варіантів X5 € великою для прямого перебору, переходять до наступного кроку, інакше - до кроку 7. Крок 5. Зменшують значення /’* - обирають, наприклад методом ди- ґ* + є"5 хотомії, нове значення /*5+І = ' Переходять до кроку 2. Крок 6. Збільшують /*5 - обирають нове значення з інтервалу (у-У;у-») Перехід до кроку 2. Крок 7. Якщо кількість можливих варіантів у множині X' є невели- кою, то прямим перебором знаходять розв’язок, який с допустимим X’ варіантом і мінімізує узагальнений критерій: тіп {Р(*)}= тіп ХРі X • (2.20) х еХЛ х еХл іьі іеЛ Якщо такий розв’язок с єдиним і задовольняє нерівність (2.17), го він є зага- льним розв’язком і відповідає результуючому ранжуванню КсменіСнела Крок 8. Якщо допустимий варіант, що мінімізує критерій вигляду (2.20), не є єдиним, тобто побудовано множину X' еквівалент них розв’язків за критерієм (2.20), то розв’язком (2.14)-(2.16) може бути обраний той варіант, на якому мінімізується критерій тіп {/?1(х)}= тіп тахр, X су~ху . (2.21) X хєЛ’*Л уєЯ і виконується співвідношення (2.17). Крок 9. Якщо умова (2.17) для всіх хєА'"1 не виконується, то знову застосовують процедуру , яка полягає у відсіюванні тих елементів множи- ни хєА'‘\ які не дозволяють побудувати допустимі варіанти і задовольня- 63
ють нерівності /(х)< /(х‘), хєА'’1, при цьому відсіювання відбувається у процесі перевірки нерівності (2.17). Після застосування процедури буду- ють множину Х(х ). Крок 10. Знаходять розв’язок х’єА'(х’), який мінімізує критерії (2.20) та (2.21). 2.7. Метод аналізу ієрархій Деякі задачі ЕО мають досить складну структуру у вигляді ієрархії, в якій на найнижчому рівні - першому - містяться альтернативи, на другому рівні - часткові критерії, на третьому - більш загальні критерії і так далі й. нарешті, на найвищому рівні й - глобальний критерій. Така структура характерна, на- приклад, для територіальної організаційної ієрархії, де найнижчий рівень (аль- тернативи) становлять окремі підприємства та організації, наступний рівень - управління окремим районом відповідно до макроекономічних показників, далі обласний рівень, і нарешті, найвищий - система управління економікою країни в цілому зі своїми показниками техніко-скономічного розвитку. Приклад такої структури критеріїв зображено на рис. 2.1, де х, - альтер- нативи, а £ - елементи ієрархії критеріїв, де верхній індекс вказує на рівень ієрархії, а нижній - на порядковий номер. Для аналізу таких систем та знаходження найкращої альтернативи Т Сааті запропонував метод аналізу ієрархій (МА1) [50]. У цьому методі за- гальна задача знаходження найбільш пріоритетної альтернативи за системою ієрархічно впорядкованих критеріїв декомпозується на ряд етапів. На першому етапі знаходять відносну значимість альтернатив щодо кожного критерію найнижчого рівня й у вигляді вектора пріоритетів И'/‘ = ІГ ' ... IV}. У результаті отримують матрицю пріори ісі їв II II де і - кіль- кість альтернатив; - кількість критеріїв рівня й, й, = 1,т„. Цю матрицю для зручності будемо записувати у вигляді И7/ = IV. 64
Рис. 2.1. Структура критеріїв На другому етапі знаходять відносну значимість кожного з критеріїв найнижчого рівня й щодо критеріїв наступного рівня (й - 1). Цю значимість записують у вигляді матриці пріоритетів: На третьому етапі аналогічним чином знаходять відносну значимість критеріїв рівня й - 1 (/**“’ ) щодо критеріїв сусіднього вищого рівня (й - 2). Цю значимість записуємо у вигляді матриці пріоритетів: де лц _ ], т>, _ 2 - кількість критеріїв на рівнях й - 1, й - 2 відповідно. Наступні етапи виконуються аналогічним чином. Нарешті, на перед- останньому рівні визначають пріоритети кожного з критеріїв другого рівня ієрархіївідносно глобального критерію найвищого рівня/, які записують у вигляді вектора пріоритетів ІУ ’г = Н]' і = 1, т2, = 1. 65
Отримані значення векторів пріоритетів використовують для визначення векторів пріоритетів альтернатив щодо критеріїв і = й-1,й-2, 1 на всіх рівнях, починаючи з найнижчого в напрямку знизу вверх. Обчислення проводять, перемножуючи відповідні матриці та вектори. Зокрема, вектор і матриця пріоритетів альтернатив х( щодо критеріїв (й - 1)-го рівня ієрархії/Л ‘ визначають, перемноживши відповідні матриці: = И'А ’ = И'*И'/* 1. X X, X у* Далі знаходять матрицю відносних пріоритетів альтернатив х, щодо кри- /* 2 теріїв рівня й 2: И'д і т. д. Нарешті, на останньому кроці знаходять вектор пріоритетів альтернатив щодо глобального критерію системи Г1; = И’/' • . 2.8. Метод попарних порівнянь Для реалізації методу аналізу ієрархії потрібно обчислити вектор пріоритетів (відносних ваг) И'Л кожної альтернат иви щодо критеріїв нижнь- ого рівня ієрархії, гак само, як вектори пріоритетів критеріїв й-го рівня ієрархії щодо критеріїв (й - 1 )-го рівня 1 = рі,*А І 1 > ' = 1. "’л • У загальному випадку ці ваги невідомі, і потрібно знайти їх на основі обробки експертної інформації. Найбільш відомим методом побудови пріоритетів альтернатив відносно деякого критерію є мегод попарних по- рівнянь (МПП), запропонований Т. Сачті [50]. У цьому методі порівнюється кожна пара альтернатив та визначається їх адекватність (сила) відносно відповідного критерію. Нехай є чітка множина альтернатив X із невідомою ефективністю аль- тернатив И'Дх,), х єХ, і~1,п відносно критерію А. У результаті опитування експертів (ОІІР) будуємо матрицю М - т„ , і, і = 1, л, де п кількість точок, в яких порівнюється значення функції И'л(х). Число ту показує, у скільки разів ІГл(х(), на думку експертів, 66
перевищує И7л(ху), при цьому кількість запитань до експертів становить не 2 л(л-І) . „ 1 п, а лише , оскільки ти = 1, и, крім того, т = 2 тч Значення оцінюється експертом за 9-бальною шкалою, запропонова- ною Т. Сааті (табл. 2.5). Вибір саме такої шкали грунтується на людській здібності розрізняти ступінь якості у різних об’єктів, не користуючись вимірювальними приладами, наприклад визначати кольори. Як відомо, лю- дина звичайно може розрізняти 7+2 значень деякої якості, користуючись ор- ганами чуття. Таблиця 2.5 Значення т* Зміст оцінок т„ 1 приблизно дорівнює И^Х,) 1 3 IVА (х() трохи більше за IVА (ху) । 5 (х() більше за (х;) । 7 И'Дх,) помітно більше за И'Дхр 9 (х,) набагато більше за (ху ) 2,4, 6, 8 Значення, проміжні за ступенем переваги між вказаними Отже, на основі парних порівнянь згідно з введеною шкалою оцінок бу- дуємо матрицю Мо = . Далі для матриці Мо знаходимо власні числа Хь Х2.Ки обираємо най- більше власне число Х^, знаходимо найбільший власний вектор Ф = [Ф,1 і = 1, п, розв’язуючи рівняння МФ = ХмхФ. (2.22) Оскільки матриця Л/о додатна за визначенням, то розв’язок (2.22) існує і він єдиний. Ф Далі обчислюємо И^(х,) = ’ = И'(х,) = И', (2.23) і=І при цьому Хпих = п. Покажемо справедливість співвідношення (2.23). Нехай 67
^(х1)‘ ^(х>) ^я(ху) ^(х„) Мо = ^(ху) И^(хя) ^(Хи) ^л(хв) ^(*я) ^(ху) ^(х„) Тоді для і-ї компоненти вектора М0Ф виконується умова (М0Ф), = Х^О^, тоді X А ф] = и; X ' = х^ф, . У І ", і=\™ } Звідси отримуємо " ф, ф <“4’ й прогумувавши за всіма і, дістанемо п Ф,- п ф. ”5^. =Хт“,?,и; ’ Звідси Кпи» = п, і з формули (2.24) отримуємо Ф 1 " Ф, ' = У 1 = соп8і. (2.25) и; Отже, розв’зуючи рівняння (2.25), знайдемо вектор пріоритетів: Ф ^(Х,)= „ ' . 1Ф. і=І Зауважимо, що матриця Мо має ранг «1», а Х^ = л. У реальному випадку під час опитування експертів за методом парних порівнянь матриця М= ту не буде мати рангу «1», а її найбільше власне число Хпих # п. Тоді ступінь неузгодженості оцінок експерта можна оцінити величиною сопзізіепсу іпсіех СІ: 68
СІ = Х~“ п. (2.26) и-1 Приклад 2.1. Нехай ОПР шукає спосіб найбільш вигідного вкладання грошей і розглядає такі можливі альтернативи: Хі - купівля акції компанії «Лої оваз»; х2 - купівля акції компанії «Лукойл»; Хз- купівля акції компанії «Сибірнафта»; х4- купівля акції компанії «Гсрмес-фінанс». Нехай у результаті опутування експертів побудовано таку матрицю по- парних порівнянь альтернатив М = : ’1 5 6 7" Знаходимо власні числа матриці М, для чого розв’язуємо таку систему рівнянь: іїеЦМ - ХЕ) = X4 - 4Х3 - 6.914Х2 - 2,715 = 0, знаходимо: X, = -0,312; Хи = -0,140 ± 1,6О5і; X. = 4,390 = Х_. Тепер знаходимо власний вектор Ф, що відповідає Х^: 1-4.39 5 1 1-4,39 5 1 1 5 4 1 1 7 6 (2.27) Розв’яжемо систему (2.27), використовуючи додаткову умову нормування: Ф, + Ф2 + Ф, + Ф4 = 1. 69
У результаті отримуємо вектор відносних ваг альтернатив: Ф, = И'(х,) = 0,619; Ф2 = И'(х2) = 0,235; ф) = И/(х,) = 0,101; Ф4 =И'(х,) = 0,045. Отже, найбільш вигідною альтернативою є Х|. що означає купівлю акцій компанії «Логоваз», дія якої 1¥(х1) = 0,619 —> тах. Коефіцієнт узгодженості результатів оцінок експерта: С/ = Х~’-Л = 0,390 =0,0975. п 4 Приклад 2.2. Розглянемо як ілюстрацію методу задачу вибору школи (ліцею) для навчання. Нехай маємо три альтернативи - школи А, В, С, які оцінюються за критеріями нижнього рівня: якістю навчання, наявністю друзів, якістю шкільного життя, рівнем професійного навчання, підготовкою до коледжу, музичною освітою. Як глобальний критерій (мета О) оберемо рівень задоволення школою. Відповідну схему ієрархії критеріїв вибору школи зображено на рис. 2.2. Мета С, задоволення школою Якість навчання / Друзі /з Шкільне життя Професійне Підготовка Музична навчання до коледжу освіта .4 4 Л Школа .4 Школа В Школа С Рис. 2.2. Ієрархія критеріїв вибору школи 70
Позначимо через вектор пріоритетів часткових критеріїв/ відносно загальної мети С. Нехай на основі МПП його було знайдено так: ^7=[/і /2 /з /4 /5 /б]Г=[0,32 0,14 0,03 0,13 0,24 0,14]г Нехай на основі МПП також було визначено матрицю відносних пріо- ритетів альтернатив щодо часткових критеріїв (табл. 2.6). Таблиця 2 6 Альтернатам х Критерії/ /» /і /і Л Л Л А 0,16 0,33 0,45 0.77 0.25 0,69 В 0,59 0,33 0,09 0,06 0,5 0,09 С 0.25 0,34 0.46 0.17 0.25 0.2? Тоді вектор відносних пріоритетів альтернатив щодо глобального кри- терію знайдемо як = УУ/їУ'’ 0,3676 0,3781 0,2543 Отже, найбільш вагомою альтернативою щодо глобальної мети г школа В. 2.9. Дослідження методу парних порівнянь Виявимо умови, коли позитивно визначена матриця А із взаємно обер- нених величин а = 1 , ї, у = 1, л буде узгодженою (сопзіяіепі). ач Нехай є додагно-визначеною мазрипсю [л*л] з обернених ве- . 1 • , о личин, такою, що аи = і, а = , і, у = 1,2,..., п. ач Нехай ЗУ = [И' ] - головний власний вектор матриці А та й £> = діа£(И^,И',.... 1Т) - діагональна матриця [лхл]. де по діагоналі розміщені числа 1Т,, і = 1, п. -і ц', Покладемо Е = В АВ - а,-, х 1 4 Я, = [у.]. Т°Д> Е с подібною до А додатно-визначеною матрицею з обернених величин, оскільки 71
Крім того, суми всіх рядків матриці Е дорівнюють найбільшому влас- ному числу матриці А: уу-уо и'.-х ’ £’и; ж, “и; Обчислення п^=ІІу,=Іуі,+ІІ(у,+Уі,)=п+ІІ Г,+ 1 Кл + (л’-л) = л2 і-і 7-1 1-1 1-І 7-1 і-І 7-1 У І і.) и/\ ’' показують, що Хт £ п. Оскільки х + 1 > 2, для всіх х > 0 й рівність буде виконуватись тоді й х ТІЛЬКИ ТОДІ, КОЛИ X = 1, ТО Ащд, = п тоді й тільки тоді, коли ВСІ =1, що и; еквівалентно умові ау = . Отже, наведені аргументи свідчать про те, що матриця А має найбільше власне число Хт £ л, і рівність буде виконуватись тоді й тільки тоді, коли матриця А буде узгодженою. Коли матриця А узгоджена, то маємо А* = п лЛ. За міру відхилення матриці А від узгодженості оберемо коефіцієнт узгодже- ності (соп5І8Іепсу іпдех): ~п г= “ - . л-1 Отже, г > 0 та г = 0 тоді й тільки тоді, коли А є узгодженою. Можна (V сказати, що оскільки г = 0, то □„ -» ' або у = а. —> 1. ’ и; ’ и; Пояснимо зміст знаменника (л-1) СІ. Оскільки ^гасе(А) = п є сумою всіх власних значень матриці А, то якщо позначити всі власні значення, крім " 1 ” першого, через X,, X,,..., X,, то л-Х = £Х,, отже, |1 = £Х, є середнім •-а Л — 11-а власних значень матриці А за винятком головного значення. 72
Безпосередні, очевидні обчислення показують, що Х^д, = п для довільної [2><2] додатно визначеної матриці взаємно обернених величин: 1 а а 1 1 + а (1 + а)а'‘ 1 + а (1 + а)а Отже, довільна [2x2] додатно визначена матриця завжди є узгодженою. Не кожна [Зх3] додатно визначена матриця із взаємообернених величин є узюд- женою, проте легко отримати явні формули для власних векторів га значень. Так, для матриці А вигляду 1 а Ь _Ь с отримуємо Х^, = 1 + </ + </ 1, де її - Легко побачити, що Х^ = 3, коли сі = 1 або с = , і в цьому випадку а матриця А буде узгодженою. Для того, щоб оцінити зміст індекса узгодженості для довільної додатно ви- значеної матриці А [пхл] з обернених величин, було проведене таке імітаційне моделювання [50]. Елементи матриці А над головною діагоналлю були вибрані випадково із множини 17 елементів < • ' • 1 Я 9 > - Далі симетричні елементи 1,9 8 ] нижче головної діагоналі заповнити оберненими величинами. Було проведено 50 000 експериментів з моделювання матриці А й підраховано середнє значення коефіцієнта узгодженості, який названо випадковим індексом (гапііот ігиіех) НІ. Результати імітаційного моделювання - індекс НІ, та його перші різниці для мат- 73
Оскільки немає сенсу в установленні ранжування альтернатив за пріо- ритетами на основі випадкової матриці порівнянь, потрібно, щоб індекс узгодженості за формулою (2.26) був набагато меншим за індекс НІ, тобто гп СІ відношення узі одженосп Ск = для конкретної матриці порівнянь маг бу- ти досить малим. За правилом «великого пальця» рекомендується використовувати МІНІ, якшо показник «відношення узгодженості» СК менший за 0,10 для и -- 4 і а менший за 0,05 для п = 3. Якщо величина СЯ буде більшою, ніж бажане значення, рекомендується робити такі кроки [50]: 1) знай їм найбільш неузгоджень- судження, наприклад судження, дія И' якого є. а є наиопьіиим; Іґ } 2) визначити діапазон значень, до яких може бути змінена відповідна оцінка так, щоб неузгодженість була покрашена; 3) запросити експерта змінити, якщо можна, своє судження відносно ціп оцінки так, щоб вона потрапила у визначений діапазон. Якщо експерт не ба- жає цього робиш, то пробувати скоригувати друге найбільш неузгоджене рішення (оцінку) і т. д. Якщо жодне судження не змінилось, відкласти рішення на майбутнє до кращого розуміння задачі. 2.10. Адитивна композиція критеріїв у методі аналізу ієрархій Синтез у МЛІ включає зважування пріоритетів елементів відносно еле- мента сусіднього вищого рівня, який називають батьківським елементом, ви- значаючи пріоритет (цього елемента) і підсумовуючи за всіма такими бать- ківськими елементами для кожного елемента нижнього рівня. У МАІ припускається, що всі критерії є незалежними (внутрішня незалежність), і тому використовується адитивний синтез. Цей процес зважування та дода- вання виконується зверху вниз починаючи з вершини ієрархії (кореня) і закінчуючи найнижчим рівнем. Результатом є мультилінійна форма, що включає суми добутків усіх пріоритетів іверху до низу. 74
Приклад 2.3 (оцінка інвестицій). Нехай деяка особа N мас три альтерна- тивні шляхи А}, А2, А} інвестування деякої суми грошей на деякий однаковий період часу. Нехай с два типи прибутків С| та С2 (наприклад, оцінка капіталу та відсоткова ставка, як це показано в табл. 2.8). Прибутки для кожної інвестиції показано нижче. Летко підрахувати дійсний розмір витрат кожним ОПР, просто підсумовуючи два числа: відносні видатки тоді нормалізуються, як показано в табл. 2.8. Далі буде видно, що процес пріоритезації за методом Л№ (обчислення векторів пріориіегів) дат ті ж самі відносні кошти, що й звичайні арифметичні обмеження. Арифметичний підрахунок прибутків Таблиця 2 Альтернатив Критерій Сі, вевормалЬоваяа вага 1,0 Кратері! С> невормалЬована вага 1,0 Зважена сума 1 Нормалі гавані або невормалЬована і відносні значення А, 200 150 350 І 350/1300 0,269 а2 300 50 350 350'1300 0,269 Аз 500 100 600 ; 600/1300 0,462 Сума 1000 300 1300 1 1 Яка відносна вага кожного критерію? Не можна просто призначити кожному критерію вагу «1», тому що значення (ваги), приписані кри- теріям, мають бути нормалізовані. Але нормалізація вказує па відносну значимість. Відносні ваги потребують, щоб усі критерії були досліджені щодо їх відносної важливості. З’ясуємо, які значення потрібно приписати критеріям, щоб відобразити їх відносну важливість. Для критерію Сі маємо а для критерію С2 отримуємо Зважуючи кожний критерій за часткою ресурсу для нього, як показано в табл. 2.8, і компонуючи та підсумовуючи, як в адитивному синтезі за методом МА1, отримуємо той самий правильний результат, що показаний в табл. 2.8. [200 + 300 + 500] 1000 [200 + 300 + 500 + (150 + 50 +100)] ~ 1300 ’ [150 + 50 + 100] _ 300 [(200 + 300 + 500) + (150+50 +100)]" 1300' Тут критерії Сі та Сі нормалізовано, відповідно сума їх ваг дорівнює 75
одиниці. Видно, що коли критерії нормалізовано, то й альтернативи (їх ваги) мають бути також нормалізовані, щоб отримати правильний результат. На- с „ 350 . приклад, у табл. 2.9 величина с пріоритетом альтернатив Л|. Тепер просто зважимо та додамо значення для альтернативи Л|. У табл. 2.8 200 15° 350 отримуємо п остаточну відносну вагу: + - =0,2692. 1300 1300 1300 Якщо ж нормалізувати критерії, як показано в табл. 2.9, то отримуємо 200 1000 150 300 350 той самии результат: + = 10001300 3001300 1300 Отже, якщо пріоритети альтернатив не нормалізовано, то неможливо от- римати розумний результат. Принаймні в цьому випадку нормалізація пріоритетів альтернатив необхідна, якщо пріоритети критеріїв залежать від пріоритетів альтернатив. Таблиця 2.9 Альтернативи Критерій нормалізована ваі~а = 1000/1300 = 0,7691 Критерій Сі. нормалізована ваза Н'і = 300/1300 = 0,2309 Зважена сума А. ^2 А} 200 1000 150 300 350'1300 = 0.2692 300/1000 ' 50071000 50'300 100/300 350/1300 = 0.2692 ^600-1300 = 0,4615 2.11. Дистрибутивний (розподілений) та ідеальний режими методу аналізу ієрархій Із прикладу 2.3 в попередньому підрозділі видно, що для того, щоб отримати правильні остаточні відносні значення (валі) для альтернатив, коли залаються вимірювання у шкалі вимірювань, суттєво, щоб пріоритети кри- теріїв було отримано з пріоритетів альтернатив. Використовуючи нормаїі- ювапі ваги альтернатив, помножені на пріоритети криіеріїв, і підсумовуючи за всіма критеріями, отримуємо відносну оцінку для кожної альтернативи. Отже, коли критерії залежать від альтернатив, необхідно нормалізувати значення альтернатив, щоб отримати остаючний результат. Таку процедуру 76
називають дистрибутивним режимам МАІ. Її можна використовувати у випадку функціональної залежності критеріїв від альтернатив, коли критерії порівню- ються окремо відносно кожної альтернативи, як у методі аналізу мереж (МАМ), наприклад, якщо дехто задає питання щодо певного індивідуума: цей індивідуум буде кращим як музикант або як учитель, і наскільки? Домінуючий режим синте- зу в методі МАМ - це дистрибутивний або розподілений режим. Якщо критерії не залежать від значень альтернатив, потрібно отримати їх пріоритети, порівнюючи їх попарно один з одним щодо більшого рівня значення (критерію) або мети. Це процес порівняння та знаходження рівня обміну одиниці одного критерію на одиницю другого, ідеальної альтернативи за одним критерієм щодо ідеальної альтернативи за другим. Щоб визначити ідеальну аль- тернативу, всі значення альтернатив ділять на максимальне значення за кожним критерієм. У цьому випадку процес зважування та підсумовування приписує кожній альтернативі значення, яке пропорційне значенню «1», що відповідає найкращій альтернативі, альтернативи зважуються з пріоритетами критеріїв і підсумовуються для отримання ваг альтернатив - це ідетьний режим МАІ. Домінуючий режим синтезу в МАІ. Коли критерії є незалежними від альтернатив - це ідеальний режим. Стандартний режим синтезу в МАІ. в якому критерії залежать від альтернатив і альтернативи можуть також за- лежати від інших альтернатив, - це розподілений (дистрибутивний) режим. Ранжування альтернатив у МАІ. В МАІ є інший спосіб отримати пріоритети альтернатив, відомий як абсолютні вимірювання. Він включає попарні порівняння, але критеріям над альтернативами, що відомі як покриваючі критерії, приписуються інтенсивності, які можуть змінюватись за кількістю та типом. Вони, наприклад, можуть бути такими: висока, середня або низька; відмінна, дуже добра, добра, погана, дуже погана. Ці інтенсивності альтернатив порівнюються попарно, щоб отримати їх пріоритети (коефіцієнти вагомості), і далі вони зводяться до ідеального ви- гляду за допомогою діленій на найбільше значення. Остаточно кожній аль- тернативі приписується інтенсивність, що супроводжується її пріоритетом (рангом) за кожним критерієм. Пріоритет кожної альтернативи зважується (множиться) з пріоритетом 77
альтернативи відповідного критерію, результати згодом підсумовуються за всіма критеріями; у результаті озримуюгь остаточний ранг (рейтинг) цієї альтернативи у відносній шкалі [0.1]. Часто потрібно мати категорії рейтингів для альтернатив, які суттєво відрізняються одна від одної, щоб ек- сперт міг правильно ранжувати альтернативи. Рейтинги корисні, коли встановлені стандарти, яким альтернативи повинні відповідати. Вони корисні іакож, коли кількість альтернатив дуже велика, шоб виконати їх попарно порівняння за, кожним критерієм. У ньому випадку, якщо кількість критеріїв < С, то кількість операцій ранжування альтернатив становить Сп, тоді як ви- Сл(л-І) копання всіх попарних порівнянь включає операцій порівнянь. Від’ємні пріоритети в МЛІ. Якщо критерії, протилежні за змістом, на- приклад витрати (соки) та придбання (раіпх), вимірюються в однакових оди- ницях (за однією шкалою), то для оцінювання альтернативи за сукупністю таких критеріїв необхідно оцінку альтернативи за першим критерієм (сочіх) віднятті від оцінки за другим критерієм (£аіп«), а потім нормалізувати резуль- тати. Для цього слід знайти суму оцінок для всіх альтернатив за кожним із двох критеріїв, а потім відняти другу суму від першої. Далі приписуємо кожному критерію суму значень альтернатив за ним, поділену па абсолютне значення визначеної різниці. Зауважимо, що критерії нормалізуються відносно різниць, а не сум. Зважуємо критерії за пріоритетами і а додаємо результат, аналогічний відніманню другого значення для кожної .стьтернативи першої суми, і потім ш різниці ділимо на абсолютну суму. Зро- іумію, що цей процес потребує використання дислрибут ивпого, а не ідеального режиму. Вихідні значення є чисельниками двох середніх стовпців у табл. 2.10. Таблиця 2 10 Віднімання пріоритетів за однаковою інкалою вимірювань Альтернатам! Критерій Сі, нормалізована вага становить 10/4 Критерій Сі, нормалізована вага становить 14/4 Зважена різниця і ! Л, 3/10 8/14 -5/4 Аг 2/10 1/14 1/4 А у 5/10 5/14 0 78
З таблиці видно, що за відсутності спільної одиниці вимірювань незро- зуміло, як поєднувати додатні та від’ємні числа, що описують пріоритети. Так, наприклад, неможливо порівнювазм відносну важливість прибутків із відносною важливістю витрат. Один із способів, який обґрунтовано використовується в МАІ, замість від’ємних пріоритетів використати їх обернені значення, зважити і потім до- дати до інших додатних пріоритетів. Відомо, що ОПР (експерти) можут ь (на- ходити компроміс між прибутком альтернативи та витратами, але вони п< можугь зробити цього шляхом глобальних порівнянь. Вони роблять :іс відносно особистих (стратегічних) критеріїв і ранжуванням внеску прибулі ні та витрат у досягненні глобальної мети. Коли і декілька альтернатив, ОПР використовує для кожного з видів прибутків та витрат альтернативу з найбільшим складеним ідеальним пріоритетом. Можливо, що найкраща за рангом щодо прибутків альтернаїива відрі і- няється від альтернативи відносно витрат, але в будь-якому випадку ОІ1Р ви- користовує ідеальну альтернативу при ранжуванні за прибуїками та відповід ну ідеальну альтернативу при ранжуванні за видатками. У загальному випадку в багатьох задачах прийняття рішень розглядаю!ь чотири види цілей (критеріїв): прибутки (ЬепсЛік), можливості (орропшпііе.'.). витрати (сокі.я) та ризики (гізкк), які скорочено позначають як В(> СК ['»()] Перші два з них вигідні й тому додатні, а двоє інших невигідні й ті му від’ємні. Іноді обґрунтовано останні два критерії вважають додатними в си- туації, коли рішення вже прийнято (наприклад, купити автомашину і нарік :ь її виявляється низькою), якщо визначені нормалізовані обернені функції вт- рат, то ці критерії можуть розглядатися як додатковий прибуток, який зважується і додається до основного прибутку. Інший, більш точний, спосіб використання ВО СК - це усвідомити, що через нормалізацію головного власного вектора можна отримати безрозмірну множину чисел, що належать абсолютній шкалі. Добре відомо, що числа аб солютної шкали можуть бути як додатними, так і від'ємними, і тому зовсім не обов’язковою є вимога, щоб прибуток був додатним. 79
Є, принаймні, чотири методи комбінування пріоритетів ВО СВ з відпо- відними нормалізованими вагами, отриманими окремим ранжуванням В, по- тім С, далі О і нарешті В: СВ 2) ВВ + оО + сІ 1 | + г| 1 |; 3) ЬВ + оО + с(1-С) + г(1-В); 4) ЬВ + оО-сС-гВ. Ці чотири методи не завжди приводять до одного й того ж найкращого результату. Виникає питання, як інтерпретувати ці пріоритети та використати їх відповідним чином у різних ситуаціях. Перший метод (традиційний) - це компроміс, міра обміну між одиницею ВО (бажаного) проти одиниці СЯ (небажаного). Другий метод - це сума отриманих переваг, за умови, що дії з низькими значеннями втрат (менше лихо) розглядаються як позитивні. Третій метод більш оптимістичний і розглядає залишкову або допов- нюючу величину як позитивну. Четвертий метод просто віднімає зі зваженої суми «добре» зважену суму «погано» і може привести до від’ємних пріоритетів. Запитання для самоконтролю І. Назвіть основні принципи системного підходу, на яких грунтується система ЕО. 2. Назвіть основні етапи ЕО й дайте їм коротку характеристику. 3. Що таке пікала вимірювання? Назвіть типи шкал вимірювання. 4 Опишіть бінарні відношення та їх властивості. 5. Наведіть класификацію задач ЕО 6. Вкажіть цілі ЕО. 7. Як формулюється задача знаходження результуючого ранжування об'єктів за індивідуальним ранжуванням? 8. Наведіть основні метрики для вимірювання відстані між ранжуваннями експертів. 9. Що таке медіана Кемені-Снела? 10. Сформулюйте задачу знаходження строго результуючого ранжування об'єктів. 80
11. Сформулюйте задачу визначення колективного ранжування об’єктів як задачу бкгиокритеріальної оптимізації 12. Наведіть алгоритм відсіювання недопустимих альтернатив та пошуку строї оі о рискування. 13. Сформулюйте задачу нестрогого ранжування об’єктів за матрицями індивідуа- льних відношень об'єктів окремих експертів. 14. Опишіть алгоритм методу ПАВ для знаходження результуючого нестрогого ра- ижування об'єктів. 15. Назвіть основні етапи МАІ. 16. Які основні ідеї та алгоритм МПП? 17. Яка шкала оцінювання використовується в МІНІ? 18. Що таке ступінь неузгодженості оцінок експерта в МПП? 19. Що таке дистрибутивний режим МАІ? 20. Що таке від’ємні пріоритети та як їх враховувати в МАІ? Опишіть суть основ- них методів використання чотирьох типів критеріїв: прибутки, можливості, витрати та ризики (ВО СК) в МАІ. 81
3. ПРИЙНЯТТЯ РІШЕНЬ В УМОВАХ ДІЇ ВИПАДКОВИХ ФАКТОРІВ 3.1. Загальна характеристика задач прийняття рішень в умовах дії випадкових факторів Широкий клас задач становлять задачі прийняття рішень в умовах дії випадкових факторів, які треба враховувати у відповідних математичних мо- делях. Дія розв’язання цих задач використовують методи стохастичного програмування. Розглянемо типову задачу прийняття рішень, яка описується такою мо- деллю: знайти такий вектор X, для якого /(Х)->тіп за обмежень £,(Х)<0, і=1,т, ХєХ. Задачі стохастичного програмування використовують у випадках, колі функції /(х), £,(х) залежать також і від випадкових параметрів ю, при цьому припускається, що <л є елементом простору станів природи (або про- стору випадкових параметрів) О. Тоді задачу стохастичного програмуванні можна сформулювати так [25; 26]: мінімізувати /(Х.ш) заобмежеиь £,(Х, о>)<0, г = 1,ти, ХєХ. Постановка задач стохастичного програмування суттєво залежить від того, чи є можливість, обираючи рішення, уточнити деякі спостереженні станів природи ш, чи її немає. Залежно від цього розрізняють задачі опера- тивного і перспективного стохастичного програмування [17]. У задачах оперативного стохастичного програмування рішення прий- мають після деякого експерименту над станом природи ш, воно залежить від результатів експерименту і є випадковим вектором Х( ш). Подібні задачі виникають, наприклад, в оперативному плануванні, управлінні виробниц- твом у режимі реального часу, медичній діагностиці. 82
У задачах перспективного стохастичного програмування рішення х при- ймається до проведення деяких спостережень за станом природи і тому є де- термінованим. Такі задачі розв’язують у перспективному техніко- економічному плануванні, під час проектування, якщо параметри системи мають бути обрані конкретними детермінованими величинами, розраховани- ми на визначений діапазон можливих збурень. Задачі стохастичного програмування звичайно задаються в одній із та- ких форм: Лї-модсль: мінімізувати Л/.{/(Х,ш)}=Р(Х) (3.1) за обмежень Л/.{#,(Х,ш)}= С,(Х)<О, і=1,т, ХєХ, (3.2) де М. - операція математичного сподівання; Р-модель: мінімізувати Р{/(Х,<о)>п} (3.3) за обмежень р{§,(Х, (і))<о}>р,, і=1,т, (3.4) де а, р, - задані константи; Р- імовірність відповідної події. Можливі й певні комбінації задач (3.1), (3.2) та (3.3), (3.4): наприклад, знайти мінімум (3.1) за обмежень (3.4), або Мінімум (3.3) за обмежень (3.2). Незважаючи на відмінність у постановці задач (3.1), (3.2) та (3.3), (3.4), їх можна звести до деякої загальної форми, наприклад до вигляду (3.1), (3.2). Для цього треба ввести характеристичні функції: А0(Х,ш)= й,(Х,со)= 1, якщо/( Х,ш) £ а; 0 в іншому випадку; 1, якщо&Д Х,о>)<0; 0 в іншому випадку. для яких Л/.{л0(Х,со)}= Р{/(Х,<о)>а}; А/.{л,(Х, <о)} = р{$,(Х, <о)<о} 83
Задача (3.3), (3.4) тоді набуває такого вигляду: мінімізувати Л/.{Л0(Х, <о)} за обмежень Л/,{л,(Х, і=1,т. Є два основні підходи до розв’язання задач стохастичного програмування: 1) непрямі методи, які полягають у визначенні функцій Г(х), С,(X) й розв'язанні еквівалентної задачі НП вигляду (3.1), (3.2); 2) прямі методи стохастичного програмування, основані на інформації про значення функцій /(X, “)> £,(х- ін), яку отримують у результаті проведення експериментів. 3.2. Одноетапні задачі стохастичного програмування До одностайних задач стохастичного програмування належать задачі, в яких рішення приймаються на підставі відомих сгохастичних характеристик розподілу випадкових параметрів умов задачі до спостережень за їх реалізацією, при цьому має прийматися найкраще в серсдньостатистичному розумінні рішення. Постановки задач стохастичного програмування розрізняються за таки- ми ознаками: 1) характером рішень; 2) вибором показника якості рішення (критерію); 3) способом дскомпозиції обмежень задачі. Обмеження на вигляд функції. У задачі стохастичного програмування звичайно обирають такі функціонали, як математичне сподівання або дис- персія ЦФ, або ймовірність перевищення ЦФ деякого порога. Задачі з ЦФ вигляду Л/{с7х} називають Л/-модслями, задачі, в яких треба мінімізувати дисперсію Л/|(сг х-сг х )2 ), називають К-модслями, а стохастичні задачі, в яких максимізусться імовірність Р{сг х £ сг х ~ Аг0}, називають Р-моделями [25]. До останньої групи моделей належать і задачі, де треба мінімізувати поріг к, який не може бути перевищений із заданою ймовірністю а. наприк- лад: мінімізувати к за обмеження Р{сгх<А:}=а. 84
Обмеження можуть мати одну з таких форм: а) ачхі - а<> ,=Ь 2, - т; 0 < а < 1; (3.5) б) Р{Ах < В} 2 а, 0 < а < 1; (3.6) в) Р) £ а),і х> - ‘‘є ґ^а» > 0 < а,< 1; к= 1,К. (3.7) Розглянемо деякі варіанти моделей одностайних задач стохастичного програмування. Модель 1. Нехай задано задачу лінійного стохастичного програмування з імовірнісними обмеженнями типу (3.5): максимізувати м{сгх} (3.8) за обмежень Р< £ аих,-^і ґ-а«> ,= (3.9) ху >0, у=1,и. (3.10) Для детермінованої матриці А=а1( і випадкового вектора Ь = (/>,) зада- ча (3.8)-(3.10) зводиться до еквівалентної детермінованої задачі ЛП таким чином. Нехай Р(б,, Ь2, .... 6. ) - сумісна щільність розподілу складових Ь, ви- падкового вектора Ь. Знайдемо щільність розподілу Ь,: Р(&,) = ]...]р(й,, Ь2,..., 6. рб, ЛЬ2... (ІЬ^ с!Ьм... Обчислимо Ь, з рівняння р(ь,)сі Ь^а,, і = \,т. (3.11) Якщо розв’язок рівняння (3.11) не єдиний, то як Ь, оберемо найбільший корінь. Очевидно, що при цьому умови (3.9) еквівалентні нерівностям
де />, задовольняє співвідношення (3.11). Звідси випливає, що задачами сто- хастичного програмування (3.8)-(3.1О) буде еквівалентна така детермінована задача ЛП: т с х->тах за обмежень Е Ь, , і = 1,т, х>> 0, де с= Л/{ с}; Ь, - корінь рівняння р(б,) = 1-а,, або Ь, = Е 1 (1 - а,); Е\ (6, ) - функція розподілу випадкової величини ЬІ. Для стохастичної задачі (3.8)-(3.10) з детермінованою матрицею А можна записати двоїсту задачу з імовірнісними обмеженнями. Розглянемо задачу Ьгу—>тіп (3.12) за обмежень Р(Агу>с)^р, (3.13) у > 0. (3.14) Її розв’язок визначається у вигляді детермінованого вектора. Нехай С/ (Е,) - функція розподілу випадкового коефіцієнта С) функції (3.8), тобто 6 ($)=Р{С, < і;}. Якщо <7у(О = Р, , то запис Е, = С~' (Р; ) еквівалентний запису Е, = тіп{у|Оу(у ) > Ру}. Задачу (3.12)-(3.14) можна записати у вигляді Ьгу->шіп за обмежень Агу £ С ’(р), у>0. Порівнявши цю задачу з вихідною (3.8)-(3.1О), можна переконатися, що за р = С/(с) такі дві одностайні задачі стохастичного програмування з імовірнісними обмеженнями являють собою двоїсту пару: С 1 (р )х—>тах, Р{ Ах< Ь} а, і 0; Р 1 (1-а )у->шіп, р{Агу£ с}> р , ¥>0. 86
Модель 2. Розглянемо тепер більш загальний випадок задачі (3.8-(3.9), коли А - випадкова матриця. Нехай елементи матриці А та складові вектора Ь - незалежні між собою нормально розподілені випадкові величини: а,уєЛг(а(у,а2у), 8,єЛг(8,,02), тобто ач - випадкова нормально розподілена величина з математичним сподіванням ач та дисперсією сг2,. Крім того, припустимо, що в умовах (3.9) а, £ 0,5, і = 1,т. Покажемо, що за таких припущень стохастична задача (3.8)-(3.10) іво- диться до детермінованої задачі опуклого програмування з лінійною цільо- вою функцією та квадратичними обмеженнями. Справді, за згаданих припущень нев’язка і -ї умови випадкова величи- на 8,(х)=£ ач х) -Ь, - є нормально розподіленою величиною з математич- ним сподіванням 8,(х)=Хаоху- Ь, 7-І та дисперсією 7-і тобто б,(х)є л^(8,(х), а2(х)) Тоді умови Р< £ ач х} <ЬІ >>а| еквівалентні нерівностям р{б,(х) < о}> а,, і = 1,т, (3.15) або (що те саме) 1 °ґ ( Лехр 2ла,(х) • (б,-8, (х ))* 2а,2(х) б/8, > а,, і = І.т. (3.16) О Г Е М X 1 Зробимо заміну змінних с, = , і позначивши Ф(і) = .— а,(х) ^2 я нерівність (3.16) зведемо до вигляду ф _Б‘(Х) >а , і м*); /е 2б/Е„ — X ЗВІДКИ 5,(х) + Ф '(а, )ст,(х) < 0. 87
Враховуючи вирази для 8, (х ), а, (х), остаточно отримаємо Ф '(а< )| X стох>’+в?) і = \,т- (3-17) Згідно з припущенням а ,£0,5, тому Ф'(а,)£ 0 і можна переконати- ся, що область, яка визначається умовами (3.17), опукла. Якщо ж обмеження задачі стохастичного програмування (3.9) має про- тилежний знак: р| £ а1у £А, ^£ а, , і = 1,тп, (3.18) то можна легко показати, що якщо ввести змінні 8,(х )=А, ачхі й по- /-1 вторити викладки починаючи від нерівностей (3.15), то детермінованим еквівалентом обмеження (3.18) буде 1 £ аи х) ~Ф(а, х* + 0’ £ А,, і = 1,т. Модель 3. Розглянемо більш загальний випадок, коли випадкові елемен- ти рядка і -го обмеження {а,у } корсльовані між собою та з елементом Ь,. Введемо такі позначення: уо= м{(ь>~ уо»= м{(а<)- ач )(°м- «.»)}• Тоді, розмірковуючи як вище, дістанемо І Ф‘~ 22>,,х,+О,2] <Ь,. (3.19) Якщо матриця У,= у,у4 і, к = 1,л додатно визначена й а, £ 0,5, і = 1,т, то допустима множина розв’язків, що задається (3.19), буде опуклою. Отже, за прийнятих вище припущень стохастична задача (3.8)—(3.10) прийняття рішень з імовірнісними обмеженнями зводиться до детермінованої задачі опуклого програмування вигляду £с,ху->тах >-і за обмежень 88
+ф ’(аД °<2 Г-І У ! » > ) Модель 4. Розглянемо задачу стохастичного програмування, задану моделлю: - мінімізувати к за обмежень = а (3.20) Вважатимемо, що випадкові коефіцієнти с,, 7 - 1,и розподілені нормаль- но із математичним сподіванням с) та кореляційною матрицею С= сгу , де )| За таких припущень лінійна форма сгх = £ с/х, с,у=Л/Нс, розподілена з математичним сподіванням сгі та дисперсією £ £ є хі х . г-1 /-1 Тому співвідношення (3.20) можна записати у вигляді Ф к-±с, = а (321) Звідси випливає, що мінімізація к за умови (3.20) еквівалентна мнимі ганії Якщо а > 0,5, то Л(х) являє собою опуклу вниз функцію за «мінними і Таким чином, за зроблених припущень задачі стохастичного нроірамунання вигляду мінімізувати к за обмежень (3.22) <х (3.23) і - 1, т (3.24) відповідає такий детермінований еквівалент: х, х) —>шіп 89
за обмежень ф '(а.)[ЕХ V,1x|+ Є,’у <.Ь-^аІ)Х), і = 1,т. Задача (3.23), (3.24) являє собою задачу опуклого програмування, для її розв’язання можна застосувати теорему Куна-Таккера або використати один із варіантів мегоду можливих напрямів та інші методи НП [25]. Приклад 3.1. Нехай велика свиноферма має можливість купувати від одною до чотирьох різних видів зерна та готувати з них різні види сумішей. Різні зернові культури містять різну кількість необхідних компонентів. При- пустимо, що для розрахунку беруть чотири компоненти: А, В, С, £> . Вихідні дані цієї задачі наведено в табл. 3.1. Нехай фермер встановив, що комбікорм для свиней повинен задовольняти деякі мінімальні потреби з точки зору його споживності. їх наведено в табл. 3.1. Нехай питомі витрати на закупівлю одиниці маси зерна видів 1, 2 та 3 дорівнюють відповідно 41,35 та 96 умовним грошовим одиницям на 1 кг зерна. Треба визначити, яка з можливих сумішей, що задовольняють потреби споживності, найдешевша. Таблиця 3.1 Інгредієнти у складі суміші Вміст Інгредієнт» в одвнвці зерна виду Мінімальні потреби ив період 1 2 3 А 2 3 7 > 1250 В 1 1 0 >250 С 5 3 6 >900 О 0,6 0,25 1 > 232,5 Позначимо через х,, х2, х, шукану кількість зерна кожного виду. Тоді треба знайти такі х,, х2, х,, для яких 41х, + 35х2 + 96х, —>тіп (3.25) за обмежень: - інгредієнт А: 2х, +3х2 +7 х, >1250; - інгредієнт В: 1 х, +1 х 2 > 250; - інгредієнт С: 5х,+Зх.>900; - інгредієнт £): 0,6х, +0,25х2 +1х, >235,5. 90
Припустимо, що мінімальні сумарні потреби в компонентах А, В, С, О є випадковими величинами а,Ь,с,сі, що розподілені рівномірно в інтерва- лах [1000, 1500], [200, 300], [500, 1000], [150, 250] відповідно. Побудуємо відповідну мінімізаційну модель, яка забезпечила б мінімальні потреби в усіх компонентах з імовірністю не меншою, ніж 0,80. Відповідні детерміновані еквіваленти імовірнісних обмежень матимуть вигляд 2Х] + Зх2 + 7х3 >в] =1400; 1X1+1X2^=280; (3.26) 5Х| + Зх22с1=900; 0,6х( +0,25х2 +1х3г</1 = 230, де аІ - відповідне значення випадкової величини а, яке задовольняє умову } = а = 0,80, звідки а1 = 1400. Аналогічно знаходять значення Ь, с, сі. Далі розв’язують детерміновану еквівалентну задачу ЛП (3.25), (3.26), її оптимальний розв’язок такий: х° - 162,5; х“ = 177,5; х° = 103,5, а відповідні мінімальні витрати становлять 20,693. Приклад 3.2. Для виготовлення визначеного сплаву із свинцю, цинку н олова використовують сировину у вигляді п’яти сплавів із цих металів, які відрізняються складом і вартістю 1 кг. Припустимо, що процентний склад металу у в кожній сировині і є випадковою величиною, рівномірно розподіленою в інтервалі Початкові дані наведено в табл. 3.2 та 3.3. Потрібноно визначити: а) скільки сировини кожного типу слід узяти, щоб виготовити з мініма- льною собівартістю сплав, який міститиме не менше 20 % свинцю, 30 % цин- ку і 40 % олова; б) вирішити цю задачу за умови, що з імовірністю 0,9 сплав буде умі- щувати олова не менш 40 %, а цинку не менше 20 %. Таблиця 3.2 Матеріал > Місткість металу в сировині і, % і-1 і-2 і-3 і-4 і = 5 а, ь9 Ь, ь. а» а9 6, і Свинець 10 20 10 20 зо 50 зо 60 20 40 . Цинк 5 15 20 50 40 60 20 40 10 ЗО Олово 60 80 40 60 15 25 10 20 20 50 91
Таблиця 3.3 І і 1 2 3 4 5 1 С‘ * 6 8 7 Розв’язок. Складемо математичну модель цієї задачі. Позначимо через х, масу сировини і-го типу, через а* - уміст металу / в сировині і (%), а через - бажаний вміст металу і у сплаві (%), сІ - вартість 1 кг сировини і. Запишемо математичну модель цієї задачі: тіпЛ/|^С,х,| (3.27) за обмежень > А,} > 0,75, у = 1,.... 3; (3.28) £х,=1; (3.29) х,>0, і = 1,..„ 5. (3.30) Обмеження (3.28) необхідно ввести, оскільки ~ це маса металу і у сплаві (кг), а Ь вимірюють у відсотках. Складемо детермінований еквівалент задачі (3.27}~(3.30). Оскільки чис- 5 ло доданків а>хІ в обмеженні (3.28) п = 5, то сума розподілена при- З 5 близно нормально з середнім 22р,х, і дисперсією ^а\х,2. Використовуючи формулу (3.20)-(3.24), запишемо детермінований еквівалент задачі: тіп А/^ С,хі | за обмежень Імгх,-Ф'(0,75/2: о’гх’,) У = 1—.3; 1-І \ 1-І 7 22х,=1, х, >0, і = 1,...,5; 1-І 12 ’ 2 92
Підставляючи дані з табл. 3.2 і 3.3, отримаємо модель цієї задачі: тіп(4х, + 5х2 + 6х, + 8х. + 7х,) за умов: 15х, + 15х, + 40х + 45х + ЗОх, - Ф ’(0,75)| 25 х,2 + 25 х2 + 100х2 + 75х2 + 100 х2 | 2 20; 1 2 ’ ’ Д З З З * 3 ІОх, +35х, + 50х, + ЗОх. + 20х, - Ф 1 (0,75)^25 х2 + 75х' + 1 °° х,2 + ’®° х2 + *°° х2) > ЗО; 70х + 50х. +1 Ох, +15х + 35х, - Ф ‘ (0,75)ґ1 °° х,2 + ’ °° х2 + 25 х! + 25 х2 + 75х2) > 40. 1 2 ’ ’ \ 3 1 3 2 3 ’ 3 ) X, +Х, + X, + X. + X, = 1, х, £0, » = !,..., 5. 3.3. Двохетапні задачі стохастичного програмування Постановка двохетапної задачі. Під час дослідженя багатьох задач планування та керування в умовах дії випадкових збурень можна і доцільно процес прийняття рішень розподілити на два етапи. На першому етапі вибирають попередній план, який дає змоіу провести підготовчі роботи. На другому етапі виконують компенсацію нев’язок, вияв- лених після спостереження реалізованих значень випадкових параметрів умов задачі. Зрозуміло, що попередній план і план-компенсація мають бути узгоджені так, щоб забезпечити мінімум середнього значення сумарних ви- трат, які виникають на обох етапах розв’язання задачі. У розв’язній задачі вибір попереднього плану має гарантувати існування плану-компенсащї. Розглянемо таку задачу: мінімізувати сгх (3.31) за обмежень Ах = В; (3.32) АІІ‘х = В("; (3.33) х>0, (3.34) де сг=[с/],/=1,л; А= а,, , і=1,/и, у=1,л; А(,’= а,' ,к=1,т. 93
Припустимо, що елементи матриці А = А(ю) і векторів В=В(ш), С=С(о>) - випадкові величини, які залежать від реалізації деякої випадкової події <о, а рішення х треба приймати до спостереження випадкових пара- метрів а(ш), В(ш), С(о>). Уявімо процес розв’язання задачі (3.31)-(3.34) таким чином. Виберемо спочатку (на першому етапі) вектор х, іцо задовольняє умови (3.33), (3.34). Далі зафіксуємо реалізацію й випадкової події та відповідні їй значення Л(й), В(й), оцінимо нев’язку В(ш)-А(<о)х в умовах (3.32) й обчислимо вектор у^о, який компенсує нев’язку відповідно до співвідношення Ву = В(й) - А(ш)х, де В = (і:І , і = \,т, І = 1,п - матриця компенсації. У загальному випадку елементи В - випадкові. Якщо задачу (3.31 )-(3.34) інтерпретувати в термінах планування виробництва й А - матриця основних технологічних способів ви- робшщгва, то В інтерпретується як матриця аварійних технологічних способів, які визначають можливі шляхи компенсації виявлених нев’язок. За порушення умов задачі встановлюється штраф, що залежить від зна- чення складових вектора у, що компенсує нев’язки. Характеризуватимемо штраф величиною дгу, причому в загальному випадку д - випадковий л,- вимірний вектор, д > 0. Вектор у можна вибрати багатьма способами. Зазвичай його вибирають таким чином, щоб забезпечити мінімальний очікуваний штраф за компенсацію умов задачі, які визначаються попереднім планом х. Інакше ка- жучи, на другому етапі розв’язується така задача [25]: мінімізувати дгу (3.35) за обмежень Ву = В - Ах, (3.36) у>0. (3.37) 94
Обидва етапи можна звести в один, тоді можна визначити таку модель двохетапної задачі стохастичного протрамування [25]: тіп М_ |сг (о> )х + тіп[чг (а> ),]} (З.ЗКІ за обмежень А'”х = В,І>; (3.39) В(ю)у = В(ш)-А(ю)х; (3.40) х > 0, у > 0. (3.41) Отже, розв’язок двохетапної стохастичної задачі складається з двох векторів: детермінованого п-вимірного вектора х, який визначає попередній план, і випадкового п,-вимірного вектора у (єо), який визначає илан-компен- сацію. Для розв’язання задачі достатньо обчислити оптимальний попередній план х. Після реалізації випадкової події пі (тобто після реалізації випадко- вих параметрів умов задачі) відповідна реалізація оптимального плану- компенсації обчислюється як розв’язок задачі ЛП (3.35)-(3.37). Витрати на план-компенсацію мають бути найменшими, тому доцільно для перспективного планування (двохетапної схеми) використати малочут- ливі до варіації параметрів умови задачі. Визначення планів першого етапу. Розглянемо множину попередніх планів х двохетапної задачі. Нехай х - вектор, який задовольняє обмеження задачі (3.38)-(3.4О). У за- гальному випадку, коли матрицю компенсації В задано довільно, немає гарантії, іцо не існує такої реалізації й>, д ля якої система В(й)у=В(й)-а(сІ))х, у>0 не матиме розв’язку. У цьому разі неможливо ліквідувати нев’язку, що ви- никла, за допомогою вектора компенсації у. Для того, щоб вектор х був до- пустимим планом двохетапної задачі, необхідно, щоб для всіх о>єО існував вектор у такий, що В(со)у = В(а>)-А(<о)х. Такі неявно задані обмеження на вибір вектора у називають індукова- ними (або наведеними) [25]. Умови (3.39), (3.41) називають фіксованими. 95
Позначимо множину векторів х, яка визначається фіксованими обме- женнями, через Л,, а індукованими - через К2, тобто Л1={х:А<І'х=В<1>; х>0}; /?2={х:У (шєП)Зу > 0, Ю(<о)у = В(<о)-А(ш)х}. Тоді область визначення вектора х задається множиною К = Розглянемо випадок, коли матриця В детермінована. Встановимо достатні умови того, що Л2 = £‘”, де £*"’ - л-вимірний евклідів простір, тобто дос- татні умови того, що множина планів задачі другого етапу непорожня. Вони формулюються в і акііі теоремі [25]. Теорема 3.1. Для того, щоб К2 = Е'"\ достатнє виконання таких умов: 1) матриця компенсації В розмірністю [шхл,] мас ранг т(т<п,); 2) існує невід 'ємний разе ’язок системи В г = 0, причому 2у>0 за )=\,т. (3.42) Перевірка умови (3.42) досить складна, однак в окремих випадках ці умови можуть бути конструктивними. Нехай, наприклад, л, = т + 1, тоді умова (3.42) матиме вигляд 2, 2..,. (3.43) і-> Згідно з першою умовою теореми 3.1 перші т стовпців Ь; матриці В лінійно незалежні, й тому 2.., *0. Відповідно до другої умови маємо 2ж| >0. Отже, співвідношення (3.43) матиме вигляд -ь 7-І 2 Якщо ВСІ І = 7 0 7 2 . іи+1 у = 1,т, то К2=К{"}. Отже, теорема 3.1 справед- лива. Справедливе також і таке твердження: множина К, попередніх планів двохетапної задачі опукла. 96
Умови розв’язності задачі другого етану. Запишемо задачу (3.38} (3.41) у такому вигляді: - мінімізувати Л/. {сх + Р(х, А,В)} (3.44) за обмежень А‘"х = В(І’, (3.45) х^О, (3.46) де /*(х,А,В) = тіпдг у; (3.47) Оу=В-Ах; (3.48) у^О. (3.49) Умови розв’язності задачі другого етапу (3.47)43.49) формулюються так [57]. Теорема 3.2. Для розв'язності задачі другого етапу за будь-яких реалізацій А(ш),В(ш) і будь-якого попереднього плану х необхідно, щоб система нерівностей Ог 2<д, була розв ’язна. Доведення. За умовою множина планів задачі (3.47)-(3.49) непорож- ня. Згідно з теоремою двоїстості функція ЛП, Р(х,А,В), обмежена знизу тоді й тільки тоді, коли область визначення планів двоїстої задачі для кожно- го х, А та В @(х,А,В) = тахгг(В-Ах) (3.50) за обмеження Пгг^д, (3.51) є непорожньою. Оскільки область визначення задачі (3.50), (3.51) не залежить від А, В, х, то якщо виконується умова (3.51), задача другого етапу розв’язна для всіх А, В, х, коли ж вона не виконується, то задача не має розв’язків за жодних значень цих змінних. 97
Еквівалентна детермінована задача. Побудуємо детермінований екві- валент двохетапної задачі стохастичного програмування. Її розв’язком є по- передній план х. За компонентами оптимального попереднього плану х та реалізації параметрів умов задачі ь> будується задача другого етапу - задача ЛП, розв’язок якої визначає необхідну компенсацію плану. Еквівалентна детермінована задача має вигляд тіпО(х). ж*Я Дослідимо функціонал С(х) - показник якості попереднього плану. Ви- разимо С(х) через статистичні характеристики параметрів умов задачі та доведемо, що детермінована задача, еквівалентна задачі стохастичного про- грамування, є задачею опуклого програмування. Розглянемо задачу другого етапу (3.47)-(3.49) та двоїсту до неї задачу (3.50), (3.51) для кожного А, В, х. Припустимо, що задача другого етану за двоїста до неї розв’язні. Згідно з теоремою 2.5 двоїстості для задач ЛП із [25] маємо Р(х,А,В)= 0(х,А,В) = 2'г(а,х,В)(В - Ах), де г'(А,х,В) - оптимальний розв’язок задачі (3.50), (3.51), який залежнії від параметрів А, В, х. Враховуючи ці позначення, двохетапну задачу можна записали так: тіпО(х) = тіп{сгх + Л/ір(х,А,В)}, (3.52) або тіп{сг х + М{г'т (В - Ах)}}. Детермінована задача (3.52), еквівалентна двохетапній задачі (3.44)- (3.49), є задачею опуклого програмування. Деякі окремі постановки двохезапної задачі. У загальному випадку відшукування точного розв’язку детермінованого еквівалента двохетапної задачі викликає великі труднощі, тому розв’язок шукають наближено. Однак в окремих випадках ця задача суттєво спрощується й її можна розв’язати класичними методами лінійного та опуклого програмування. 98
Розглянемо такі випадки [25]. Візьмемо двохетапну задачу, в якій випадковим є тільки вектор обме- жень Ь(ю), а матрицю компенсації О після відповідної перестановки рядків та стовпців можна записати у вигляді В = [Е,-Е], деЕ одинична матриця розмірністю [лхл]. Аналогічним чином розіб’ємо вектори у та д на дві частини: [у, ,у . ] та [ч,,Ч2 ], які відповідають матрицям Е та -Е. Тоді задача (3.38) (3.41) мати- ме вигляд = сг х + Л/Р(х,Ь )->шіп за обмежень А‘"х = В"’, х > 0, де Р(х,Ь)= тіп(д[у,+ д2у2) (3.53) за обмежень у,- у2 = Ь(о>)-Ах; (3.54) У,£О,у2£О, (3.55) Де у, , у2 , ч>» Чз - п -вимірні вектори. Очевидно, що задача (3.55) другого етапу має плани за довільної реалізації о> і за будь-якого попереднього плану х,тобто К2 =/?“’ 1/? = /?!= |х:Л<І*х=Ь(п, х > о|. Необхідна та достатня умови існування скінченного розв’язку задачі другого етапу в цьому разі матиме такий простий вигляд. Як відомо, у за- гальному випадку цю умову записують у вигляді Вгг < д, тоді {г: [Е,- £^2^4} = {2:-д22 <д, }. Оскільки д, > 0,д2 > 0, то ця умова виконується завжди. Задачу, двоїсту до (3.53)-(3.55), запишемо так: С(х,Ь ) = тах2г (Ь - Ах ) (3.56) 99
за обмежень -Ч2£ і £Ч1. Задачу (3.56) легко розв’язати: е(і.ь) = іе,(х4 1-1 де ЬІ-Хачхі 9„ .жпио/>,-Х а х і 0; /-1 ) /«1 о„х . к2< в іншому випадку. /-і ) (3.57) Тому еквівалентну опуклу задачу для двохетапної стохастичної задачі (3.53)-(3.55) запишемо так: за обмежень сг х + Л/^£ £>, (х,6, А"*х =В"’, х £ 0, ->тіп (3.58) (3.59) (3.60) де С(хД ) визначаються зі співвідношень (3.57). Наведемо ще одну форму запису задачі (3.58Н3.60). Введемо позначення: Ах =ЛУ; (Ах), = Т,ачх> = 7-І Л/С(х,ь)= Л/[їс.(х,6,)1= ЛСЄ,(М.)=ІЄ(к). (3-61) Зазначимо, що функції &,(&,) так само, як і СДИ',,6, ), опуклі за ї¥,. Двохетапна стохастична задача в цій найпростішій постановці зводиться, та- ким чином, до задачі опуклого програмування: сГ«+ЕЄ<(и;)-мпіп (3.62) 1-1 за обмежень А(І)х = В(1>, (3.63) Ах = и\ (3.64) х^О. (3.65) 100
Дослідимо функції £7, (йИ, )• ДЛЯ ЦЬОГО позначимо через 6,, у, відповідні точні верхню та нижню межі випадкової величини Ь, (то) через Ь=[А|, Ь2,Ьт МЬ - математичне сподівання вектора обмежень, а че- рез Г, (А,) - функцію розподілу компонент А, ( (і) ). Розіб’ємо множину зна- чень IV, на три області: (- <ю; у, ),[у(, 5,} (6,, °о). Якщо А, (о) не має нижньої межі (відповідно й верхньої), то покладемо у, =-оо(й(=оо). Обчислимо значення £?, (И7,) у кожній з цих областей. Використовуючи вираз (3.57), отримаємо Є,(^,)=л/{Є1(и/(Л)} = =~ч'2\ _ ^+ч'\ Vй' ~ )= = )-(<?.“’+ 9"’) /(А, - Н^Г.М П *,«г, Звідси 0,(и',) = )-(9;“+^"’) |(л,-^)б/г,(й,). (3.66) Розглянемо три випадки. 1. Нехай ЇР, < у,, тоді { А,: А, £ Ї7, | =0 із виразу (3.66) дістанемо Є,(И'1)=9)‘,,(А1-И'.)- 2. Нехай IV,є[у,,5, ], тоді функцію £2І(И'', ) на ньому проміжку вира- жають співвідношенням Є,->Г,і (Ь.-И'. ). г. 3. Нехай ІУ, > 6,, у цьому випадку множина {А, :А, } збігається з усією збластю зміни А, (<о ), тобто О, і тому |(А,(ю)- И,()«/^1(А()= |(А,(ш) - ЇУ,УГ,{Ь, )= Ь- \У,. *,4Г, п 101
Тоді функція £2, (Н",) на інтервалі (б, ,<ю) має вигляд с.(и,1) = б, )=-<?,І2,(й,- Отже, функція 0,(^,) неперервна та опукла иа всій числовій осі. За деяких спеціальних розподілів компонеиг вектора />(о>) двохетапну гадачу можна звести до стандартних задач ЛП або опуклого програмуванні Розглянемо такі випадки [25]. Приклад 3.3. Нехай компоненти А, (<о) розподілені рівномірно на відрізку [у,,б, ]. Тоді 'ММ- 0, якщо Ь, < у і; / \ 1 , якщо у , < Ь,< б,, (1ЕІ І), )= (іВ,; б, —у, ' &і~Уі 1, якщо А, >5,. Припустимо, що ^є[у,,б,], тоді е.к,)= Ч‘"(ь, - (Р.) 4- (?,“’+ ч'.1') і ь,)аг(ь,)= *,4Г, = ч!"(ь-г)+(ч‘;' + ч:2> )]/"*</*>. / о, - у, Враховуючи, що 1 а о, — 6, - у, 8, - у і інримуємо С.(^,)= 7,"’(8 )(^.-У.)2 Тоді двохетапна задача стохастичного програмування (3.62)-<3.65) зво- диться до гакої задачі квадратичного програмування [1Я]: £ с. х, +Х Ч\' (/>, - И’, ) + X Ч' \4' - У, )’-» тіп (3.67) ;-і 1-І і-] 2 «а умови 102
Л<,)х=Ь"), або 7-І (Лх),= І = 1»«; 7-1 0 , у = 1,л. Приклад 3.4. Нехай всі компоненти Ь, вектора Л(со) розподілені експоненціально, тобто 0, якщо Ь{< у,; РМ= Х Г /а Я «. Г 1 (3’68) 1 - ехр[-Гі(*і- Уі ^.якщой.є [у,,00 б ар,(ь,)=-к,е^"}аь,. У такому випадку згідно з формулою (3.68) отримаємо /(*,- )ар(ь,) = х, І(ь,- (V, )е ^, Гі}аь,. (3.69) *.ї Г, т, Інтегруючи вираз (3.69) частинами, після нескладних перетворень ді- станемо х, І(ьІ-»гІ)е х*^* Г,^аьі=(яг1- ь^е х'(6' т')- 1 е т,)|’г' = ті Х' 'г< (3.70) 1 1_е-м^ц((Ггї(). Підставляючи вираз (3.70) у (3.66) і враховуючи, що Ь, = У.+ 1 К,' знаходимо с.(ш, ) = дУ(Ь,-) - (91“>+ 9!» [1 - еу, )] = = 9.,П[ Г. + / - ] + (9.<,,+ 9!‘} У, ) - Ч‘^Ч‘} [1 - е ] = 103
Отже, двохетапна задача стохастичного програмування зводиться до та- кої задачі опуклого програмування: Е + (^-Г. І-Е , 1-е ' 1 + -^тш /=1 ї=1 і=1 А./ |_ К, за обмежень (3.63), (3.64). У випадку, коли можна вважати, що « = Ь,, розклавши функцію [1-е' к‘(г‘~Т| * ] у ряд Тейлора, отримаємо І «!"(»'. -)+і+ ’•-(»', -»,)'+ 7-І 1-І 1-1 / Отже, ця задача зводиться до задачі квадратичного програмування. Приклад 3.5. Розглянемо випадок скінченного числа реалізацій випад- кового вектора Ь(ю). Нехай складові 6, вектора Ь(ю) можуть набувати значень Ь**< Ь{2) <...< 6}*’ з імовірностями Р/”, Р,т,..., Р/“. Із формули (3.61) випливає, що у разі дискретного розподілу випадкової величини Ь, (ш) функції є кусково-лінійними функціями змінних со,. Введення до- даткових змінних та обмежень дає змогу звести опуклу кусково-лінійну зада- чу до задачі ЛП. Позначимо ^(,)=ЕрЛ)=р{6і<6і(,)}; р/*'+,)= 1;Р,(,)= Р{б,< і}0} = 0; *і=Л/{6,}= Е^Р^. Г = 1 Введемо змінні ІГ/”, г = 1, 2,.... к, + 1, які задовольняють такі умови: Е Г/г)= І?,; £ Ь}1>= <1^; 0 £ ІГ/'Ч ЬІГ)- Ь}г~"= <1}г\ г = 1,2,..., *, + 1; 104
У цьому випадку в, к) = ?Г’ (*. - г,) - (< + <?!2> )4 - IV, ^г, (а, )= = я!" (ь, - ) - (е + чГ )ї к* - ^у >г= = ?гчк+ >/и к" г-І Отже, задача стохастичного програмування (3.62)-(3.65) зводиться до задачі ЛП вигляду І с, х, £ [д,‘“ - (91<** + Я?' >/” ] И7" -»піп /-1 1-І Г-І за обмежень £^Ч=А(<‘>, і = 1,т; Е^х,=Е»7'>. у-І Г"І де И'(“> $ 0 $ И?” і г = 2, 3, ..., к,; і = 1,т; 0, у = 1, п. Приклад 3.6. Двохетапну задачу, в якій усі випадкові компоненти векто- ра і(ш) мають неперервну функцію розподілу, можна наближено звести до задачі квадратичного програмування. Для цього треба замінити неперервну гладку функцію розподілу східчастою функцією і податити Ь, у вигляді суми рівномірно розподілених випадкових величин: л1=Е^(и^,,.Е/’Г= і. 0, якщоА,г)< у}г); «И]; 1, якшо А((г) > б|г). 105
Тоді відповідну детерміновану задачу запишемо так: • / ч 1 - *• ат+ат 7-І 1-І г-І 2 1-І г.| О, — у, у<о у _^тіп за обмежень X а,7х/= л',)’ *= 7-І £а)уху + й/’’, г = 1,к,г і = 1,т, И7'’ і 0, ху2 0. Приклад 3.7. Розглянемо задачу, що зводиться до двохетапної моделі стохастичного проірамування. Нехай існує декілька підприємств, які виробляють деякий однорідній продукт. Підприємства розташовані в пунктах А,, Аг, .... А_. Обсяги виробництва продукту у відповідних пунктах становлять а„ і = = 1,т. Крім того, є п пунктів споживання цього продукту В2, В2,..., В, з рівнями споживання й(, Ь2, ..., йя відповідно. Позначимо виробничі витрати на виробництво одиниці продукту в пун- кті А, через с(, а транспортні витрати на перевезення одиниці продукту із пункта А, в пункт В, - через с2) (і = 1,/п , у = 1,и). Припустимо, що ве- личина попиту в пунктах Ь) - випадкова, з відомою функцією розподілу ), і нехай Г,(йу )- рівномірний розподіл на відрізку [у?, 8у]. Позначимо через витрати на зберігання одиниці надлишкового про- дукту в пункті В/. Якщо попит Ь/ перевищує обсяг ввезеного продукту хр то потрібні додаткові витрати на виробництво та ввезення продукції. Позна- чимо питомі витрати на виробництво та ввезення одиниці продукту в пункт ВІ через ц, = шіп(с, + с|у). Припустимо, що величини с, та с, випадкові, з відомими середніми с, та с,г Потрібно визначити такі обсяги перевезень хо із пункту Л, в пункт Вр 106
• також плани випуску додаткової продукції х,, за яких мінімізується сума очікуваних витрат на виробництво і перевезення продукції та зберігання над- яжшкового запасу. Розв’язання. Складемо математичну модель задачі. На першому етапі треба знайти такий план перевезень х = х,) , для якого Л/{сгх} =МС ЕЕсохіу}->тіп за обмежень А"’х = Е хч^а,г і = 7-І Позначимо обсяг виробництва продукту, який перевезено в пункт через їГу. Очевидно, що А(2,х=Е*м = IV,, і = 1,л. 1-1 Введемо вектор компенсації ¥ = ' у) , де у}= >Гу, у = 1,л, та матрицю компенсації (>(Х»Ь)= Е £?(ХА )= І А ). 7-І /-І ДЄ [ - ЇГу якщо а -[ Ьі - IVякщо Ь> < і. Використовуючи співвідношення (3.62)-(3.65), запишемо детерміно- ваний еквівалент для цієї задачі в такому вигляді: м{ Е І счхч в, 'Ь> )}->тіп І 1-І 7-І 7-І за обмежень £ аІ9 і- 1,т; 7-І £^о =і = і.«; 1-І х,^0. Використовуючи вираз (3.67), зведемо цю задачу до вигляду я» я п . _ ч Я 5 . + п , , ,2 Е Е Хи +т,^( + Е Vі-Ч і} -> тіп (3.71) 7-І >=1 2(о7-77) е,(^Л) = 107
за обмежень °і> 1 = (3.72) £х,у=^, у =1,л, (3.73) 1-І де х.^0. (3.74) Задача (3.71)-(3.74) є задачею квадратичного програмування з обмежен- нями-рівностями й обмеженнями-нерівностями. Щоб розв’язати її, засто- суємо теорему Куна-Таккера. Складемо функцію Лагранжа для цієї задачі: £(*.л) = Е Е сохо+? М ьі~^хч +Е _/Л 7 \х \.і=1 > '=> к ) Запишемо необхідні та достатні умови оптимальності: 5£( х,А) ахо 7 5, -У І 0, і =1,лі, і =1, л; 7 і Ж/=£хіу-а^0,/ = !.«; 5£( х,Д) йх, ,• ~ У і У к бі“7?\і=і і =1,л», у = 1,л; Х., = 0, і = 1,лі. ах,. Для подальшого розв’язання цієї задачі можна застосувати стандартні методи ЛП або метод перебору варіантів. 3.4. Метод проектування стохастичних квазіградієнтів Розглянемо клас задач прийняття рішень, що описуються моделями оперативних задач стохастичного програмування, в яких треба мінімізувати цільову функцію /(х.го), яка визначається в умовах дії похибок. 108
Точне значення функції /(х), а також її похідних Гж(х) = \у(х), визна- чна неможливо, втім є можливість багаторазово спостерігати за станом цяроди со (зовнішнього середовища) та оцінювати реалізації цільової функ- ча/(х),<аіх/(х2 ,ш2), ...,/(хж,сож). У такому випадку доцільно використо- вувати методи стохастичного програмування, до яких належить метод проектування стохасгпичних квазіградієнтів (СКГ), або стохастичний тзіградієнтний метод [25]. Стохастичний квазіградієнтний метод призначений для розв’язання задач як стохастичного програмування, так і нелінійного програмування з «гладкими або опуклими функціями та обмеженнями в умовах неточної інформації про ці функції та їхні похідні. Отже, нехай треба мінімізувати /(х,<о) = /(х1,х2,...,х„<о) (3.75) за обмеження хєА(х), де Л(х) - опукла замкнена множина; /(х) - опукла негладка функція, точне значення якої, а також її похідних, обчислити неможливо. У цьому випадку замість точних значень градієнтів або узагальнених градієнтів функції /(х) використовують випадкові вектори, що є статистичними оцінками цих величин. У методі СКГ як напрями спуску вибирають такі випадкові вектори. Отже, нехай існує деякий випадковий простір із множиною елемен- тарних подій со. Розглянемо послідовність випадкових точок хж(со), 5 = 0, 1, .... які визначають за формулою =*,(«,-рлЛ.). (З-76) де лж - оператор проектування на множину /?(х); хс - довільна початкова точка простору; рж - величина крою,', уж нормувальний множник; - випадковий вектор, умовне математичне сподівання якого Л/ІЕ, х . х..і,) - а, Г (х,) + В, • (3.77) ,іс скаляр аж >0; Вж = Л.ж>. . випадковий вектор, який не залежить зід послідовності (х0, х,,.... хж); величини рж, уж вимірні за Борслсм. 109
Як відомо, узагальнений градієнт функції /(х,) у точці х, - вектор Гж(ха) - задовольняє за будь-якого вектора 2 нерівності [25] Вектор , що задовольняє вираз (3.77), з точністю до параметрів а,, В, збі- гається в середньому з вектором узагальненого градієнта. Якщо покласти а =1, В, =0, то цілком природно назвати стохастичнимузагальненим градієнтам (або квазіградієнтом), а процедуру (3.76) -методом проектування СКТ. З аналізу процедури (3.77) випливає питання про збіжність послідов- ності {х,}.Є різні варіанти збіжності випадкових послідовностей: за ймовірністю, в середньому квадратичному та з імовірністю 1 (тобто майже обов’язково). Найбільший практичний інтерес становить збіжність з імовірністю 1. Наведемо умови, за яких ця збіжність гарантується. Припустимо, що у, =1, 5 = 0,1,..., ар, не залежить від <о. Позначимо через х* множину оптимальних розв’язків задачі (3.75). Справедливою є така теорема [25]. Теорема 3.3. Нехай виконуються умови І|2 £ с = соп5І, 5 = 0,1, ..., (3-78) а(со)£с, |В,(ю)||^В„ (3.79) р, £0, <<ю, ]Гр’<ао> (3.80) • -0 »-0 £р,С, =00 з імовірністю 1. Нехай множина Я(х) обмежена і Л/рХ0||2 < ао, тоді послідовність х,(со), визначена згідно з виразами (3.76), (3.77), збігається до х" з імовірністю 1, причому 1ітха(<о)є х*. Доведення. Нехай х* є/’, згідно з означенням операції проектуванні па [25] маємо (зй) = X’ -1,1! + 2рЛГ (х* - х.)+р2 по
Візьмемо операцію умовного математичного сподівання від обох частин нерівності (3.81) за умов х(, х2,...»х,: М(||х‘ - х,+1|і2 іХо.х,, • | + 2р,а, £(х,Хі -х,) + р 82) + 2рХ(»’-»,) + рЖІІ2- Оскільки /(х) - опукла вниз функція, то оа/(х-)-/(х,)^г;(х.Хх--х,), отже гГ(х,х»*-і.)^о. Тому, застосовуючи нерівність Коші-Бустіковського В£(Х* -X,) £ -х, й використовуючи умови (3.78), отримуємо з нерівності (3.82) - М’і жо’ж>’ -’х.} *!!х‘ ~х.Ґ+2їр-в-+ся2’ де у - деяка константа. Позначимо 2, =і|х* -Х,|’ + 2у£р,в, +сХр», (3.83) тоді з виразу (3.83) випливає Л/(7^|х.,х„...,х,)^7„ і внаслідок того, що 2, залежить тільки від х„ М(2п1 2^,...,2,)^2,. Таку послідовність випадкових величин {7,} називають супермар- тингалом [17]. Оскільки супермартингал невід’ємний (7ж£0), то він збігається з імовірністю 1 [17]. Звідси з урахуванням умови (3.80) можна зробити висновок, що послідовність х*-х, 2 збігається з імовірністю 1, отже, послідовність {х,} обмежена і множина її граничних точок X' непорожня. Нехай х'(єо), х’(єо) - дві довільні граничні точки послідовності {х, (<»)}. Тоді для будь-якого х' є Х‘ матимемо х' - х'(єо)' = х‘ - х'(єо)1 Якщо 111
тепер показати, що одна із граничних точок з імовірністю 1 належить множині X’, то з останньої рівності випливатиме, що вона і є єдиною граничною точкою послідовності. Ь виразу (3.81) маємо Iх* - х..і ІҐ *'!»’ - х. Ґ + 2Е рХ (і* - Ж*) + сХ Р», *-0 *-0 ЗВІДКИ м[і*’ - П *м(і!х* -«вҐІ+2Хінч **(х*хж’ - ж*)+ 1 1 , *-? (3.84) + г£аЛ/34+с£д2. 4-Ю 4-0 Оскільки ліва частина нерівності (3.84) невід’ємна, то справедлива нерівність МЙх‘" *оП + ^(х»Хж* - ж*) + + сІл °- ' ’ 1-0 4-0 4-0 Переходячи до границі за з —> оо і враховуючи умови (3.80), отримуємо з імовірністю 1: » лГ ЕРіЛ/а*£х(х*Хх -х*)>-оо, *-=0 і внаслідок (3.79) £р*с. і. (х,)(х* - X,) > -00. *-0 Оскільки £р,С> =оо, то звідси випливає, що знайдеться така послідов- 4-0 кість {х^}, що з імовірністю 1 С(х^Хж* -х-)-*0 за І —>оо, де Г.(х) - узагальнений градієнт, тому /(х*)-/(х-)^ГДх-Хх--х,)->0. Отже, для будь-якої граничної точки хп>(ш) послідовності {х,,} отри- маємо /(х^^)) = /(х"), тобто з імовірністю 1 Ж^ є X’. Теорему доведено. 112
Покажемо тепер, як за допомогою методу СКТ можна конструювати різні варіанти прямих методів стохастичного програмування. До них, зокрема, належить метод стохастичної апроксимації. 3.5. Метод стохастичної апроксимації Метод стохастичної апроксимації запропонували Н. Робіне і С. Монро й розвинули Е. Кіфер та Дж. Вольфовітц для розв’язання екстремальних сто- хастичних задач без обмежень. Нехай треба знайти мінімум функції регресії Г(х) = Л/_{/(х,ю)} = |г«/6(г,х), де 0(2, X) = Р{/(Х, со) £ 2}. Основна ідея цього методу полягає в тому, що у разі мінімізації Г(і) за напрямок спуску обираються антиградієнт функції /(х,ю) замість невідо- мого антиградієнта Г,(х) функції Г(*), яку точно виміряти (визначити) не- можливо. У методі стохастичної апроксимації розглядаються ітеративні процедури пошуку, що визначаються співвідношеннями =х,-р,Г,(х,,о)), 5 = 0,1,.... (3.85) Якщо за кожного <о градієнт Гд(х, <о) аналітично обчислити неможливо, то розглядають різницевий варіант методу, в якому градієнт визначають чисельно: -р,Е А ег 7-І Д, де е, - орт у -ї осі; (у = 0,1,2,.... л) - результати незалежних спостережень за станом природи со; р, — довжина кроку; Д, - довжина пробного кроку. 113
Збіжність методу стохастичної апроксимації зазвичай досліджують у припущенні, що Е(х) має неперервні та обмежені другі похідні. Можна показати, що за цих припущень [25] І д< де V, - деякий вектор, такий, що V £ сопзі. Отже, метод стохастичної апроксимації є окремим випадком методу СКГ, де + Д»е>’®л)_е (3.86) 7=1 д, 7 Наведемо деякі узагальнення процедури (3.85). Припустимо, що розмір- ність простору Е*"* велика і на чисельне визначення напрямку спуску 5, згідно з формулою (3.86) витрачається дуже багато часу, а крім того, є обмеження х є Л(х). Тоді можна використати випадкові напрямки Р = {Р,,р2,....Р,} з незалежними та рівномірно розподіленими компонентами Ру на проміжку [-1, 1] і розглянути такий процес пошуку: Х,-Р,2. “ ------. --------------Рі* • І *=1 Д> ) де р^(Л = 0,1,2,..., к.) - серія незалежних реалізацій вектора 0 5-й ітерації (1 £ к, £ л); Д, - зміщення по осі. Величини к, та Д, скрізь вважають вимір- ними за Борелем. У розглядуваному випадку, якщо Е(х) двічі диференційовна, має обмежені другі похідні за х є Е(х), то м[ £ + Д’Рл’Ч*)-/(Х5>Чо) "І= к, рх(Хі)+худ, д, ) 3 де XV, - деякий випадковий вектор, причому , XV 2 = сопзі. Оскільки другі похідні функції /(х) обмежені, ТО ^,'2 £соп8і, а вели- чини р,, кі, Д, слід вибирати так, щоб забезпечити умови збіжності: а)р,£0; б)Ер’<°о; в) £ рЛ = с°> г) ^р.А/Д, <°о. 1-е 114
Якщо к, = к = соплі, то умови збіжності мають вигляд а) р, £0; =<ю; б) £р’ <а>; в) £р,Д, <«>. (3.87) *-0 ж-0 гЧ) Типовим прикладом послідовності, що задовольняє умови (3.87), є гар- монічний ряд р = * , 5 = 0,1,..., с = соплі. С + 5 Зауважимо, що метод стохастичної апроксимації широко застосовують у задачах навчання інтелектуальних систем в умовах статистичних збурень (перешкод). На його основі побудовано сімейство алгоритмів навчання в сто- хастичному середовищі, зокрема алгоритми навчання нейронних мереж [23]. Його важливою перевагою є те, що за вище зазначених умов ці алгоритми збігаються до істинних значень відповідних параметрів і не потрібно кож- ного разу доводити збіжність цих алгоритмів. 3.5.1. Застосування методу стохастичннх квазіградієнтів до задач стохастичного програмування Найпростіша задача керування запасами. Нехай є деякий склад місткістю а, в якому потрібно створити запас деякого однорідного продукту. Нехай попит (о на продукт випадковий з функцією розподілу Н(2) = Р{и>^г}. Позначимо за- планований обсяг запасу через х одиниць. Розглянемо функцію витрат: а(х-<о), якщо х^со -витрати на зберігання; Р(со-х), якщо х<со - штрафи внаслідок дефіциту, де а - питомі витрати на зберігання одиниці запасів; Р - питомий штраф внаслідок дефіциту. Треба знайти такий рівень запасів х, за якого Р(х) = М{/(х, <о)} = а |(х - х)<1Н (х)+р | (х - х)сІН (х) -> тіл. 0 X Оскільки функція /(х,<о) - недиференційовна за х = со, то в загальному випадку Р(х) теж недиференційовна. Очевидно, що Р(х) = М птах {а(х - <о), Р(со - х)}, тобто маємо окремий випадок мінімаксної задачі. /(х,о>) = 115
Знаходимо стохастичний квазіградієнт: к _ /• \_(®> Ч» } «V •> І-р, якщо ха<а„ і рекурентний процес визначення оптимального обсягу запасів х' матиме та- кий вигляд: V =*, -РЛ.. або V, = л,(х, -рЛ). Запитання для самоконтролю 1. Назвіть основні класи задач стохастичного програмування. 2. Які є класи методів стохастичного програмування? 3. Які основні види моделей одностайних задач стохастичного програмування? 4. До якого класу належать одностайні задачі стохастичного програмування і яким методом вони розв’язуються? 5. До якого класу належать двох етапні задачі стохастичного програмування? 6. Назвіть умови розв’язуваності задачі другого етану двохетапної задачі стохастич- ного програмування та поясніть їх зміст. 7. До якого класу належить метод стохастичних квазіградієнтів? 8. Наведіть умови збіжності методу стохастичних квазіградієнтів та поясніть їх зміст. 9. Наведіть умови збіжності методу стохастичної апроксимації та порівняйте їх з від- повідними умовами методу стохастичних квазіградієнтів. 10. До якого класу задач стохастичного програмування застосовуються метод стохастич- них квазіградієнтів та стохастичної апроксимації? 11. Як працює метод аналізу ієрархій? 12. Розкрийте роботу методу парних порівнянь. 13. Наведіть шкалу вимірювання в методі парних порівнянь. 14. Що таке ступінь неузгодженості оцінок експерта? 15. Які режими існують в методі парних порівнянь і чим вони відрізняються? 16. Чи можуть ваги критеріїв у методі аналізу ієрархій бути від'ємними, і якщо так, то в яких випадках? 116
Задачі для самостійного розв'язання Задача 3.1. Підприємство з обробки картоплі випускає три різних про- дукти (1, 2 та 3). Картоплю можна купувати у двох постачальників. Об’єми продуктів 1, 2 і 3, які можна отримати з однієї тонни картоплі першого по- стачальника, відрізняються від об’ємів продуктів, що отримуються з картоплі другого постачальника. Кількість продукту, отримуваної з 1 т картоплі різних постачальників, є величиною випадковою (табл. 3.4). Таблиця 3.4 Продукт Кількість продукту 1ІТ Обмежений ні об’єм напуску продукту Постачальник 1 Постачальник 2 р-11-ІД рП-ІІЗ р із - ІД Р-21-2Д р-22-ІД 1 0,1 0,25 0,3 0,3 0,35 8 2 0Л 0Л5 0,1 0,1 0,1 6 3 0,3 0,35 0,3 0,3 0,25 12 Відносний прибуток у разі закупівлі картоплі у постачальника 1 дорівнює п’яти, а у постачальника 2 - шести. Ухвалюючи рішення про закупівлю картоплі необхідно враховувати виробничі можливості випуску продукції кожного виду, а також максимальні об’єми продукції, які можуть бути продані. Нехай попит с31 на і-й продукт, і = 1, 2, 3, випадковий з відомою функцією розподілу р,(Ц)- Припустимо, що продукт 1, 2, 3, який опинився в надлишку відносно фактичного рівня попиту!), можна продати оптовому покупцю й отримати відносні питомі прибутки Е, Н, Ь відповідно. Побудуйте двокрокову лінійну модель, що дозволяє вибрати об’єм закупівель картоплі у постачальників 1 і 2, так, щоб очікуваний прибуток був максимальний. Розв’яжіть цю задачу за таких початкових даних: = 3; Д‘2> = 4; Д<’> = 5; ри = рп = р„ = 1 / 3; £>‘° = 1; О‘2) = 3; П2(,) = 5; рг1 = 1 / 6; = 1 / 2; = 1 / 3; = 4; О<2» = 6; А> = Р(^”) = 11 Зі Р» = Р№') = 2/3; Е = 2;Я = 1;£ = 3. Задача 3.2. Нехай деяке підприємство після виконання основної вироб- ничої програми має в своєму розпорядженні запаси заощадженої сировини трьох видів - 52,5, у кількості 1\, Ь2, Л,. Із цієї сировини може бути виго- 117
товлено два види виробів - Сі і Сг. Відомі величини: ау - кількість /-го ви- ду; су - дохід, що отримується від реалізації одного виробу. Припустимо, що норми витрат ау є випадковими величинами з рівномірним законом розподілу в інтервалі су розподілені нормально з середнім с, і дис- персією <т^. Відповідні числові дані наведено в табл. 3.5а та 3.56. Таблиця 3.5, б Таблиця 3.5, а Кішжкть сармижв, яка Жде а мттпшкв Сармпа Перша* вад Друга* важ ГП 6П га 8,2 20 2 4 1 5 5, 16 1 2 1 4 51 12 0 0 2 6 Пмтвмж* врвСутев від арадажу вкраіу Характер встакж /-1 1-і Середнє с/ 3 2 Дисперсія ст^ 4 1 Скласти такий план випуску продукції, щоб очікуваний прибуток підприємства був максимальний за умови, що з імовірністю не менше 0,90 план буде таким, що реалізується, тобто кількість всіх видів сировини вия- виться достатньою для його виконання. Задача 33. Для виробництва двох видів виробів (/ = 1.2) може бути ви- користане устаткування двох груп (і = 1, 2). Витрати часу а# цими групами устаткування на виготовлення виробів різні та є випадковими величинами. Вартість одного виробу Ьу(і = 1,2; / = 1,2) буде також випадковою. Припустимо, що щільність розподілу величин ау і Ьу відома, Оу роз- поділена згідно із нормальним законом ^(а^.а^), а Ьу - рівномірно в інтервалі (у^). Позначимо через і ЛГ2 план випуску виробів першого і другого виду. Нехай = 100 шт.; = 200 шт. Визначте оптимальний план роботи груп устаткування, за якого мінімізу- ються очікувані сумарні виробничі витрати на випуск виробів, якщо вірогідність перевищення фонду часу Т на виконання всього планового завдання становить не більше 0,10, а ймовірність виконання плану випуску виробів не менше 0,95. 118
Складіть математичну модель завдання і знайдіть рішення для початко- ва даних, наведених у табл. 3.6. Таблиця 3.6 Цртм мшмі Питимі витрата часу гол/ птт. Питима вартість варову Фонд часу <-г»успгпсу- ваввя 7-1 і-2 /-1 ІГ2 ал ви •а ва Та *П Та ба 1 од од 0,3 0,3 2 4 1 2 50 2 0,1 од 0,1 од 3 6 2 8 65 Задача 3.4. Перевезення народногосподарських вантажів регулярними лініями виконують п різних типів суден. Виходячи з даних про собівартість тонно-кілометра і комерційного завантаження кожного типу судна на кожній лінії встановлюються: місячні експлуатаційні витрати на судно у-го типу на 1-й лінії су, і = 1, ..., т; ] = 1, ..., л; місячний об’єм вантажообігу (об’єм перевезень суднау-го типу на /-й лінії) ау. Нехай величини су та а^ випадкові, де су мають рівномірний розподіл з параметрами (у#,8г), ао# - нормальний розподіл N(0^,0^); а^ - незалежні випадкові величини. Мінімальний план перевезень і-ю лінією становить А,, 7 = 1,...,т. При- пустимо, що кількість суден у-го типу дорівнює . Складіть такий план розподілу судів регулярними лініями, який забезпечує мінімум очікуваних сумарних витрат при виконанні плану переве- зень з імовірністю не менше 0,80. Складіть математичну модель завдання в одностайній постановці та знайдіть оптимальне розв’язання цієї задачі за різних варіантів початкових ’300‘ 200 1000 500 та в табл. 3.7в, 3.7г за даних, наведених у табл. 3.7а, 3.76 за умови 4 = умови 4 = 500 200 200 200 119
Таблиця 3.7, а Таблиця 3.7, б Лінія/ Місячий вантажообіг а* / а* 3-і /-Ї 3—3 1 15/5 30/10 25/15 2 10/5 25/10 50/25 3 30/15 10/5 30/10 4 50/20 20/10 25/30 Лінія/ МкячМ експлуатаційні виграти / 8^ 3-і 3-І 3-3 1 5/20 40/100 20/60 2 10/30 20/36 40/80 3 20/30 12/18 25/45 4 30/40 10/90 30/100 Таблиця 3.7, в Лінія/ в,/о. У"1 /“2 3‘3 /-« 1 25/15 20/10 50/10 50/20 2 20/10 12/6 - 45/15 3 15/15 10/15 - 40/10 4 10/5 40/20 18/4 25/25 Таблиця 3.7, г Лінія/ т,/«. 3-1 3-3 3‘4 1 15/20 10/30 4/10 12/18 2 20/40 20/40 — 10/16 3 20/30 8/12 — 30/40 4 10/50 5/10 15/25 20/70 Задача 3.5. У колгоспі три поля у (/ = 1, 2, 3) площею 5, =10000 та; 5, = 15 000 га; 5, = 5000 га засівають пшеницею. Для прибирання полів можуть бути використані комбайни різних типів і (і = 1,..., л) продуктивністю гек- тарів за день. Нехай добові експлуатаційні втрати з утримана комбайна типу і становлять с, грн/день. Загальна кількість комбайнів типу і дорівнює Величини - випадкові, розподілені експоненціально з середнім, т# = 1 / , а с, - рівномірно розподілені в інтервалі Початкові дані наведено в табл. 3.8. Визначте, яку кількість комбайнів кожного типу потрібно направити на кож- не поле, щоб з імовірністю р = 0,9 прибрати всі поля не більше ніж за Т днів за мінімальних очікуваних сумарних втрат. Задачу розв’язати за Т= 4,5 і 6 днів. Таблиця 3.8 Тая комбайни і Середи продуктовій сть комбайна ви полі у Кількість комбайнів Експлуатаційні витрати 3-і 3-І 3-3 аі ь, 1 40 55 80 10 10 зо 2 80 120 150 10 20 40 3 120 175 200 8 26 45 4 100 160 180 16 зо 40 120
Задача 3.6. В умовах задачі 3.5 визначити, яку кількість комбайнів кожно- го типу необхідно направити на кожне з полів, щоб очікуваний час прибирання був мінімальним, а сумарні виробничі витрати з імовірністю =0,9 не пере- вищували величини Сте. Складіть модель задачі стохастичного програмуван- ня і розв’яжіть її за См = 7000 грн, См = 7500 грн, Сто = 9000 грн. Задача 3.7. Підприємство має у своєму розпорядженні ресурси сирови- ни, робочу силу й устаткування, необхідні д ія виробництва чотирьох видів виробів. Нехай питомі витрати ресурсів типу у є випадковими величинами, розподіленими в інтервалі [а(, А,], а прибуток за одиницю виробу виду і ста- новить с( одиниць. Початкові дані наведено в табл. 3.9а, 3.96. Таблиця 3.9, а Таблиця 3.9, б Ресурс Норми витрат ресурсів для виготовлення виробу / Об’єм Виріб 1 2 3 4 Прибуток, П» зо 25 56 48 1-1 і-2 1—3 1-4 Сировина, кг Робоча сила, нормо-годнна Обладнання, станко-година. 2-4 15-25 6-12 3-6 10-15 10-18 1-2 15-20 6-10 2-5 30-50 12-20 60 400 128 Визначте оптимальний асортимент виробів, що забезпечує: а) максимум очікуваного прибутку за умови реалізації плану з вірогід- ністю 0,95; б) максимум очікуваного прибутку, якщо співвідношення асортименту З : 2 : 1 : 2; в) максимум кількості комплектів, що включають один виріб типу 1, два - типу 2, три вироби типу 3 та один - типу 4. Задача 3.8. Під час складання добового раціону годування худоби мож- на використовувати свіже сіно (не більше 50 кг) і силос (не більше 85 кг). Суміш повинна містити живильні речовини: білок (не менше 1 кг), кальцій (не менше 100 г) і фосфор (не менше 80 г). Кількість кожного компонента в 1 кг сіна і силосу є нормально розподіленою випадковою величиною з середнім і дисперсією о’, а собівартість продукту с, рівномірно роз- поділена в інтервалі [б(,у(]. Початкові дані наведено в табл. 3.10. 121
Таблиця 3.10 Продукт» і Вміст комаокевтів у продукті Питома собівартість, грв/кг Білок Кальцій Фосфор Ні, сті, 6, Т. Сіно 40 20 1,25 1 2 1 1 1,5 Силос 10 5 2,5 1,5 1 0,8 0,6 1 Визначте оптимальний раціон виходячи з умови мінімуму собівартості, враховуючи, що з імовірністю р = 0,80 повинна виконуватись вимога заданої поживності. Задача 3.9. Підприємство може випускати продукцію, використовуючи три технологічні процеси (і = 1, 2, 3). Продуктивність а, і-ї технології є нор- мально розподіленою випадковою величиною з середнім ц, і дисперсією о?. Нехай вигратиу-го ресурсу за 1 год робіт (табл. 3.11а) є випадковою ве- личиною, рівномірно розподіленою в інтервалі Об’єм кожного ре- сурсу на підприємстві наведено в табл. 3.116. Таблиця З.ІІ.а Спосіб ввробвацтм і В втрати/-то ресурсу Продуктивність ’л 42 8 <2 ТЦ 8ІЗ ’/4 8/4 Чз 8|3 6? 1 1 3 2 4 4 10 1 3 0,5 1,5 20 10 2 1 2 3 5 2 4 0.5 1.5 0 0 25 15 3 2 4 1,5 21 3 5 2 2 ^8. и зо зо Таблиця 3.11,6 Тви ресурсу Сировина Верстати Робоча сила Енергія Транспорт Об’єм ресурсу 60 80 70 50 40 Визначте оптимальний об’єм продукції, що виготовляється відповідно до кожного технологічного процесу, за якого максимізується сумарний об’єм продукції за умови реалізації плану з імовірністю не менше 0,90. Задача 3.10. Нехай деталі А, В, С можуть виготовлятися на трьох вер- статах 1, 2, 3. Витрати часу на виготовлення деталі і на верстаті у є випадко- вими величинами, рівномірно розподіленими в інтервалі ), їх наведено в табл. 3.12, де також зазначено середню роздрібну ціну одиниці деталі сі та собівартість 1 год роботи кожного верстата. Нехай сумарний плановий фонд 122
часу роботи верстата Фу - рівномірно розподілена випадкова величина в інтервалі [фу-й,Фуи„]. Знайдіть оптимальну виробничу програму випуску деталей, яка була б реалізована з імовірністю не менше 0,90 та забезпечувала б екстремум одного з таких критеріїв витрат: а) максимум товарної продукції Т; б) максимум сумарного прибутку П. Таблиця 3.12 Верстати Деталі Вартість однієї годній Час роботи верстата Порив часу для деталей А В с 1Ч *ч Ігі і» ч, ф,_ ф упмх 1 0,2 03 0,1 0,2 0,05 °,і зо 20 60 2 0,5 1 0,2 0,4 0,2 0,4 10 60 90 3 ОЛ 0.2 0,15 0,3 03 0,5 20 20 40 Ціна деталі 10 16 12 - - - Задача 3.11. Три сорти взаємозамінної сировини (і = 1, 2, 3) у кількості 200, 100 та 300 кг використовуються для виробництва чотирьох виробів (/ = 1, 2, 3, 4). Норми витрат а* сировини і на виробництво виробу у є нор- мально розподіленими випадковими величинами із середнім ц, та диспер- сією а’, а виробничі витрати - рівномірно розподіленими випадковими ве- личинами на інтервалі Вихідні дані наведено в табл. 3.13а та 3.136. Складіть такий план виробництва виробів, щоб з імовірністю 0,9 випус- тити 25 одиниць першого виробу, 45 одиниць другого, 30 одиниць третього та 70 одиниць четвертого виробів за мінімальних очікуваних сумарних ви- робничих витрат. Таблиця 3.13, а Сорт снрошшв і Нормо витрат иа виріб / 1 3 4 Нп 2 Нп 2 °Ї2 2 2 °І4 1 2 3 0/5 1 3 2 1 2 2 1 3 2 3 2 3 2 4 3 2 5 1 2 2 4 2 3 123
Таблиця 3.13, б Сорт сарованкі ВвробввчІ ввтратв ва одвнвцю продукції Сг 1 2 3 4 Тп «п У'2 8п Уп «о у» «м 1 20 60 15 45 10 20 20 50 2 15 45 20 зо 40 50 зо 50 3 10 зо зо 60 10 зо 25 45 Задача 3.12. У кормову суміш входять три продукти: сіно, силос і кон- центрати, - які містять поживні речовини - білок, кальцій і вітаміни. Місткість поживних речовин (табл. 3.14) -- це нормально розподілені випадкові величини із середнім ц, і дисперсією о’. Мінімально необхідні норми споживання білка - 2000 г, кальцію - 120 г, вітамінів - 40 г. Визначити оптимальний раціон харчування мінімальної вартості, який забезпечує добові норми споживання всіх поживних речовин з імовірністю не менше 0,8, якщо ціна 1 кг сіна становить 30 коп. силосу - 20 коп, концен- тратів - 50 коп. Розв’яжіть цю задачу за умови, що відомі граничні норми споживання добової видачі: сіна - не більше 12 кг, силосу - не більше 20 кг, концентратів -16 кг. Таблиця 3.14 Продукт Склад шикивних речовая Білок Кальці* Вітаміни Сіно 30/20 4/8 3/2 Силос 20/10 6/4 1/2 Концентрати 150/100 4/2 2/3 Задача 3.13. На трьох ділянках колгоспного поля (к = 1, 2, 3) можна ви- рощувати три культури: жито, пшеницю й ячмінь (і = 1, 2, 3). Урожайність цих культур нормально розподілена із середнім ца і дисперсією ста (табл. 3.15). Нехай планове завдання із збирання врожаю кожної культури становить відповідно 500,600 і 400 ц, а площі ділянок - відповідно 30,50 та 20 га. Визначте оптимальну структуру посівів, які мінімізують сумарні очіку- вані витрати за умови виконання плану з імовірністю не менше 0,90. 124
Визначте оптимальну структуру посівів, які забезпечують максимальну ймовірність перевиконання плану із збереженням планового асортименту у співвідношенні 5:2:4. Таблиця 3.15 Ділянка* Урожайність Н культура Середні в втрати О*і Ми Ми ®и С*2 См 1 10 15 12 6 8 4 2 3 4 2 12 8 14 10 18 12 3 6 8 3 20 10 16 8 24 8 4 7 10 Задача 3.14. Нехай три підприємства (і = 1,2,3) використовують для випус- ку у-ї продукції (/ = Л,В,С) два види ресурсів (1, 2) об’єми яких становлять для першого підприємства 250 і 150, для другого - 100 і 200 і для третього - 240 і 300 одиниць. Нехай норми витрат кожного ресурсу на і-му підприємстві для вироб- ництва у-ї одиниці продукції - рівномірно розподілені випадкові величини в інтервалі а собівартість виробництва одиниці у-ї продукції' на і-му підприємстві сг - випадкова величина із середнім с,. Початкові дані наведено в табл 3.16а та 3.166. Нехай виробничий план випуску продукції становить відповідно 300, 170 і 250 одиниць. Визначте оптимальну спеціалізацію виробництва, за якої мінімізується сумарна очікувана собівартість випуску, якщо ймовірність виконання плану становить не менше 0,90. Таблиця 3.16, а Підприємство і Норма витрат сировини ваду 1 і 2 ва одиницю продукції А В С 1 2 1 2 1 2 1 1 3 2 6 0,5 1,5 2 3 2 3 2 4 2 1 2 3 7 1 3 1,5 3 2 2,5 1 4 3 1 3,5 2 4 1 1,5 1 2 1 4 3 5 Таблиця 3.16, б Щдприсмстао і Собівартість випуску одиниці продукції А В С 1 2 8 5 2 3 6 6 3 3 9 5 1 125
Задача 3.15. Три механізми І, II та III можуть виконувати три види ґрун- тових робіт А, В, С. Нехай продуктивність механізмів під час виконання різ- них робіт є нормально розподіленими величинами із середнім та диспер- сією о’, а питома вартість робіт є рівномірно розподіленою випадковою величиною в інтервалі [уг,8г]. Вихідні дані наведено в табл. 3.17а та 3.176. Таблиця 3.17, а Механізми Продуктивність, м’/г Ресурсе часу А В С Нп аа Нз % І зо 20 20 10 40 15 400 II 20 10 зо 20 50 25 300 ш 60 зо 40 20 зо 15 280 Таблиця 3.17,6 Механізми Питома вартість, грн/г А В с «п «а 1 20 зо 40 60 20 зо II 25 35 10 зо 40 60 Ш зо 50 20 40 50 70 Визначте оптимальне завантаження механізмів, яке з імовірністю р = 0,9 забезпечує: а) мінімізацію середніх сумарних витрат за об’ємів робіт: А = 600 м’, В 5000 м’, С= 8000 м’; б) максимальний обсяг виконаних робіт у разі дотримання умови ком- плексності обсягів А, В, Су співвідношенні 1:2:3. Задача 3.16. Авіакомпанія д ля організації пасажирських перевезень між центром Ц та чотирма містами Д, В2, Вг, В4 має в розпорядженні три групи літаків. Перша група складається з 50 чотиримоторних, друга - із 40 двомотор- них літаків нового зразка, а третя - із 40 двомоторних літаків старого зразка. Кількість пасажирів, яких перевозять одним літаком певного типу за місяць, є випадковою величиною, розподіленою нормально із середнім та дис- 126
дисперсією дані наведено в табл. 3.18а, а експлуатаційні витрати на один лпак (тис. гри), розподілені рівномірно в інтервалі [у,,5е], наведено в табл. 3.186. Нехай місячний план перевезень пасажирів по кожному маршруту ста- новить відповідно 40, 50, 40 та ЗО тис., а вартість одного квитка коштує відповідно 200,150,180 та 300 грн. Розподіліть літаки по маршрутах таким чином, щоб з імовірністю 0,9 виконати план перевезень та отримати: а) максимальний очікуваний прибу- ток авіакомпанії; б) мінімальні сумарні експлуатаційні витрати. Таблиця 3.18, а Тип літака Кількість пасажарів і _6в я 1 Ц-И3 ц 1 О ц О м О р к О і І 2000 1000 1500 800 800 500 1800 900 : П 1500 1000 1200 600 1300 800 1400 900 і Ш 1600 600 700 400 800 450 1000 600 ' Таблиця 3.18. б Тип літака Експлуатаційні витрата, тне. гра аа міеипь 1 Я і ц-в, ц-в4 Уп 6ц т« «п Уп 8м І 12 16 14 18 9 11 16 24 П 14 18 10 15 10 14 12 18 ПІ 6 10 8 12 11 13 12 ..16 127
4. ПРИЙНЯТТЯ РІШЕНЬ У НЕЧІТКИХ УМОВАХ У задачах організаційного керування часто-густо трапляються ситуації, в яких вихідні умови задачі нечітко визначені. Такі ситуації відображають недостатню інформованість ОПР. Інформація, що використовується, може бути суб’єктивною, а її відо- браження в мові людей зазвичай містить багато невизначеностей типу «бага- то», «мало», «приблизно», які не мають аналогів у мові математики, тому опис цієї інформації засобами традиційної математики сильно загрубляє ма- тематичну модель. Таким чином, для подальшого застосування математич- них методів аналізу та дослідження дедалі складніших систем з’явилася по- треба у створенні нового математичного апарату, який дав бн змогу формально описувати нечіткі поняття, котрими користується людина, опи- суючи свої бажання, цілі та уявлення про систему. Таким апаратом стала теорія нечітких множин, створена Л. Заде, перша фундаментальна праця якого була опублікована ще 1965 р. [62]. Протягом ос- танніх сорока років цей новий напрям інтенсивно розвивався, з’явилися сотні праць, присвячених теоретичним та прикладним аспектам теорії нечітких множин. Одним із найактуальніших напрямів нової теорії є проблема прийняття рішень у нечітких умовах та критеріях, що привела до появи нового напряму в математичному програмуванні - нечіткого математичного програмування. Розглянемо основні ідеї моделі та методи прийняття рішень у нечітких умовах. 4.1. Нечіткі множини та операції над ними Основні поняття та визначення. Викладемо основні поняття у сфері нечітких множин. Визначення 4.1. Нечіткою множиною А. 4° задана на універсальній множині X, називають сукупність пар (х,ц^(х)), де хєХ, а - функція х [0;1], яку назвають ФНмножини А. Значення рДх) для конкретного х називають ступенем належності цього елемента до нечіткої множини А (рис. 4.1, а) [25]. 128
/'/О Рис. 4.1 Звичайні множини утворюють підклас нечітких множин. Справді, ФН звичайної множини В £ X є її характеристична функція ц,(х) (рис. 4.1, б): якщо ' (0, якщо хе В. Визначення 4.2. Нечітку множину 0, визначену на X, називають по- рожньою, якщо її ФН дорівнює нулю на всій множині X, тобто рв(х) = 0,УхєХ. Визначення 4.3. Універсальна множина X описується ФН вигляду цх(х) = і,УхеХ. Визначення 4.4. Носієм нечіткої множини А з ФН Ц,,(х) називають множину вигляду яирр А = {х: ц4(х) > 0, х є X}. Доповненням нечіткої множини А з ФН ц^(х) називають нечітку множи- ну А з ФН: ц/х) = 1-рл(х). Нечітку множину А називають нормальною, якщо виконується умова вир (х) = 1, інакше її називають субнормальною. Нехай А та В-нечіткі множини на X; цл(х) та ц,(х)-їхні ФН відповідно. Говорять, що А включає в себе В (тобто В с А), якщо для будь-якого х є X виконується нерівність ц,(х)£ цДх) (рис. 4.2). Якщо В а А, то зиррВ а хиррЛ. Множини А, В еквівалентні (А ~ В), якщо ц,(х)=щ(х), Ух є X. Приклад 4.1. Розглянемо нечіткі множини: А = {х: величина х близька до 1}; В = {х: величина х дуже близька до 1}. 129
Тоді В^А і ФН цих множин мають задовольняти умову (рис. 4.2) Рис. 4.2 Операції над нечіткими множинами. Розглянемо основні операції над нечіткими множинами [25]. Визначення 4.5. Об’єднанням нечітких множин А та В в X називають нечітку множину С = В із ФН вигляду (рис. 4.3) рс(х) = тах{р4(х);ц,(х)}. Визначення 4.6. Сильним об’єднанням нечітких множин А та В в X називають нечітку множину С = АЙВ із ФН ІИл (*) + Мв (*), якщо М*) + М-О < (1, якщо ц/х) + рв(х) 1. Визначення 4.7. Перетином нечітких множин А та В в X називають нечітку множину С = АГ\ В із ФНвигляду (рис. 4.4) Р. (х)=м Іп«(х)= тіп<м.(^); рДх)} Якщо {Лг} - скінченна або нескінченна сім’я нечітких множин із ФН рЛ(х, у), де у є У - параметр сім’ї, то перетин С = Р)Л), є нечіткою множи- У ною із ФН вигляду 130
рг(х)=іпГр (х,у), хе/. У*7 7 Визначення 4.8. Сильний перетин нечітких множин А та В у X ви- значають як нечітку множину С=АГі В із ФН вигляду МсМ =Н,(*)-М,(*)» х(=Х Визначення 4.9. Різницею нечітких множин А та В у X називають нечітку множину А\В із ФН вигляду /н = ІМл(х)-Мв(-к). якщорл(х)2їрв(х)>0, в іншому разі. Визначення 4.10. Декартовим добутком Л1хЛ1х...хЛ> нечітких мно- жин А1 в Хіг і — 1,п називають нечітку множину в декартовому добутку X, х Х2 х...х X' із ФНвигляду р4(х) = шіпіцДхДр^х,) рл(х.)}. Визначення 4.11. Опуклою комбінацією нечітких множин А1,А2,....Аіі на X називають нечітку множину А із ФН вигляду Мл(х) = ЇЛмА), де Х,£0,£х, = 1. м і=і Визначення 4.12. Операції концентрування (СОН) та розтягнення (Дії.) нечіткої множини А визначають так: СОИА = А2, ОІЬА = А'2, або в загальному випадку СОИА = А‘, ОІЬА = А'12, дек - ціле, к > 1; р^ (х) = (р/х))‘. Множини рівня та декомнозиції нечітких множин. В апараті нечітких множин важливу роль відіграють множини рівня а. Визначення 4.13. Множиною рівня а нечіткої множини А на X нази- вають множину, складену з елементів хєХ таких, ступінь належності яких до множини А не менша а, тобто якщо Аа - множина рівня а нечіткої множини А, то 4. ={х:і*,(х)*<х}. 131
Справедливі такі співвідношення [25]: (<М=ЛІМ; (<р)«=4ҐК Якщо для операції об’єднання та перетину використовуються відповідні сильні операції, то (я£)В)а о(4ІШ; (ЛГ)В)а 5=(ЛаПВа). У деяких випадках доцільно використувати розкладання нечіткої мно- жини ц за її множинами рівня, а саме поданням нечіткої множини у вигляді Л = ^аЛо, (4.1) а-Ю де ц^(х) =ац4_(х), а об’єднання нечітких множин беруть згідно з формулою (4.1) за всіма а від нуля до одиниці. Приклад 4.2. Нехай X = {1,2,.... 6}, а ФН нечіткої множини А у X за- дано у табл. 4.1. Таблиця 4.1 х 0 і 2 3 4 5 6 м*) 0 0.1 0,3 0,5 0,7 0,9 1 Тоді на множині А можна записати такі множини рівня: 4, = {1,2,3,4,5,6}; 4, = {2,3,4,5,6}; 4, = {3,4,5,б}; 4, = {4,5,6}; 4, = {5,б}; 4. = {б}, а нечітку множину А можна подати у вигляді А = О,1{1,2,3,4,5,6} 0 0,3{2,3,4,5,6} II 0,5{3,4,5,б} II 0,7{4,5,б} II 0,9{5,б} II 1,0{б}. 4.2. Нечіткі відношення. Операції над ними Введемо поняття нечіткого відношення і розглянемо його властивості [25]. Визначення 4.14. Нечітким відношенням К на множині X називають нечітку підмножину декартового добутку X х X, яка характеризується та- кою ФН рДх.у), що ХяХ—Ь|—>[0,1], причому ц,(х,у) розглядається як суб ’єктивна міра виконання відношення хКу. Приклад 4.3. Нехай задано: а) чітке відношення Я(£, х £ у), де х є [0,1]; 132
б) нечітке відношення К(»,х » у). На рис. 4.5, а зображено пари (х, у) із проміжку [0,1], пов’язані відношенням Я, тобто такі, що х у. Вони утворюють множину точок заштрихованої області, які відокремлені чіткою межею - діагоналлю квадрата - від інших точок. Будуючи нечітке відношення К:х»у на одиничному квадраті, переконуємося, що існують пари (х,у) такі, які можна напевно віднести до множини Я (наприклад, точку х = 0,9, у = 0,01), а також які напевно не нале- жать до Я (наприклад, х = 0,01, у = 0,9). Окрім того, є множина пар (х,у), про належність яких до множини Я можна говорити лише наближено з певною суб’єктивністю (наприклад, точка х = 0,8, у = 0,6 ). Тому нечітка множина Я характеризується відсутністю чіткої межі від доповненої множини Я, і ступінь належності ц,(х,у) пари (х,у) варто характеризувати щільністю штриховки (рис. 4.5, б). Можна роз- глянути деякі перетини відношення Я за фіксованого х0. Рис. 4.5 Відповідну сім’ю функцій р,(х0,у) подано на рис. 4.5, в. Якщо відно- шення Я на X скінченне, то його ФН рж(х,у) задається у вигляді квадратної матриці і,у = 1,л з елементами гг є[0,1]. Якщо =а, то це означає, що ступінь виконання відношення х(Яху дорівнює а. 133
Носієм нечіткого відношення В на множині X називають підмножину декартового добутку X х X, яка визначається так: аиррЛ = {(х,у): рДх,у)>0, хєі, у є У). Операції над нечіткими відношеннями. Нехай на множині X х X за- дано два нечітких відношення А та В із ФН ц^(х,у), цж(х,у). Тоді множина С = А І) В є об’єднанням нечітких відношень А та В на множині X, якщо її ФН визначається виразом Мс(*.у) = шах{р/х,у), рж(х,у)}. Аналогічно множина В = А Г) В є перетином нечітких множин А та В, якщо Мс(х,у) = тіп{р4(х,у). р,(х,у)}. Можна ввести також операції сильного об’єднання та сильного перетину, аналогічні операціям над нечіткими множинами (див. визначення 4.6 та 4.8). Нечітке відношення В включає в себе нечітке відношення А (А а В), якщо для них виконується співвідношення Ц^(х,у) 5 М>(х,у), Ух, у є X. Якщо В - нечітке відношення із ФН р,(х,у), то відношення В, що характеризується ФН рж(х,у) = 1-ц,(х,у), Ух, уєХ, називають доповнен- ням В на множині X. Обернене до Я відношення на X визначають так: хЯ'ує------>уЯх, при цьому ФН пов’язані між собою рівністю цд1 (х,у) = ц,(у,х). Нечіткі відношення мають такі властивості: 1. Рефлексивність. Нечітке відношення називають рефлексивним на X, якщо виконується умова ц,(х,х) = 1, Ух є X (приклад рефлексивних відно- шень: приблизно рівні, близькі). 2. Антирефлексивність. Нечітке відношення В на X антирефлексивне, якщо для всіх х є X маємо ц,(х,х) = 0 (наприклад, В - набагато більше). 3. Симетричність. Нечітке відношення В на X симетричне, якщо для всіх х.уєХ маємо Ц,(х,у) = р/(у,х). Відношення В антисиметричне, якщо з того, що р,(х,у) > 0, випливає ц,(у,х) = 0 (наприклад, »; «). 134
Важливе значення в теорії нечітких множин має композиція (або добуток) нечітких відношень. На відміну від звичайних (чітких) відношень, композицію (добуток) нечітких відношень можна визначити різними способами [25]. Визначення 4.15. Максимінна композиція (добуток) нечітких відношень А та В характеризується ФН вигляду ЦлАх>У) = зиртіпІр/х.гХр/г.у)}. ж«Х Визначення 4.16. Мінімаксна композиція нечітких відношень А та В (вона позначається А о В) визначається ФН вигляду (*- У) = пЦР тахіц, (х, х), ц, (х, у)}. Визначення 4.17. Максимультиплікативна композиція нечітких відно- шень А та В - нечітке відношення С — А* В із ФН вигляду Ра»в(х>У) = «ЧИМ*.*) Мв(2.>’)} • 2ЄХ Приклад 4.4. Нехай задано два нечіткі відношення А та В на множині X, яка складається з двох елементів X = {х|,х2}, де матриці нечітких відношень такі: Уі Уі цА*’У)= х, 0,2 0,6 х2|о,5 0,8| х, 0,5 х2|0,3 0,7 1 М,(^>) Тоді композицію (добуток) нечітких відношень визначають так: а) максимінна В* = АВ: Ил. (*>’) = 0,3 0,5 0,6 0,8 б) мінімаксна Л2 = А о В: 0,5 0,5 0,7 0,7 в)максимультиплікативна В* = А*В: КгЛх>У) 0,18 0,25 Нечітке відношення В на множині X 0,6 0,8 ‘ називають транзитивним, якщо В-В^В . Із цього випливає, що властивість транзитивності нечіткого відношення залежить від способу задання композиції нечітких відношень. 135
4.3. Нечітке відношення переваги Під час моделювання реальних систем можуть бути такі ситуації, коли ОПР немає чіткого уявлення (інформації) про відношення переваги між усіма або деякими альтернативами, а можна лише оцінити ступінь виконання тієї чи іншої переваги між парами альтернатив у вигляді числа на відрізку [0;1]. У такому разі за допомогою ОПР (або експерта) можна ввести нечітке відношення переваги. Визначення 4.18. Нечітким відношенням нестрогої переваги на множині альтернатив X називатимемо будь-яке задане на цій множині нечітке рефлексивне відношення В [25; 44]. Отже, нечітке відношення переваги В на X описуватимемо ФН рк (х,у), що має властивість рефлексивності, тобто рд(х,х) = 1 для всіх х є X. Якщо К - нечітке від ношення переваги на множині X, то для довільної пари альтернатив (х,у)єЯ значення рДх.у) слід розуміти як ступінь виконання переваги х^у. На основі заданого на X нечіткого відношення нестрогої переваги В можна однозначно визначити три відповідних йому нечіткі відношення: 1) байдужості 1^; 2) еквівалентності Я,; 3) строгої переваги Я,, які використовуються для визначення й аналізу властивостей множини недомінозаних альтернатив у за- дачах прийняття рішень [25; 44]. За аналогією із звичайними (тобто чіткими) відношеннями переваги їх визначають так: я7 = {Ххх}\{яСія І}и{яПя1}; я, = я\я', Я,=ЯПЯ’'. Тобто відношення еквівалентності Я, визначають так: альтернатива х еквівалентна у(у~х), якщо одночасно виконуються відношення хку та у^х. Використовуючи раніш введені означення операцій ЬІ.П, неважко от- римати вирази для ФН цих відношень: 1) нечітке відношення байдужості: р'(х,у) = тах[1-тах{рж(х,у); ря(у,х)}; тіп{р,(х,у); р,(у,х)}]= = тах[тіп{1-р/х,у); 1-р,(у,х)}; тіп{р,(х,у); рд(у,х)}]. 2) нечітке відношення еквівалентності: 136
р',(х^)=тіп{р,(х,у); Му,*)}; 3) нечітке відношення строгої переваги: и5(х = якщо ня' (0, в іншому разі. Розглянемо деякі властивості введених нечітких відношень. 1. Нечіткі відношення , К' рефлексивні й симетричні. Справді, їх рефлексивність випливає з того, що ц'(х,х) = 1, Х/хєХ, оскільки вихідне відношення К рефлексивне, тому р;(х,х)=р;(х,х) = і. Симетричність обох відношень випливає з їх означень. 2. Нечітке відношення строгої переваги К5 антирефлексивне та антиси- метричне. Справді: а) ц’(х,х) = 0, оскільки вихідне відношення К рефлексивне і для нього р,(х,х) = 1 для всіх х є X; б) нехай ц,(х,у)>0, тобто цд(х,у)>ц/(у,х)>0, тоді ц*(у,х) = 0, що означає антисиметричність цього відношення. Можна показати, що коли вихідне нечітке відношення переваги К на X транзитивне, то транзитивні також і відповідні відношення еквівалентності Я, та строгої переваги [44]. Лінійність нечітких відношень. Важливою властивістю заданого на X відношення переваги є його лінійність. Визначення 4.19. Відношення К на X називають лінійним, якщо цим відношенням або оберненим до нього К~' пов ’язані будь-які дві альтернативи певної множини. Інакше кажучи, для лінійного відношення на множині X немає непорівнянних між собою альтернатив стосовно відношення переваги. Очевидно, лінійність звичайного (чіткого) відношення еквівалентна умові ЯЦІЯ1 =ХяХ, по-іншому цю умову можна записати так: М*. У) = 0----(у, х) = 1. 137
Розглянемо властивості лінійності для нечіткого відношення переваги (НВП). Визначення 4.20. Нехай X - деяке число з проміжку [0;1]. Нечітке відношення називають ^.-лінійним, якщо його ФНзадовольняє умову тах{р,(х,у),р,(у,х)} ї X для будь-яких X, У&Х. Нечітке відношення ц, називають сильно лінійним, якщо його ФН задовольняє умову шах{ц,(х,у),р,0’,х)} = 1 для довільних X, у є X. Інакше кажучи, властивість сильної лінійності можна визначити таким чином: ---->М«(х,>') = 1. V* є X. (4.2) Щоб пояснити зміст властивості сильної лінійності покажемо, що сильна лінійність еквівалентна умові ц,(х,у) = 1-^(Ьх), (4.3) де ц*(у,х) - відповідне нечітке відношення строгої переваги. Справді, якщо виконується властивість (4.2), то згідно з означенням отримаємо ц*(>\х) = 0, тобто умова (4.3) також виконується. Навпаки, якщо виконується умова (4.3) і ц,(х,_у) £ щ(у,х), то тоді щ(х.у') = 1, тобто вико- нується властивість (4.2). Розглянемо умову сильної лінійності у формі (4.3). Неважко помітити, що її можна записати у вигляді К~' = (X х X) \ К5. З означення сильної лінійності випливає, що у разі сильно лінійного не- чіткого відношення переваги К на множині X для будь-яких двох довільних альтернатив х,, х2 виконується хоча б одна з рівностсй = 1 та(або) цж(х2,х|) = і. Важливою особливістю сильно лінійного нечіткого відношення переваги є те, що відповідні йому множини Я, та К. збігаються. Припустимо, що для 138
деякої пари (х,у) є А-виконується нерівність цж(х,у)^цд(у,х). Тоді з умови (4.3) випливає, що |хд(х,у) = 1 , а із визначення ц^(у.х) отримаємо, що ці(*.>) = Р*(>’.х)- Через симстричность у випадку, коли цж(х,у)£рд(у,х), матимемо рІ(х,у) = цДх,у). Отже, МІи. У) = тш{р,(х, у), рж(у,х)} = м'Дх.у). Нечітка підмиожипа недомінованих альтернатив. Використаємо введені вище відношення строгої переваги К3 для визначення підмножини недомінованих альтернатив. Згідно з означенням нечіткого відношення переваги К5 для будь-яких альтернатив х,уєХ величина ц*(х,у) є ступенем, з яким альтернатива у домінуєгься альтернативою х. Тому за фіксованого уєХ функцію ц*(у,х) можна розглядати як ФН нечіткої множини альтернатив х є X , які строго домінуються альтернативою Ц«(х,у) • Звідси випливає, що множина всіх альтернатив х, які не домінуються альтернативою у, є доповненням введеного відношення К5. Згідно з означенням доповнення нова нечітка множина описується ФН вигляду 1 _ (у> х)г х є X. (4.4) Якщо, наприклад, р*(у,х) = 0,3, то зі ступенем 0,7 альтернатива х ис домінуєгься альтернативою у. Звідси випливає, що для виділення в X підмножини всіх альтернатив, кожна з яких не домінуєгься жодною альтернати- вою з X, треба взяти перетин нечітких підмножин (4.4) за всіма у є X. Такий перетин назвемо нечіткою підмножиною недомінованих альтернатив й позначи- мо його через Хп. Згідно з означенням операції перетину нечітких множин отримаємо такий вираз для ФН множини недомінованих альтернатив: ц7(х) = іпГП-р*(у,х)], хєХ, або (х) = 1 - аир р* (у, х), х є X. (4.5) гЧ Згідно з виразом (4.5) ц“(х) - ступінь, з яким альтернатива х не доміну- ється жодною з альтернатив множини X. Нехай ц“(х) = а для деякої 139
альтернативи х„. Тоді х0 домінується будь-якими іншими альтернативами зі ступенем, який не перевищує (1 - а). Користуючись означенням нечіткого відношення ц*(х,у) можна пока- зати, що !^РМІ(>’,х) !іир[ц,(у,х)-р,(х,у)], хєі. (4.6) Вираз (4.6) дає змогу описати підмножину недомінованих альтернати ФН вигляду р“(х) = 1 - кир{р,(у,х) - р.(х.у)], де - вихідне нечітке відношення нестрогої переваги. Оскільки величина ц“(х) є ступенем недомінованості альтернативи х, то раціональним слід, звичайно, вважати вибір альтернатив, що мають найбільший ступінь належ- ності нечіткій множині , тобто таких, що ц7(х°) = зирц7(х) = 1 -ілГаир{р,(у,х) - р,(х,у)}. (4.7) Множину всіх альтернатив хи, які задовольняють умову (4.7), назвемо мак- симальними недомінованими альтернативами на множині X. Очевидно, що X" = {х:ц7(х) = аиррїЧг), х є X}. Приклад 4.5. Нехай у скінченній множині X = {х1,х2,х,,х4} задано нечітке відношення нестрогої переваги (табл. 4.2). Таблиця 4.2 Цл(хі,х2) «V Х1 х2 х5 х« Хі 1 од 0,3 0,1 Х2 0,5 1 ОД 0,6 Хі 0,1 0,6 1 од х< 0,6 0,1 0,5 1 Використовуючи введені означення, а також формули для ФН нечіткого відношення строгої переваги, знайдемо відношення строгої переваги К, (табл. 4.3). 140
Таблиця 4.3 МІС*,.*,) «V Х1 Х2 Хз х< Хі 0 0 0,2 0 *2 0,3 0 0 0,5 Хі 0 0,4 0 0 0,5 0 од 0 Звідси отримаємо шукану ФН нечіткої множини недомінованих альтер- натив (табл. 4.4). Таблиця 4.4 Х1 х2 хз х« 0,5 0,6 0,8 0,5 Як бачимо, найбільший ступінь недомінованості має альтернатива х,(ц“(х) = 0,8), тому її вибір слід вважати найкращим рішенням. Чітко недоміновані альтернативи та їх властивості. Розглянемо задачі раціонального вибору альтернатив, у яких множина недомінованих альтернатив являє собою нормальну нечітку підмножину множини X, тобто ФН цієї підмножини має властивість У цьому разі для будь-якої альтернативи х із множини Xм максималь- них недомінованих альтернатив виконується умова ц“(х) = 1 • Це означає, що для будь-якої альтернативи хєX** та довільної альтернативи уьХ виконується рівність цІ(у,х) = 0, тобто жодна з альтернатив не домінує з не- нульовим ступенем альтернативу х. Такі альтернативи, для яких ц“(х) = 1 , називатимемо чітко недомінованими (ЧНД), відповідну множину - множиною ЧНД-альтернатив, і позначатимемо її АгЧЦД. Тоді ХЧВД = {х:хєХ та ц"(х) = 1). Множина ЧНД-альтернатив відіграє визначальну роль у задачах раціона- льного вибору, оскільки її можна розглядати як чітке рішення нечітко сформульованої задачі. 141
Розглянемо деякі властивості ЧНД-альтернатив, насамперед питання про їх еквівалентність. Покажемо, що ЧНД-альтернативи, якщо їх можна порів- нювати, обов’язково еквівалентні. Як випливає із визначення для довільної ЧНД-альтерна- г/ЩД • • тиви хел виконується рівність З'ФМІб'.*) = 0. г«х Звідси можна зробити висновок, що для будь яких х1,х2 є Xчвд виконуєть- ся рівність Тоді з означення цІ(х,,х3)випливає, що ц>(х1,х3) = ц>(х3,х1). Згідно з означенням нечіткого відношення еквівалентності ц^(х1,х2) отримаємо = МХ|,Х3) для всіх хгх2е*ЧВД (4.8) Розглянемо два типи лінійності НВП: 1) К: X- лінійне НВП. Якщо Я є X-лінійним, то тах{р,(х1,х3),р,(х3,х1)} £ X, а з рівності (4.8) випливає ц;(х„х3)£Х. Отже, дві довільні ЧНД альтернативи еквівалентні зі ступенем, більшим за X; 2) К сильно лінійне НВП. Якщо К сильно лінійне, то шах {ц, (х,, х3), ц, (х2 ,х,)} = 1, а х,,х2 є Х41”, з означення сильної лінійності та рівності (4.8) випливає 142
4.4. Багатокритеріальний вибір альтернатив на основі нечіткого відношення переваги Розглянемо застосування НВП та множини недомінованих альтернатив у проблемі раціонального вибору за наявності декількох критеріїв [25]. Нехай маємо ситуацію, коли кожний із критеріїв у заданий у формі чітких функцій корисності Х->Кт. Значення /^х) можна трактувати як числову оцінку альтернативи хєХ за ознакою у. Альтернатива х з більшою оцінкою /,(х) вважається кращою за критерієм (ознакою) у. Таким чином, кожна із функцій /{(х) описує (задає) звичайне (чітке) відношення переваги К/ на множині альтернатив X вигляду Я, = {(х,у): /у(х) £ /,(у),х,у є X}, у = 1,/и. Завдання полягає в тому, щоб вибрати альтернативу х0, яка мала б найбільші оцінки за всіма критеріями (ознаками). Отже, раціональним у розгля- дуваному випадку слід вважати вибір альтернативи х0 є X, яка має властивість /у(хо)^/у(>-). УуЄХ,у = 1Тт. Такі альтернативи називають ефективними (або парето-оптпимальними), і розв'язком цієї задачі вибору є множина всіх ефективних альтернатив. Для розв’язання сформульованої задачі багатокритеріального вибору треба обрати належний спосіб згортки багатьох критеріїв (векторного критерію) у скалярний. Одним із найпоширеніших способів згортки критеріїв є використання перетину. Нехай (), =р|Я,, тоді множина ефективних альтернатив у множині 1-1 Xз відношенням переваги @ збігається з множиною ефективних альтернатив для набору функцій /у(х). Отже, для відшукання множини ефективних альтернатив можна замість набору відношень }' = 1,т використати їх перетин (? і знайти множину недомінованих альтернатив за НВП . 143
Позначимо через цу(х,у) ФН НВП К/. Очевидно, що , . [1, якщо/у (х)£/у (у), або (х,у)єЛу; |0, в іншому випадку (х, у) й Лу. Тоді їх перетину р|Лу - НВП б, - відповідає ФН Ма (*.У) = тіп{р1(х,у),р2(х,у),...,рж(х,у)}. (4.9) Така згортка критеріїв аналогічна згортці вигляду Г(х) = пшкоу/у(х), (4.10) що застосовується у багатокритеріальних задачах прийняття рішень (див. гл. 5). Числа соу у виразі (4.10) - це коефіцієнти відносної ваги відповідних критері- їв. У згортці (4.9) очевидно, що соу =1, V/= 1,т, і відношення Сі с рефлекси- вним. Якщо ж соу * 1, то На С*»*)=..........................“яМяи.У)}. отже, відношення Сі вже не є рефлексивним. Введемо згортку вихідних відношень {Яу} у вигляді суми т де Е(Оу =1, (Оу £0. 7=1 їй відповідає ФН вигляду Мо,и.у) = £<о/Му(х,у)- Зазначимо, що результуюче НВП Сі рефлексивне, оскільки рефлексивні усі вихідні НВП Кг Використовуючи НВП Сіта Сз» знаходимо множини недомінованих аль- тернатив 0^ та СГ’ • Далі доцільно шукати перетин множин СіМ » * знайти множину Сцд =СіНЛП та відповідну ФН ржд(х)= тіп{р“(х),ц^(х)}. На множині Сш треба відшукати альтернативи з максимальним ступенем недомінованості. Це і буде найкращим вибором. 144
Опишемо алгоритм вибору альтернатив за наявності багатьох критеріїв оптимальності у формі нечітких відношень переваги (НВП) [25]. 1. Нехай на універсальній множині альтернатив X задано відношення переваги (чіткі або нечіткі) із ФН цу(х,у), а також (Оу, у = 1,?и - вагові коефіцієнти відповідних відношень. т Будуємо згортку відношень ЯрЯр У ВИГЛДДІ перетину Сі = П Яу із ФН 7=1 Иа(^у) = пнп{ц,(х,у),ц2(х,у),.... ц_(х,у)}. 2. Визначимо множину недомінованих альтернатив , що породжу- ється НВП Сі У множині (А\Сі): Рй (*) =1 “ 8иР {Рй ІУ, х) ~ Ий <х’ >*)) • уеХ 3. Використовуючи згортку критеріїв у вигляді суми, будуємо НВП : = £со, =1, соу£0. 1-і 1-і 4. Знаход имо нечітку множину недомінованих альтернатив за відношенням О^: Иф (*) =1 - хиР {ма (У.*) - Рйі <*’>')) • геХ 5. Знаходимо перетин множин СГ" > СГ і спільну множину не- домінованих альтернатив 0^ = СГГІ в" *3 ФН ри(х) = тіп{ц“(х), ц“(х)} . Раціональним вважатимемо вибір альтернатив із множини Анд = {** ' Рцд(*‘) = 8иРМцд(х),Х Є X}. X Отже, найкращим слід вважати вибір альтернатив із множини з най- більшим ступенем недомінованості. Пр иклад 4.6. Нехай громадянин N планує свою відпустку. При цьому він розглядає такі можливі варіанти: X] - поїхати в Крим; Хі - поїхати на закордонний курорт на березі Чорного моря; 145
х, - відпочити на дачі на березі Дніпра; х4 - поїхати в санаторій під Києвом. Громадянин оцінює альтернативи за такими критеріями: Я1 - вартість відпочинку із врахуванням дороги; Л, - якість відпочинку, рівень сервісу і обслуговування; Я, - можливість отримання лікування; Я4 - можливість роз- ширення свого світогляду, наявність екскурсій. Нехай за оцінками експерта зазначені критерії встановлюють такі відношення переваги на множині альтернатив: Я,: х, в>х2,хі >-х^Ху >х4,х4 >- х2; Я,: х^ > х,,х, х4,х4 >- х,; Я,: х, ®х4,х^ >л^,х2 »х,; Я4: х; ® х1,х1 >-х,,х, »х4. Нехай ваги критеріїв такі: ^=0,4; к2 = 0,3; мг, = 0,2; ^,=0,1. Побудувати згортки критеріїв й =ПЯу та (?2 =Хи,уЯ; і знайти найкра- щу альтернативу за обома згортками. Розв ’язання. 1. Будуємо матрицю відношення Я,. Вважатимемо всі відношення транзитивними, тобто якщо х2 > х, , а х2»х,,то л^^х,. Скористаємось співвідношенням 1, якщо х, > х,, або х, »х., Мл,(*(»х,)= . 0 в іншому випадку. Отримаємо матрицю відношення Я,: Х( \Ху Хг Ху 1 1 0 0 х2 1 1 0 0 Ху 1 1 1 1 х, 1 1 0 1 146
2. Будуємо аналогічно матрицю відношення Л,: х,\ху *з *4 1 0 1 1 Х2 1 1 1 1 0 0 1 0 *4 0 0 1 1 3. Будуємо матрицю відношення Я,: х,\ху *3 Х4 1 1 1 1 Х2 0 1 1 0 0 1 1 0 *4 1 1 1 1 4. Будуємо аналогічно матрицю відношення К4: х(\ху *з *4 1 1 1 1 Ч 1 1 1 1 0 0 1 1 *4 0 0 1 1 5. Будуємо згортку відношень = Л, гл Л, : х,\ху *2 хз *4 1 0 0 0 Х2 0 1 0 0 *3 0 0 1 0 *4 0 0 0 1 6. Знаходимо відношення строгої переваги £>*: х,\ху *2 *3 *4 0 0 0 0 Х2 0 0 0 0 *з 0 0 0 0 *4 0 0 0 0 147
Знаходимо підмножину недомінованих альтернатив за згорткою : *4 от 1 1 1 1 7. Будуємо адитивну згортку відношень із ФН: х,\ху *2 *4 1 0,7 0,6 0,6 0,8 1 0,6 0,4 х> 0,4 0,6 1 0,5 *4 0,6 0,6 0,6 1 8. Будуємо матрицю строгого відношення 0^ та знаходимо підмножину недомінованих альтернатив ££*: х,\ху *2 *4 0 0 од 0 *2 0,1 0 0 0 х> 0 0 0 0 *4 од од 0,1 0 X, Хі *4 от 0,8 0,8 0,8 1 9. Знаходимо перетин множин (У* та СГ ® обчислюємо ФН результуючої МНОЖИНИ 0“ = ОТ X, X! Х2 Хз *4 0“ 0.8 0,8 0,8 1 Отже, найкращою альтернативою є х4 - поїхати в санаторій під Києвом, її ступінь недомінованості цм(х4) = 1 = шах. 148
4.5. Узагальнення нечіткого відношення переваги. Принципи узагальнення Заде-Орловського Нехай на універсальній множині У задано НВП Я із ФН : УхУ---->[0;1]. Нехай ¥ - клас усіх нечітких підмножин множини У, тобто клас усіх функцій вигляду V: У-> [0;1]. Сформулюємо таку задачу: визначити, яке НВП відображає на клас ¥ вихідне НВП Я. Для розв’язання цієї задачі скористаємося принципом узагальнення, за- пропонованим Л. Заде. В його основу покладене означення нечіткої множини за звичайного (чіткого) відображення. Нехай <р:Х----->У - задане чітке відображення, А - деяка нечітка підмножина множини X із ФН ц4(х). Відповідно до принципу узагальнення образ В нечіткої множини А при чіткому відображенні <р визначається як нечітка підмножина В множини У, яка є сукупністю пар вигляду [25] (У.Р.(у)) = (ф(^).н/х)),хєХ, (4.11) Де И»ІУ) '• У-КОД] ~ ФН образу. Функцію належності ц,(У) можна записати у вигляді ц,(у)= вир р,(х),уєУ, —тЛЯ де множина ф 'Су) для довільного фіксованого у є У має вигляд <р,(у) = = {х:ф(х) = у,хєАг}, тобто є множиною всіх елементів хєХ, образом кож- ного з яких за відображення ф є елемент у. Застосуємо принцип узагальнення у формі (4.11) для розширення області визначення нечіткого відображення [25; 44]. Нечітке відображення можна описати як відображення, за якого кожно- му елементу х є X ставиться у відповідність не конкретний елемент множи- ни У, а у загальному випадку деяка нечітка підмножина множини У. Нечітке відображення описується функцією вигляду р,: X х У-----> [0;1] , тоді функція р,(х0,у) за фіксованого х0 є ФН нечіткої множини у є У, яка являє собою нечіткий образ елемента х0 за цього відображення. 149
Наприклад, для систем керування нечітку множину р,(х0,у) можна трактувати як нечіткий опис реакції цієї системи на керування х„. Отже, нехай р : Хх У------> [0;1] - задане нечітке відображення, р^(х) - нечітка множина в X, і треба знайти образ В нечіткої множини А за цього відображення. Якщо для цього застосувати принцип узагальнення у формі (4.11), то отримаємо сукупність пар вигляду {ц,(*.у).М^(х)}, хєХ , де р,(х,у) з» кожного фіксованого х є X є нечіткою підмножиною множини У. Отримаємо, що образ нечіткої множини р2 у цьому разі - це складний об’єкт: нечіткий підклас класу всіх нечітких множин множини У. Використання таких об’єктів на практиці дуже складне, тому С. Орловський запропонував принцип узагальнення у більш зручній формі. В його основу покладене таке визначення образу нечіткої множини за нечіткого відображення [44]. Визначення 4.21. Образом В нечіткої множини А в X за нечіткого відоб- раження рф: Хх У------>[0,1] називають нечітку множину В із ФН вигляду р,(у) = яиртіп{рі|(х),р,(х,у)}. (4.12) В основі цього визначення образу лежить Максимівна композиція нечітких відношень р4 та р*. Можна перевірити, що в окремому випадку, коли рф - звичайне (чітке) відображення вигляду ф: X---------->У (тобто р,(х,у) = 1, коли у = ф(х) і р,(х,у) = 0 для всіх інших пар (х,у))> визначення 4.12 дає р,(у)= вир р/х), що відповідає вищенаведеному визначенню образу за звичайного (чіткого) відображення на основі принципу узагальнення Л. Заде. Іноді задане нечітке відображення р* може залежати від п змінних, тоб- то мати вигляд р,: Хх¥------>[0;1], де Х = Х,хХІх...хХ,. Нехай на множині X задано нечітку підмножину р^(х,у). У загальному випадку її ФН задають так: ...х,) = тіп{рІ(хІ), ра(х2).р,(х,), у(х„ хг.... х.)}, 150
№ Мі(хі),’ = 1»и та у(лі> •••» х.) ~ задані нечіткі підмножини відповідних множин X, та X. Застосувавши у цьому разі принцип узагальнення у формі (4.12), отримаємо такий вираз для ФН образу нечіткої множини: Мв(у) = зир тіпІр^Х]),Ц2(х2), ...,М„(хя),у(х1,х2,...,хя), »-»*я Цф(*1. *2..^Я.У)}- Узагальнене нечітке відношення переваги. Використаємо введений вище принцип узагальнення для розв’язання задачі знаходження образу нечіткого відношення за нечіткого відображення. Розглянемо задане на множині У НВП К. із ФН у,гєУ. Нехай V: У------> [0;1] - деяка нечітка підмножинв множини У . Тоді згідно з принципом узагальнення образ V за нечіткого відображення ц,(у,2) є нечіткою підмножиною У із ФН вигляду [25; 44] т](у,у) = 8иртіп{у(х),ря(х,у)}. (4.13) <<Г Функція т] описує узагальнення відображення вихідного НВП на множи- ну У х У. Інакше кажучи, для фіксованого V, є У функція т](у0,у) описує не- чітку множину елементів У, пов’язаних із V, узагальненим відношенням К', тобто таких уєУ, що у0Л'у. Отже, величина ц(у0,у) є ступенем, з яким нечітка множина V, переважає елемент у. Аналогічно П(У.У0) = 8иртіп{у(х),цд(у,х)} (4.14) геГ є ступенем оберненої переваги у к V,. Продовжимо процес узагальнення вихідного НВП К. Розглянемо отри- ману функцію ц у (4.13) як нечітке відображення У----->у, де у - клас усіх нечітких підкласів класу У. Згідно з принципом узагальнення образом у0 за нечіткого відображення ц є нечіткий підклас класу У із ФН вигляду ті(*.у0) = 8иртіп{ув(у),т)(у,у)}, (4.15) причому його можна розуміти як підклас нечітких підмножин в У таких, що V > Го. Із виразів (4.14), (4.15) отримаємо такий вираз для ФН узагальненого нечіткого відношення переваги [25]: 151
П(у,А2) = 8иртіп{у,(у),8ир[у2(г),цд(у,7)]} = **’’ (416) = 8иртіп{у1(у),у2(2),рд(у,г)}. ' ‘ } Аналогічно можна дійти висновку, що обернена перевага у2 £ V, виконується із ступенем, який дорівнює величині п(у2. V.) = 8иР{''10’).',І(2)»Мг.У)}. Приклад 4.7. Нехай X = {х,,х2,х,} - задана нечітка множина А в X, яка має ФН ц^(х), що задані у табл. 4.5, а нечітке відношення Л має ФН ц,(х, у): X х У---->£0;1] (табл. 4.6). Таблиця 4.5 X х| х2 х, М*) 0,3 0,7 1.0 Таблиця 4.6 х\у У, У2 Уі Уа У, X, 0,8 1 0 0,3 0,7 0,8 0,3 0,8 0,4 0,7 х, ОД 0,3 0,5 од 1 Знайти образ В нечіткої множини А в X, що генерується відображенням К. Розв’язання. Згідно з виразом (4.12) знайдемо ФН нечіткої множини В: ц>(у) = 8иртіп{ці1(х); ця(х,у)}. МІ Обчислимо спочатку Мж(у,), для цього виконаємо операцію знаходження тіп для всіх елементів рядка Цл(х) та стовпця у, (табл. 4.6). Це дає 0,8 [0,3 0,7 1]П 0,8 0,2 0,3 П 0,8 0,7 П 0,8 1П0.2 0,3 0,7 0,2 Після виконання операції V є У на елементах здобутого стовпця отри- маємо тах{0,3;0,7;0,2} = 0,7. Таким чином, ц,(у,) = 0,7. Виконавши аннало- гічні операції над рядком та усіма стовпцями табл. 4.6, дістанемо: Р,(У2) = 0,3; М,(у>)=0,7; м,(у«) = 0,4; р,(у,) = 1. Розглянемо деякі властивості введеного узагальненого нечіткого відношення переваги т] , які визначаються властивостями вихідного відношення ц, та класом нечітких множин, на якому воно розглядається. 152
Теорема 4.1. Якщо НВП ц, на У рефлексивне, то й індуковане ним НВП т] теж рефлексивне на класі всіх нормальних нечітких підмножин множини У. Доведення. Якщо уєУ нормальне, тобто 8иру(у) = 1, то з виразу (4.16) отримаємо Л(у,у) = 8иртіп{у(у),у(г),р„(у,х)} ^8иртіп{у(у),у(у)} = виру(у) = 1, уаТ у отже, т](у,у) = 1. Теорему доведено. У наступних теоремах розглянемо пи- тання лінійності НВП. Теорема 4.2. Якщо НВП на У сильно лінійне, то й індуковане ним НВП т] також сильно лінійне на класі всіх нормальних нечітких підмножин множини У. Теорема 4.3. Якщо НВП на У к-лінійне, то й індуковане ним НВП т] також к-лінійне на класі всіх нормальних нечітких підмножин множини У, які мають властивість вир у(у) £ 1. Доведення цих теорем наведено в монографії [37]. Отже, властивість лінійності вихідного НВП ц, переноситься на індуковане ним узагальнене НВП т]. Приклад 4.8. Універсальна множина X неперервна. Нехай X = Я*, а не- чітку множину А на X задано у вигляді А = {х: рі^(х) = є'*1', Л, > 0}. Нечітке відношення К:ХхУ------->{0;1] має ФН рІІ(х,у) = е~і‘“”, Л,>0, за к1>к> (функції р4(х) та ц„(х,у) наведено на рис. 4.6, а, б). Треба знайти образ В в У, що генерується нечітким відношенням Я. Розв'язання. Згідно з виразом (4.13) р>(у)= виртш{цл(х),рд (*./)}• Знайдемо мінімум за х для рх(х) та цд(х,у). Дві криві (рис. 4.6,6) перетинаються у двох точках: а) умова 0 і х £ у: є*" = дає точку х, = у і б) умова х > у, е = е^'” дає точку х1= у. кі ~кх
Рис. 4.6 Криву Мв(х,у) = ц^(х)Арл(х,у’), максимум якої досягається за х = ^2 уг виділено на рис. 4.6, б суцільною лінією. +к2 Отже, Ц>О’) = Є . Приклад 4.9. Нехай задано дві нечіткі множини V, та у2 на У = К' із ФН уі0') = е >0 та у2(х) = е ‘’ *"’, де к, >0, к2 >£,. Нехай К а У х У - чітке відношення нестрогого порядку (х £ у), тобто ( ч _ 11, якщо х £ у; о, якщо г<у. Знайти ФН узагальненого НВП т](у,, у2 ), що генерується відношенням К на V,, у2. Відповідно до співвідношення (4.16) Т1(у2,у,) = 8иршіп{у1(у),у2(2),ця(2,у)} = зир{у1(у),у2(х)}. *.х«г 154
Розглянемо криві лДу), т]2(у)(рис. 4.7) і знайдемо точки їх перетину. Рис. 4.7 Маємо Л, у = к1 (г - 5). Знайдемо ліву точку перетину (г < 5): або *іУ = *і(5-2). = 5А2 - кг2-, 2 = -*іУ + 5Л2 К _ 5*2 Точку перетину кривих визначаємо за у = 2 =--- к, +к. . Л 5*. Отже, на інтервалі 0<у< матимемо т](у2,у1) = є на інтервалі <у<2, = , де г2 - друга (права) точка перетину кривих *1(у) та уг(2) • п(''2Л1) = е*‘' ; на інтервалі у>2 = отримаємо 2 к2-к, Недоміновані альтернативи у загальній задачі нечіткого матема- точного програмування. Розглянемо у загальному вигляді задачу НМП і зведемо її до задачі прийняття рішень за НВП [25; 44]. Формально задача НМП формулюється таким чином. Нехай X - універсальна множина альтернатив і цл : X----->[0;1]. Задано нечітку підмножину допустимих альтернатив. Нехай У - універ- сальна множина оцінок результатів альтернатив із множини X і р,: X х У >[0;1] задане на множині У НВП. Вибори альтернатив 155
оцінюються нечіткими значеннями заданої нечіткої функції цілі ф(х,у): Х*У------И0;1]. Завдання полягає у раціональному виборі альтернатив на основі інформації, заданої у вищеописаній формі. Аналізуючи цю задачу, спочатку вважатимемо для простоти, що множину допустимих альтернатив X описано чітко. Побудуємо на множині X НВП, яке індуковане вихідним НВП р* та не- чіткою функцією цілі <р, а далі виділимо в ньому підмножину недомінованих альтернатив. Довільній альтернативі х° задана функція <р ставить у відповідність нечітку оцінку цієї альтернативи у вигляді нечіткої підмножини оцінок ф(х,у) на У. Нехай г) - НВП, що індукується вихідним відношенням НВП на класі ¥ всіх нечітких підмножин множини У. Користуючись цим відношенням, можна порівнювати за відношенням переваги нечіткі оцінки альтернатив, а отже, й самі ці альтернативи. Інакше кажучи, ступенем переваги альтернативи х, є X над альтернативою х2 є X вважатимемо ступінь переваги нечіткої оцінки ф(х,,.г) над нечіткою оцінкою ф(х2,у), тобто покладемо Т](х1,х2) = п(ф(х1,я): ф(х2,у)), (4.17) де ф(х,,х), ф(х2,у) - нечіткі підмножини оцінок, які відповідають х, та х2. Отже, використовуючи визначення т] (4.16), отримаємо НВП на множині альтернатив такого вигляду: П(У1,У2) = 5иртіп{ф(х1,7),ф(х2,у),р,(г,>’)}. (4.18) Зауважимо, що в аналогічній задачі з чітко описаною цільовою функцією (ЦФ) X___________>У визначення (4.17) зводиться до звичайного (чіткого) відношення переваги х, і х2 < >/(Х|) £ /(х2) Справді, у цьому разі 1, якщо /(х) = у; 0 в іншому випадку; 1, якщо 2^ у; 0 в усіх інших випадках. ф(*.>) = Ря(г.>') = 156
Тоді рівність (4.17) матиме вигляд п(х1,х2)=& ЯКЩО. *’ (0 в усіх інших випадках. Можна переконатися в тому, що якщо функція <р нормальна (тобто Яф<р(х,у) = 1, Ух є X ), то НВП рефлексивне, отже, т)(х, х) = 1, Ух е X. та Виділимо у множині X із НВП т] нечітку підмножину недомінованих альтернатив. Згідно з означенням Хп її задають так: Л“(х) = 1 - 8ир(і](х',х), - Г](х,х')). Звідси з урахувашіям рівності (4.18) отримаємо Пвд(х) = 1 - киР[ «Ф тіп{ф(х',х),ф(х ,у),ця(х,у)} - х'еХ г,у«Г - вир тіп{ф(х',г),(р(х,у),ця(у,г)}]. і.усУ Розглянемо простішу, але практично важливу задачу, коли множина оцінок У - числова вісь. Тоді вираз (4.18) набуває вигляду т](х1,х2) = 8иртіп{ф(хі,г),ф(х2,у)}, т.га аг а розв’язком відповідної задачі НМП є нечітка підмножина недомінованих альтернатив вигляду Л“(х) = 1-8ир[8иртіп{ф(х’,г),ф(х ,у)}- ~Х а, (4 19) -8иртіп{ф(х,2),ф(х ,у)}]. 4 ’ ' ат Величина Т]“(х) є ступенем недомінованості альтернативи х. Якщо т]“(х)^а, то у множині X немає жодної альтернативи, яка домінувала б альтернативу х зі ступенем більшим, ніж 1 - а . Покажемо, що для знахо- дження альтернативи, недомінованої зі ступенем не меншим, ніж а, достат- ньо розв’язати таку задачу НМП: у----->тах (4.20) за обмежень ф(х,у)іа;хє Справедлива така теорема. 157
Теорема 4.4. Нехай нечітка ЦФ <р: X х X >{0;1 ] така, що зирф(х,у) £ а за будь-якого х є X, і нехай т] - НВП на X, яке індуковане відношенням не- строгого порядку «£» на числовій осі ¥ та функцією <р. Якщо (х°,у°) - розв'язок задачі (4.20), то т]"(х°)^а, де т)“(х) - нечітка підмножина недомінованих альтернатив на множині (Х,г\). Доведення. Нехай пара (х°,^в)єХ хУ- розв’язок задачі (4.20). Тоді, як випливає з виразу (4.19), для доведення теореми досить показати, що 8ир[8иртіп {<р(х',2),ф(х°,у)} - зиртіп{ф(х°,х),ф(х',у)}] 1 - а. Припустимо супротивне, тобто, що знайдуться х є X та є > 0 такі, що [зиртіп{ф(х,х),ф(х0,у)} - 0 (4.21) -8иртіп{ф(х ,х),<р(х,у)}] і 1 - а + є. Виберемо ує¥ так, що ф(х,у)> а-є (існування такого у випливає із припущення про функцію ф(х,_р) в умовах теореми 4.4). Оскільки пара (х0,у’) - розв’язок задачі (4.20), то у° > у і, крім того, ф(х°,У) £ а. Звідси 8иршіп{ф(х0,г),ф(х,у)} >а-є, але тоді нерівність (4.21) неможлива, оскільки лівий доданок у лівій частині (4.21) не може бути більшим за одиницю. Із доведеної теореми випливає, що будь-які умови, достатні для розв’язання задачі (4.20), достатні й для існування відповідних недо- мінованих альтернатив у множині. Зокрема, справедлива така теорема [44]. Теорема 4.5. Якщо множини X та ¥ компактні, причому ¥ - підмножина числової осі, функція <р: X х ¥ >{0;1] напівнеперервна на до- бутку Х*¥, 8цр<р(х,у)£а за будь-якого хєХ й т) - узагальнене НВП на X, індуковане відношенням порядку <<£» на ¥ та функцією <р, то у множині (х, т]) існує хоча б одна альтернатива х, для якої т]“ (х) £ а. 158
4.6. Загальна задача нечіткого математичного програмування і методи її розв'язання Нехай деяка виробнича фірма планує випуск різних виробів Хр—.х, на поточний період (квартал або рік). Позначимо через су очікуваний прибуток на одиницю реалізованої продукції типу у = 1,л. Для виробництва кожного з виробів використовуються ресурси 61,і>2,..., Ьш - виробничі потужності фірми, причому питомі витрати і-го ресурсу під час виробництва одиниці продукції типу ) становлять а, одиниць. Треба знайти такий раціональний план випуску виробів кожного типу, який забезпечує максимальний прибу- ток фірми. Математичне модель цієї задачі така: максимізувати 7-І за обмежень ^а>х] <,Ь)У х£0; хєй". і Цю задачу, коли значення параметрів су, є випадковими величинами з відомими функціями розподілу Р(ау), можна розв’язати методами стохастичного програмування (див. розд. 3). Однак на практиці ці параметри бувають невідомими і для параметрів с/, а* можна лише вказати інтервал можливих значень. Задачу такого типу можна назнати задачею з багатознач ними коефіцієнтами. У межах цієї задачі немає сенсу говорити про максимізацію ЦФ, оскільки значення цієї функції - не числа, а множини чи сел. Треба з’ясувати, яке відношення переваги на множині альтернатив по- роджує ця функція, а далі визначити, які рішення слід вважати раціональними стосовно цього відношення переваги. Наступним етапом на шляху деталізації та уточнення розглядуваної моделі є опис параметрів задачі у вигляді нечітких множин. У модель вво даться додаткова інформація як ФН у вигляді цих нечітких множин. Ці функції можна розглядати як спосіб наближеного відображення експертом наявного у нього неформалізованого уявлення про реальне значення цього 159
параметра. Значення ФН - це вагові коефіцієнти, які експерти приписують різним можливим значенням цього параметра. Отже, після уточнення маємо таку постановку задачі НМП. Задано лінійну форму вигляду /(х, с) = £ сІхІ---> тая, (4.22) /-і в якій значення коефіцієнтів {с}} описано нечітко у формі нечітких підмно- жин відповідних універсальних множин, тобто задано ФН ру(су), у =1,п. Окрім того, задано обмеження ^а^х^Ь,, і = 1,т, X;|£0, у = 1,л, (4.23) і причому значення коефіцієнтів описано також у формі нечітких мно- жин із ФН Уг(аг),т]((А,). Треба здійснити раціональний вибір вектора х є Л*. який у певному розумінні максимізує задану нечітку лінійну форму. Побудуємо модель цієї задачі та зведемо її до загальної задачі НМП. Нехай X - універсальна множина альтернатив. Підмножину допусти- мих альтернатив описують нерівностями, що випливають з обмеження (4.23): КІ(х,а„,аІ2..а„)£0, і = \,т, де - задані функції; X х К"-------> Я1; і = 1,л, у = 1, т - числові парамет- ри, значення яких описано у формі нечітких множин числової осі. Нехай уДаг) - задані ФН цих нечітких множин. Для завершення фор- мулювання задачі треба відшукати відношення переваги в універсальній множині оцінок альтернатив. У розглянутому випадку ця універсальна мно- жина являє собою числову вісь К‘. Вважатимемо, що вихідне відношення переваги - це нестрогий порядок «а» на К'. Побудуємо математичну модель задачі у формі загальної задачі НМП. Для цього розглянемо спочатку нечітке обмеження (4.23) і побудуємо відповідну йому нечітку підмножину допустимих альтернатив, ФН якої по- значимо як цс(х). 160
у(Л) = тіпу/>(а(,), Нехай {а^},/ = 1,п,у = 1,ти - деякі конкретні числові значення відповід- них параметрів в обмеженнях (4.23), ступені їх належності заданим нечітким множинам становлять відповідно уг(ар, / = 1,и, 7 = 1, т. Позначимо через мінімальне з цих чисел, тобто = шіпуг(а°). Як- що деяка альтернатива хєі задовольняє нерівності &,(х,а,°,а°2,..., а°)£0, і = 1,т, то природно вважати, що ця альтернатива належить множині допус- тимих альтернатив із ступенем не меншим, ніж , тобто вважати, що цс(х)^ц°. Цією нерівністю і задається множина допустимих альтернатив. Для зручності запису її ФН введемо такі позначення: А = |,а^ , і = 1,ти, у = 1,п; і=іл. (4.24) Р(х) = {Л = :^іІ аі2, .... а*,, х)£0; і = 1,т}. У цих позначеннях отримаємо цс(х) = вир у(Л) . Кожній альтернативі х функція рс(х) ставить у відповідність ступінь її допустимості з урахуванням нечіткої інформації. Розглянемо тепер нечітко задану функцію /(х, с,,с2,..., с„) і запишемо її у вигляді нечіткої ЦФ аналогічно тому, як це було зроблено для обмежень. Нехай с°,У = 1,и - деякі конкретні числові значення параметрів функції (4.22), ступені її належності заданим нечітким множинам дорівнюють відпо- відно х/су),7 = 1,п. Нехай <р° - мінімальне з них: <р = шіпху(су). Нехай, нарешті, х є X - де- яка альтернатива, і число г0 = /(х, с°, с°,.... с°) відповідає альтернативі х та значенням параметрів {с°}, у = 1,п значення функції (4.22). Природно вважа- ти, що це значення г° належить нечіткій оцінці альтернативи х зі ступенем не меншим, ніж <р°. Звідси шукана нечітка ЦФ <р(х,г) має вигляд ф(х, г)= вир х(с), (4.25) 161
де Х(с)=пйпх/(су),с=[с1,с2.с,]г; 0(х,г)={с:сєЛ',/(х,с)=г}. (4.26) Отже, вихідна задача з нечітко описаними параметрами формулюється у вигляді такої загальної задачі НМП: максимізувати нечітку ЦФ <р(х,г)= зир х(с) на нечіткій множині допустимих альтернатив М*) = зир *(Л), де С(х,г) та Р(х) задаються відповідно виразами (4.26) та (4.24). Недоміновані альтернативи у загальній задачі нечіткого математично- го програмування та метод П розв’яння. Розглянемо загальну задачу НМП, в якій нечітко задані параметри с) функції /(х) і параметри а, обмежень (4.24). Насамперед зазначимо, що в розглядуваній задачі вибір альтернатив має здійснюватися з урахуванням двох відношень: нечіткого, індукованого функцією <р(х,г) (4.24), і чіткого, індукованого функцією цс(х) та звичайним порядком на К'. Функція ф(х,г) і звичайний порядок «^» на числовій осі генерують на множині альтернатив X узагальнене НВП вигляду т): т]1(х,,х2) = виртіп{<р(х1,х),<р(х2,у)} =виртіп{ вир х(с), вир х(с)}. Нехай Т)і"(д:) ~ відповідна множина недомінованих альтернатив у множині X з НВП Л- Виберемо деяке число а з інтервала 0 5 а 51 й розгля- немо задачу відшукання альтернативи, ступінь недомінованості якої не мен- ший за а, тобто т]ВД(х) £ х £ а. Вважатимемо, що всі вихідні нечіткі множи- ни ху(су) такі, що зирху(су)2а,у = Сл. З теореми 4.4 випливає, що якщо всі задані нечіткі множини с) такі, що вирху(су)^а, то для знаходження альтернатив, ступінь недомінованості яких не нижчий за а, досить розв’язати таку задачу: максимізувати 162
(4.27) за обмежень <р(х,г)2а; 8і(х,ал....Яіл)£0. » = !,»», ге Я1. (4.28) Припустимо, що множина X компактна, Ху(су),/ = 1,п неперервні на Я1, функція /(х,с,,с2,...,с.) також неперервна на добутку Х*К". У роботі [44] показано, що за цих умов задача (4.27), (4.28) еквівалентна такій задачі: максимізувати ...с.) за обмежень Ху(су)2а; £,(х.ап..... а„) і 0, і = 1,т. Друге відношення на X Г|2 визначається тим, що переважатимуть альте- рнативи, які мають більший ступінь допустимості, тобто , . (1, якщо цс(х,) і РсЧхД 2 »’ 2) (0, якщо рс(х1)<цс(х2). Отже, треба знайти найкращу недоміновану альтернативу за двома відно- шеннями переваги т)і та т^. Задачі такого типу розглянуто в підрозд. 4.4, де за- пропоновано процедуру побудови підмножини недомінованих альтернатив за наявності декількох критеріїв (відношень переваги). Відповідно до неї треба по- будувати дві згортки з вихідних НВП т], та т]2 - їх перетин та зважену суму. Перетин відношень т),, т]2 має вигляд ...*.) = т1п{т1,(*, х,),ті2(х„.... х,)}. Зважена сума (критеріїв) за умови рівності вагових коефіцієнтів відношень т), ,т)2 така: С2(х,,х2) = ^[т],(х1,х1) + П2(х„х2)]. Нехай Сґ(х). 0?(х) - нечіткі підмножини недомінованих альтернатив за відношеннями (%,(?,), (А'.й) відповідно. Тоді результуюча підмножина недомінованих альтернатив має вигляд 2“(х) = тіп{й“(х);22“(х)}. (4-29) 163
Основою для вибору конкретних альтернатив у загальній задачі НМП служить ФН £>“(х). У цій задачі, як і раніше, практичний інтерес становить питання про відшукання альтернатив хє X, для яких Р“(х) £ а, де а є [0;1], однак для спрощення спочатку розглянемо задачу відшукання ЧНД альтер- натив (тобто таких, для яких (х) = 1, а = 1). Отже, розглянемо задачу знаходження ЧНД-альтернативи, для якої £>“(х) = 1, Із виразу (4.29) отримаємо, що для цього необхідним і достатнім є виконання умов = 1. й**(х) = 1 • З’ясуємо спочатку умови, за яких х є ЧНД-альтернативою на множині (-¥,£>), тобто коли (х) = 1. Якщо вихідні нечіткі множини Ху(су), У = 1,п нормальні, тобто коли 8иРХу(с;) = 1, то, як показано вище, за а = 1 функція <р(х,г) у виразі (4.25) має властивість зир<р(х,г) = 1 за довільного х є X. Нехай X™ - підмножина всіх ЧНД альтернатив за відношенням т]2, тоб- то множина всіх х° є X, для яких рівність я/х’.х) = 1 виконується за будь- якого хєХ. Можна показати, що ЧНД-альтернативи множини (х, 0) дос- татньо шукати серед альтернатив множини АГ™. У роботах [25; 44] показано, що для того, щоб х° була ЧНД-альтернати- вою відносно О.х = т], о т)2, необхідно і достатньо, щоб вона була ЧНД-аль- тернативою одночасно за двома НВП: т], та т]2. Отже, щоб знайти ЧНД-альтернативу в множині X з НВП 0, достатньо знайти ЧНД-альтернативу в множині АГ™ з НВП т], - Нехай вихідні нечіткі множини уДдД » = 1,т, / = 1,л такі, що існують {о°}, для яких уДа%) = 1, при цьому множину X™ складають альтернати- ви, які задовольняють умову т]“ = 1. Якщо виконуються такі припущення: компактність множини X , неперервність функції /, то згідно з теоремою 4.4 маємо таку задачу зна- ходження ЧНД-альтернативи у множині X: максимізувати 164
/(х,с„с2,...,с.) (4.30) за обмежень £,(х, ап, аі2.аІЯ) 0, ау е Я*; Х/су) = 1,7 = 1,н; (4.31) = К і = \,т, / = 1,и. Будь-який розв’язок х° є X задачі (4.30), (4.31) є ЧНД-альтернативою у множині (х,£?,), водночас він є ЧНД-альтернативою у множинах (х, т],) та (х,т]2). Можна легко показати, що будь-який розв’язок цієї задачі є також ЧНД-альтернативою і в множині (х,Р2) [25]. Отже, будь-який розв’язок задачі (4.30), (4.31) задовольняє умову й"(х°) = 1, тобто х° - ЧНД-альтернатива для вихідної загальної задачі НМП. Наявність у задачі НМП (4,30), (4.31) обмежень вигляду Х7(су) = 1, уДдг) = 1 означає, що для відшукання ЧНД-альтернатив у вихідній задачі достатньо враховувати лише ті зі значень параметрів у та ау, які на- певно, тобто зі ступенем «1», належать відповідним нечітким множинам. Отже, якщо шукати лише ЧНД-альтернативи, то у формулюванні вихідної задачі можна не вимагати повного опису нечітких множин значень параметрів, а обмежитися лише інтервалами їх значень, які зі ступенем «1» належать до цих множин. З аналогічних міркувань випливає, що для знаходження найкращої альтер- нативи, яка має ступінь недомінованості не нижчий за а (тобто т]“(х<1)^а), достатньо розв’язати таку задачу математичного програмування [45]: максимізувати /(х,сх,с2 сп) (4.32) за обмежень &(х,а„,а,2,...,ав)$0,аг є/?1; (4-33) %,(с,)їа,у = 1.п; (4-34) у#(аг) а, і = 1,т, / = 1,и. (4.35) Розв’язання задачі типу (4.32)-(4.35) дає змогу визначити лише деякі з недомінованих альтернатив з відповідним ступенем а для вихідної загальної задачі НМП. 165
Можна показати, що всі можливі рішення цієї багатопараметричної за- дачі НП перебувають між двома крайніми випадками: задачею «песиміста» та задачею «оптиміста». Задача «песиміста» має вигляд тахтіп/(х,с,,...,с,) (4.36) за обмежень (4.34) та (4.35), а задача «оптиміста» - шах шах/(х, с,,..., с„). (4.37) * Я-Х. Отримане в задачі (4.36) значення функції /(х,с)- це найбільш обереж- на («гарантована») оцінка альтернатив, недомінованих зі ступенем, не мен- шим ніж а, а відповідне значення / у задачі (4.37) - найменш обережна («оптимістична») оцінка. Інтервал між цими оцінками дає змогу судити про можливі значення функції /(х) під час вибору альтернатив, недомінованих зі ступенем а = 0,80. Приклад 4.10. Нехай треба максимізувати (4.38) 7-і за обмежень £а,ху і = 1,ж; (4.39) 7-І ху£0, у = 1,п, причому змінні с] - нечіткі параметри (множини) з ФН р(су) = 1 • . = ,,/ = 1,л. 1 + (9-су)2 Розв’язати відповідну задачу НМП, користуючись співвідношеннями (4.32)-(4.35): максимізувати /(х,с) = ї>Л /-І за обмежень (4.39) та ц(Су)= 1 ?0,8, у = й (4.40) 1 + (с,-су)’ 166
Обмеження (4.40) записують у такому еквівалентному вигляді: (с, - су)’ і 0,25 або с, — 0,5 і су 5 с, + 0,5. Отже, задача зводиться до задачі параметричного програмування і може бути розв’язана відомими методами. Приклад 4.11. Для випуску продукції / = 1,2,3 три підприємства і — 1,2,3 використовують два види ресурсів к = 1, 2 відповідно в обсягах і>‘ =250, б’ = 150, Ь\ = 100, = 200,*' = 240, Ь} = 300. Нехай норми втрат кожного ресурсу на і-му підприємстві для виготовлення /-Ї продукції - нечітка множина в інтервалі [у‘, 5‘ ] із ФН ц,(а,)=ехр 2 де значення величини а* наведено в табл. 4.7, а величини с, - у табл. 4.8. Собівартість виготовлення /-Ї продукції на і-му підприємстві також не- чітка множина із ФН Таблиця 4.7 Щіпрасмспо 1-і 1-2 7-з І «Л 2 1 «12 2 ап аа 2 ЛіЗ 1 2 4 1 2 3 4 2 1.5 5 2 2,5 2 3 3 3 2 2 3 3 4 Таблиця 4.8 Щдррасмство 1-і 1-2 1-2 1 4 8 5 2 4 6 7 3 3 7 5 Нехай виробничий випуск виробів 77, = 360 од, П2 = 170 од, П, = 250 од Скласти математичну модель задачі НМП та знайти оптимальну спе- ціалізацію виробництва, за якої мінімізується сумарна собівартість вироб- 167
ництва виробів відповідно до заданого плану. Знайти підмножину мінімі- зуючих альтернатив недомінованих зі степенем а = 0,75. Розв’язання. Нехай х# - обсяг випуску продукції на і-му підприємстві. Тоді математична модель матиме вигляд З З -- тіп££сух,, і = 1,3, М У-І за обмежень * = 1,2 7=1 Іх^Пу, у = 13, х# £0, ц(°г)^0,75, у(сіу)£0,75. Розв’яжемо нерівність та обчислимо кінці інтервала нечіткої множини рівня а = 0,75: И (М=ехр 2 £1п0,75; £0,75 - ’ 2 (а -аг)2 £-21п0,75 = 21п 1 = 21д4; ' ' 0,75 З 0,5^0,75(с,-С^-, ,г7 іУ с*-ііз5С.5С’ + ^У Задача «песиміста»: 168
Задача «оптиміста»: Загальний розв’язок визначається як А' = (1-Л)л^ес+ЛхОІГГ, де Ляп - оптимальні розв’язки задач «песиміста» та «оптиміста» відповідно, *є[0;1]. 4.7. Лінгвістичні змінні Важливим кроком у розробленні апарата прийняття розв’язків у нечітких умовах стало введення Л. Заде поняття лінгвістичної змінної й опис значень змінних з використанням нечітких множин. Визначення 4.22. Лінгвістична змінна задасться п’ятіркою х, Т, І/, С, М , де х - ім'я змінної; Т- терм-множина, кожний елемент якої (терм) подається як нечітка множина на універсальній множині І}; С - син- таксичні правила, часто у вигляді граматики, що визначають назви термів; М — семантичні правила, які задають ФН нечітких термів, породжених синтаксичними правилами С. Наприклад, розглянемо лінгвістичну змінну з іменем х - «температура в кімнаті». Четвірку, що тоді залишиться, можна визначити так: - універсальна множина І/= [5,35]; - терм-множина Т = {«холодно», «комфортно», «спекотно»} з такими ФН(пєС/): . . 1 . , ( и-10 ] 1 +-----І І 7 Н.Ції — ✓ І з 169
М«тевпжі»ОО . хЮ 9 , (и-30) 1 + І б ; - синтаксичні правила, що породжують нові терми з використанням квантифікаторів «не», «дуже» і «більш-менш». Квантифікатори та їх ФН на- ведено в табл. 4.9. Таблиця 4.9 Приклади квантифікаторів та їх функції належності Квантнфікатор Функція належності ( є 17) Не/ Дуже/ (и,(«))2 Більш-менш / 7р.(“) Приклад 4.12. Розглянемо якісну змінну - зовнішність людини. Нехай її задано на універсальній шкалі м = [0,1]. Оберемо такі базові терм-множини: {ТІ - потворна, Т2 - некрасива, ТЗ - симпатична (приємної зовнішності), Т4 - красива, Т5 - ідеальна зовнішність (наприклад, Сикстинська мадонна Рафае- ля)}. Тоді ФН відповідних термів мають вигляд, показаний на рис. 4.8. 170
4.7.1. Застосування лінгвістичних змінних Алгоритми нечіткого логічного висновку. Використовуваний у різних експертних та керуючих системах механізм нечітких висновків оснований на базі знань, сформованій фахівцями предметної області у вигляді сукупності нечітких предикатних правил такого вигляду [28; 44; 88]: П,: якщо х єЛ(, тоує Д; П2: якщох єЛ2, то у є В2; П,: якщо х єЛя,тоує Д, де х, хеX - вхідна змінна (ім’я для відомих значень даних); У,УЄ ¥ - змінна висновку (ім’я для значення даних, яке буде обчислено); А, та Д - ФН лінгвістичних змінних, задані відповідно на множинах А'та У. Знання експерта А —> В відбиває нечітке причинне відношення переду- мови й висновку, тому його можна назвати нечітким відношенням і позначи- ти черезК: В: А —> В, де «-»» називають нечіткою імплікацією. Відношення можна розглядати як нечітку підмножину прямого добутку X х У повної множини передумов X і висновків У Таким чином, процес от- римання (нечіткого) результату висновку В' з використанням спостереження А' й знання А—>В можна подати у вигляді композиційного правила «не- чіткий "пкхіиа ропепх"»: В' = А'»П = А'»(А->В), де «• » - операція згортки. Як операцію композиції, так і операцію імплікації в алгебрі нечітких множин можна реалізовувати по-різному (при цьому буде різним й отриму- ваний результат), але в кожному разі загальний логічний висновок здійснюється за такі чотири етапи [28]. 1. Уведення нечіткості (фазифікация, /иххі/ісаііоп). Функції належності, задані на вхідних змінних, застосовуються до їхніх фактичних значень для визначення ступеня істинності кожної передумови кожного правила. 171
2. Логічний висновок. Обчислене значення істинності для передумов кожно- го правила застосовується до висновків кожного правила. Тоді виникає одна не- чітка підмножина, яку буде призначено кожній змінній висновку для кожного правила. Як правила логічного висновку зазвичай використовують тільки опе- рації тіл (МІНІМУМ) або ргоії (МНОЖЕННЯ). У логічному висновку МІНІ- МУМУ ФН висновку «відгинається» по висоті, відповідній до обчисленого сту- пеня істинності передумови правила (нечітка логіка «І»). У логічному висновку МНОЖЕННЯ ФН висновку масштабується за допомогою обчисленого ступеня істинності передумови правила. 3. Композиція. Усі нечіткі підмножини, призначені до кожної змінної вис- новку (у всіх правилах), поєднуються разом, щоб сформувати одну нечітку підмножину для всіх змінних висновку. У разі подібного об’єднання зазвичай використовують операції мах (МАКСИМУМ) або зшп (СУМА). У композиції МАКСИМУМУ комбінований висновок нечіткої підмножини конструюється як поточковий максимум за всіма нечіткими підмножинами (нечітка логіка «АБО»), У композиції СУМИ комбінований висновок нечіткої підмножини формується як поточкова сума за всіма нечіткими підмножинами, призначени- ми змінній висновку правилами логічного висновку. 4. Зведення до чіткості (дефазифікація, сіе/иггі/ісаііоп). Використовує- ться, якщо потрібно перетворити нечіткий набір висновків у чітке число. Є значна кількість методів зведення до чіткості, розглянемо деякі з них. Приклад 4.13. Нехай деяка система описується такими нечіткими правилами: Пь якщо х є А, то н є £>; Пі: якщо у є В, то » є£; П3: якщо г є С, то н1 є Р, де х, у й х - імена вхідних змінних; и» - ім’я змінної висновку; А, В, С, О,Е,Р - задані ФН (трикутної форми). Процедуру отримання логічного висновку зображено на рис. 4.9. Перед- бачається, що задані конкретні (чіткі) значення вхідних змінних хв,_у0,70. На першому етапі на підставі заданих значень, виходячи з ФН А, В, С, обчислюють ступені істинності а(х0), а(у0) й , а(х0) для передумов кожно- го з трьох наведених правил. На другому етапі відбувається «відсікання» ФН 172
висновків правил (£>, Е, Г) на рівнях а(х0), а(у0) й а(х0). На третьому етапі розглядаються ФН, зрізані на попередньому етапі, вони об’єднуються з вико рнстанням операції тах, у результаті чого отримуємо комбіновану нечітку підмножину, описувану ФН цІ(и'), яка відповідає логічному висновку для вихідної змінної н'. Нарешті, на четвертому етапі отримуємо, за потреби, чітке значення вихідний змінної, наприклад центроїдним методом. Рис. 4.9. Ілюстрація процедури логічного висновку Аналіз стану діючого підприємства на основі лінгвістичних змінних та алгоритму нечіткого висновку Мамдані. Розглянемо приклад застосу- вання лінгвістичних змінних для побудови бази нечітких правил експерта з метою оцінювання фінансового стану деякого підприємства й визначення рн зику його банкрутства, використовуючи алгоритм нечіткого висновку Мамдані [22; 28]. Алгоритм складається з таких етапів. Етап 1. Лінгвістичні змінні й нечіткі підмножини. На цьому етапі ви значаємо нечіткі множини О, В, що описують стан підприємства: а) лінгвістична змінна О «Ризик банкрутства» має п’ять значень: Сі - нечітка підмножина станів «граничний ризик банкрутства»; Оі - нечітка підмножина станів «ступінь ризику банкрутства високий»; 173
Сз - нечітка підмножина станів «ступінь ризику банкрутства середній»; - нечітка підмножина станів «низький ступінь ризику банкрутства»; Оз - нечітка підмножина станів «ризик банкрутства незначний». Носій множини С - показник ступеня ризику банкрутства % - набуває значення від нуля до одиниці за визначенням; б) для окремого фінансового показника або показника керування Л} задаємо лінгвістичну змінну В і «рівень показника Л>> на такій терм-множині значень: Вц - підмножина «дуже низький рівень показника Лі»; Ва - підмножина «низький рівень показника Лі»; Вп - підмножина «середній рівень показника Лі»; Вц - підмножина «високий рівень показника Лі»; Ва - підмножина «дуже високий рівень показника Лр>. Етап 2. Показники. Будуємо набір окремих показників X = {Лі} загальною кількістю М які, на думку експерга-аналітика, впливають на оцінку ризику бан- крутства підприємств й оцінюють різні за природою аспекти ділового й фінансового життя підприємства. Оберемо систему з таких шести показників [22]: Л] - коефіцієнт автономії (відношення власного капіталу до валюти балансу); Х2 - коефіцієнт забезпечення оборотних активів власними коштами (від- ношення чистого оборотного капіталу до оборотних активів); Л3 - коефіцієнт проміжної ліквідності (відношення суми коштів і дебі- торської заборгованості до короткострокових пасивів); Л4 - коефіцієнт абсолютної ліквідності (відношення суми коштів до короткострокових пасивів); Х5 - оборотність усіх активів за рік (відношення виторгу від реалізації до середнього виторгу (за період) вартості активів); Л6 - рентабельність усього капіталу (відношення чистого прибутку до середньої (за період) вартості активів). Етап 3. Формування бази правил системи нечіткого висновку. Базу пра- вил формують фахівці із предметної області у вигляді сукупності нечітких предикатних правил вигляду ПІ: якщохєЯ! іу є2?і,тохє Сь 174
П2: якщо х є Л2 і у є В2, то г є С2. Уведемо такі лінгвістичні змінні для реалізації алгоритмів нечіткого ви- сновку Мамдані [22]: Хй Дуже Низький, Низький, Середній, Високий, Дуже Високий; Х2: Дуже Низький, Низький, Середній, Високий, Дуже Високий; Ху. Дуже Низький, Низький, Середній, Високий, Дуже Високий; X»: Дуже Низький, Низький, Середній, Високий, Дуже Високий; Х$. Дуже Низький, Низький, Середній, Високий, Дуже Високий; Хі. Дуже Низький, Низький, Середній, Високий, Дуже Високий. Рівні банкрутства: Дуже Низький, Низький, Середній, Високий, Дуже Високий. Для спрощення запису введемо такі скорочення: Дуже Низький - (ДН), Низький - (Н), Середній - (Ср), Високий - (В), Дуже Високий - (ДВ). Тоді можна записати такі правила з урахуванням можливих комбінацій: - якщо Хі ДН, і Х2 ДН, і Х2 ДН, і X» ДН, і Х5 ДН, і Х« ДН, то ризик банкрутства ДВ; - якщо Хі Н, і Х2 ДН, і Хз ДН, і Х< ДН, і Х5 ДН, і Х6 ДН, то ризик банкрутства ДВ; - якщо Хі Ср, і Х2 Н, і Хз ДН, і X» ДН, і Х5 ДН, і Х« ДН, то ризик банкрутства ДВ; - якщо Хі Ср, і Х2 Ср, і Хз Н, і Х4 ДН, і Х5 ДН, і Х6 ДН, то ризик банкрутства ДВ; - якщо X! Ср, і Х2 Ср, і Хз Ср, і X» Н, і Х5 ДН, і Х6 ДН, то ризик банкрутства В; - якщо Хі В, і Х2 Ср, і Хз Н, і X» ДН, і Х5 Н, і Х6 ДН, то ризик бан- крутства Н; - якщо Хі В, і Х2 В, і Хз В, і X» Ср, і Х5 Ср, і Х6 В, то ризик бан- крутства Ср; - якщо Хі ДВ, і Х2 ДВ, і Хз В, і X» ДВ, і Х5 В, і Х« В, то ризик бан- крутства Н; - якщо Хі ДВ, і Х2 ДВ, і Хз ДВ, і X» ДВ, і Х5 ДВ, і Х6 ДВ, то ризик банкрутства ДН. 175
Загальна кількість правил дуже велика, якщо враховувати всі можливі варіанти перестановок значень. Для полегшення сприйняття й скорочення запису правил уведемо бали для лінгвістичних значень: ДН = 5; Н = 4; Ср = 3; В = 2;ДВ = 1. Обчислимо граничні показники рівня банкрутства, використавши такі граничні правила: - якщо Лі ДН, ІХ2 ДН, ІХ3 ДН, ІХ ДН, ІХ, ДН, ІХ ДН, то БАЛ = ЗО; - якщоХ] Н, іХ2 Н, ІХ, Н, ІХ Н, іХ5 Н, ІХ Н, то БАЛ = 24; - якщоХ! Ср, іХ2Ср, іХзСр,іХСр, іХ5Ср, іХ6Ср,тоБАЛ = 18; - якщоХ] В, іХ2 В, іХз В, ІХ В, ІХ5 В, ІХ$ В, то БАЛ = 12; - якщо Хі ДВ, і Х2 ДВ, і Хз ДВ, і X ДВ, і Х5 ДВ, і X ДВ, то БАЛ = 6. Тоді нові правила для оцінювання ризику банкрутства запишемо в такий спосіб: - якщо БАЛ > 24,то рівень банкрутства ДВ; - якщо БАЛ< 24 і БАЛ >18, то рівень банкрутства В; -якщо БАЛ< 18 і БАЛ >12, то рівень банкрутства Ср; -якщо БАЛ< 12 і БАЛ >6, то рівень банкрутства Н; -якщо Бал= 6, то рівень банкрутства ДН. Такий підхід дозволяє охопити всю множину правил. Етап 4. Фазифікація вхідних параметрів. Проведемо фазифікацію вхід- них параметрів або опишемо кожну з терм-множин (лінгвістичних змінних) за допомогою ФН й знайдемо ступені істинності для кожного значення в умовах правил: А і (хо), Л2 (хо), (Уо). В2 (уо). Як ФН будемо використовувати функції трикутного вигляду. Для більшої наочності подамо їх графічно (рис. 4.12) та вкажемо на них відповідні фактичні значення показників. да сР с да ь XX ।. і । ।. 2 • ’ ' ’ і і - > * і * > > < і ч 1 її Рис. 4.10. Функція належності Ці параметра X] 176
Для висновків правил - оцінки рівня ризику банкрутства - використовують відповідні лінгвістичні значення, ФН яких зображено на рис. 4.11. Он Рис. 4.11. Функції належності ризику банкрутства Етап 5. Логічний висновок. Знайдемо рівні «відсікання» для умов кожно- го з правил, використовуючи операцію тіл: сі] = •А](Дїо) Л ^21 Л Л ^і(Х4>) Л ^310"м) Л -ДбіС^во)» ОЦ = •4|(Лїо) Л ЛгХГ*») Л Л Л ^Зі(.Хк) Л Також знайдемо «усічені» ФН виходів (висновків) правил: С^ = (а( лСДг)), < = 1»...»К. Для більшої наочності покажемо це на рис. 4.12. 1.2 І 0.8 0.6 0.4 ОД 0 0 0.1 Рис. 4.12. Перше правило Відповідно до першого правила виконуємо ранжування для кожного вхідного значення X, та обчислимо БАЛ (суму балів) :5 + 5 + 5 + 5 + 2 + 5 = = 27=>ДВ. У цьому прикладі таких правил було складено всього вісім [22]. 177
Етап 6. Композиція. Об’єднаємо знайдені ФН виходів правил з використан- ням операції шах й отримаємо кінцеву нечітку підмножину для вихідної зміниш із ФН Цї. Для наочності покажемо це на рис. 4.13. Рис. 4.13. Виведення правил за 2009 рік (логістичний висновок) Етап 7. Зведення до чіткості (дефазифікація). Зведення до чіткості ви- конується центроідним методом [22]: ц, — А--------__ О Для підприємства, що розглядається, значення И© за 2009 рік становить ^о(2оо9) =0,347, що відповідає «Дуже Високому» або «Високому» рівню бан- крутства [22]. Детально моделі й методи прийняття рішень у системах нечіткого логічного виведення розглянуто в роботах [22; 28]. Запитання для самоконтролю 1. Дайте визначення нечіткої множини. 2. Як знаходять функцію приналежності для об’єднання нечітких множин; для пере- тину нечітких множин; для різниці? 3. Які операції виконуються над нечіткими відношеннями? 4. Які види композицій існують для нечітких відношень? 5. Дайте визначення властивостей рефлективності, симетричності та транзитивності для нечітких відношень. 6. Дайте визначення нечіткого відношення нестрогої переваги. 7. Дайте визначення нечіткого відношення строгої переваги. Як знайти його ФН? 8. Дайте визначення нечіткого відношення еквівалентності. 178
9. Дайте визначеній нечіткої множини недомінованих альтрнатив. Як знайти її ФН? 10. Дайте визначення чітко недомінованих альтернатив. Яку властивість вони мають? 11. Сформулюйте підхід Белмаяа-Заде знаходження нечіткої мети за нечітких умов. 12. Наведіть класифікацію задач нечіткого математичного програмування. 13. Наведіть принцип узагальнення Заде. 14. Наведіть принцип узагальнення у формі Орловського. 15. Як знайти ФН нечіткого відношення у разі нечіткого відображення? 16. Що таке узагальнене нечітке відношення несірогої переваги і як знайти його ФН? 17. Опишіть основні ідеї багатокритеріального прийняття рішень (вибору альтернатив) за наявності декількох критеріїв - нечітких відношень несірогої переваги. 18. Запишіть математичну модель задачі НМП. 19. Викладіть метод розв’язання загальної задачі НМП. 20. Дайте визначення лінгвістичної змінної. Якими множниками вона описується? 21. Які основні етапи нечіткого логічного висновку (виведення)? Задачі для самостійного розв'язання Задача 4.1. Нехай громадянин N планує якнайкращим чином витратити наявні у нього засоби. При цьому він розглядає такі можливі варіанти: х,— купити автомобіль; х2— поїхати в круїз; х,- вкласти гроші в акції компанії; х4- вкласти гроші у нерухомість. Громадянин оцінює альтернативи за такими критеріями: - величина витрат; - можливий прибуток; К, - рівень задоволення естетичних потреб. Нехай за оцінками експерта згадані критерії встановлюють такі відношення переваги на множині альтернатив: Я,: х, -<х2; х, «х2; х2 »х<; Я2: х, >- х2,х, -<х2,х4 >- х2; Я,: х, -< х2,х, >- х2,х2 я> х4,х, -< х2. Нехай ваги критеріїв такі: н; = 0,3; = 0,25; = 0,45. Побудуйте згортки критеріїв О1 = гн та £72 = £ и^Я, і знайдіть най- ? і кращу альтернативу за обома згортками. 179
Задача 4.2. Нехай громадянин N хоче придбати автомобіль. При цьому він розглядає такі можливі варіанти: х, - купити автомобіль марки «Жигулі»; х2 - купити автомобіль марки «Москвич»; х, - купити автомобіль марки «Запорожець» (новий). Громадянин оцінює альтернативи за такими критеріями: 7?і - ціна; Т?2 - дизайн; Ку - економічність (витрати і ціна палива); Лд динаміка автомобіля; Л5 - зносостійкість. Нехай за оцінками експерта згадані критерії встановлю- ють такі відношення переваги на множиш альтернатив: /?,: х,чх2.х2ях,; 7^: X] «х2,х1 >-х,; 7^: х, ^ХцХ, >-х2; Т?4: х, хх3,х, >-х2; 7?,: х, >-х,,х, >-х2. Нехай ваги критеріїв такі: м'і = 0,4; 0,5; нз = 0,2; мч = 0,15; мз = 0,2. Побудуйте згортки критеріїв 2,=Р[7? та * знайдіть най- кращу альтернативу за обома згортками. Задача 43. Нехай громадянин N має обрати роботу. При цьому він розглядає такі можливі варіанти: х, - робота у вітчизняній фірмі; х2 - робота на державному підприємстві; х, - робота в науковій організації; х4 - робота на сучасному підприємстві (наприклад, німецькому або в США). Громадянин оцінює альтернативи за такими критеріями: 7? і — розмір і стабільність заробітної плати; К2 - наявність творчої та цікавої роботи; /?з - перспективність роботи (можливість професійного зростання). Нехай за оцінками експерта згадані критерії встановлюють такі відношення переваги на множині альтернатив: 7?,: х, » х2, х2 я х3, х4 >- х,; Я?: х, >- х2, х2 х х„ х, я х,, х, >- х,; /?,: х2 я х,, х4 >-х,,х, я х2. 180
Нехай ваги критеріїв такі: м», = 0,4; = 0,25; м», = 0,35. Побудуйте згортки критеріїв =гк та 0г =^м’у/?7 і знайдіть най- ) ) кращу альтернативу за обома згортками. Задача 4.4. Нехай громадянин N має певну суму для купівлі квартири, при цьому він розглядає такі можливі варіанти: х, - купити квартиру в центрі Києва; х, - купити квартиру на околиці Києва; х, - купити квартиру в передмісті Києва. Громадянин оцінює альтернативи за такими критеріями: Кі - вартість квартири; К2 - витрати на проїзд; - забрудненість навколишнього середо- вища; К4 - відпочинок після роботи. Нехай за оцінками експерта згадані критерії встановлюють такі відношення переваги на множині альтернатив: Л,: х, -<х2,х2 ЧХ3; х, хх,,х, ^ХрХ, »х,; Я,: х, ® х„х, >-х,; /?4: х, >х,,х, »х,. Нехай ваги критеріїв такі: м;=0,4; ^,=0,25; к, =0,2; =0,15. Побудуйте згортки критеріїв & та = * знайдіть най- і і кращу альтернативу за обома згортками. Задача 4.5. Нехай деякий молодий чоловік планує вступити у вищий навчальний заклад після закінчення школи, при цьому він розглядає такі можливі варіанти: X! - Київський державний університет імені Тараса Шевченка; х, - НТУУ «КПІ»; х, - один із нещодавно відкритих платних університетів; х, - Київський інститут народного господарства. Громадянин оцінює альтернативи за такими критеріями: - пре- стижність вищого навчального закладу; Я2 - гарантоване працевлаштуван- ня після закінчення навчання; - безплатне навчання; Яд - наявність 181
у вищому навчальному закладі сучасної матеріально-технічної бази нав- чання; Кі - якість навчання. Нехай за оцінками експерта згадані критерії встановлюють такі відношення переваги на множині альтернатив: Я,: х, я х2, х, >- х„ х, >- х4; Я/ х2 >- х,, х, -< х„ х, « х4, х, я х2; Я,: х, » х2, х, >- х4, х, >- х2; Я4: х, ях2,х2 >-х,,х, >-х4; Я,: х, я х2, х, >- х5, х, >- х4. Нехай ваги критеріїв такі: м; = 0,3; м>2 =0,15; ^,=0,2; и',=0,15. Побудуйте згортки критеріїв ^I та * знайдіть най- / І кращу альтернативу за обома згортками. Задача 4.6. Нехай громадянин А хоче якнайкращим чином вкласти свій майновий сертифікат. При цьому він розглядає такі можливі варіанти: х, - вкласти у приватизацію житла; х2 - використати для купівлі акцій автомобільної компанії ЛОГОВАЗ; хі - вкласти в акції будівельної компанії; х4 - продати сертифікат. Громадянин оцінює альтернативи за такими критеріями: {{- очікуваний дохід; - можливий ризик, пов'язаний з банкрутством; - час отримува- ного прибутку. Нехай за оцінками експерта згадані критерії встановлюють такі відношення переваги на множині альтернатив: Я,: х, >- х4,х2 я х3, х2 >- х,; Я,: х, >- х2, х, я х4, х, >- х2, х, >- х2; К?: х, я х4, х4 >- х2, х2 я х,. Нехай ваги критеріїв такі: м; = 0,4; и<2 = 0,3; м», = 0,3. Побудуйте згортки критеріїв й та С2 = ХН’Л * знайдіть най- ) і кращу альтернативу за обома згортками. 182
Побудувати математичні моделі та розв’язати такі задачі НМП Задача 4.7. Меблева фабрика випускає столи, крісла, бюро і книжкові ша- фи, використовуючи два типи дошок. Фабрика мас 1000 дошок типу 1 і 500 до- шок типу 2. Трудові ресурси фабрики складають 800 осіб на тиждень. Витрати кожного виду ресурсів на виготовлення одного виробу с нечіткими параметра- ми із ФН Цг(аг) і наведеш в табл. 4.10, а. Прибуток від реалізації виробів С, є нечіткою величиною із ФН Уу(Су) (табл. 4.10,6), де М,(«,) = /2 у; у/с,)=ехр 2 +(а,-а,; Визначте оптимальний асортимент забезпечується за умови реалізованості плану бутку. Знайдіть множину недомінуючих альтерт випуску виробів, який максимуму очікуваного при- гатив зі степенем а = 0,75. Таблиця 4.10. а Ресурся Ввробв Стіл Крісло Бюро Шф Дошки типу 1 4 2 8 12 Дошки типу 2 2 4 6 10 Трудові 5 3 6 12 Таблиця 4.10, б Ввробя Стіл Крісло Бюро Шафа Сі 12 5 15 20 Задача 4.8. Підприємство має ресурси сировини, робочу силу та облад- нання, які необхідні для виробництва чотирьох видів виробів. Нехай питомі витрати ресурсів типу у на виробництво одиниці виробів типу і-а, є нечітки- ми змінними на інтервалі [лг,5г] із ФН цДаД а прибуток одиниці виробу С, - нечітка величина із ФН уДс,), де 183
Початкові дані наведено у табл. 4.11, а і б. Визначте оптимальний асор- тимент випуску виробів, який забезпечує максимум очікуваного прибутку за умови реалізованості плану. Знайдіть підмножину недомінованих альтерна- тив зі степенем а = 0,8. Таблиця 4.11. а Ресурс Норма витрат ресурсу) Об’єм ресурсів 1-1 і-і 1-3 1-4 Сировина 4 6 2 5 80 Робоча сила 20 12 20 40 400 Обладнання 10 15 10 16 150 Таблиця 4.11, б Виріб 1 2 3 4 Прибуток зо 25 56 48 Задача 4.9. У кормову суміш входять три продукти: сіно, силос і кон- центрати, які містять поживні речовини: білок, кальцій і вітаміни. Кількість поживних речовин (табл. 4.2) є нечіткими величинами в інтервалі |бг,<тг] із ФН рг(ог). Мінімально необхідні норми споживання білка - 2000 г, кальцію - 120 г, вітамінів - 40 г. Визначте оптимальний раціон харчування мінімальної вартості, який за- безпечує добову норму споживання всіх поживних речовин, якщо ціна 1 кг і-го продукту - нечітка величина із ФН Уу(Су). Знайдіть підмножину недомінованих альтернатив зі степенем а=0,75: Таблиця 4.12 Продукті Вартість Сі, КОП.МКГ Склад поживних речовин а>, г Білок Кальки ВНамІии Сіно зо 300 4 3 Силос 20 20 6 І Концентрати 50 150 8 2 184
Задача 4.10. На трьох ділянках колгоспного поля можна вирощувати три культури: жито, пшеницю та ячмінь. Урожайність цих культур - нечітка ве- личина із ФН рг(а,). Очікувані затрати - нечітка величина із ФН уДсД Нехай планове завдання зі збирання врожаю кожної культури складає відповідно 500,600 і 400 ц, а площі ділянок становлять відповідно 30,50,20 га. Визначте оптимальну структуру посівів, яка мінімізує сумарні очікувані витрати за умови виконання плану. Знайдіть підмножину недомінованих аль- тернатив зі степенем а = 0,8: н,(а,)= -у--у; г,(с,)=ехр- • Початкові дані наведено в табл. 4.13. Таблиця 4.13 Ділянка Уропіикть/4 культура, ц з га Середні витрати Сі Сп Сп 1 10 12 8 2 3 4 2 12 14 18 3 6 8 3 20 16 24 4 7 10 Задача 4.11. Для виготовлення визначеного сплаву зі свинцю, цинку та олова використовують сировину у вигляді п’яти сплавів з тих самих металів, які відрізняються складом і вартістю 1 кг. Припустимо, що процентний склад металу] в кожній сировині і є нечіткою величиною в інтервалі із ФН цДаД а вартість сплаву С, - нечіткою величиною із ФН У7(С;), де )=«р[- ьт,(с,)= Початкові дані наведено в табл. 4.14, а і б. Визначте, скільки сировини кожного типу потрібно взяти, щоб вигото- вити з мінімальною собівартістю сплав, який міститиме не менше 20 % свин- цю, 30 % цинку і 50 % олова. Знайдіть підмножину недомінованих альтерна- тив зі степенем а = 0,7. 185
Таблиця 4.14, а Матеріал ) МІСТКІСТЬ Металу в сировині і, % і-1 і-2 і-3 і-4 і-5 •» *» •і Свинець 10 10 зо зо 20 Цинк 5 20 40 20 10 Олово 60 40 50 10 20 Таблиця 4.14, б і 1 2 3 4 5 с. 4 5 6 8 7 Задача 4.12. Три сорти взаємозамінної сировини (і = 1,2, 3) у кількості 200, 100 і 300 кг використовують для виробництва чотирьох продуктів (/ = 1, 2, 3, 4). Норми витрат а* сировини і на виробництво продукту у - нечіткі величини із ФН цДаД а виробничі витрати-нечіткі величини в інтервалі [уг,5#] ізФН уг(Сг). Складіть план використання сировини, який забезпечує виробництво 25 одиниць першого продукту, 30 одиниць другого продукту, 45 одиниць тре- тього продукту та 36 одиниць четвертого продукту й мінімізує очікувані сумарні витрати за умови реалізованості плану. Знайдіть підмножину недомінованих альтернатив зі степенем а=0,85: / \ (а,-а,) цДа,)=схр^'2 7 1 І+К-С,)'' Таблиця 4.15, а Початкові дані наведено в табл. 4.15, а і б. Сорт сировини і Норма витрат аа продукт ] 1-І 1-2 1-І 1-4 а* а. а* ац 1 2 0,5 3 1 2 1 2 2 2 3 2 1 2 2 Таблиця 4.15, б Сорт сировини і Виробничі витрати аа одиницю продукції С, 1-і 1-2 1-і 1-4 1 20 15 10 20 2 15 20 40 зо 3 10 зо 10 25 186
5. ПРИЙНЯТТЯ РІШЕНЬ З ВЕКТОРНИМ КРИТЕРІЄМ ОПТИМАЛЬНОГО На практиці під час прийняття рішень часто трапляються ситуації, коли необхідно оцінювати рішення не за одним, а за декількома критеріями опти- мальності. Наприклад, вибираючи маршрут, необхідно враховувати його вар- тість і час перевезення. Проектуючи новий прилад, потрібно оцінювати його за критеріями вартості, надійності та продуктивності. Такі задачі називають багатокритеріальними задачами прийняття рішень, або прийняттям рішень з векторним критерієм оптимальності. Складність розв’язання таких задач полягає в тому, що ці критерії зазви- чай суперечливі, а оптимальні рішення за одним із критеріїв не будуть опти- мальними за іншими. Тому потрібно шукати раціональний компроміс між різними критеріями. 5.1. Постановка багатокритеріальної задачі прийняття рішень та її властивості Розглянемо ситуацію прийняття рішень на заданій множині допустимих альтернатив за потреби врахування сукупності властивостей, що описуються множиною ЦФ: / = {/Да)}, де /Да) відповідає ї-й властивості, за якою оцінюються альтернативи а є А. Вважатимемо, що перші т ЦФ максимізуються, а інші М- т - мінімізують- ся. Позначимо через Ц = {1,2,.... ш} і /2 = {т + 1, т + 2.А/} множини індек- сів відповідно для функцій, що максимізуються та мінімізуються. Щоб сформу- лювати задачу прийняття складних рішень у термінах багатокритеріальної оптимізації, розглянемо питання порівняння альтернатив на множині ЦФ. Введемо такі відношення на множині альтернатив за наявності множини ЦФ (критеріїв): а) слабкої переваги (не гірше) (>): говоритимемо, що х1>-х2, якщо /(х1)^/(х2), У/є/ ; (5.1) (/Дх^/Дх^, Уіє/2; 187
б) строгої переваги (краще): ж, > х2 тоді й тільки тоді, коли система не- рівностей (5.1) виконується і хоча б одна з них - строго; в) сильної переваги: X] »- х2, якщо всі нерівності (5.1) - строгі; г) еквівалентності: х1~х2 тоді й тільки тоді, коли /^(х1) = . Зазначимо, що відношення (>), яке описується співвідношеннями (5.1), не є лінійним або сильним упорядкуванням. Це означає, що не будь-яка пара альтернатив може бути порівнянна на множині цільових функцій тобто не для всяких пар альтернатив хрх2єЛ справджується або х(^х2, або х2 > X], або те й інше разом. У цьому полягає одна з принципових особливостей задач багатокритері- альної (векторної) оптимізації (БКО). Розглянемо приклад. Нехай у деякій задачі прийняття рішень потрібно вибрати один керівний вплив (стратегію) із заданої множини А = {аД, / = 1,5 з урахуванням двох ЦФ і /2, значення яких наведено в табл. 5.1. Таблиця 5.1 /і(а/) /(а/) аі 5 3 аг 4 1 а3 3 2 сц 6 6 «5 5 4 Нехай перша цільова функція визначає продуктивність приладу і ви- мірюється в тисячах операцій за секунду, а друга цільова функція /2 - вар- тість приладу і вимірюється у гривнях. Потрібно вибрати таке рішення а, - проект приладу, яке матиме найбільшу продуктивність і мінімальну вартість. Очевидно, що при порівнянні альтернатив за цими критеріями (за ЦФ) а, >-а5, а2 >-а3, а в якому відношенні перебувають між собою усі інші рі- шення встановити неможливо. Які ж альтернативи вважаються кращими за сукупністю ЦФ? Якщо X] >- х2, то альтернатива х1 краща за х2, оскільки у разі переходу 188
від х2 до х1 нічого не втрачаємо за жодним із критеріїв, а за одним виграємо. У такому випадку кажуть, що Х1 домінує над х2. Якщо у множині допустимих альтернатив А існує хоча б одна альтерна- тива х, така, що х >- х, то альтернативу х називають домінованою. Якщо ж такої альтернативи X не існує, то альтернативу X називають недомінованою або ефективною. Дамо більш чітке означення ефективної альтернативи в термінах ЦФ. Визначення 5.1. Альтернативу х0 називають ефективною, якщо на множині допустимих альтернатив А не існує такої альтернативи X, для якої б виконувалися нерівності //(»)£ V/є Л, ^є/2, і хоча б одна з них була строгою. Це означає, що ніяка інша альтернатива не може покращити значення де- якої ЦФ порівняно з ефективною альтернативою, не погіршуючи при цьому хоча б одну з інших ЦФ. Тому іноді ефективну альтернативу називають непокращуваною на множині ЦФ, або оптимальною за Парето [25]. Із означення ефективної альтернативи випливає така теорема [25]. Теорема 5.1. Дві ефективні альтернативи або еквівалентні, або не порі- внянні поміж собою на множині ЦФ. Доведення. Якщо х0 - ефективна альтернатива, то для будь-якої аль- тернативи X*, яка не збігається з х0 на множині ЦФ, або справедливі М рів- ностей вигляду /(х0) = /(х'),Уіє/, і тоді х' еквівалентна х0, або знай- деться принаймні один індекс з е І такий, що /,(х0) > /,(х'), коли 5 є /,, або /,(Х0) < ЛС1*), коли 5 є ТОДІ х* не може бути ефективною. Із теореми випливає, що якщо існує тільки одна ефективна альтернатива, то вона надає оптимального значення кожному з критеріїв/(х), х є А. Справді, оскільки Хо >- X, то очевидно/(Хо) /(х); Ух, Уї є /, і/Дхо) /Дх); Ух, Уі є І2. 189
Як і у випадку прийняття рішень за одним критерієм, у задачах прийнят- тя рішень із множиною ЦФ можуть існувати декілька множин ЦФ, яким від- повідатимуть ті самі відношення строгої переваги та еквівалентності. Для ілюстрації введемо таке визначення. Визначення 5.2. Множини ЦФ /<І)(х) = {//І)(х)}, іє/] і /<2)(х)={/(2)(х)}, іє!г, визначені на одній і тій самій множині допустимих альтернатив А, на- зиватимемо еквівалентними, якщо вони визначають на ній одне й те саме ві- дношення слабкої переваги, тобто для будь-яких двох альтернатив х,,х2 із /(і) /(2) /(2) /(1) Х| >- х2 випливає, що X] >- х2, і навпаки, із X] >~ х2 випливає, що X] >- х2. Еквівалентні множини ЦФ визначають на множині допустимих альтер- натив однакові відношення еквівалентності та строгої переваги. Теорема 5.2. Якщо існує множина монотонних перетворень ї¥ = {и'/г)}, і є І таких, що і-те перетворення переводить область значень функції //2)(х) в область значень функції /(1>(х) і /(1)(х) = и{/;(2)(х)) для всієї множини допустимих альтернатив А, то множини ЦФ /(|) =|^<І\х)| і /<2) = |//2)(х)| еквівалентні. Довести цю теорему можна, скориставшись теоремою 5.1. Використо- вуючи теорему 5.2, а також визначення ефективних альтернатив, неважко до- вести і таке твердження: якщо х0 - ефективна альтернатива на множині ЦФ / = {/(*)}> «є/, то х0 - ефективна альтернатива і на множині функцій ЇУ = {и'.(х)} = {и’ С^Сх))}, і є І, де м-(/(х)) - монотонна функція від /(х). Оскільки ЦФ /(х) мають різну фізичну розмірність, бо характеризують різні властивості вибраного рішення, то часто доцільно розглядати не саму множину ЦФ, а еквівалентну їй множину функцій Я, = {и’(/Дх))}, де И'Д/Хх)) - монотонні перетворення, які зводять ЦФ до безрозмірного вигля- ду і дають змогу порівнювати їх між собою. Позначимо через И'Км множину значень функцій и' = {и'1(х)}, на якій кожній альтернативі х відповідає певний вектор и’єїГ, де м'=(и'(х)), 190
ї = 1,ш, і навпаки. Тоді відношення слабкої переваги, еквівалентності та стро- гої переваги, введені для альтернатив, справджуватимуться і для множини Нехай чт', чч* є ЯР, тоді ЧЧ' >- ЧЧ* <-> є /р £ и£, V/ є /2; зг'~ зг'+> Х/і є /; (5.2) чч' > чч' <-> 5 н<, V» є/2;] і хоча б одна з нерівностей (5.2) буде строгою. Вектор чч0 е ЇТ, який відповідає ефективній альтернативі, називатимемо ефективним. Властивості ефективних альтернатив і способи їх знаходження. Вважа- тимемо, що всі значення м'Дх) > 0 мінімізуються і зведені до безрозмірного ви- гляду. Властивості ефективних альтернатив наведено нижче в трьох теоремах. Теорема 5.3. Якщо множина допустимих альтернатив А опукла, а цільові функції чуД/Ді)) -увігнуті, то для будь-якої ефективної альтернативи х0 існує такий вектор С = {с, }, і є І, де с, £ 0 та £ с, = 1, що лінійний критерій ні Г(х)=Х‘;іні(») ні досягає мінімуму на множині А за х = х0. Доведення цієї теореми наведено в роботі [8]. Теорема 5.4. Нехай х0 - ефективна альтернатива множини ЦФ (V = {н’І-(х)},и’(х)>0, УіеІ. Тоді існує вектор С = {с,}, ієІх з компонен- тами сі > 0 та 22 с, = 1 такий, що критерій НІ Г(х) = тах с^иДх) НІ досягає мінімуму на множині допустимих альтернатив Аза х - х0. Як компоненти с, можна взяти числа X,-/X, де X = 2^Х(; X, = 1 и>,(х). іе/ Цю теорему довів Ю. Б. Гермеєр [8] і вона виявляється більш сильною, 191
ніж теорема 5.3, оскільки жодних умов на вигляд функцій и'(х) обмежень у ній не накладається. Теорема 5.5. Якщо х0 - ефективна альтернатива множини ЦФ, то для будь-якого І є /,(х0) = шах/;(х); Л(Хо)^/(х). ^є/і /Дх0)^/(х), V/є/2, хєЯ, або для довільного І є І2 /,(х0) = тіп/,(х); /,(Хо)^/,(хЬ VIє/,; /Джо^/М Уіе/2, і*1. Доведення цієї теореми наведено в роботі [8]. Ці теореми дають змогу будувати різні способи знаходження ефектив- них альтернатив. Прийняття рішень в задачі багатокритеріальної оптимізацО. Розгляне- мо, як знайти найбільш раціональне рішення в задачі багатокритеріальної опти- мізації. Таке рішення може виявитися неоптимальним для усіх ЦФ, але разом з тим, воно буде найкращим компромісним рішенням з урахуванням усіх ЦФ (критеріїв) одночасно. Очевидно, найкращим рішенням слід вважати таку альтер- нативу х, за якої відхилення від оптимальних значень для кожної ЦФ /(х): Д/(х) = /)-^(х)^іє/І; /(х)-/^^іє/2, досягає свого мінімального значення. Тут через /9 позначено оптимальне зна- чення і-ї ЦФ /. на множині допустимих альтернатив. Однак оскільки найменші значення величин Д/ (х), V/ є І, не досягаються одночасно на жодній альтерна- тиві, то виникає необхідність порівнювати ці величини між собою, що пов’язано з потребою залучення додаткової неформалізованої інформації від експертів. Оскільки ЦФ мають різну розмірність, то потрібно ввести деяке пере- творення и'/О/х)), що приведе/(х) До безрозмірного вигляду. Це перетворення 192
має задовольняти, принаймні, такі вимоги: а) врахувати необхідність мінімізації відхилень від оптимальних значень для кожної ЦФ; б) мати спільну початкову точку та один порядок змінювання значень на множині допустимих альтернатив; в) зберігати відношення переваги на множині альтернатив, що порівню- ються для сукупності ЦФ /, і завдяки цьому не змінювати множини ефекти- вних альтернатив. Остання вимога, як було показано раніше (у теоремі 5.2), означає, що перетворення мі(/(х)) має бути монотонним. За таке перетворення можна вибрати одну з монотонних функцій вигляду (/(»)) = І шш Уіе/,; V/ є /2; (5.3) ^(/(х)) = /?-/№ Г.° £(х)гЛ° V» є уіє/2; (5.4) и'і(/(х)) = ^(/(х)), (5.5) де ./і тіп* /і тю “ відповідно найменші значення функцій, які максимізують- ся, і найбільші значення функцій, що мінімізуються, на множині допустимих альтернатив. У виразі (5.5) й;С4(х)) можуть визначатися співвідношенням (5.3) або (5.4), а показник степеня ц - ціле число, ц £ 2. Зазначимо, що в пере- твореннях (5.3) величини ^(/(х)) завжди перебувають у межах інтервалу [0,1], а в перетвореннях (5.4) цього може не бути. Вибрані перетворення и’Дх), іеі одночасно визначають розміщення множини допустимих альтернатив, яка описується одним зі співвідношень (5.3)-(5.5) у просторі ЇУ с Км зна- чень функцій и'Дх). 193
Тепер визначимо, яку альтернативу будемо вважати рішенням задачі ба- гатокритеріальної оптимізації, якщо вибрано множину функцій їК = {и'1(х)}, і є І, кожна з яких мінімізується, 0 < и;-(х) < 1, і задано відношення переваги на множині ЦФ. Справедливе таке твердження [25]. Теорема 5.6. Для кожної допустимої альтернативи хєЛ такої, що 0 < в» (х) < 1, V/ є 1 у просторі ї¥, є вектор р, який задовольняє співвідношення Р = {Р, } = {Р,: Р, > 0. V/ є І, І Рі = 1}, (5.6) і число к0, таке, що альтернатива х задовольняє одночасно Мрівноапей вигляду р<и',(х) = Л0, Уіе/. (5.7) Доведення. Оскільки в»(х)*0, Х/їє/, то поділивши обидві частини виразу (5.7) на в',(х), отримаємо Р,=-^ . (5.8) Оскільки величніш рі мають задовольняти умови (5.6), то, підставивши у співвідношення £рі= 1 вираз для р(, матимемо іе/ , Пмі(«) . _ 1 = їе/ ° у 1 І П ^(х)- ,Г/н-і(х) З урахуванням (5.9) вираз (5.8) набуває вигляду П *>(») Р1.= І П *,(») ге/ уе/ і*г (5.9) що і доводить теорему 5.6. Вираз (5.9), який визначає параметр к0, є монотонно зростаючою функцією за кожною зі змінних и>, (х) на інтервалі [0,1], при цьому к0 є | 0; * 1, де М = І. \ Л/ / Справедлива така лема [25]. 194
Лема 5.1. Якщо для двох нееквівалентних альтернатив х' і х* вектори р' і р* рівні (р'= р', V/є/), то и£(х) = ун£(х) і А^(х') = у Л0(х’), де у - коефі- цієнт пропорційності. Доведення. Альтернатива х' задовольняє систему (5.7): ріи;(х') = А0(х'), а альтернатива х* - систему вигляду р'ні(х') = к0(х!'). Звідси р- = і р’ = . иі(х') и;(х') З урахуванням того, що (р* = р*), отримаємо и’/Сх') = ",(О *о(х') (5-Ю) Рівність (5.10) і доводить лему. Зауважимо, що за у = 1 м’,(х’) = м>Дх*), тобто х' — х*. Довільний вектор вагових коефіцієнтів р = {р,}>0, який задовольняє співвідношення (5.6), розглядатимемо як переваги одних ЦФ множини / над іншими, що виражені в кількісній шкалі оцінок. Визначимо напрямок, який породжується вектором р у просторі Ж. Задамо його кутами Р( (і є У) між осями координат і радіусом-вектором р. Тоді со8р, = ”, Тіі = , * ’ е/ Міе/ де = {и>,} - точка, що міститься у просторі на векторі р. Враховуючи цс співвідношення та умову нормування, запишемо систему лінійно незалежних рівнянь, з яких можна знайти невідомі напрямні косинуси: —8^ = и^, V/, ує/ та 22со52р,=1. (5.11) СО8ру И-у іеі Водночас як наслідок теореми 5.6 виконується таке співвідношення: = Ру м'* Р, Враховуючи останнє співвідношення, систему рівнянь (5.11) можна запи- сати так: СОвРі Ру . „ 2п , ----- =— , 2.СО5 Р, =1. СО8Ру р, £/ 195
Розв’язавши цю систему, отримаємо такий вираз для напрямних косину- сів вектора р: П Р/ соф, = ------ (5.12) ІХ П р2, у гєі /є/. Вважатимемо ЦФ рівноцінними, якщо р, = \ V/ є І, тоді напрямні ко- ли синуси для такого вектора р у просторі 17 визначатимуть так: СО8Р,= у] М Отже, завдання відношення переваги між ЦФ у кількісній шкалі за до- помогою співвідношення (5.6) дає напрямок пошуку рішень у просторі зна- чень 17 вибраних перетворень ЦФ /Дх). Тому під розв’язком задачі вектор- ної оптимізації будемо розуміти таку компромісну альтернативу, яка належить множині ефективних альтернатив і лежить на заданому напрямку, що визначається вектором р = {р, } у просторі 17. Якщо для деякої альтерна- тиви х та заданого вектора р >0 виконується співвідношення рДм’Дх)) = Л0, і є І, то будемо говорити, що альтернатива х лежить на напрямку, що визна- чається вектором р. Знайдемо, яке значення параметра к0 відповідає ефективній альтернативі, що лежить на напрямку, визначеному вектором р. Відповідь дає така теорема [25]. Теорема 5.7. Якщо х0 - ефективна для певного вектора р > 0, то їй відпо- відає найменше значення параметра к0, за якого система нестрогих різнос- тей (5.7) виконується одночасно для всіх і є І. Доведення цієї теореми випливає безпосередньо з леми та визначення ефективності альтернативи х0. Нехай за перетворення ЦФ иД/Дх)) обрано перетворення вигляду (5.3). Тоді з урахуванням теореми 5.6 розв’язок задачі векторної оптимізації визначимо таким чином [25]. Визначення 5.3. Під розв’язком задачі векторної оптимізації для заданого вектора переваги р(р>0) розуміють таку компромісну альтернативу х0. 196
що забезпечує однакові мінімальні зважені відносні втрати й’і(х0) = р1и'1(х0) за всіма критеріями одночасно (тобто це найкращий компромісний розв’язок). 5.2. Метод обмежень для пошуку компромісних рішень у задачах векторної оптимізації Розглянемо підхід до пошуку компромісного рішення (альтернативи) у задачі векторної оптимізації. Він грунтується на такій теоремі. Теорема 5.8. Для того, щоб альтернатива х є А така, що иДх )>0, VI є І, була ефективною за заданого вектора переваг р > 0, достатньо, щоб X був єдиним разе ’язкам системи нерівностей р,иі(х)£А0,Уіє/ (5.13) для мінімального значення параметра А^, за якого ця система сумісна. Доведення. Припустимо супротивне, що єдиний розв’язок системи • • (5.13) X для значення параметра Ао = к$ неефективний. Тоді існує альтерна- тива х'єЛ така, що иДх')£ иДх ), Уіе/, причому хоча б одна нерівність буде строгою. Помноживши ці нерівності на р, > 0, V! є 1 отримаємо, що р1м’Дх')^рІи’ (х, )^А0 і хоча б одна нерівність строга. Отже, маємо супереч- ність: альтернатива х' задовольняє систему (5.13) із значенням параметра Ао, яке не перевищує Ао. Таким чином, теорему 5.8 доведено. Із цієї теореми випливає, що визначене вище компромісне рішення мож- на знайти як єдиний розв’язок системи нерівностей вигляду (5.13) для міні- мального значення параметра Ао, за якого ця система ще сумісна. У просторі ІГ компромісній альтернативі відповідає точка перетину променя, напрямні косинуси якого визначаються заданим вектором переваг р > 0 за формулами (5.12), з областю ефективних альтернатив. Якщо існує точка перетину, то звідси випливає існування компромісного розв’язку, для якого мінімальні зважені втрати за всіма критеріями однакові: р^иДх) = АОшіп, УієІ. Якщо ж такої точки не існує (тобто промінь, що визначається вектором переваги р, 197
не перетинає області ефективних альтернатив), то для компромісної альтер- нативи виконується система нерівностей (5.13) і цій альтернативі відповідає точка, найближча до заданого променя. Щоб знайти компромісну альтернативу будують ітераційний процес з , (п її параметром к0 є 0; .на кожному кроці якого перевіряють сумісність си- \ А/) стеми нерівностей (5.13) для х е А і заданого вектора р. Параметр к0 є | 0; 1 | обмежує відносні втрати и'Дх), V» е/. Якщо к0 —>0, відносні втрати наближаються до нуля, тобто ЦФ наближаються до своїх оптималь- них значень /(х)->/(х0) = Л°» а ««ЩО Ло-> 1 , нерівності (5.13) викону- М ються на всій множині допустимих альтернатив А. Зменшуючи параметр к0 і тим самим зменшуючи зважені втрати для всіх ЦФ, наближаються до альтернативи, що забезпечує мінімальні втрати за всіма ЦФ, тобто до компромісної альтернативи. Ітераційний процес припиняється, коли найменше значення Л0(и) (де п - номер ітерації), за якого система нерів- ностей на множині допустимих альтернатив ще сумісна, відрізняється від свого найближчого значення к0(п +1), за якого вона стає вже не сумісною, не більше, ніж на є (є > 0), де є - досить мала величина, яка задається із міркувань при- пустимого часу розв'язання задачі. При цьому якщо розв’язок системи нерів- ностей єдиний, то це й буде шукана компромісна альтернатива. Якщо ж цей розв’язок не єдиний, то для знайдених альтернатив відносні втрати будуть ек- вівалентні з точністю до є. Єдину компромісну альтернативу можна отримати, оптимізуючи на цій множині еквівалентних альтернатив деякий додатковий узагальнений критерій. За такий критерій можна взяти, наприклад, критерій вигляду Г(х) = £р,к,(х), (5.14) іє/ і мінімізувати його на множині альтернатив 4' = {х':р,м>,(х')^ЛОшш, ЧієІ, хєЛ}. (5.15) 198
Як показано вище, такий узагальнений критерій завжди дає ефективні рішення. Проілюструємо ідею методу на прикладі двох рівноцінних критеріїв на множині допустимих альтернатив, яке описується лінійним обмеженням (рис. 5.1), де О„ - область значень перетворених критеріїв і у просторі обмежень; Г - межа цієї множини, яка задається співвідношеннями О„ (з*) = = Атг В; Г2*(/) - частина області значень Я'і і Я2, в якій ці критерії набувають зна- чень, що не перевищують А0(у). Оскільки ці критерії вважаються рівноцінними, тоб- то Р1 = Р2 = 1 2 І СОХ^ - СО8Р2 = 1/2, то на- прямок збігається з напрямком бісек- триси координатного кута н'і 0 иь. Розв’язки, які дають мінімальні відносні Рис. 5.1 відхилення від оптимальних значень, лежать в області С на промені, який ви- ходить з початку координат у напрямку К. Компроміс, що належить множині ефективних альтернатив, буде в точці С*, яка визначається перетином згада- ного променя з областю ефективних точок. Щоб знайти цю точку, знайдемо таке найменше значення к^п), за якого ще не порожній перетин областей 6яіО*(п). Розглянемо деякі відомі методи відшукання компромісних рішень в за- дачах векторної оптимізації. Одним із таких методів є метод мінімаксу, за- пропонований Ю. Б. Гермеєром [8]. Він ґрунтується на мінімізації узагальне- ного критерію вигляду ?(*) =шахРі»«(^ ->тіп, ' Те/ 1 1 ' хеА де и'Хх) задається перетвореннями (5.3). Метод мінімаксу дає змогу знаходити таку альтернативу х е А, для якої або виконується система рівностей р/М’/х) = ко для всіх і є /* й мінімального значення параметра ко, або для деяких і рівності не виконуються й р/и/х) < Ао™- Якщо при цьому така альтернатива єдина, то це і є шукане компромісне рішення. Тому роз- глянутий далі метод обмежень, оснований на пошуку допустимих альтернатив 199
системи нерівностей (5.13) за мінімального значення параметра к$, можна роз- глядати як метод розв’язання мінімаксної задачі такого вигляду: мінімізувати Т’(х) = тіптахр(м'/(х). (5.16) хєЛ іеі Якщо розв’язок задачі (5.16) не єдиний, то для вибору компромісної аль- тернативи треба застосувати додатковий критерій вигляду (5.14). Отже, якщо за монотонні перетворення ЦФ обрати співвідношення (5.3), то задачу (5.14)-(5.15) знаходження єдиної компромісної альтернативи мож- на сформулювати так: знайти розв’язок такої задачі параметричного програ- мування стосовно параметра кц за заданого вектора переваг р: мінімізувати /г(х) = тіп (5.17) за умов Л(х)^< = Л°-*°СЛ°-Л1піпЬ ^іє/р (5.18) Р/ /і(х)^/;=Л° + *°(/ІІМХ-^), Уїє/2. (5.19) Рі Розв’язок задачі (5.17)-(5.19) за мінімально можливого значення параме- тра Ад є | 0; 1 | визначить шукану компромісну альтернативу. \ А/) Розглянемо метод відшукання компромісної альтернативи х0, який на- зивають методом обмежень [33]. Спочатку відшукаємо мінімально можливе значення параметра к0, за якого система обмежень (5.18)-(5.19) буде сумісною. Якщо знайдений розв’язок не єдиний, тобто існує деяка підмножина (ефективних) альтернатив, еквівалентних з точністю до є за значенням параметра Лд, то вибір компроміс- ної альтернативи здійснюється за допомогою додаткового критерію (5.17). Такий метод не залежить від вигляду функціональних залежностей /(х) і множини допустимих альтернатив А. Разом з тим, для кожного конкретного виду залежностей /(х) треба мати ефективні способи перевірки сумісності системи нерівностей (5.18)—(5.19) на заданій області обмежень. 200
5.3. Багатокритеріальні задачі лінійного програмування У багатьох практичних задачах дослідження операцій, що описуються моделями ЛП (наприклад, із сфери економіки), вибір рішення за одним показ- ником якості може бути неадекватним до змісту задачі, оскільки треба врахову- вати одночасно декілька таких показників - критеріїв [25]. Це зумовлює необ- хідність постановки та вирішення багатокритеріальних задач ЛП. Застосуємо метод обмежень для розв’язання цих задач. Нехай задано деяку множину ЦФ (X), де ДХ) = сГх=Іс,?.Х/, і = 1,Д/, у=1 причому перші тп ЦФ потрібно максимізувати, а інші (М- т) - мінімізувати. На вектор керуючих змінних X = {ху}, і = 1,л накладемо лінійні обмеження вигляду АХ<В, (5.20) ху^0,/ = 1,л (5.21) Для розв’язання цієї задачі застосуємо метод обмежень. Перетворення, що приводять критерії до безрозмірного вигляду, в розглядуваному випадку будуть такими: а) для ЦФ, що максимізуються: Х° — СТ X ^СЛ(Х))= рр -у' , V/є Лі Аітіп б) для ЦФ, що мінімізуються: СГХ-СГХ? >Ш(Х)) = ~т^------ЬЬ ’ е Ь = {« +1.« + 2,.... М}, Хітжх V, Х| де X® - розв’язок, що задовольняє умови (5.20), (5.21) та оптимізує і ЦФ; Х/шід (Хітіх) - розв’язок, що мінімізує (максимізує) відповідну ЦФ на допус- тимій множині розв’язків. Компромісним розв’язком цієї багатокритеріальної задачі буде такий ефективний розв’язок X, для якого зважені відносні «витрати» однакові 201
й мінімальні, тобто Р1^(Х) = р2И'2(Х) =... = р„И^(Х) = кОтш. (5.22) Згідно з методом обмежень шуканий компромісний розв’язок можна знайти, розв’язавши систему лінійних нерівностей: С^Х^сГхї’-^ССГх^-СГх,.^), УієІ,; (5.23) Рі С[х^С’’х{’ + *0(С’’Х(тіх-С’’х®), У/єІ2; Р> АХ^В, ху£0, ) = 1,п для мінімального значення параметра к0, за якого ця система сумісна. Розв’язок системи (5.22) еквівалентний розв’язку такої задачі ЛП [25]: мі- німізувати ко за обмежень £ і* ) *Ал+Іхл+1 7=1 £ ^УХ) + ^іл+1*я+1 "* ^і 0» ;=» (5-24) (5.25) де £ + ^Айі+1^л+1 7=1 7=1 £ауХу-/>4£0, 7-1 ху£0, у=1,и, |рл>*/=!,», «єА; —4 -РіСу^ = ^> (5.26) 202
4.П+1 Хсу(40)~Х9тт>’'є/і; 7=1 -РїЕс^.^іє/р 4= Ґ РіЕс,?.40).^є/2. . >=1 Розглянемо приклад. Приклад 5.1. Потрібно максимізувати /100 = х, + 4х2 і мінімізувати /2О0 = Зхі-х2 за обмежень 8,: Хі + 2x2 £ 4; 82: Зх, + х2£7; 83: -Зх, +5x2 £17; 84: 5Х; - х2 £ 23; 85: Зх, - 4x2 £ 7; х,,х2 2:0. Допустиму множину розв’язків задачі Я(х) зображено на рис 5.2 у вигляді бага- токутника АВСИЕ. Неважко отримати графічно оптималь- ний розв’язок цієї задачі за критерієм /і(Х)> який перебуває у точці С (хі = 6; х2 = 7). Йому відповідає/, =/(хі = 6; х2 = 7) = 34. Мінімальне значення буде в точці Е (хі = 3; х2 = 0,5), /1тіп = 5. За другим критерієм /(X) оптимальний розв’язок буде в точці В (1,4) йому відповідає 203
/і = ЛОЛ) = 1 •а найгірше значення критерію^(Х) - у точці £> (5,2): /2ти = 13. Відрізок ВС являє собою ефективний план. Розглянемо випадок, коли критерії рівноцінні, тобто Рі =р2, шукатиме- мо компромісний розв’язок, що забеспечує мінімальні однакові відносні ви- трати. Функції відносних витрат И"= Р|Г|(Х) = 1 = 1 34 Х» 4х2 ; 2 >5°-/,то, 2 29 И" = р ЇР (X) = 1 ^2П(Х) ” = 1 .. 2/^-/? 2 14 Запишемо еквівалентну задачу ЛП згідно з виразами (5.23)-(5.26): міні- мізувати х3 -к0 за обмежень п /і°-/1(Х)=114-х?-4х2 /1°-/^ 2 29 ” /2(Х)-^ = 13хІ-х2 + 1 2 14 х, + 2х2 £ 4; 3х1 + Х2 £ 7; -Зх1 +5x2 ^17; • 5х1 - х2 £ 23; Зхі ~ 4*2 хІ 2:0, Х2 0, х3 0. Після елементарних перетворень зводимо цю задачу до такого вигляду: мінімізувати х3 (5.27) за обмежень 204
Х|+4х2+58х3234; -Зх] + Х2 + 28хз 2 1; хІ + 2x2 4; Зхі + х2£7; (5.28) Зхі -5x2 2-17; -5Х] + х2 2 -23; -Зхі + 4x2 2 -7, Хі 2 0, х2 2 0, х3 2 0. (5.29) У цій задачі п = 3 змінних та т = 7 обмежень. Оскільки т > п, для спро- щення пошуку оптимального розв’язку перейдемо до двоїстої задачі, спря- женої з (5.27)-(5.29). Вона має такий вигляд: максимізувати (34уі + у2 + 4у3 + 7у4 -17у5 -23у6 -7у7) за обмежень ІУ1 - + 1Уз + 3>4 + Зу5 - 5у6 - Зу7 0; 4Уі + 1у2 + 2у3 + 1у4 - 5у, + 1у6 + 4у7 £ 0; 58уі + 28у2 £ 1, у1 2 0, у2 2 0, уз 2 0. Розв’язуватимемо її симплекс-методом. Для цього введемо вільні змінні та заповнимо початкову симплекс-таблицю (табл. 5.2). Результати послідов- них ітерацій наведено в табл. 5.3-5.5. Таблиця 5.2 і с, 34 1 4 7 -17 -23 -7 0 0 0 в* Ао Аі Аг Аз А4 Аз Аб А7 А« А» Аю 4- 0 г. 0 1 -1 3 3 3 -5 -3 1 0 п 0 4 1 2 1 -5 1 4 1 0 Уіо 1 58 28 0 0 0 0 0 1 д 0 -34 -1 —4 -7 17 23 7 0 0 0 205
Таблиця 5.3 і с, 34 і 4 7 -17 -23 -7 0 0 0 В, Ао Аі Аі Аі А4 А5 А* А7 А* А» Аю 34 И 0 1 -1 3 3 3 -5 -3 1 4— 0 п 0 0 5 -10 -11 -17 21 16 —4 1 0 По 1 0 86 -174 -174 -174 290 174 -58 1 Д 0 0 -33 98 95 119 -147 -95 34 0 0 Таблиця 5.4 і с, 34 1 4 7 -17 23 -7 0 0 0 В, Ао Аі Аі Аі А< А5 А* А7 А* А» Аю 34 К 0 1 0 1 4 5 _2 5 _4 5 1 5 1 5 1 5 0 1 Н 0 0 1 -2 11 5 17 5 21 3 16 5 1 1 5 0 4— 0 По 1 0 0 -2 1512 5 118 — 5 -71* 5 -101,2 10,8 -17,2 1 Д 0 0 0 22 18 -13 7 28 5 9 0 Таблиця 5.5 с, 34 1 4 7 -17 -23 -7 0 0 0 В, Ао Аі а2 Аі А4 А» А* А7 А* А» Аю 34 и 0,06 1 0 0,93 0,85 0 -1,04 -1,14 0,23 0,14 0,0 1 н 0,058 0 1 -2,06 -2,63 0 2,15 0,284 -0,49 -0,295 0,058 17 н 0,0168 0 0 0,017 0,128 1 -0,6 -0,855 0,091 -0,145 0,016 д 0,175 0 0 26,27 15,02 0 0,8 16,9 3,03 5,22 0,175 206
Оскільки в табл. 5.5 усі оцінки Д? 2 0, то знайдено оптимальний розв’язок двоїстої задачі. Скориставшись співвідношенням х® = Д^’у, знай- демо оптимальний розв’язок прямої багатокритеріальної задачі. Маємо: х’^Д^ 1 = 1 Д^ 1 = 3,03; х£=|Д<да) | = 5,22; х?=|ДЦ’)| = *0= 0,175. Цьому розв’язку відповідає точка Р на відрізку ВС (рис. 5.2) і йому ж відповідають мінімальні відносні втрати і відхилення від оптимального зна- чення для обох критеріїв: Рі»,і(/1(х10,х20))= ‘ '0/,(^’Х2°) = 0,175 = к0; 1\ ІІ тіл Р2^(Л(х1°,х2°))= ’ Л = 0,175 = *,. 2 Лти ~ Л Тепер розглянемо графоаналітичний метод знаходження компромісного рішення, для цього використовуємо дві умови: - у шуканій точці відносні зважені відхилення мають бути рівні рІи^(х) = р2и-2(х); - ця точка повинна міститися на відрізку ВС, що визначається обмежен- ням б]. Отже, складемо систему рівнянь: 34 - х, - 4х2 _ Зхі _ х2 +1 29 14 -Зхі +5х2 =17. Розв’яжемо цю систему й отримаємо 117,2хі=355, звідки знаходимо шукане рішення: х° =3,03;х° =5,22. Воно збігається з рішенням, знайденим раніше симплекс-методом. 207
5.4. Методи багатокритеріальної оптимізації Оскільки, зазвичай, множина ефективних розв’язків задачі багатокрите- ріальної оптимізації (БКО) складається з багатьох альтернатив, виникає про- блема вибору однієї з них, пов’язана з необхідністю використання додаткової інформації про переваги ОПР для формування правил вибору. Більшість із процедур вибору мають інтерактивний характер і викону- ються в режимі діалога через взаємодію між ОПР та комп’ютером. Кожна ітерація складається з двох етапів. /. Обчислювальний етап. На цьому етапі комп’ютер використовує отриману від ОПР інформацію для побудови (або корекції) правила вибору, визначає ефективну альтернати- ву і формує допоміжну інформацію для визначення переваг ОПР. 2. Етап аналізу та прийняття рішень. Особа, що приймає рішення, аналізує отриману від комп’ютера ефективну альтернативу х° і допоміжну інформацію. Якщо ця інформація задовольняє ОПР, то ОПР приймає рішення про вибір цієї альтернативи х° або вводить нову інфор- мацію про свої переваги (нові обмеження) і процес пошуку продовжується. Залежно від типу інформації, яку дає ОПР для формування правил вибору, можна дати таку класифікацію методів БКО [10]: 1) методи БКО, які не використовують інформацію про переваги ОПР на множині критеріїв; 2) методи БКО, які використовують один тип інформації про перевагу ОПР на множині критеріїв; 3) методи, які використовують різного типу інформацію про переваги на множині критеріїв; 4) спеціальні методи. Дамо короткий огляд відомих методів багатокритеріальної оптимізації згідно з цією класифікацією [10]. 1. Метод ідеальної точки не використовує допоміжної інформації від ОПР про перевагу на множині критеріїв, оскільки в ОПР цієї інформації не- має або її не можна використати. 208
У такому разі робиться припущення про наявність «ідеального» розв’язку задачі БКО, який можна знайти перетворенням задачі з векторним критерієм у відповідну задачу зі скалярним критерієм. Ідеальною називають точку /° = [/?. Л /»]. і є М, якщо всі критерії максимізуються. Правило вибору компромісу К у цьому методі полягає у знаходженні альтер- нативи, яка має оцінку, що є найближчою до ідеальної точки в деякій метриці. Знайдемо відстань і Р5(/г/°) = [?|/,«-Л05У М=г 7 між точками /? і /х) у просторі з показником метрики $21. Тоді згідно з цим методом знайдемо компромісну оцінку як розв’язок однокритеріальної задачі: і х* = агйшіпґ£'/,(х) - У® '5 V. \і=і 7 Значення показника метрики 5 обирають залежно від предметної області. На практиці використовують переважно значення $ = 1,2, оо. Значення 5 =2 обирають у випадках, коли критерії мають зміст відстані чи ін- ших фізичних величин, для яких евклідова метрика має сенс. У цьому випадку компромісну альтернативу х знаходять як розв’язок однокритеріальної задачі тпіпК/Хх)-/®)2 х »=1 За 5 = 1, критерії можуть мати інший зміст (наприклад, вартість, надій- ність тощо) і відповідна однокритеріальна задача набуває вигляду Г1 = тіпЕ|/і(х)-у°' = тах2;у(х), (5.30) х М х І=1 а якщо з = оо, отримаємо таку задачу: = тттпах'/Хх)-/^. (5.31) х іеЛГ 209
Критерій (5.30) вибирають, коли ОПР оцінює «відстань» до ідеалу як сумарну нев’язку за всіма критеріями і така оцінка мас певний сенс у предметній області, наприклад в економіці, коли вирішується задача з двома критеріями і треба максимізувати дохід підприємства від виробництва та завантаження верстатів, які зайняті випуском різної продукції. Критерій (5.31) обирають, коли ОПР оцінює відстань до ідеалу як мак- симальну нев’язку за всіма критеріями (тобто за найгіршим за значенням по- казником). Якщо критерії вимірюються в різних шкалах (одиницях вимірювання), то для задач у формі (5.30) та (5.31) їх зводять до безрозмірної форми [0,1], як це було показано в параграфі 5.2: (5.32) або шах тіп -’ й- « ' /, ~/>тт (5.33) 2. Метод найкращого компромісного розв'язку використовує інформа- цію ОПР про переваги критеріїв і є узагальненням методу «ідеальної точки». Інформація про переваги ОПР задається у вигляді вектора «ваг» критеріїв т р = [рі], і = 1,Л/ таких, що р, £0, Хр, = 1, де р< - відносна вага критерію І=1 /,(х). У цьому разі критерій (5.32) має такий вигляд: Гі=тахЕр,. х 1=1 і тіп або в еквівалентному вигляді /•^тіпХр ‘ -С- -, Х /і / ітш а мінімаксний критерій (5.33) набуває вигляду Р2 = піах тіп р, тш Х і /і / ітш 210
або в еквівалентному вигляді ‘2(х)= 01111 шах * Х і /" їтіп 3. Метод вибору за кількістю домінуючих критеріїв не використовує допоміжної інформації від ОПР про переваги на множині критеріїв. Правило вибору К за цим методом враховує взаємні співвідношення типу «більше - менше» за оцінками альтернатив і не враховує величини різниць оцінок. Він призначений для розв’язку багатокритеріальних задач із дискретною множи- ною альтернатив, яка має невелику потужність. Нехай ц(х, х') - кількість критеріїв, за якими альтернатива х' сірого перева- жає альтернативу х. Покладемо ()(х) = шах </(х, х') та визначимо = тіп^^x). х Тоді за правилом вибору К, яке розглядається, вибираються альтернативи, які від- повідають величині <2 (домінуючому показнику множини X). Основні властивості цього методу полягають у тому, що вибір за цим методом з усієї множини альтернатив і вибір із множини ефективних альтернатив збігаються. Нехай розглядається задача пошуку ефективної альтернативи за трьома критеріями, що максимізуються, значення яких наведено в табл. 5.6. Розв’язок наведено в табл. 5.7. Таблиця 5.6 Таблиця 5.7 Хі /і /і /з Хі Хз Хз х4 Хз Хв Х7 0<х) Хі 5 3 4 Х1 0 2 2 1 2 0 1 2 Х2 4 5 5 хз 1 0 3 0 2 1 0 3 Хз 4 5 6 хз 1 0 0 0 0 1 0 1 Х4 4 5 3 х4 2 3 3 0 2 0 0 3 Хз 4 3 6 хз 2 3 3 2 0 2 2 3 Х6 5 3 1 х« 3 2 2 2 2 0 2 3 Хз 4 4 2 Хз 2 3 3 3 2 1 0 З табл. 5.7 видно, що 2 = тіп(7(х) = 1, і цьому значенню показника мно- жини альтернатив відповідає ефективна альтернатива Х3. 211
Проаналізуємо як вибирались значення, наприклад, <?(х2 ,х3) = 3. Справді, аль- тернатива х3 строго переважає х2 за трьома критеріями, оскільки між відповідними компонентами їх оцінок є дві рівності й одна строга нерівність на користь альтерна- тиви х3. Водночас <?(х2, х4) = 0, оскільки між відповідними компонентами є дві рі- вності й немає жод ної строгої нерівності оцінок на користь альтернативи х4. 4. Метод послідовних поступок, особливістю якого є те, що критерії задачі БКО мають бути заздалегідь впорядковані відповідно до зменшення їх важливості, після чого вибір розв’язку задачі здійснюється виконанням ба- гатокрокової діалогової процедури послідовних поступок, яка складається з одного попереднього й т основних кроків (де т - кількість критеріїв). 0-крок. Критерії ранжуються за зменшенням їх важливості відповідно до думки ОПР. Вважатимемо для зручності, що /і >/2 >>/* і-й крок (і = 1,т). Розв’язується однокритеріальна задача /(х)->тах, де х є 6,- (С, = X ’ - вся множина розв’язків). Позначимо через X. оптимальний розв’язок, обчислимо оцінку У' = {/і(хІ),/2(х,),..../т(х,)}. Особа, що приймає рішення, аналізує отриману оцінку й у випадку, коли воно її не задовольняє за критерієм /І+І(х,). вводить поступку за і-м критері- єм: Л(х)^/,.(х,)-А/.. Її додають до обмеження в, й отримують нову множину альтернатив: СІ+1 = {х Є С, П /,(Х) /Хх.) - А/,}. тоді відбувається перехід на наступний крок (і +1). В іншому випадку альтерна- тиву х. беруть як розв’язок багатокритеріальної задачі і процедуру припиняють. На ш-кроці ОПР повинна погодитися з отриманою наприкінці альтернати- вою або повторно виконати цю процедуру, скоригувавши значення поступок. Зауважимо, що метод має можливість забезпечити вибір ефективної аль- тернативи. Це підтверджується такою теоремою [10]. Теорема 5.9. Для будь-якого впорядкування критеріїв і будь-якої ефектив- ної альтернативи х° існує послідовність невід ‘ємних поступок {А/}, і = 1,т 212
таких, що на останньому кроці процедури буде отримана множина ефекти- , . о вних альтернатив, усі елементи яких рівноцінні х Якщо на перших кроках ОПР давала великі значення поступок, то ефек- тивна альтернатива, яку отримано наприкінці процедури, може мати вищі значення показників за менш важливими критеріями, і навпаки, якщо ОПР намагається отримати високі значення показників за більш важливими кри- теріями, то вона може отримати ефективну альтернативу з неприпустимо ма- лими значеннями показників за менш важливими критеріями. Недоліком методу є зростання обчислювальної складності задач опти- мізації із кількістю кроків, оскільки на кожному кроці додається нове обме- ження. Метод використовує два типи інформації від ОПР: інформацію про впорядкування критеріїв і про діапазон значень критеріїв. 5. Метод послідовного введення обмежень. Характерною особливіс- тю цього методу є послідовне (на кожному кроці) введення обмежень на аль- тернативи, які мають незадовільні, на думку ОПР, значення критеріїв. Розг- лянемо к-й крок (к = 1, 2, ...). Обчислюють оптимальні значення кожного з критеріїв окремо на уточненій множині альтернатив /^*) = тах/,(х), « = 1,т, 6, = Х. і формують вектор ідеальної оцінки на «уточненій» множині альтернатив: Визначають вагові коефіцієнти критеріїв: аі*\ аг*\ а™) й складають матрицю переваг ОПР: о(і) = {о-**}», / = 1,т на множині критеріїв, кожна пара симетричних елементів якої } характеризує відносну важливість і-го критерію порівняно зу-м критерієм. Значення кожної пари елементів однієї матриці вибирають так: Су = (8;1) - за дуже значної переваги і-го критерію (/•) наду-м; о,у=(4;1) - за значної переваги; = (2; 1) - за звичайної переваги; 213
Су = (1;1) - у разі рівноцінних критеріїв. Далі розраховують вагові коефіцієнти критеріїв за формулою: ст(*)=_^=1----, = • т т * Після розв’язку задачі тах^а^/ОО знаходять альтернативу х* та її оцінку /(*) = [/<*)(х)„.„ Д4)(х)]. Особа, що приймає рішення, аналізує отриману альтернативу та оцінку , зіставляючи з «ідеальною» оцінкою . Якщо оцінки задовольняють ОПР, то процедуру завершують, а альтернативу х* беруть за розв’язок вихідної за- дачі, інакше вказують номер 8 є т] критерію, який, на думку ОПР, найменш його задовольняє. Далі ОПР визначає до якого рівня потрібно покращити зна- чення цього критерію, формує нову «уточнену» множину альтернатив Ся+і = = {х є ск П /4(х) 2 , після чого здійснюється перехід на наступний крок. Метод бажаної точки є розвитком методу найкращого компромісного розв’язку. Особливістю цієї' діалогової процедури є необхідність задання ОПР бажаних значень критеріїв для визначення переваги на множині критеріїв. 0-й крок. Розраховують «найкращі» та «найгірші» значення критеріїв: = шах/,(х); /ітіп = тіп/,(х). хсХ хєХ Далі здійснюють монотонне перетворення критеріїв до нормованого без- розмірного вигляду (як у методі обмежень): ґхї-^-/-(х) і-іт н’Дх)- . ,1-1, т. ’ і / гтіп к-й крок (к = 1,2,...). Особа, що приймає рішення, аналізує отриманий на попередньому кроці (к- 1) розв’язок і його оцінку порівняно з «найкращими» та «найгіршими» значеннями критеріїв, і вказує бажані значення критеріїв: тіп» і ^ітлх^' 214
Бажані значення цільових функцій перетворюють до нормованого безро- змірного вигляду: н’*’= ,і = 1, т. Г~ Г Вагові коефіцієнти критеріїв обмежуються до вигляду (*) 7-І Р*=_»*Е. г* т 1 ія т ... І 4) 1ПЛ*> 7-і ц. ’ ?=п=і Ефективну альтернативу х° знаходять як розв’язок однокритеріальної задачі тахтіпр*н’ (х) й обчислюють оцінку >* =[/і(хо),/2(х0),/т(х0)]. хеХ ї=1,т Якщо отримані значення ЦФ задовольняють ОПР, то процедуру завер- шують, інакше переходять на наступний крок. Цей метод використовує лише один тип інформації від ОПР - про бажані значення критеріїв. Метод задоволення вимог. Особливістю цієї діалогової процедури є визна- чення переваги на множині критеріїв через виділення «головного критерію». к-й крок (к = 1, 2,...). Особа, що приймає рішення, виділяє головний крите- рій і є {1,т}, який, на її думку, обов’язково (найбільш за все) має бути покращений; далі встановлює мінімально допустимі рівні значень інших кри- теріїв / = 1,т, ] # і. Після розв’язку однокритеріальної задачі тах/Дх); хєб*, де вк = {х є X /^х) £ і = 1,т; і * і, визначають ефективну альтернативу V*’ та її оцінку ук = {/Дх^), —. /„(х^)}- Особа, що приймає рішення, аналі- зує отримане значення головного критерію /|(х(*))- Якщо воно її не задово- льняє, то переходить на наступний крок алгоритму, залишаючи номер голов- ного критерію незмінним. Якщо ж значення головного критерію задовольняє 215
ОПР, то вона розмірковує, можливе чи неможливе деяке погіршення голов- ного критерію для покращення значень інших. Якщо ні, то процедуру завер- шують, інакше відбувається перехід на наступний крок щоб призначити ін- ший головний критерій. Метод використовує два типи інформації від ОПР: - інформацію про переваги одного критерію над іншими; - інформацію про діапазони значень критеріїв. Метод векторної релаксації. Ця діалогова процедура призначена для пошуку ефективних альтернатив у задачах багатокритеріальної безумовної оптимізації такого вигляду: тах/Чх); хєЯ" хє/?л, і = 1,т. Припускається, що критерії задачі є неперервно-диференційованими увігнутими функціями. к -й крок (к = 1,2,...). Це крок градієнтного методу для оптимізації згортки критеріїв ^*(х)=Еа|*)/(х), і=1 а|4) > 0; і = 1,т, £а<‘> = 1, І=1 де {а, } - ваги критеріїв, які призначаються ОПР за допомогою деякої експер- тної процедури оцінювання. Пошук наступної точки рішення на к-му кроці здійснюється згідно з градієнтним методом: X* = Х*_, + у* £ Ї=1 216
де у4 - величина кроку, яку знаходять з умови досягнення максимуми функції в обраному напрямку, у* > 0: Якщо отримана оцінка у* = {^(х^)...Д™ альтернативи хк задово- льняє ОПР, то процедура закінчується, інакше переходять на наступний крок. Зауважимо, що альтернативи, які генеруються цією процедурою, лише в граничному випадку будуть ефективними, тому, оцінюючи отриману чергову альтернативу, ОПР має перевірити, наскільки вона є оптимальною за Парето. ” к Оптимальність альтернативи можно оцінювати величиною Еа, /(х^) . Цей і=1 метод використовує лише один тип інформації від ОПР - інформацію про ві- дносну важливість критеріїв. Приклад 5.2. Розглянемо багатокритеріальну задачу приклада 5.1. (рис. 5.3) і для зручності перейдемо в другому критерії /2(х) = ЗхІ + х2 -» тіл до екві- валентної задачі максимізації /2'(х) = —3х1 + х2 —> шах. Рис. 5.3 217
Тоді тах/2'(х) = /2'(Д) = 1 = ^); тіп/2(х) = /2'(Р) = -13. Розв’яжемо цю задачу методом ідеальної точки: Г1(х) = тіпЕ|/і(х)-^.-» 2 шах £ /і{х) = шахОі(х) + /2'(х)} = (хі + 4х2) + (-Зх, + х2) = -2хх + 5х2. І=1 Графічно розв’яжемо цю задачу і неважко побачиш, що оптимальне рішення буде в точці С (хі = 6; х2 = 7), в якій досягається оптимальне значення /і(х): Гі(С)= /і°-/і(С) + /і'0-/2(С) = 34-34 + |1-(-11) =12. Тепер розв’яжемо цю задачу методом послідовних поступок. Для цього проранжуємо критерії. Нехай /і(х) > /2(х). Крок 1. Знаходимо шах/і(х) = /І(С) = 34. Введемо поступку для /і(х). Нехай ДД = 4. Розв’язуємо задачу за другим критерієм: /ї{х) = -Зхі + х2 -> шах за обмеження /і (х) £ - Д/і = ЗО та початкових обмежень АХ £ В прикладу 5.1. Цю задачу також розв’язуємо графічним методом. Для цього побудуємо область Хі + 4х2 £ ЗО і знайдемо розв’язок у перетині прямих хі + 4х2 =30 та -Зхі +5х2 =17(ВС). Розв’язуючи цю систему, знайдемо х° = 4^ »4,824; х2 = 6-^ =6,294 - координати точки перетину Л/(рис. 5.3). Значення критерію /2(х) у точці М 14 5 З /2(Л/') = -3 • 4 — + 6~- = -8—. Особа, що приймає рішення, аналізує значення критерію /2 = -8~: якщо воно її влаштовує, то процедуру примножують, вводиться нова поступка за критерієм /і(х). Припустимо, що ОПР не влаштовує досягнуте значення за критерієм /2, тоді вона збільшує поступку: Д/і = 6 й знову розв’язує задачу птах/2(х) =-Зхі+х2 за умови /І(х)£/І°-А/І =28. 218
Розв’язок цієї задачі перебуває на перетині прямих X! + 4х2 = 28 та -Зх1 + 5х2 = 17. Відповідне рішення х знаходимо в точці перетину ЬІ: . 4 . 16 . . х^ =4—«4,235; х2 = 5—«5,94. Дня цього рішення /1(х) = 28; /2(х) = = -6,765>/2(Л/), при цьому /°-/і(х*) = 6; /і = 7,765. Якщо цей розв’язок влаштовує ОПР, то на цьому процес завершується. 5.5. Багатокритеріальні задачі лінійного програмування з нечіткими цільовими функціями Розглянемо тепер задачі багатокритеріальної оптимізації в умовах неви- значеності [25]. Нехай задача прийняття рішень з декількома критеріями зводиться до багато- критеріальної задачі ЛП (задача БКЛП) з нечіткими ЦФ такого вигляду: тахх, = У. с^х) = С^Х, і = 1,К 7=1 за умов АХ£В, Х£0, де всі коефіцієнти цільових функцій Су є нечіткими числами, заданими на ін- тервалі Су є [с^/, с^] з відомими ФН. Однокритеріальні задачі з інтервально заданими нечіткими параме- трами цільових функцій. Перш ніж викласти загальний метод розв’язання нечіткої задачі БКЛП розглянемо випадок, коли ОПР невідома ФН нечіткого параметра су, а відомі лише кінці інтервала невизначеності: нижній Су, і верх- ній Суи. Для цього ступеня інформованості ОПР пропонується такий метод розв’язання [25]. Складемо й розв’яжемо задачу «песиміста»: тахз, = У с,;ху =С^Х 7=1 219
за умов АХ5В, Х£0. (534) (5.35) Знайдений п розв’язок позначимо через X/, а оптимальне значення ЦФ гт«, =г/(ХІ) = 7/*. Одночасно розв’яжемо відповідну задачу мінімізації: тіл 2/(X) = 2, за умов (5.34), (5.35). Далі розв’яжемо задачу «оптиміста» (для найкращих умов зовнішнього середовища): шах 2И (X) = £ суиху = С^Х >=і за умов (5.34), (5.35), і знайдемо оптимальний п розв’язок Х„, а також 2* = тах2и(Х). Визначимо нижню межу критерію «оптиміста»: 2„ =ШІП2И(Х) за умов (5.35), (5.34). Тоді задачу знаходження оптимального рішення в умовах з інтервально заданими параметрами ЦФ можна звести до задачі знаходження компроміс- ного рішення такої багатокритеріальної задачі: 'г,(Х) = С[Х шах •' ' ‘т ^2и(Х) = С>] за умов (5.34), (5.35). Щоб знайти її рішення застосуємо такий підхід: перейдемо від критерію 2,(Х) до нечіткого критерію з ФН, що задається так: 0. якщо 2/(Х)$2/; /,(Х) = * , лпгци 2,-2/ 1, ЯКЩО 2/(Х)^2/. 220
Аналогічно для критерію оптимальності ги(Х) перейдемо до нечіткої ЦФізФН /и(Х), яку визначають так: /И(Х) = 0, якщо 2„(Х)£ ги; ги(Х)-2и . —І------, ЯКЩО 2и < 2и(Х) < 2и ; 2и~2и ~ 1, якщо 7и(Х)£г2- Далі застосуємо підхід Белмана-Заде і шукатимемо таке компромісне рішення х°, для якого тт{/(Х), /„(X)} -► шах за умов (5.34), (5.35). Цю мінімаксну задачу можна записати в такому еквівалентному вигляді: шах А X за умов А(2/’-2/)-2/(Х)£-2,; Цги' -2и)-2и(Х)5-2и, АХ$В; Х>0. Величина А°(Ає[0,1]) характеризує досягнутий ступінь задоволення кожного з нечітких критеріїв (// та /,). Задача лінійного програмування з нечіткими параметрами критеріїв з відомими функціями належності. Розглянемо тепер випадок більшої інфор- мованості ОПР про нечіткі параметри. Нехай ОПР відома ФН Ц(у(Су) нечітких параметрів с,. Тоді ОПР може задатися деяким рівнем а (а є (0,1)) й визначи- ти підмножину рівня а С“ нечіткого числа су , що задається інтервалом С“ = Гс“;,с“Л. Тоді можна сформувати два критерії-ипесимісти» 2°(Х) для лі- вого кінця інтервалу й «оптимісти» г“ (X) для правого кінця інтервалу й перей- ти до розв’язання двокритсріальних задач вигляду шах г“(Х) = С“тХ 2'1(Х) = С“ТХ 221
Для Знаходження найкращого компромісного розв’язку цієї задачі пе- рейдемо до лінійної задачі вигляду [25] тах А. за умов АХ£В, Х£0. Вона є звичайною задачею ЛП, її розв’язують стандартними методами ЛП (симплекс-методом, методом оберненої матриці тощо). За потреби більш повного врахування інформації про вигляд ФН ц7(су) ОПР може задатися декількома рівнями а: ара2,... ая, і тоді обмеження мі- німаксної задачі (5.36) запишемо у вигляді (X) * -гЛ; Х(2и“^-гЛ)-2и^(Х)5-2и^, г = 1,Я, тобто отримаємо 2Я обмежень (зазвичай обирають Я = 3...4). Багатокритеріальна задача лінійного програмування з нечіткими параметрами в цільовій функції. Розглянемо тепер загальний випадок за- дачі БК ЛП з нечіткими ЦФ. її можна записати у вигляді тах £ сахі = X, і = 1, к (5.37) 7=1 за умов ^>оВ’ <538) де с^) - нечіткі числа з відомими ФН ц,/^). Задамося декількома рівнями ага^а2,...,ая і знайдемо відповідні ін- тервали невизначеності ,с°' . 222
Далі, використовуючи підхід, описаний у попередньому розділі, зводимо задачу (5.37), (5.38) до такої багатокритеріальної задачі: тах N : N N £ й : «.р £•>$>$ 1 , г = 1,Л за умови (5.38), яка зводиться до такої однокритеріальної задачі: тахХ за умов ЧьР* - V:) - (X) * ^вг*-<г)-^аг(х)^-2^а:, і = \,к, г = \,П, (539) АХ£В; Х£0. Зауважимо, що кількість обмежень вигляду (5.39), які додаються до за- дач (5.37), (5.38), становить 2КК. Приклад 5.3. Розглянемо таку багатокритеріальну задачу ЛП з нечітки- ми ЦФ [25]: тах /'І(Х)=с, |Х, + с12Х2, тах /^(Х) = с21Х! + за умов х, + х2 £ 7; 0 ' (5.40) -2^ + Х2 <. 4; ' х2^10; X! + 2x2 і 24; ХрХ^О, (5.41) де Су - нечіткі числа (множини) з ФН; ц(сй) = — 1 - , де сп =1; с12 = 4; 1+(су-с(у)2 = 3; сг2 = —2. 223
Знайти найкращий компромісний розв'язок для рівня а = 0,8. Розв'язувати задачу будемо графоаналітичним методом. Побудуємо область допустимих розв’язків, яка визначається умовами (5.40) і (5.41), її зображено на рис. 5.4. Знайдемо крайні точки ОПР та їх координати: А (1 ;6); В (3;10); С (4;10); £)(18;3);£(6;1). _____ -Т~ ~І-------*-+-т--------1------і------1--Ь 2 4 г. 7 Г Ю 12 14 Іі> Рис. 5.4 Розв'яжемо нерівності та знайдемо інтервали належності рівня а=0,8 для нечітких коефіцієнтів с^: ----2: 0,8 -+(&,- с.)2 5 ^ = 0,25; (^ - с„) 5 0,5; І + ^-с^Г °>8 Су - 0,5 £ Су £ Су + 0,5. Знаходимо інтервали для Су. 0,55с1І51,5; 3,55с1254,5; 2,5 50^ £3,5; -2,5 5 0^5-1,5. Запишемо критерії «песиміста» та «оптиміста»: =0,5Х) +3,5хг; = 1,5Х| + 4,5x2; =2,5Х) — 2,5x2; ^2і/ =3,5Х) — 1,5X2- 224
Розв’яжемо графічно ці задачі та знайдемо значення ЦФ: шах 2ц. (х) = 2ц. (С) = 2 + 35 — 37; тах^іи(х) = ^щ(О = 51; тах2и(х)=2и(Р) = 37,5; тах^2и(х) = = 58,5; тіпги(х) = 2и(£) = 6,5; тш2щ(х) = 2щ(£) = 10,5; ттг2£(х) = 72£(В) = -17,5; шш^2ц(х) = ХщІВ)=—4,5. Тепер запишемо задачу знаходження компромісного розв’язку: тахХ за умов (37 - 6,5)Х - (0,5хі + 3,5хг) £ -6,5; (51 - 10,5)Х - (1.5Х! + 4,5x9 <, -10,5; (37,5 +17,5)Х - (2,5хі - 2,5x2) і 17,5; (58,5 + 4,5)1 -(3,5хі - 1,5x9 £ 4,5 й умов (5.36) та (5.37), або: ЗО.5Х - (0,5х! + 3,5x2) £ -6,5; 40,5Х - (1,5х! + 4,5x2) 5 "ЮД ‘ 55Х-(2,5хі-2,5x2) ^17,5; 63Х-(3,5х1-1,5х2)^4,5. Розв’яжемо цю задачу симплекс-методом і знайдемо найкращий ком- промісний розв’язок, який максимізує X. Зауважимо, що оскільки максимальні значення критеріїв досягаються в точках С і £), то компромісне рішення належить відрізку С£>, тобто лежить на прямій X] + 2x2 = 24, отже, шукану точку Е можна в цьому випадку знайти графоаналітично. Виключивши одну змінну (хі), отримуємо систему нерівно- стей із двома змінними: X і х2, а побудувавши область допустимих рішень, знаходимо шуканий компромісний розв’язок х° = 12; х° =6 і значення крите- рію Х^» = 0,606.. Точку Е, яка відповідає йому, показано на рис. 5.4. 225
5.6. Багатокритеріальне нелінійне програмування з нечіткими параметрами У попередньому підрозділі розглянуто проблему багатокритеріальної оптимізації в ЛП з нечіткими ЦФ й описано підхід, який дає змогу вирішити її, використовуючи апарат нечітких множин. Розтаємо більш загальний випадок задач багатокритеріального нелі- нійного програмування (БКНП) з нечіткими параметрами. Запропонований підхід до її розв’язання використовує поняття Парето-опгимальності а-рівня. Пфано-опяшмальність а-рівня. У загальному випадку задачу БКНП можна записати у вигляді такої задачі векторної оптимізації: мінімізувати /(Х) = [/1(Х),/2(х), ..,/*(*)] за обмежень х є X = {х є Я00, #/х) £0, у = Ця}, де х - л-вимірний вектор змінних розв’язку; [/і(Х),/2(Х),...,/і(Х)] - к різ- них ЦФ; [#і(Х),...,£я(Х) 0] - множина допустимих розв’язків (МДР). Як відомо, центральним поняттям для задач багатокритеріальної оптимі- зації є поняття Парето-оптимального розв’язку. (Його визначення для чітких задач багатокритеріальної оптимізації дано в підрозділі 5.1.) На практиці часто у значеннях параметрів ЦФ та обмежень виникає не- визначеність, що відображає неповноту знань експертів про реальне середо- вище. Тоді доцільно розглядати БКНП з нечіткими параметрами в описі ЦФ та обмежень: мінімізувати /(х,а)=[/1(х,а1),/2(х,а2),...,/я(х,ал)] за обмежень х е Х(Ь) = {х є Е",£у(х,Ь) 5 0, і = 1,л»}, де ам Ьу - вектори нечітких параметрів, включених в ЦФ та обмеження Я7(х,Ьу) відповідно, а,=[ап,аі2.ай], Ь}=[Ь}1,Ь}2,...,Ь}г]. Ці параметри вважають нечіткими числами. 226
Визначення 5.4. Нечітке число К - це опукла неперервна нечітка під множина числової осі, ФН ц(р) якої визначається таким чином [25]: 1) ц(р): £і---ЯО;Ц; 2) Н(/>)=0 для всіх рє(-оо;р,); 3) ц(р) - строго зростаюча функція на проміжку [р];р2]; 4) М(р)=1 для всіх рє[р2;рз]; 5) ц(р) - строго спадна функція на проміжку [р3;р4]; 6) ц(р)=О для всіх рє(р4;оо), де ру - дійсні числа, такі, що Рі<р2<Рз<Р4- Можливий вигляд ФН для нечіткого числа зображено на рве. 5.5. Припустимо далі, що у нечіткому БКНП є нечіткими числами з ФН відповідно. Для спрощення позначень визна- чимо такі вектори та матриці: аі =[°л»Яп«— А=[«і, ж2,.... •*]; В=[Ь(, Ь2,.... Ьж]. Тоді можна ввести множину а рівня або а-перетин нечітких чисел а* та Ьіг. Рі Рі Р] Рі Р Рис. 5.5 Визначення 5.5. Множиною рівня а нечітких чисел л^.(і = 1,Л,г=1,р,) та Ь^(] =1,т,з=1,ц^ називають множину ^(а.Ь), для якої ступінь належності всіх елементів не нижчий за величину а, тобто , . кх I/ км М(«іг)^“.» = 1.*.г = ЇА ^(а,Ь) = иа,Ь)| . І М(Ьу,)^а,у=1,т,я = 1,9у Множини рівня а мають таку властивість: £ с^ тоді й тільки тоді, ко- ли Дч(а,Ь)аІ|Ві(а,Ь). Отже, для деякого заданого значення а задача нечіткого БКНП може 227
трактуватися як така а-БКНП задача [25]: мінімізувати Цж.а)=[/(ж.а,). /2(х,а2)../*(х,а*)] (5.42) за обмежень х є Х(Л) = {х е £" | £у(х,Ьу) * 0, і = 1,т, (о,Ь) є ^(о.Ь)}. (5.43) Зазначимо, що в а-БКНП задачі параметри (а,Ь) розглядаються як змінні, а не як константи. Використовуючи множини рівня а нечітких чисел, введемо поняття Парето-оптимальних розв’язків для нечітких БКНП задач рівня а [25]. Визначення 5.6. Вектор х* є Х(Ь*) називають а.-Парето-оптимальним розв’язком задачі (5.42), (5.43) тоді й тільки тоді, коли не існує іншого х є Х(Ь), а також значень параметрів (а,Ь) є ДДа,Ь) так, що /(х,а/)^/(х*,а*), і=\,к, і строга нерівність виконується хоча б для одного і, де відповідні величини параметрів (а ,Ь ) називають оптимальними параметрами рівня а. Із властивостей множини рівня а випливає таке твердження. Нехай х1, х2 - Парето-оптимальні розв’язки рівнів ап та а2 відповідно, (а'.Ь1),^2,!»2) - відповідні оптимальні параметри рівня а2 та а2 задачі БКНП. Якщо аі^а^, то існують х2 та (а2,Ь2) такі, що /(х,а*)^ /(х,а2) для довільного х1 та (а’.Ь1). Як випливає з цього визначення, зазвичай а-Парсто-оптимальні розв’язки складаються з нескінченної множини точок й ОПР має вибрати свій компроміс або задовільний розв’язок серед а-Парето- оптимальних розв’язків, ґрунтуючись на своїх суб’єктивних уявленнях. Щоб відшукати «кандидата» на задовільний розв’язок (який є також і Парето-оптимальним) звертаються до ОПР із проханням визначити ступінь а для множини а-рівня, а також відповідні рівні досягнення значень ЦФ, які називають «еталонними» рівнями. Для заданих ОПР ступеня а та еталонних рівнів відповідний а-Парето- оптимальний розв’язок, який відповідає вимогам ОПР (або кращий за них за умови, що еталонні рівні досяжні), отримують розв’язанням такої мінімаксної 228
задачі [25] (у припущенні, що різниці [/(х.а,) - однаково важливі для ОПР): знайти ішп шах[/Дх,а/)-//], хєХ(Ь) і або еквівалентно: мінімізувати З за обмежень (а,Ь)є^(«,Л); тєХ(і). Зазначимо, що мінімаксну задачу використовують як засіб генерації а-Парето-отимальних розв’язків і, якщо ОПР не задоволена поточним а-Парето-оптимальним розв’язком, то можна поліпшити цей розв’язок кори- гуванням його еталонних рівнів. Взаємозв’язки між оптимальними розв’язками мінімаксної задачі та а-Парето-оптимальними розв’язками задачі БКНП описують такими теоре- мами [25; 28]. Теорема 5.10. Якщо (х ,3 ,а ,Ь ) - єдиний оптимальний розв’язок мі- німаксної задачі для деякого /=[/ї>Л»— »/*]» то х* _ о.-Парето- оптимальний розв ’язок для а-БКНП задачі. Доведення. Припустимо, що х не є а-Парето-опгимальним розв’яз- ком задачі БКНП. Тоді існує хєХ(Ь) (причому (а,Ь)єІь(а,Ь)) такий, що /(х,а/)^/(х,,а;), І = 1Х Звідси випливає тах[/5(х,а/)-/]^тах[/;(х,а*)-/(], а це суперечить припущенню, що (х , 3 , а , Ь ) - єдиний оптимальний розв’язок мінімаксної задачі. Звідси х - а-Парето-оптимальний розв’язок а-БКНП задачі. Теорема 5.11. Якщо х* - а-Парето-оптимальнийрозв’язок і (а*,Ь*) - оптимальні параметри а-рівня в а-БКНП задачі, то існує вектор 229
ї-МіЛі.....Л] оижий, що (х ,3 ,а ,Ь )- оптимальний розв’язок мінімакс- ної задачі. Доведення. Припустимо, що (х ,3 ,а ,Ь ) - не оптимальний роз- в’язок мінімаксної задачі для довільного /, що задовольняє умову /1(х,,а;)-Л=...=А(х,а;)-А = 3*. Тоді існують і є Х(Ь) та (а,Ь) є ДДа,Ь) такі, що тах[/(х,а/) - 7і ] < тах[Л(хФ,а^ - /,]=о*. Звідси випливає тах{^(і,а{) -/Дх'.а’)} <0. іде* Якщо будь-яка різниця /(х,а/)-/(х*,а*) додатна або дорівнює нулю, то ця нерівність не виконуватиметься. Звідси має виконуватися /(х.а,)- -/(х ,а/)<0, що суперечить припущенню про те, що х* - а-Парето- оптимальний розв’язок і (а ,Ь ) - оптимальні параметри а-рівня. Отже, тео- рему доведено. Якщо ж оптимальний розв’язок мінімаксної задачі (х ,3 ,а ,Ь ) не єди- ний, то можна перевірити а-Парето-оптимальність для х , розв’язавши таку задачу: знайти і шах^є, (5.44) м за обмежень /(*.<*/)+є, = /(х’.а/), е, £ 0, і =1,*; хєА'(Ь),(а,Ь)єІь(а,Ь). Нехай (і, а, Б) - оптимальний розв’язок задачі (5.44), (5.45). Якщо всі є, = 0, то х - а-Парето-оптимальний розв’язок. Якщо ж хоча б одне є/ > 0, то можна легко показати, що і є а-Парето-оптимальним. Експериментальні дослідження алгоритму розв’язання задач БКНП. Для експериментального дослідження інтерактивного алгоритму розв’язання 230
задачі БКНП обрали таку задачу [25]: шіп/і(х,а1)=(х1 -йц)2 +(х2 -оі2)2 +5(х, -^3)2; (5.46) шіп/2(х,а2)=(х1 -10)2 -а21 +(л^ +5)2 ап +2(х,-а^)2 (5.47) за обмеження ^х2 + £ 100, (5.48) де 5ц, ЬІгі = 1,3 - нечіткі числа з ФН трикутного вигляду з параметрами А» Рг> Рзп Рі* значення яких наведено в табл. 5.8. Щоб знайти розв’язок мінімаксної задачі вигляду (5.46)-(5.48), викорис- товують метод бар’єрних поверхонь [25], для застосування якого будується бар’єрна функція вигляду /-і £/(**Л) де к-номер поточної ітерації, Р = 0,1, г0=5. Таблиця 5.8 НечШ параметра Р1 Й“Й Р* Дії 3,8 4,0 43 012 48,5 50,0 52,0 оц 1,85 2,0 23 021 183 20,0 22,5 022 2,9 3,0 3,15 оа 4,7 5,0 535 Ьг 0,9 1.0 1,1 62 0,8 1.0 13 6з 0,85 1,1 1,15 Умови зупину алгоритму були такі: " 1 лГ----------^Е, м де е=10~*; хк - оптимальний розв’язок після к-ї ітерації. Для оптимізації бар’єрної функції використовується градієнтний метод зі змінним кроком. Експерименти проводилися за різних рівнів а. Як еталонні рівні використо- 231
вувалися значення /( та /2, які задавала ОПР. У табл. 5.9 наведено результа- ти експериментальних досліджень залежно від варіацій а та значень еталон- них рівнів /, =2000, /2 = 2500, де 2*і та Р2 - досягнуті значення критеріїв Л, А і ^{Т ~ число ітерацій оптимізації. У наступних експериментах було досліджено вплив вибору нечітких па- раметрів Ь, з проміжку [А“,Л7] = Аі(М на область допустимих рішень (ОДР) та досягнуто значення критеріїв за а=0,5. Звичайно, що за Ь, =Ь* отримає- мо максимальну ОДР, а за = Ь* - мінімальну. Таблиця 5.9 а г, Р 9-х. Хі № 0,50 1635,4 2133,9 -364,2 1,542 9,807 1,136 177 0,60 1657 2156 -342,0 1,507 9,714 1,1402 113 0,80 1702 2200 -297,9 1,443 9,5339 1,1454 120 Відповідні результати наведено в табл. 5.10. Таблиця 5.10 Експеримент Л Рі 9 Збільшення ОДР 1589 2089 -409,8 Зменшення ОДР 1748 2248 -251,5 Проаналізувавши наведені експериментальні результати, робимо такі висновки. 1. Збільшення рівня а призводить до погіршення досягнутих значень критеріїв Г\ та Рі, що зрозуміло, бо скорочується інтервал £а(а<), на якому від- шукуємо тіл /(х,а,). х.<% 2. Збільшення ОДР приводить до покращання значень критеріїв, а змен- шення, навпаки, - до зворотного ефекту. Зменшуючи задані значення ета- лонних рівнів /1 та /2, можна досягти покращення значення відповідного критерію внаслідок оптимізації. 232
Запитання для самоконтролю 1. Дайте визначення Парето-оптимального (ефективного) розв’язку багатокрите- ріяшюї задачі оптимізації. 2. Які властивості Парето-оптимальиих альтернатив (розв’язків) Вам відомі? 3. Дайте визначення еквівалентних множин критеріїв оптимальності. 4. Сформулюйте достатні умови еквівалентності систем (множин) критеріїв. 5. Наведіть формули переходу від початкової системи критеріїв до еквівалентної системи безрозмірних критеріїв. б. Дайте визначення найкращого компромісного розв’язку задачі багатокритеріаль- иої оптимізації. 7. Як пов’язані між собою Парето-оптимальні розв’язки та найкращий компроміс- ний розв’язок багатокритеріальної задачі оптимізації? 8. У чому полягає метод обмежень Ю. Гермеєра? 9. Опишіть метод розв’язання багатокритеріальних задач ЛП. 10. Опишіть метод розв’язання багатокритеріальних задач ЛП з нечіткими ЦФ. 11. Запишіть задачу знаходження найкращого компромісного розв’язку багатокри- теріальної задачі ЛП з нечіткими критеріями. Який зміст має параметр А у математичній моделі цієї задачі? 12. Дайте визначення Парето-оптимального розв’язку рівня а для багатокритеріа- льної задачі нелінійного програмування (задачі БКНП) з нечіткими параметрами. 13. Який зв’язок між Парето-оптимальним розв’язком рівня а та розв’язком міні- максної задачі? 14. Опишіть інтерактивний алгоритм знаходження Парето-оптимального розв’язку рівня а для багатокритеріальної задачі НП (задачі БКНП). 15. Назвіть основні методи багатокритеріальної оптимізації та вкажіть їх властивості. 233
Задачі для самостійного розв'язання Задача 5.1. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: Г1(х) = 3хі+2х2->тах; Г2(х) = Хі-х2->тах за умов Х| -6x2 $3; Х1+Х2 £10; -2х1 + х2^іі Х2 $11; ІХі +Х2 $32; ХрХ^О; р1=р2 = 0,5. Вважаючи, що величини Су є нечіткими числами з ФН =-----—--—2« Де Си=3, Сіг = 2, Сгі=1, Сг2=-1, знадіть найкращий 1+(С#-С#) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,8. Задача 5.2. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ^і(х)=хі +4*2 /г2(х) = 2х1 -2^2->тах за умов 1 О д^+Х2 £7; -2% +Х2 $4; хі$10; Х| + 2^2 $ 24; д^,д^£О; Р!=Р2=0,5. 234
Вважаючи, що величини Су є нечіткими числами із ФН 2 - - = —-----ч2 ’ де =1» ^12 =4» Сії =2, С12 = -2, знайдіть найкращий 2+[Су-Су) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а *= 0,8. Задача 5.3. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ГДх)=+ ^2-♦ тах; /г2(х) = 2х1-х2—>тіп за умов Хі+Іх^ЗЬ -2хх + *2 16; х, + 2*2 £ 64; -*!+ 4л^ £40; лі £24; ДІ,Х2^(Х Рі=Р2=0,5. Вважаючи, що величини Су є нечіткими числами із фн ц(сі/)= =------2 » дс Сц=1, Сі2=1, Сц=2, Сг2=-1» знайдіть найкращий 1+(с„-С#) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,8. Задача 5.4. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ГДх)=2хі+ 2*2 тахі Г2(>) = Зхі + х2 —> тах за умов -5хі+3х2^14; лі +4X2 £57; 235
2хі+Х2^30; Х1.Х2 £0; Рі=р2=0,5. Вважаючи, що величини Су є нечіткими числами з ФН = =------1——Де Сп =1. Сіг = 2, Сгі=3, Сі2=1, знайдіть найкращий 1+(С#-С#) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,5. Задача 5.5. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: 7^(х)=4хі+2х2 ->тах; Г2(х)=- х2 _>тах за умов х^-бх^З; Хі + х^ІО; -2хі +х2 £2; *г^12; 2х] +х2 ^32; ХрХ^О; Р1=р2=0,5. Вважаючи, що величини Су є нечіткими числами із ФН м(с#)= =----------де Сц=4, Сі2 = 2, Сгі=1, Сі2=-1, знайдіть найкращий 1+^-0,) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,8. Задача 5.6. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ГДх)=Зхі+ 2*2 “““і Р2(х)=х1 -Зхг ->тіп за умов 2хі +^2 Хі+2х2 £8; 236
Х|+2X2^20; +4*2 212; Хі ^6; Р1=р2=0,5. Вважаючи, що величини Су є нечіткими числами із ФН м(с#)= =—-——2» де Сц = 3, Сі2=2, Сгі=1, Сг2=-3, знайдіть найкращий 1+(С#-С#) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а " 0,5. Задача 5.7. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ?і(х) = х, + 4*2->іяах; Г2(х)=3-^ ~х2 ->пй> за умов Х|+2х2^4; Зхі -Зхі+5х2^17; 5хі-Хг^23; Зхі -4x2 Хі,Х2 £0; Рі=р2=0,5. Вважаючи, що величини Су є нечіткими числами із ФН р(С,) = =—-—~ ——2» де Сц=1, Сі2=4, Сгі=3, С22=-1, знайдіть найкращий і+(с,-с#) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,8. Задача 5.8. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: ГДх)=Зхі + 2*2 -* Г2(х)=X] - Зх2 -> тах 237
за умов лі-бхг^б; лі+х^гО; -2х1+х2^2; х^22; 2Х] +Х2 £64; хі.х^О; р1=р2=0,5. Вважаючи, що величини Су є нечіткими числами із ФН =------1 2* де =3, ^12 =2» с2і =1« = ~3» знайдіть найкращий і+(с,-о,) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а = 0,8. Задача 5.9. Знайдіть найкращий компромісний розв’язок такої задачі багатокритеріальної оптимізації: Л(х)=Сц*і +С12х2 ->шах; 7*2 (х) = С21лі + СиЛг -> шал за умов £Л2; о лі +Х2 £7; -2хі +Х2 £4; х2£10; Хі + 2x2 £ 24; хі,Х2 £0; р1=р2=0,5. Вважаючи, що величини Су є нечіткими числами із ФН ц( Су) = =------—у, де Сп =2, Сіг =4, Сгі =3, С22 =-2, знайдіть найкращий 1+(Су-Су) компромісний розв’язок цієї задачі, оптимальний за Парето, рівня а ** 0,8. 238
6. ДИНАМІЧНІ ПРОЦЕСИ ПРИЙНЯТТЯ РІШЕНЬ На практиці досить часто виникають ситуації, коли необхідно приймати не одноразове рішення, а послідовність рішень на заданому часовому інтер- валі. Зокрема, такі задачі виникають під час планування деякого виробництва на квартал чи рік, для управління запасами при проектуванні (управлінні проектами) тощо. У цих задачах рішення пов’язані між собою, і кожне попе- реднє рішення впливає на наступні через змінні, що описують стан системи. Для розв’зання таких задач розроблено спеціальний метод динамічного про- грамування. 6.1. Основна ідея та особливості методу динамічного програмування Динамічне програмування (ДП) - це обчислювальний метод для роз- в'язання задач оптимізації процесів послідовного прийняття рішень, матема- тичні моделі яких мають спеціальну структуру з адитивними або мульти- плікативними ЦФ [25]. Динамічне програмування виникло і сформувалося в 1950-1953 роках XX ст. з робіт Р. Белмана та його співробітників. Перші задачі, що зумовили появу обчис- лювального методу, були динамічними задачами керування запасами. Ідею обчислювального методу ДП розглянемо на такому прикладі: мак- симізувати (б.і) /-і за обмежень а. > 0; х. £0; Ь>0. (6.2) 7-і Як бачимо, ЦФ задачі та обмеження є сумою функцій від однієї змінної ко- жна. Таку функцію, як відомо, називають адитивною. Якщо всі У = 1,л опуклі, то для розв’язання задачі можна застосувати метод множників Лагранжа. 239
Коли існує декілька локальних мінімумів, то цей метод дає лише один із них. Якщо ж потрібно знайти глобальний максимум, метод множників Лагранжа застосувати неможливо. Тому розглянемо інший метод, який забезпечує відшукання глобально- оптимального розв’язку. Припустимо, що всі Пу, & - цілі числа. Припустимо також, що в задачі, яка розглядається, всі змінні можуть набувати лише ціло- чисельних значень. Через г* позначимо абсолютний (глобальний) максимум 2 за умови я ^аіХ^ Ь. Виберемо деяке значення х„ і, зафіксувавши його, максимізуємо 2 7-і за всіма іншими змінними х(, х2,..., хв_|. Припустимо, що така максимізація проведена для всіх можливих значень х„, тоді 2 буде найбільшим з усіх мо- жливих значень 2. Формально цей процес (цю процедуру) записують так: 2(хл)= тах ]е/у(ху)і = хі»х2..«Я-1І/-1 І Г л-1 = /л(*л)+ тах 4£/у(Ху), »1.»2............ причому я—1 Е аіх} ±Ь-апх„. (6-3) Я—1 Оскільки тах £ /у (ху) для невід’ємних цілих чисел, що задовольняють умову (б.З), залежить від Ь-ап хв, то позначимо я—1 “ах £ /у(ху) = Лв_! (Ь-а„ хв). »і-л»-іу-1 Припустимо, що обчислено Лв_1(і>-авхв) для всіх допустимих цілих 240
Очевидно, що **=“йк- <*">+л"-і х">) • <6-4) Щоб знайти (6.4), визначимо /(хя) та Ля_{(1>-аяхя) для всіх допус- тимих значень хя й оберемо максимальне 2 . Одночасно знайдемо оптима- льний розв'язок хя. Таким чином, якби була відома функція Л(Ь-а„ хя ), то вся задача звелася б до задачі з однією змінною. Покажемо, як обчислити Ля_| (Ь-ап хя ). Позначимо ЛЯ_1(О= тах £ /у(х?) »і.........«я-іу-і за умови я—1 £ аух7^. 7-і Повторивши вищенаведені викладки, отримаємо Ля_І(О=тк{/я_і (*я-і)+Ая_2(^-ая-і хв-і)}» (65) де я-2 Ля-гЙ-^я-і<6-6) причому максимум у (6.5) можна відшукати за умови я-2 £ а]Х]^-ая_ххя_х. 7-і Аналогічним чином обчислюємо Ля_2(£), Л.в-з(£) і Д- Нарешті, на Л-му кроці використовуємо основне рекурентне співвідношення (ОРС) дина- мічного програмування: А*(О=тах{Л(хк)+Л*_,й-акхк)} (6.7) за умови, що к £ а.Ху к = л, л-1,.... 2. 7-і 241
Викораспжуючи ОРС (6.7), організуємо процес обчислень як багато- кроковий процес таким чином. На першому кроці, зафіксувавши початок ін- тервалу «0» і змінюючи його правий кінець £, обчислюємо АДО- шах Л(х,) для всіх можливих значень £ ” 0, 1, Ь. Оптимальний розв’язок першого кроку позначимо через х® (£). Складемо таблицю динамічного програмуван- ня першого кроку (табл. 6.1) і заповнимо її результатами обчислень. На другому кроці (1’2) знаходимо Л2(£) згідно зі співвідношенням Л2(О= тах {Л(*2)+лі(^-а2х2)}. причому значення Л|(£ - а2х2) обираємо ізтабл. 6.1. Обчислюємо послідовно Л2 (£) для всіх значень £ - 0,1,Ь, використо- вуючи результати табл. 6.1. Одночасно зниодимо х2(£) і Х]°(х2(£)). Резуль- тати обчислень заносимо в таблицю другого кроку (табл. 62). Таблиця 6.1 $ Лі© х*|© 0 1 ... ь Таблиця 6.2 Лі© Л© Л© 0 1 ... ь Далі, використуючи співвідношення (6.7), послідовно обчислюємо .........4^0- —мя.всіхзна.чвнь\-0..’..?_ 6 242
Нарешті, на останньому кроці для к=п знаходимо = ЛВ(£ = *)= ИЦ* Оіх.і - { /«(*« )+^я-1(^ апХп а також відповідне оптимальне значення для останньої змінної хя=хя(Ь). Для відшукання значень всіх інших змінних хл_,, х„_2,..., х* треба скорис- татися таблицею (л-1), (л-2) і т. д. кроків. Поклавши =1\ -аяхя, із таб- лиці попереднього кроку знаходимо (без обчислень) х®_і =хв_і(*-аях®), х°-2=*в-2иі).........*і°=*і($і ) Отже, ДП - це напрямлений послідовний перебір варіантів, який обов’язково приводить до глобального максимуму. Для застосування методу треба табулювати функції Л|(£), Л2(£), ..., А „_](£) для всіх можливих значень £. Порівняємо метод ДП за кількістю необхідних операцій з простим пере- бором варіантів. Для спрощення розрахунків візьмемо а, = а2 =... = ав = 1. У простому переборі число можливих варіантів (за умови цілочисельно- сті всіх змінних хі ) дорівнює числу способів, якими можна розмістити Ь од- накових куль в л урн, ь (п+Ь-\)\ "**“І £>!(л-1)! Наприклад, якщо л = 5, а Ь = 20, то С24 = 10 626. Оцінимо кількість операцій, потрібну для розв’язання цієї задачі мето- дом ДП. Для обчислення Ак(£) за фіксованого £ потрібно виконати (£ + 1) обчис- лень функції А(хк)+Лк_! (£-х*) за 0£ х* £ Щоб заповнити одну таблицю , е л , * /е .. П>+1)(&+2) (за £ = 0,1,..., Л>), потрібно £ (£+!)=-—--' операцій. 5-0 2! 243
Отже, щоб обчислити ВСІ функції Л,(^), Л2(£),.... ЛЯ_1(^), потрібно , ЛЬ+\){Ь+2) (л-1р------------' операцій. З урахуванням обчислень функції ЛЯ(6) загальна кількість операцій становить (»-1)(Ь+1)(Ь+2) (Ь+1)[(.-1)(И-2)+2] да---------2І------- 2 Це значно менше, ніж С^+І_г, тобто маємо суттєве скорочення обсягу обчислень порівняно з простим перебором. Підведемо деякі підсумки. Задачу (6.1) з економічного погляду можна тракту- вати як задачу розподілу одного обмеженого ресурсу Ь між л різними способами виробництва, де - обсяг виробництва зау-м способом; /у(ху ) —прибуток від досягнення обсягу Ху; - витрати ресурсу на виробництво зау-м способом (за обмеження на загальний обсяг використаного ресурсу £ а. х. $6). Тому Л4 ($) /-1 можна трактувати як максимальний прибуток від перших к способів виробництва, коли загальний обсяг ресурсу (сировини) становить £ од иниць. Цю задачу можна інтерпретувати як л-кроковий процес прийняття рі- шень, в якому нау-му кроці приймається рішення про те, яку кількість ресур- су із загального обсягу £ треба виділити на переробку за у-м способом вироб- ництва. Як бачимо, структура цієї задачі не змінюється від кількості кроків, тобто задача інваріантна щодо л. Розв’язок для Л-ідрокової задачі отримуюкль із розв’язку (£ - 1)-крокової задачі додаванням к-го кроку та використанням результатів попереднього (к- 1)-го кроку. Отже, суть ДП полягає в заміні розв’язання певної л-крокової задачі по- слідовністю однокроковнх задач. Підсумовуючи, наведемо головні ознаки (властивості) задач, до яких молена застосувати метод ДП: 1. Задача має допускати інтерпретацію як п-кроковий процес прий- няття рішень. 244
2. Задача має бути визначена для довільної кількості кроків і мати структуру, яка не залежить від їхньої кількості. 3. Для к-крокової задачі має бути задана деяка множина параметрів, яка описує стан системи і від якої залежать оптимальні значення змінних. Ця множина не повинна змінюватися зі збільшенням кількості кроків. (У вище розглянутому прикладі таким параметром була загальна кількість ресурсу.) 4. Вибір розв'язку (стратегії керування) на к-му кроці не повинен впли- вати на попередні рішення, крім необхідного перевизначення змінних. Нехай £ - вектор параметрів, що описують стан процесу (вектор стану). Тоді оптимальне значення ЦФ для ^-крокового процесу Л*(£) називатиме- мо функцією стану. Нехай X* - вектор змінних керування (стратегія), який треба визначити на к-му кроці. Тоді для задач, до яких можна застосувати метод ДП, справ- джується таке ОРС [25]: Л*(У = тах{/к(X» Д) + X*))}, де Хк ) - вектор стану попереднього (к - 1)-го кроку за умов £ та хк. У розглядуваній задачі Т(£, хк) = акхк. Сформулюємо принцип оптимальності Белмана, який обгрунтовує це співвідношення [25] - оптимальна стратегія має таку властивість: • для довільних початкового стану та початкової стратегії Хі страте- гія на к-му кроці має бути оптимальною тільки стосовно поточного стану системи і не залежати від попередніх станів. Отже, за принципом оптимальності Белмана оптимальне керування систе- мою на кожному кроці не залежить від передісторії процесу, тобто від того, яким чином система досягла поточного стану, і визначається лише самим ста- ном. Системи (процеси), що мають таку властивість, називають марковськими. 245
6.2. Задачі послідовного прийняття рішень Структура розглянутої задачі розподілу ресурсів була такою, що змінні Хр і = 1,2,л під час побудови процесу можна було визначати в довіль- ному порядку (тобто їх можна було міняти місцями). Однак є багато задач, в яких рішення мають прийматися у строгій часовій послідовності, і тому змінні X/, X; не можна міняти місцями. Такі задачі називають задачами пос- лідовного прийняття рішень. Для цих задач обирають одну з двох різних схем розв’язання [25]: - розв’язання в прямому напрямку, коли перший крок схеми ДП відпові- дає першому за часом рішенню, що приймається; - розв’язання задачі у зворотному напрямку, коли останній цюк схеми ДП відповідає першому фактично прийнятому рішенню. Для пояснення цих двох схем розглянемо таку задачу. Задача про використання трудових ресурсів. Підприємцю треба ви- значити оптимальну кількість робітників на кожний із л місяців. Виробничі завдання для кожного місяця відомі, що дає змогу визначити оптимальну кількість робітників на певний місяць. Припустимо, що в у-й місяць ідеальне число робітників становить ліу. Якби підприємець міг звільняти та набирати нових робітників без додаткових витрат, то він у у-й місяць найняв бн рівно л»у робітників (у = 1, 2,..., л). Нехай Ху - фактична кількість робітників у у-й місяць. Витрати на зміну кількості робітників з переходом з (/' - 1)-го до у-го місяця задаються функці- єю /у (Ху-Ху_,). Залежно Від знака різниці х^х^ функція //(ху-ху-і) ви* значає витрати щодо найму (якщо х^х^) або щодо звільнення. Очевидно, /у(О)жО. Відхилення кількості від ідеальної величини ліу спричиняють додаткові виробничі витрати, які задаються функцією ^у(ху~ту)> причому £у(0) = = 0,7 = Г,л. 246
Припустимо, що в початковий момент кількість робітників становила то. Цільова функція задачі г - сумарні витрати на виробництво та набір робіт- ників - визначаються співвідношенням де Хо-По- треба знайти таку кількість робітників на кожний місяць хі, за якої су- марні витрати міиімяіткні Розв’яжемо цю задачу методом ДП. Оскільки задано початковий стан системи х0, то використаємо схему розв’язання у зворотному напрямку. По- значимо Лв ($)=тіп{/в (хв - $)+£„ (х„ Тоді основне рекурентне співвідношення матиме вигляд Лк(^)=шт{[Д(хк-^)+Л(хі-тк)]+Лк+і(хк)}, (6.8) де Л*(£) - мінімальні сумарні витрати за місяці з £-го по л-й включно, якщо кількість робітників у (к- 1)-й місяць дорівнювала £. Використовуючи співвідношення (6.8), послідовно обчислюємо Лл(£), Л^), ..., Л2(^) для всіх можливих значень результати заносимо у відповідну таблицю. Нарешті, на останньому цюці за к - 1 знаходимо оптимальну кількість робітників хі у перший місяць за початкової умови Хо = то. Для цього знахо- димо Лі (^=що)=шіп{/1(дс|-іИоІ+дСх!-ліі)+Л2(хі)}. (6-9) Визначивши із співвідношення (6.9) X] й поклавши — X] із складеної таблиці попереднього кроку знаходимо х2(х,), далі х3 -х,(^) і т. д. 247
У розглядуваному випадку розв’язання у зворотному напрямку доці- льне, оскільки невідома кількість робітників наприкінці робіт, тобто на (л + 1)-й місяць. Розглянемо випадок, коли, крім то, задано також потрібну кількість ро- бітників після закінчення робіт т^і. Шукатимемо цілі числа, для яких дося- гає мінімуму вираз 2= І [/у(ху -ху-і)+«у(ху-™у)+/в+І(тя+І -*„)], тоді можна записати 2=™п|л+,('иі,+,-*і,)+яіт“ і“"»/)] • Оскільки тепер задано кінцевий стан системи, то розв’язуватимемо зада- чу в прямому напрямку. Визначимо послідовність функцій стану: Тоді Лі(^)=тіп{/2(^-Яі)+«2(т2-^)+/і(х1-Л())+д(^-х1)}. Основне рекурентне співвідношення ДП для цього випадку матиме вигляд А*и)=тіп{Л+1(^-х*)+Л+1(^-тк+1)+Лк_1(х*)}, $=хк+1. (6.10) Функція Лк(£) - це мінімальні витрати за перші (£+1) місяці за умови, що кількість робітників у (Л+1)-й місяць дорівнює £. Використовуючи ОРС (6.10), послідовно обчислюємо Л1(£) , Л2(£), ..., Л „_| (£ ) для всіх можливих значень £. 248
Нарешті, на останньому кроці за к-п, поклавши £ = тя4.|, отримаємо співвідношення Л„ ($='"„♦і) = тіп {/В+1 (ти+, - х„ )+Ля_, (х„ )]. (6.11) Визначивши із співвідношення (6.11) оптимальне значення х„ за табли- цею попереднього (л - 1)-го кроку і поклавши £ = хи, знайдемо оптимальні значення всіх інших змінних х^, хи_2,.... х[. Підведемо деякі підсумки розглянутої задачі. Нехай маємо задачу послідовного прийняття рішень на л періодів. Якщо задано початковий стан системи, то задача розв’язується методом ДП у зво- ротному напрямку; якщо ж задано кінцевий стан системи, то у прямому на- прямку. Нарешті, коли задано як початковий, так і кінцевий стани системи, то задачу можна розв’язувати як у прямому, так і в зворотному напрямках. Результати за обома схемами збігаються. Приклад 6.1. Нехай задано задачу про використання трудових ресурсів із такими даними: л = 4 місяці; лц = 2, лі2 = 5, лі3 = 3, лі< = 1, т0 = 2. Нехай функції та мають такий вигляд: Ю(ху-ху_,), якщоху>ху_1; 7(Х/-1-ХД якщо х^^х^ /у(0>0; К,(0>0. Оскільки зафіксовано початок (хо = т0 - 2), то розв’язуватимемо задачу в зворотному напрямку. Для цього використаємо основне рекурентне спів- відношення: А* (£) = тіп{/* (х* -£) + £* (х* -) + Аі+) (х4)}, к = 3, 2,1; А„ (£) = тіп{/„ (х„ - (х„ - т„ )}, л = 4. 249
Крок 1. Візьмемо Л4 (£) = тіп{/4 (х4 - 5) + £4 (х4 - т4 )) = тіп«4 (х4, 5). Для відшукання складемо таблицю значень «4(х4, 5) (табл. 6.3). Значення шіп«4(х4, для всіх Е, оберемо з табл. 6.3 і запишемо в основну *4 таблицю (табл. 6.4). Оскільки всі функції;^ - ху _ і) та %/т] - ху) опуклі за ху, то і функція «4(х4, £) опукла за х4 для всіх значень Тому щоб знайти Л4^), достатньо обчислити перший мінімум функції «4(х4, £), який і буде глоба- льним. ВІДПОВІДНО ДО ЦЬОГО висновку значення функції «4(74, ^) обчислимо лише для області значень х4, яка містить цей мінімум (табл. 6.3). Обчислення виконуємо так: 5 = 0, х4 = 0, «4 = 0+11(1-0)= 11; 5=1, х4 = 0, «4 = 7(1-0)+11(1-0)= 18; 5 = 0, х4 = 1, «4 = 10(1-0) + 0= 10; 5=1,Х4=1, «4 = 0 + 0 = 0; 5 = 0, х4 = 2, «4= 10(2-0) + 8(2-1) = 28; 5=1, х4 = 2, «4 =10(1-0) + 8(2-1) =18; 5 = 2, х4 = 0, «4 = 7(2-0)+11(1-0) = 25; 5 = 2, х4=1, «4 = 7(2 - 1) + 0 = 7; 5 = 2, х4 = 2; «4 = 7-0 + 8(2 - 1) = 8; 5 = 4,х4 = 0, «4 = 7(4-0)+11(1-0) = 39; 5 = з, х4 = о, «4 = 7(3-0)+ 11(1 -0) = 32; 5 = 3, х4 = 1, «4 = 7(3 - 1) + 0 = 14; 5=3, х4 = 2, «4 = 7(3-2) + 8(2-1) = 15; 5 = 5, х4 = 0, «4 = 7(5-0)+11(1-0) = 46; 5 = 4, х4=1, «4 = 7(4-1) +0 = 21; 5 = 4, х4 = 2, «4 = 7(4-2) + 8(2 - 1) = 22; 5 = 5, х4=1, «4 = 7(5-1) + 0 = 28; 5=5, х4 = 2, «4 = 7(5-2) + 8(2-1) = 29. Треба визначити діапазон зміни параметра Очевидно, що Е,тіП = О, а 5т» тах{т Л. У розглядуваному прикладі 5т.« = 5. 250
Таблиця б.З £ *4 5 *4 Я^х) 0 0 11 3 0 32 1 10 1 14 2 28 2 15 1 0 18 4 0 39 1 0 1 21 2 18 2 22 2 0 25 5 0 46 1 7 1 28 2 8 2 29 Таблиця 6.4 4 МЕ) х<(У 0 10 і 0 1 2 7 1 3 14 1 4 21 1 5 28 1 Крок 2. Використаємо ОРС за к = 3: Л3 (^) = тіп{/з (хз - Е,)+8з (х3 - тз)+Л4 (хз)} = тіпП3 (хз, Е,), ч ч і виконаємо другий крок аналогічно першому. Допоміжні результати обчис- лення П3( х3, Н наведемо в табл. 6.5, а підсумкові - в.табл. 6.6. Таблиця 6.5 Яз хі Яз 0 0 40 3 1 36 1 32 2 25 2 38 3 14 1 0 50 4 39 1 22 4 2 32 2 28 3 21 2 0 57 4 29 1 29 5 2 39 2 18 3 28 3 24 4 36 251
Таблиця б. б Аз Х4 0 32 1 1 і 22 1 1 2 18 2 1 3 14 3 1 4 21 3 1 5 28 3 1 Крок 3. Використаємо співвідношення (6.10) й обчислимо для всіх Л2(^) = шіп{/2(х2-^)+й(х2-т2) + Лз(х2)} = тіпП2(х2,^), де = Результати обчислення О2(х2, %) занесемо в табл. 6.7, а значення Л2(£) та х2 (Е,) - в основну табл. 6.8. Таблиця б. 7 5-Х1 Хі Пі 4-хі *1 Пі 0 1 76 3 2 58 2 71 3 36 3 66 4 42 4 72 4 2 65 1 2 61 3 43 3 56 4 32 4 62 5 38 2 2 51 5 4 39 3 46 5 28 4 52 6 46 Таблиця 6.8 £-*і Лі Хі Хз Х4 0 66 3 3 1 1 56 3 3 1 2 46 3 3 1 3 36 3 3 1 4 32 4 3 1 5 28 5 3 1 252
Крок 4. Використовуючи початкову умову ^, = х0 й підставляючи її у співвідношення Лі(л<)) = П1Іп|^(хі-Л()) + й(х1-»І1) + Л2(х1)}, знайдемо Л1(л<) = 2) й оптимальне значення змінної х*=2. їх наведено в табл. 6.9. Далі із табл. 6.8 за значенням = х1 = 2 обчислюємо оптимальні значення всіх інших змінних: х2 =3, х3 = 3, х4 =1, при цьому сумарні витрати станов- лять Лі = 46 ум. од., що є мінімумом: Лі(хо) = 46; х‘ = 2. Таблиця 6.9 Х1 Пі 2 1 74 2 46 3 54 6.3. Динамічне програмування для задач із кількома обмеженнями та змінними Розглянемо задачу оптимального розподілу ресурсів, але вже за двох обмежень [25]: шахЕ/у(ху) за обмежень я я У о,у Ху £ іц; У а^Х] Ху £ 0, де Ху - ціле число. /-1 7-і Оскільки в задачі маємо два види ресурсів - і Ь2, то треба ввести два параметри стану - та £2. Позначимо тах £/у(ху) (6.12) '1.Ч 7-і ' ' 253
Г^іі 84 =шіп Іа1^ за обмежень к к Е а,Е а2;х7 ^2, х. £ 0, і = 1, к, де х, - ціле число. (6.13) 7-і у=і Запишемо основне рекурентне співвідношення для цієї задачі: Л*(§і»§2)=а “ах <614) Оїхк^&к ДЄ І1Ї а2к Я’ Одночасно з Л4(^1, £2) знаходимо і відповідний оптимальний розв’язок х*(^Д2). Послідовно знаходимо Л|(£|,£2)> •••> л*(^і>^г)> •••» Лл—і(£«• £г)- На л-му кроці, поклавши = Ьі, = ^2. знаходимо Лв(і\, ЬД і водночас хв(/ц, Б}). Оптимальні значення всіх інших змінних - хв_І,х„_2,...,х1 - можна отримати із таблиць попередніх кроків за допомогою співвідношень хл-1 = Хя-1(^1 ~а1яхп' ^2 —а2іл)’ 0 - / . 0 0і 0 0 \ хя-2“Хя-2( ^1-а1нхн ~а1я-1хя-Р ®2 а2пхп а2п-Іхи-1 ) ІТ. Д. Як бачимо, функції ЛД £(, £2 ), хв^(, ^2 ) є функціями двох змінних (параметрів). Якщо кожна із змінних £2 може мати 102 значень, то фун- кцію Л*( £,, £2 ) треба табулю вати в 104точках. Коли маємо три обмеження вигляду =1,2,3, (6.15) 7-і то для розв’язання задачі (6.12)-(6.15) методом динамічного програмування треба ввести три параметри стану £|, £2, і функцію Л*(^і, £2, £з). Коли ко- жен із параметрів £і, ^2, набуватиме 102 значень, то функцію ЛД^і, £2, ^з) 254
доведеться табулювати вже в 106 точок. Як видно, обсяг обчислень за схемою ДП зростає експоненціально залежно від розміру задачі (тобто від кількості параметрів стану т). Без спеціальних способів задачу, що містить більше п’яти-шссти параметрів стану, неможливо розв’язати на сучасних ЕОМ через надто великий обсяг обчислень, який зростає експоненціально залежно від розміру задачі. Це плата за пошук глобального оптимального розв’язку. Цей феномен Р. Белман свого часу охарактеризував як «прокляття багатовимір- ності динамічного програмування» [25]. Метод множників Лагрянжя для зниження вимірності задач дина- мічного програмування. Розглянемо один із найпоширеніших методів зни- ження вимірності задач ДП - метод множників Лагранжа. Нехай потрібно розв’язати таку задачу: максимізувати х = Д/у(ху) (6.16) за обмежень £аих =^, 7=1 = (6.17) 7-1 ху £0, у=1,л. Зауважимо, що обмеження тут задано у формі рівностей. Від задачі (6.16) із двома обмеженнями перейдемо до задачі з одним обмеженням: максимізувати х1 =шах І7-1 7=1 (6.18) за обмежень £а,уху = />„ 7-1 (6.19) ху £0. Для розв’язання задачі (6.18) методом ДП потрібний лише один пара- метр стану, і тому вона набагато легша, ніж вихідна. 255
Параметр X у задачі (6.18) - це множник Лагранжа, і він відіграє роль ціни на другий ресурс (Аг). Апріорі величина X невідома і тому задачу (6.18) доводиться розв’язувати для деяких довільних значень X. Розв’язуватимемо задачу (6.18), (6.19) методом динамічного програму- вання. Її оптимальний розв’язок залежатиме від X як від параметра: х^ = х/°(Х), і = 1,и. Якщо знайдений оптимальний розв’язок х°(Х) задовольнятиме відкину- те обмеження (6.17), то він і буде шуканим. В іншому разі значення X пот- рібно скоригувати. Функція А2 = Е а2уху (М монотонно спадає зі збільшеи- ням X [25], тому, якщо Е а2;Х° (^) > Аг, значення X треба збільшити (оскіль- У-і ки по другому ресурсу є перевитрати, то ціну на нього треба підвищити). В іншому разі значення X треба зменшити. Для швидкого визначення шуканого значення X можна застосувати ме- тод послідовних наближень, оснований на такій інтерполяційній формулі. Якщо вже апробовано два значення Хь Х2 і знайдено для них відповідні оп- тимальні розв’язки X] (X,). х2(Х2), то на наступному кроці Х3 оцінюють за такою формулою: Х3 = ^"^(Аг-А1)+Х1, л2-л1 де А2 = Е а27х‘(Х2); А, = £ а2уХу(Х,). 7-і Покажемо, що коли оптимальний розв’язок задачі (6.18) х задовольняє умову (6.17), то х - оптимальний і для задачі (6.16). Припустимо, що це твердження хибне і позначимо через х° розв'язок задачі (6.16). Тоді г(«°)-І4(х;)г|4(х;)-г(/). (в20) 256
Оскільки х - оптимальний розв’язок для задачі (6.18), то хі(х‘) = х(х‘)-^Еа2/х} * г(х°)-Х^а2>х®. Водночас, оскільки то 21(х‘)Цх°). (6.21) Порівнюючи співвідношення (6.21) і (6.20), робимо висновок, що Отже, це твердження виконується. Основне рекурентне співвідношення для задачі (6.18) має вигляд )~^а2кх* + ^*-1(^-а2*хк )}• Можна показати, що зі збільшенням X від 0 до к величина Л2(Х)=Х а2уХ^(Х) монотонно спадає [4; 49]. Ця важлива особливість значно полегшує пошук X під час розв’язання практичних задач. Розглянемо загальний випадок обмежень: максимізувати Е/Дх7) (6.22) за обмежень І ачх.їЬіг і=Г,М, х.£0, у=1,п. (6.23) /-1 Введемо к (к < М) множників Лагранжа і перейдемо від (6.22), (6.23) до еквівалентної задачі максимізації функції: тах| Е //(х7)~ Е <%ху і (6 24) Ми*1 М ) 257
за останніх т-кобмежень п ______ £ а^х, £ Ь(, і = к+\,М. Задачу (6.24) розв’яжемо методом динамічного програмування з викори- станням невизначених множників Лагранжа. Отже, задача зводиться до визначення функції стану А*(^і, £м_*) від М-к змінних разом із пошуком у і-вимірному просторі змінних, які задо- вольняють перші к обмежень. Вихідна багатовимірна задача замінюється по- слідовністю задач значно меншої вимірності, що дає змогу суттєво знизити вимоги до об’єму пам’яті ЕОМ та її швидкодії. 6.4. Динамічні задачі керування запасами Важливий клас задач послідовного прийняття рішень становлять задачі керування запасами. Якщо розглядається функціонування системи постачан- ня матеріалами або товарами за п періодів, причому попит нестаціонарний, то маємо динамічні моделі задач керування запасами. Такі задачі зазвичай не допускають аналітичного розв’язання, проте оптимальну стратегію керуван- ня можна знайти, застосувавши метод ДП. Нехай розглядається задача керування запасами на п періодів, коли по- пит в і-й період детермінований і визначається величиною і = 1,п. Уведемо такі позначення: у» - залишок запасу від (к - 1)-го періоду; <4 - попит у А-му періоді, к = 1,и; х* - запас, що створюється в к-му періоді (або замовлення на поставку). Припустимо, що замовлення на поставку виконується миттєво, причому витрати на виконання замовлення (виробничі витрати) позначимо через С*(х*,у*). Нехай 5*(х* + Ук - <4) - витрати на зберігання залишкового запасу в к-му періоді, причому дефіцит у системі неприпустимий. Тоді сумарні витрати системи на виробництво та зберігання надлишко- вих запасів за п періодів ^пТ = X С*(хк,ук)+5*(х* +ук-сІк) (6-25) *=і 258
за обмежень **+Л-4=Лм» к = \,п. Треба знайти такі {х4}, {у*}, для яких сумарні втрати (6.25) будуть міні- мальними. Щоб мінімізувати ЬнТ, скористаємося методом ДП Послідовно мі- німізуватимемо витрати за 1,2,..., к періодів за умови, що на початку (Л + 1)-го періоду є залишковий запас Визначимо послідовність функцій стану: +уі ~аі)= за обмежень »* + Л-4=£ Тоді основне рекурентне співвідношення ДП запишемо тах: Л* (£) = шіп{Л (х*,у*)+Л*_, (л )} = = «піп {/* (хьЕ, - х* + </* ) + Л*_, (Е, - хк + ак)}, ДЄ** + Л-<4=£ На першому кроці (за к = 1) отримаємо Лі (Е,) = шіп{_/| (хри )} = шіп{Сі (хри ) + (хі + л - 4 )} ч ч заобмеження Хі + Уі~4=^. Обчисливши послідовно Д((^), Д2(^), ..., Л*(^), на останньому кроці, поклавши ^=уя+І, знайдемо Ля(уя+і) та хя(уя+і). Оптимальні значення хк знаходимо послідовно за формулою х*=х* .уя+і+ £ ру-ху) . \ >’*+• ) 259
Розглянемо окремий випадок, який значно спрощує обчислювальну схе- му ДП. Припустимо, що: - усі функції Су (ху | вгнуті за змінними Ху; - функції витрат на зберігання запасів лінійні, тобто (</ + У) “ 4/ )=(-Уу+1) = 5}У}+\- Тоді загальний вираз для функції витрат матиме вигляд за обмежень Х)+У)-У]^ї=(ір І = (6.27) Припустимо, що У], у„+1 задано, замовлення на поставки запасів вико- нуються на початку періодів, часом на виконання замовлення нехтуємо (поста- вки миттєві), а попит кожного періоду <4 бути задоволений повністю (де- фіцит не допускається). Треба відшукати такі послідовності |ху |, {уу|, які мінімізують функцію загальних витрат £пГ у виразі (6.26). Розглянемо процедуру розв’язання. Оскільки треба знайти мінімум суми вгнутих функцій на опуклій множині, то оптимальним роз- в’язком буде одна з крайніх точок допустимої множини розв’язків, яка ви- значається обмеженням (6.27). Оскільки кількість обмежень дорівнює л, а загальне число змінних {ху} та дорівнює 2л, то оптимальний розв’язок містить не більше як л нену- льових значень змінних. З урахуванням того, шо Ху, уу не можуть дорівнювати нулю одночасно (в іншому разі не виконуватиметься обмеження (6.27)), оп- тимальний розв’язок |х®,у®| має властивість хуУ®=0,/ = 1, л. (6.28) 260
Умова (6.28) еквівалентна такій парі умов: якщо у? = 0,то х? >0; о о (6-29) якщоуу >0, тоху =0. Пояснимо зміст умов (6.28), (6.29). Замовлення на виготовлення (поста- вку) нової партії X/ не робиться, якщо на початку періоду у був ненульовий запас (у° > 0), і навпаки, якщо на початку періоду у запас у} = 0, то робиться замовлення на поставку х^ > 0. Звідси випливає, що х° = 0, або х° = або х° +«/у+І і т. д., тобто оптимальний розмір замовлення дорівнює попиту на ціле число періодів. Припустимо, що уін-і = 0. Тоді розв’язуємо задачу (6.26) у прямому на- прямку. Нехай Л*(О ~ мінімальні витрати за к періодів, якщо запас на поча- ток (і + 1)-го періоду дорівнює Основне рекурентне співвідношення ДП для цієї задачі має вигляд Л*и)=^>{Л(хдЛ) + Л*_І(^-х* +</*)) (6.30) за обмеження 5=Я+і =** + >’*-<**. *=!,«. У розглядуваному випадку, оскільки х4у4 =0, мінімум у співідношенні (6.30) унаслідок вгнутості функції {/*(** Л) + Л4 (£-х4 + А)} досягається в одній з крайніх точок хк =0 або хк -і,+<1к, тому Аналогічно: л*-і(^+А) = пш> Аи+^^) + Л4_,(0); Л(0; $)+**-,($+А) А-і(о;^+А)+л*-2(^+А+А-і)- (6.31) (6.32) 261
Виписавши вирази, аналогічні (6.32), для Л4_2(0), Л4_3, ..., Ль й під- ставивши їх у співвідношення (6.32), (6.31), отримаємо в результаті л* ($)=““/*(»). де &(')=л4_,(о)+// Е <4 + к ( к \ (6.33) >-/+1 в-У+1 ) де 8к (*) ~ витрати за к періодів за умови, що останнє замовлення робилось на початку періоду і. Розглянемо окремий випадок функції виробничих витрат на виконання замовлення сДху). Нехай . . 0, якщох, =0; С/(х/)=- '' '' [Лу + Сху,якщоху >0, де - фіксовані витрати на замовлення; , ч [0, якщо х, =0, 8,(х/)=. 1 7' 11 1, ЯКЩОХу >0. (6.34) (6.35) Тоді У цьому випадку задача спрощується і зводиться до задачі ЛП: мінімізувати (6.36) 262
за обмежень ХМ=О- Використовуючи вирази (6.34)-(6.36) і підставляючи їх у (6.33), отриму- ємо, з урахуванням, що £ = 0, співвідношення &(«)=Лі-і(о)+4 + еЧ І (б-37) «=>+і М°) =““/*(»)• (638) Подальше спрощення в обчислювальній схемі можна отримати, якщо врахувати таку обставину. Якщо під час обчислення Л *_(( 0 ) виявилося, що замовлення, за допомогою якого задовольнявся попит (Л - 1)-го періоду, ро- билося на початку періоду V, то і замовлення, яке задовольняє попит Л-го пе- ріоду в оптимальному рішенні, має виконуватися також не раніше періоду V. Отже, обчислюючи Л*(0), достатньо розглянути Л4(0)=штЛ(ї). (6.39) Приклад 6.2. Підприємство планує поставки своєї продукції на сім місяців у таких розмірах: сії = 90 пгг., = 125 пгг., <^ = 140 пгг., <Ц = 100 пгг., = 45 шт., 4 = 60 шт., = 130 шт. Витрати на зберігання одиниці продукції протягом мі- сяця становлять 5; =5=2 грн/міс., у = 1,7- Витрати на настройку устаткування (верстатів) для виробництва партії становлять Аі = 300 грн, 7=1,7, причому настройка проводиться лише в ті місяці, коли випускається партія. Часом на виконання замовлення нехтуємо. Треба визначити місяці, коли виконуються замовлення, а також оптимальні розміри партій х°, 7=1,7. Припустимо, що на початку першого місяця не було ніякого запасу, тобто У] = 0. Отже, треба мінімізувати 2=і ТУ* >' 300£М*/)+2Еуі^ ’ Р/Мг/Ц У-» 7-і де 6у(ху) = 1, якщо Ху >0, і 6у(*у) = 0. якщо Ху =0, за обмежень 263
Х1~У2=^1 =9°. х1 + У1~У^і=^ У = 2>7- Використовуючи співвідношення (6.37), (6.39), маємо: *= 1: Лі(0) = Л,=300; к = 2: Л2(0) = тіп ^+2^2=300 + 2 125 = 550 Л, + Дг =300 + 300 = 600 = 550, 1 = 1. Отже, у разі планування на два періоди вигідніше виконувати лише одне замовлення в першому періоді: * = 3: 1 = 1, Лі+2(</2+^з) + 2</з=11(Ю Л3(0)= тіл рі(/) = тіп к«з ' ’ і = 2, Л|(0) + + 2</3 = 880 і=З, Л2(0) + 4 = 850 = 850, 1 = 3. Результати всіх наступних обчислень наведено в табл. 6.10. Таблиця 6.10 Період* 1 2 3 4 5 6 7 Попит 4* 90 125 140 100 45 60 130 1= 1 300 550* 1100 і = 2 600 880 «(О 1 = 3 850* 1050* 1230* 1590 1-4 1150 1240 1480 і = 5 1350 1470* 1990 1 = 6 1530 1790 1 = 7 1770* М>) 300 550 850 1050 1230 1470 1770 1 1 1 1 1 1 1 V 3 3 3 3 3 5 5 7 В останньому рядку таблиці 6.10 наведено номери тих місяців, в які ви- конувалися замовлення. Зірочки над #*(і) вказують на те, що це значення є мінімальним за 1 у відповідному стовпці (тобто дорівнює Л*(0)). Покажемо, як послідовно з табл. 6.10 визначити періоди виконання за- мовлень за к = 7. Мінімум у стовпці к = 7 досягається за і = 7 (£т(7) = 1770). 264
Тому перейдемо до задачі за к = 6. Мінімум у шостому стовпці досяга- ється за і = 5. Отже, останнє замовлення виконувалось у п’ятому місяці. То- ді перейдемо до к = 4 і знайдемо, що мінімум за к = 4 досягається за і = 3. Тоді перейдемо до к = 2 й одразу знаходимо, що мінімум у стовпці к = 2 до- сягається за і = 1. Отже, відомі номери місяців, коли замовлення викону- ються: і = 1,З, 5, 7. Оптимальний розв’язок згідно з табл. 6.10 буде таким: шіп 2 = Л7(0) = 1770; х*2 = х\ = х*6 = 0; =4+е/2 = 90 +125 = 215; хз =</3 +с/< = 240; Х5 =</$ +<4 = 105;х^ =Л7 =130. 6.5. Задачі динамічного програмування з нескінченним числом кроків Способи оцінювання нескінченних послідовностей ефектів (витрат). Розглянуті вище моделі динамічних задач планування та керування (напри- клад, трудовими ресурсами або запасами) охоплювали деякий інтервал часу, який складався зі скінченного числа періодів (відрізків). Якщо функціонуван- ня системи на цьому не закінчується, то раніше прийняті рішення, безумовно, впливають на її поведінку в майбутньому. З такого погляду ці моделі можна розглядати як елементи нескінченного планового періоду, при цьому такий період можна трактувати як межу скінченного планового періоду за и -» оо. Для того, щоб у моделях з нескінченним плановим періодом отримати певні рішення, вводиться обмежувальне припущення про стаціонарність, яке означає, що всі функції витрат або ефектів (економічних) та зовнішні умови для кожного з періодів стаціонарні або змінюються циклічно. Якщо ж роз- глядається імовірнісна система, то її імовірнісні характеристики також вва- жаються стаціонарними. Перш ніж розглянути методи прийняття рішень у нескінченному плано- вому періоді викладемо основні способи оцінювання та порівняння нескін- ченних послідовностей ефектів (або витрат). 265
Існує три основні способи оцінювання таких послідовностей [25]: 1) серед- ній ефект (СЕ) за інтервал часу; 2) інтегральний дисконтований ефект (ІДЕ); 3) еквівалентний середній ефект (ЕСЕ). Розглянемо ці способи оцінювання. Припустимо, що деякій стратегії керування системою відповідає така послідовність ефектів (витрат): 1 " Я,, Я2,К„, тоді СЕ = Ііт - £ К^. Головний недолік критерію СЕ полягає в тому, що він однаково оцінює як прибуток, отриманий у цей момент, так і майбутній дохід. Водночас цін- ність того самого прибутку нині та в майбутньому через Л часових інтервалів (наприклад, кроків) зовсім неоднакова через вплив інфляції. Щоб урахувати цю нерівноцінність, вводиться коефіцієнт дисконтування а (0 < а £ 1), за до- помогою якого всі послідовності майбутніх ефектів (прибутків або витрат) зводяться до теперішнього часу. У результаті отримуємо інтегральний дисконтований ефект: ІДЕ= Я1+аЯ2 + а2Я3+... + а"_|Д,+...= £а*-,Др *-і і , де і - річна Величину а можна обчислити, наприклад, як 1 + процентна ставка (тобто річні проценти, які отримує вкладник за гроші, вкладені у банк). Зв'язок між критеріями СЕ та ЩЕ здійснюється через ЕСЕ. Під ЕСЕ розуміють таку величину ефекту, сталу для всіх інтервалів ча- су, к = 1, оо, що ІДЕ для послідовності з однакових значень ЕСЕ і для вихід- ної послідовності збігаються. Припустимо, ЩО ДЛЯ ПОСЛІДОВНОСТІ Кі, Я2,.... Я* ЩЕ = І а*-,Я4 = Р(а). Позначимо ЕСЕ через х( а ). Маємо послідовність х(а) + ах(а) + а2х(а) +...+а*х(а)=(1+а + а2 +...)х(а) = ^а- ' ' 1-а 266
Оскільки за значенням обох послідовностей величини ІДЕ збігаються, ч х(а) тоР(а)= , звідки 1-а ЕСЕ=х(а)=(1-а)Р(а)=(1-а) ІДЕ. Приклад 6.3 (модель експлуатації лісового господарства). Ліспромгосп планує засадити лісом нову земельну ділянку. Припустимо, що дерево, зрубане в і-й відрізок часу (наприклад, у і-й рік), від дня його посадки при- несе прибуток Я* (грн). Припустимо також, що витратами на посадку та до- гляд за лісом можна знехтувати і що всі дерева на ділянці мають бути зру- бані одночасно. Потрібно визначити оптимальний момент (рік) к рубання лісу, коли досягається максимальний прибуток за коефіцієнта дисконтуван- ня а,0<а<1. Розглянемо спочатку випадок, коли після вирубки лісу не робитимуть- ся нові насадження (одноразове прийняття рішень). Треба знайти таке значення к, що ІДЕ (к) =а.к~1Кк —> тах. * Шукане значення к визначається таким співвідношенням: ^4 ^4+1 Тепер розглянемо нескінченний плановий період. Припустимо, що ко- жного разу після вирубки лісу на к-иу інтервалі часу, на (к + 1)-му здійс- нюються нові насадження лісу, причому цей процес повторюється нескін- ченну кількість разів. Якщо кожного разу рубка лісу здійснюється через к відрізків після посадки, то ІДЕ послідовності прибутків для нескінченного планового періоду становитиме Г(к) = ІДЕ[*](1 + а* + а2* +...). Звідси 267
Оптимальною для нескінченного планового періоду є така стратегія к, для якої максимізується величина Р(к) •' Р* = тахР(к) = шах к ' ’ 1-а* Шукане значення Л®, за якого Р(к) досягає максимуму, визначається за умови Звідси отримуємо співвідношення (1 + а +... +а*°~^Я4о ( (1 + а+...+а*° Ад0 (1 + а+...+а* -2^д0 ^1+а+...+а*°_|^Л4о+1 При цьому оптимальне значення і® задовольняє нерівність Л® £ К, де К - оптимальне значення за умови одноразового прийняття рішень. Модель відновлення для нескінченного планового періоду. Досить поширений клас задач, в яких необхідно досліджувати нескінченну кількість етапів, становлять задачі (процеси) відновлення. У цих процесах черговий мо- мент відновлення відбувається в той час (момент), коли система повертається у вихідний стан (наприклад, рубання лісу або заміна устаткування). У цих за- дачах керуючими змінними (стратегіями) є інтервали часу між компонентами відновлення. Розглянемо загальну модель задачі відновлення. Скінченний плановий період. Припустимо, що в задачі відновлення можливими стратегіями є к (к = 1.У) - кількість інтервалів часу між сусідні- ми моментами відновлення. Пов’яжемо з кожним варіантом к витрати (або ефект) А* з їх оцінюванням на початку періоду відновлення (наприклад, вартість заміни устаткування). Позначимо через /„ інтегральні дисконтовані витрати для оптимальної страте- гії відновлення, відповідно до якої один з альтернативних варіантів має бути обраний за п інтервалів часу до кінця планового періоду. Припустимо, що 268
обрано альтернативний варіант к. Тоді відразу з’являються витрати і якщо припустити, що в наступний момент відновлення (тобто на відрізку п - к) також приймається оптимальне рішення, то в подальшому виникають витрати а*/ _ ь де а* використовується для зведення майбутніх витрат через к інтервалів часу до нинішнього моменту. Отже, за п інтервалів часу до кінця планового пе- ріоду оптимальною буде така стратегія, відповідно до якої мінімізується сума (Я* + а%_*). Запишемо рекурентне співвідношення: А = „[“‘А-* + ] (и ЛО. (6.40) Нескінченний плановий період. Розглянемо випадок нескінченного пла- нового періоду. Поклавши п —> оо в (6.40) й випустивши індекс п у функції /т дістанемо співвідношення / = * тіл Да*/ + Дк]» 0<а£1. (6.41) Воно являє собою екстремальне або функціональне рівняння з невідо- мим/ Використовуючи функціональні рівняння, треба визначити: - чи існує у цього рівняння скінченний розв’язок; - якщо існує, то чи він єдиний; - якщо він єдиний, то чи буде/ мінімальним значенням для всіх можли- вих (не обов’язково) стаціонарних стратегій. Зі співвідношення (6.40) випливають нерівності /<.ак/ + Кк та/^-^т,Л = М/, (6.42) причому (6.42) має бути строгою нерівністю хоча б для одного к. Звідси ви- пливає, що функціональне рівняння (6.41) має однозначний скінченний розв’язок вигляду (6.43) Оптимальна стаціонарна стратегія відповідає вибору альтернативного Л”, яке дає змогу отримати оптимальне значення / • Г Л* = тш —. * 11-а* 269
Тут як критерій оцінювання використано ІДЕ за 0<а<1. Очевидно, за а«1 співвідношення (6.43) не виконується. Для того, щоб використати крите- рій СЕ, перейдемо спочатку до критерію ЕСЕ, для чого покладемо #=(1 -а)/. Тоді після простих перетворень вираз (6.43) набуде вигляду # = тіп ______Ь______ 1 + а+а2+...+а* (6.44) Поклавши у виразі (6.44) а = 1, отримаємо такий розв’язок: £* = тіл к Отже, стратегія к буде оптимальною, якщо для неї мінімізуються середні витрати за інтервал часу. Методи послідовних наближень. Розглянемо методи розв’язання функціонального рівняння вигляду /=пііп|\х*/ + Я*], 05а<1. (6.45) Є три підходи до розв’язання рівняння (6.45). Перший підхід грунтується на динамічному характері моделі. Він поля- гає у з’ясуванні того, чи не є стратегія, оптимальна для дуже великого, але скінченного планового періоду, одночасно оптимальним розв’язком і для не- скінченного періоду. Розглянемо розв’язок для моделі зі скінченним плановим періодом: А = “““[а* А-* + **]. о^а<1, (6.46) де п набуває дуже великих значень. Щоб такий підхід був справедливим, потрібно виконати такі умови: - за будь-якого досить великого л розв’язок к^, отриманий з виразу (6.46), має також задовольняти рівняння (6.45); - якщо тривалість планового періоду дуже велика, то стратегія опти- мальна для нескінченного планового періоду, буде оптимальною також і для скінченного планового періоду. Для моделі відновлення справедлива така теорема про тривалість плано- вого періоду, яка обгрунтовує цей підхід [25]. 270
Теорема 6.1. Існує таке скінченне значення п*, що для довільного скінчен- ного періоду тривалістю п відрізків (л <> л*) виконуються такі співвідношення: якщо то 7=®^/+^; (6.47) «що / = а‘/ + Л*. то Л=<*7»-* + Л*. (6.48) Зі співвідношення (6.47) випливає, що будь-яка стратегія іц,, оптимальна за достатньо великої тривалості планового періоду л (л £ л*), одночасно є оп- тимальною стаціонарною стратегією і для нескінченного планового періоду, а співвідношення (6.48) є зворотним твердженням. Другий підхід полягає в тому, щоб спробувати вгадати деяке значення /. Далі на основі цього значення обчислюється величина в правій частині рів- няння (6.45) і перевіряється виконання цього рівняння. Якщо воно не вико- нується, то результат обчислень використовується як скориговане значення /, і процес знову повторюється. Відповідний метод називають методом ітерацій за критерієм (або у просторі функцій) [25]. Він полягає в такому. Нехай /0) - початкове вибране значення / Метод передбачає побудову послідовності наближень ... на основі рекурентного співвідношення /я+,)= пшГа*/") + яЛ, 0£а<1. (6.49) *-і,лгЬ -• Припустимо, що П* > 0. Якщо у40' = 0, то можна довести, що 5... і £ У^"+1\ тобто сукупність - Монотонно зростаюча послідовність наближень. Тоді за досить великого л значення виявиться як завгодно близьким до / Проте у загальному випадку не існує такого скінченного л, що дорівнюватиме /. 271
Отже, метод ітерацій за критерієм забезпечує збіжність до істинного значення / але число ітерацій не є скінченним. Приклад 6.4. Для ілюстрації методу ітерацій за критерієм розглянемо задачу відновлення з такими вихідними даними: 5; /?! = 8,7; Я2 = 12,9; Л3 = 14,7; Щ = 19,7; Я, = 28,7; а = 0,8. Можна обчислити, що [Я 1 ----*. = тіл {43,50; 35,28; 30,00; 33,39; 42,84} = 30,00, 1-0.8*] 1 ' отже, = 3 - оптимальна стратегія. Обчислюючи на підставі співвідношення (6.49), за = 0, отримуємо /1) = пші[а*0+Я*] = 8,7, * = 1; /2) = пйп[а*/(,) + Я*] = 15,66, *=1; /3)=пші[а*/(2)+Я*] = 21,23, * = 1. Після аналогічних обчислень далі отримуємо: = 25,53; - 27,57; /б) = 28,76; /7) = 29,37; /8) = 29,68; /9) = 29,84;/,0> = 29,91, причому на всіх ітераціях к = 3. Третій підхід полягає у спробі вгадати оптимальну стратегію для нескін- ченного планового періоду. Для пробної стратегії, яка перевіряється на опги- мальність, обчислюють відповідні інтегральні дисконтовані витрати (1ДВ), які використовуються як значення/ далі перевіряють справедливість рівняння (6.45). Якщо воно виконується, то поточна пробна стратегія є оптимальною, інакше за нову пробну стратегію обирають ту, для якої досягається мінімум правої ча- стини (6.45). Оскільки існує скінченна кількість N різних стаціонарних страте- гій і не потрібно повертатися до раніше відкинутої стратегії, то оптимальну стратегію буде знайдено за скінченну кількість ітерацій, а саме: тільки-но стратегія лишається оптимальною на двох ітераціях поспіль, то обчислення можна скінчити, причому дорівнюватиме оптимальному значенню / Цей метод називають методом ітерацій за стратегіями [25]. Відповідний алгоритм методу складається з таких кроків. 272
Крок 1. Візьмемо л = 0 й оберемо початкову стратегію А<>. Крок 2. Для заданої пробної стратегії Ао обчислимо ІДВ протягом не- скінченного планового періоду: гі") - 7 1-а*0 Крок 3. Перевіримо можливість подальших покращень стратегії, для чого обчислимо + Я* ]=+ Я*- (6.50) й оберемо в результаті стратегію X. Крок 4. Якщо а*Х«) + Яг = то обчислення припиняємо: стратегія к! оптимальна; в іншому випадку замінюємо попередню стратегію на V. Перехо- димо до (л + 1) ітерації на другий крок, використовуючи як нову стратегію И. Приклад 6.5. Розглянемо попередній приклад з тими самими вихідними даними: 5; Я, = 8,7; Я2 = 12,9; Я3 = 14,7; Щ = 19,7; Я5 = 28,7; а = 0,8. Нехай за початкову пробну стратегію обрано ко = 1, тоді /(°)= ^- = 43,50. 1-а Перша ітерація: використовуючи вираз (6.49), обчислюємо пйп[а*/0) + Я*] = а3/0) + Я3 = 30,00, кг = 3. Друга ітерація: знаходимо ІДВ для стратегії Аі = 3: /(,)= -^,=30,00. 1-а3 Повторне використання формули (6.50) дає + Я* ] = тіл {8,0 • 30,00 + 8,7; 0,64 • 30,00+12,7; 0,51 • 30,00+14,7; 0,41 • 30,00+19,7; 0,33 • 30,00+28,7} = 30,00, = 3. Оскільки А] = А2, то подальші розрахунки можна закінчити; стратегія А = З оптимальна і для неї/ = 30,00. 273
6.6. Задачі динамічного програмування на мережах Багато динамічних задач оптимального планування та керування (на- приклад, керування запасами, розподілення ресурсів та ін.) можна подати у вигляді мережі (або графа), в якій кожному стану системи відповідає деяка вершина мережі й задача оптимального керування зводиться до задачі відшу- кання найкоротшого маршруту в мережі (на графі). Розглянемо, наприклад, деяку ме- режу, що містить Р вершин, і множину орієнтованих дуг, які з’єднують деякі вершини (рис. 6.1). Поставимо у відпо- відність коленій допустимій стратегії у стані і дугу (і, У). Переміщенню по ко- жній дузі (і, ]) відповідають певні ви- Рис. 6.1 трати (ефект) С^. Припустимо, що час переміщення з вершини і у вершину У дорівнює одному часовому відрізку, а коефіцієнт дисконтування (дисконт- фактор) позначимо через а. Нехай маршрут починається з деякої довільної вершини і. Припустимо, що із вершини у переходимо до вершини к, при цьому виникають дисконтовані витрати Ср. Якщо процес триває протягом необмеженого часу, то маршрут є нескінченним. Позначимо через уі ІДВ для оптимального нескінченного маршруту, який починається з вершини і. Якщо обрана стратегія є стаціонарною, то кожного разу, повернувшись до вершини і, знову оберемо ту саму стратегію (і, А) (тобто дугу), яку обирали кожного разу, коли знаходились у цій вершині. Нехай існує стаціонарна стратегія, яка є оптимальною, тоді відповідні ве- личини ІДВ задовольнятимуть таку систему функціональних рівнянь: для всіх вершин і у, =тіп (М) (651) 274
Виникають запитання: чи завжди можна для всіх значень у, відшукати однозначний і скінченний розв’язок? Якщо відповідь на перше запитання «гак», то чи буде відповідна стаціонарна стратегія справді оптимальною? Відповіді на обидва запитання ствердні. Вони випливають із теореми про стаціонарну стратегію [25]: завжди існують однозначно визначені скінченні уь і = 1,Р, і відповідна стаціонарна стратегія є оптимальною. Розглянемо методи розв’язання системи функціональних рівнянь (6.51) і відшукання оптимальних стратегій. Метод ітерацій за критерієм. Нехай є система функціональних рівнянь вигляду (ауу + С#) для всіх і = 1,Р; у. = птіп (і. 7) її розв’язання методом ітерацій за критерієм складається з таких кроків: /фок 7. Задаємося початковими значеннями у, (наприклад, у. °) = 0) та л = 0. Крок 2. Для всіх і обчислюємо у}"+,) = шіп^ау^ + • Крок 3. Якщо У("+,) =у|л) для всіх і, то закінчуємо обчислення, в іншому разі переходимо до другого кроку чергової ітерації, взявши л=л+1. Якщо всі у|0)=0 і всі С#£0, то значення у^ зростають монотонно і кожне з у}”) збігається до своєї межі, однак збіжність не гарантується за скінченне число ітерацій. Метод ітерацій за стратегіями. Розглянемо метод ітерацій за стратегіями для розв’язання системи функціональних рівнянь (6.51). Крок 7. Оберемо довільну початкову стратегію# покладемо у|0) =0, і=1,Р. Зауважимо, що вибір стратегії означає вибір деякої дуги Су для кожної вершини. Крок 2. Для заданої пробної стратегії обчислимо значення у-я) згідно з системою рівнянь (розрахунку «вартості» вершин): Уія) = ау>я) + Су або у}я) - а.у$я) = Су, де дуга (і,у) відображає вибрану пробну стратегію для стану (вершини) і. 275
Крок 3. Перевіримо можливість подальшого поліпшення стратегій, дві чого обчислимо для всіх і тт(а^я) + ^) = ^л). (6.52) Крок 4. Якщо = у<л) для всіх і, то завершуємо обчислення, поточна стратегія буде оптимальною. В іншому випадку змінюємо поточну стратегію для кожної вершини к такої, що < у["^. Для цього за нову стратегію ви- беремо дугу, яка дає змогу досягти значення У/и) (у виразі (6.52)). Перейдемо на другий крок (л + 1)-ї ітерації з новою пробною стратегією. Метод ітерацій за стратегіями має такі властивості: 1) для будь-якої вершини У|"+,) £ у/"* і, якщо 1*л) < то у*"+,) < у*л), алгоритм є скінченним; 2) стратегія, що дає змогу після закінчення обчислень досягти У/, і=1,Р, є оптимальною. Мінімізація середніх втрат. Розглянемо випадок, коли критерій оши- мізації мережі являє собою середні витрати (ефект) за інтервал часу. Припустимо, що середні витрати для певної моделі існують і позначимо їх мінімальне значення через С. Крім того, припустимо, що в розглядуваній мережі існує орієнтовний маршрут від будь-якої вершини і хоча б до однієї з вершин, ЩО ВХОДЯТЬ у ВІДПОВІДНИЙ мінімальний ЦИКЛ Побудуємо функціональні рівняння для визначення С. Нехай уі - ІДВ для системи (мережі), якщо її поточний стан у певний момент є і. Тоді еквівалентні середні витрати (ЕСВ) для системи в початко- вому стані і дорівнюватимуть (1 - а)у,. Еквівалентні середні витрати для кожної вершини і зручно пов’язати із С таким співвідношенням [18]: (1-а)»м(1-а)м}+С, 0£а<1, де щ - «вага» і-ї вершини. 276
Тоді и = м', +---, 0^а<1. (6.53) 1-а Підставивши у, з виразу (6.53) у рівняння (6.51), після нескладних пере- творень отримаємо функціональне рівняння у вигляді мі = тіп (ам'/ + С,- СІ, або в такому еквівалентному вигляді для всіх вершин і: мі + С= тіп(ам', +СЙ). Якщо а = 1, отримаємо шукані функціональні рівняння мі + С = тіп (м», + С,) (6.54) для всіх вершин і. Для розв’язання функціональних рівнянь (6.54) доцільно скористатися методом ітерацій за стратегіями. Зауважимо, що коли обчислено значення н,, які задовольняють функціональні рівняння (6.54), то і значення м{ = м'і+а для всіх і, де а - деяка довільна константа, також є розв’язками цієї системи. Таким чином, розв’язки М»( не є єдиними і для зручності доцільно взяти одне з них таким, що дорівнює нулю (наприклад, м) = 0). Припустимо, що на кожній ітерації пробна стратегія, що перевіряється, утворює рівно один цикл. Алгоритм методу ітерацій за стратегіями складається з таких процедур. Крок 1. Оберемо довільну пробну стратегію, тобто для кожної верши- ни і деяку дугу (і, у), і покладемо м^ = 0. Крок 2. Для обраної пробної стратегії обчислимо значення і - 1,Р, та С<">, розв’язавши таку систему рівнянь для всіх і: = (6.55) де дуга (і,у) відображає поточну пробну стратегію у стані і. 277
Крок 3. Перевіримо можливість подальшого поліпшення, обчисливши тіп^"’ + Су - С(л)) = Игі(л) (6.56) для всіх і. Крок 4. Якщо = м{Л, для всіх і=ї,Р, то прилинемо обчислення. Поточна стратегія оптимальна. В іншому разі замінюємо поточну стратегію для кожної вершини к такої, що И*(л)<м{л\ вибравши відповідну дугу, яка дає змогу досягти значення И* л) у виразі (6.56). Переходимо до другого кро- ку (л + 1) ітерації для нової пробної стратегії. Отже, на кожній ітерації треба розв’язувати систему функціональних рі- внянь (6.54). Якщо пробна стратегія, що перевіряється, утворює лише один цикл, то рівняння (6.55) завжди матимуть єдиний розв’язок [25]. Зауважимо, що якщо скласти рівняння (6.55) для всіх вершин, які вхо- дять у цикл, то всі ваги и{я) зникнуть, отже, отримаємо С(л)=- X С/у, де £ - сукупність дуг, які утворюють цикл; т - кількість дуг у цьому циклі. Описаний алгоритм має такі властивості [6; 18]: - на кожній ітерації С(л^ і С(л+1); - обчислення закінчується після скінченної кількості ітерацій; - оптимальною є та стратегія, яка дає змогу досягти значень при цьому С(л) = С = тіл. Приклад 6.6. Розглянемо мережу (рис. 6.2). На її дугах проставлено відповідні значення С^. Покладемо С2з = 3. Нехай треба знайти оптима- льну стратегію, яка мінімізує середні випрати за інтервал часу. Для того, щоб застосувати метод ітерацій за стратегіями, треба вибрати початкову пробну стратегію, в якій для кожної вершини і є одна дуга, що виходить з неї. Рис. 6.2 278
Нехай пробною стратегією є така: - для вершини 1 - дуга (1,4); - для вершини 2 - дуга (2,1); - для вершини 3 - дуга (3,2); - для вершини 4 - дуга (4,1). Отже, ця стратегія включає єдиний цикл (1,4}-(4,1). Складемо систему функціональних рівнянь для обраної пробної стратегії: и{°>-мі(,)=СІ4-С<0); Ц0)-м|0,=С21-С<0’; >Ц0’-Ц0>=С32-С(0>; м$°>-м{0>=С41-С<0>. Ця система має розв’язок С*°) =2; м{0) =0; Ц°> = 2; < =1; =-1. Розрахунок показників можливого покращання за формулами (6.56) дає такі нові значення для вагових коефіцієнтів : - для вершини /: тіп(и£0) +С^2и{0) +СІ4-С(0^ = тіп(2+4-2, -1+3-2)=0 = И7] (для дуги (1,4)); - для вершини 2: тт(м/0) + С2Ї -С®\ Цо) + С23 -С(0)) = 2 = И2 (для Дуга (2,1)). Оскільки И, = и{°\ іР2 = Ц°>, то знайдено оптимальну стратегію, для якої С=С<0) = 2. Динамічна задача керування запасами з нескінченним плановим веріодом. Розглянемо важливу з практичного погляду динамічну задачу ке- рування запасами з нескінченним плановим періодом, яка є узагальненням динамічної задачі зі скінченним плановим періодом [25]. Нехай маємо систему постачання, яка виробляє продукцію, накопичує її в запас і постачає замовнику відповідно до попиту. Вихідні дані системи 279
(задачі) такі: обсяг випуску продукції х £ 5 од., попит на інтервалі часу сталий: = 3 од., при цьому рівень запасів на кінець інтервалу часу має задовольняти умову 7 ^4. Витрати на виробництво С(х) обсягу випуску продукції х зада- ються співвідношенням ч [0, якщо х=0, х) — * 13 + 2х, якщо х > 0,1 £ х £5. Витрати на зберігання запасу рівня у становлять Лу, де Л = 1. Припустимо, що система функціонує безмежно довго. Треба визначити таку оптимальну стратегію керування запасами (тобто знайти обсяг випуску х у кожному інтер- валі (відрізку часу)), за якого мінімізуються середні витрати за відрізок. Виберемо рівень запасів на початку відрізка і (де і = 0, 1,2, 3,4) за змін- ну стану системи. Стаціонарна стратегія являтиме собою правило визначення оптимального обсягу випуску продукції для кожного значення і. Для розв’язання цієї задачі треба передусім подати її у вигляді мережі (сітьової моделі). Кожному можливому стану поставимо у відповідність одну вершину мережі; за заданого і кожному допустимому обсягу випуску відпо- відає деяка дуга (і, у). Так, якщо рівень запасів на початку відрізка дорівнює і, обсяг випуску становить х одиниць, а попит = 3 одиниці, то запас у на початку наступного відрізка становитиме у = і + х - 3. Таким чином, дуга (і,у) відпові- дає обсягу виробництва х =у - і + 3. Отже, витрати у виборі стратегії (дуги) (і,у) задаються виразом с#»сс/-/+з)+лу. (6.57) У зв’язку з існуванням обмежень на обсяг випуску х та рівнянь запасів, деякі сполучення і тау недопустимі Наприклад, за і = 0 має бутиу £ 2, оскільки х £ 5. Мережу, яка відповідає умовам задачі, зображено на рис. 6.3, при цьому величини Су обчислені згідно з виразом (6.57). Припустимо, що за критерій оптимальності взято мінімум середніх ви- трат (СВ) за інтервал часу. Тоді функціональне рівняння, яке потрібно розв’язати, має вигляд [25] щ = тіп(м’у +Су-С) для всіх і. За пробну стратегію оберемо таку: випускати недостатню для повного задо- волення попиту кількість продукції за і £ 3, так щоб рівень запасів на кінець 280
інтервалу часу становив / = 0; і взагалі нічого не випускати, якщо на цьому інтервалі і = 4. На мережі цю стратегію подають так (рнс. 6.4): - вершина 0 - дуга (0,0), х = 3; - вершина 1- дуга (1,0), х = 2; - вершина 2 - дуга (2,0), х = 1; - вершина 3 - дуга (3,0), х = 0; - вершина 4 - дуга (4,1), х = 0. Рис. 6.3 Перша ітерація. Використовуючи алгоритм методу ітерацій за стратегі- ями, складемо систему функціональних рівнянь, які відповідають пробній стратегії: 281
^-^ + С<°>=С00 = 19; Ч0)-^0) + С<0)=С10 = 17; и/20)-мХ0°) + С<0)=С2о = 15; >>-вГ + С<О)=См=О; и$0)-Ч0) + С<0)=С41=1; Чо,=о. Її розв’язок такий: С<0) = 19; и£0) = 0; м{0) = -2; и£0) = -4; м£0) = -19; = -20. Для всіх і обчислюємо И'/л) =тт(и-<я) + Су -С00). Отже, маємо: И,0(0) =0 для дуги (0,0); И'1(0) =-12 для дуги (/3); ^2<0) =_'4 для дуги (23); Из(0) = -19 для дуги (3,0); >Р40) = -20 для дуги (4,1). На цьому перша ітерація закінчується. Оскільки И'/0’ < н{0) і 1Г2(0) < н£0), то треба перейти до другої ітерації, а як нову пробну стратегію обрати таку: (0,0), (1,3), (2,3), (3,0), (4,1). Результати обчислень, отримані під час виконан- ня ряду послідовних ітерацій, наведено в табл. 6.11. Таблиця 6.11 Ітерації Вершина 0 1 2 3 4 () с 0 о.о 1.0 2,0 З.о 4,1 19 0 -2 -4 -19 -20 ^(0) 0 -12 -14 -19 -20 1 (»,7) 0,0 1.3 2,3 3,0 4,1 19 IV/ 0 -12 -14 -19 -20 -9 -12 -22 -24 -20 2 О 0,1 1,3 2,4 3,4 4,1 171 3 0 <4 І СП 1 -11- 3 -із1 3 -21 т А. м -11і 3 -17* 3 -21 282
Закінчення табл 6.11 Ітерації Вершина 0 1 2 3 4 3 м 0,2 1,2 2,4 3,0 4,1 17 м-Р’ 0 -2 -8 -17 -18 0 -8 -10 -17 -18 4 (',Л 0,2 1,3 2,3 3,0 4,1 «1 0 -6- 3 -8? 3 І ** -22 Г(и> -1 ш і к> -11- 3 -16 і 3 -22 5 (і./) 0,1 1,3 2,4 3,0 4,1 16 М'/” 0 -6 -10 -16 -21 г/4 -1 -6 -10 -16 -21 6 (Ц) 0,2 1,3 2,4 З.о 4,1 15- 5 0 -5- 5 е-4 1 «г —15- 5 -20 2 5 ж/4 0 <5, ІЛ 1 о» ^1 5 —15- 5 —20— 5 Аналізуючи цю таблицю, можна зробити такі ви- сновки: - на першій ітерації значення не поліпшується (С(0)=С0>); - на всіх наступних ітераціях л = 2, З,4, 5, 6 викону- ється умова - після шостої ітерації знайдено оптимальну страте- гію керування запасами. Вона має такий вигляд: х ” 5 за у - 0,1,2; х = 0 за/ = 3,4. їй відповідає виробничий цикл (5,5,0,5,0), при цьому .____ . . . - 4 середні виграти мінімальні: Стк =15-. Відповідний міні- мальний цикл наведено на рис. 6.5. Рис. 6.5 283
6.7. Динамічне програмування для марковських процесів У попередніх параграфах розглянуто багатокрокові задачі оптимального планування та керування в детермінованих моделях, в яких існує взаємно однозначна відповідність між рішенням, яке приймається, та його наслідком - наступним станом системи. Разом з тим на практиці часто трапляються системи, в яких не існує та- кої взаємно однозначної відповідності, а можна лише говорити про імовір- ність переходу в той чн інший стан. Такі системи виявляються імовірнісни- ми. Важливий клас імовірнісних систем становлять марковські системи, вла- стивості яких у будь-який момент часу І залежать тільки від поточного стану і й не залежать від передісторії процесу. Динамічне програмування є ефективним методом оптимізації систем, які описуються марковськими процесами. Функціональні рівняння Белмана. Нехай є деяка система, яка може пе- ребувати в одному із # станів, і задано деяку множину рішень Р={</>), які можуть прийматися в кожному стані п, і = 1,Л\ та матрицю умовних імовірнос- тей Р = |;р(/1де р(/|і,</) - умовна ймовірність того, що сис- тема перейде у стан /, якщо поточний її стан був і та прийнято рішення </. При цьому відповідно до властивості марковської системи припускається, що вели- чини р(у | і, </) залежать лише від значення поточного стану і й це залежать від передісторії процесу, тобто траєкторії руху, яка привела систему в стан і. Припустимо, що ймовірності перебування системи у кожному стані в початковий момент часу дорівнюють дДО), і = 1,ЛГ. Тоді закон руху марков- ської системи повністю визначається величинами ?Д0), і=1,Л\ та матрицею Р = 1ір(у|і, б/)'|. Якщо позначити через дДл) імовірність перебування систе- ми у стані і на л-му відрізку часу, то у 9/" +1) = Е 9ї(л)Ю І і," = 0,1,2. (6.58) 284
Тут припускається, що перехід з одного стану в інший відбувається точ- но за один інтервал часу. Припустимо також, що за л —> °о величини д{(п) наближаються до деяких граничних значень д{, які називають стаціонарними (або граничними) імовірностями станів. Кожна величина д, являє собою деяку сталу відносну частоту перебування системи в стані і. Величини д{ можна отримати з виразу (6.58) за допомогою граничного переходу за л оо. Прийдемо до системи рівнянь вигляду у 9/ = Е9^(УІ».^) (6.59) /-і за умови N Е?/=1- /-1 Систему називають ергодичною, якщо величини д( не залежать від роз- поділу початкових імовірностей д,(0). Розглянемо марковську систему, описану на початку розділу. Позначимо через с(у|і,</) умовний ефект (або витрати), що визначаються переходом системи із стану і у стан у за умови прийняття рішення </. Таку систему зруч- но записати у вигляді сітьової моделі, де кожній дузі (і, у) відповідає пара ве- личин {р(у1 і, </), с(у1 і, </)}. . Нехай кожний гіерехід здійснюється за один інтервал часу, система фун- кціонує протягом необмеженого часу, а за критерій вибрано ІДВ. Позначимо через У, значення ІДВ, якщо поточним станом (у певний момент) є стан і. Якщо у цей момент приймається рішення </, то * г -і Н = Е рО і «. о[а>7 + си | і, </)] = Е рУ І І, <Г)ау} + си, 1-І де а - коефіцієнт дисконтування (0 £ а < 1); си - очікуваний ефект (витрати) на певному інтервалі часу для початкового стану і в разі рішення - ІДВ для стану і в разі рішення </. Припустимо, що система функціонує оптимально, тобто на кожному кроці приймається оптимальне рішення, а період функціонування системи нескін- ченний. Тоді справедлива така система функціональних рівнянь Белмана 285
для марковської системи, що є звичайним узагальненням функціональних рі- внянь (6.58) для марковських систем [25]: для всіх і = 1.ЛГ Уі= І чТЮ] + сіа •’ (6.60) де О(і) - множина можливих рішень у стані і. Визначимо стратегію на нескінченному плановому періоді як вичерпне правило прийняття рішень, що приймаються на кожному інтервалі часу в кож- ному стані. Під оптимальною стратегією, як і раніше, розумітимемо стратегію, яка забезпечує мінімальні ІДВ за будь-яких початкових станів. Така стратегія не обов’язково має бути стаціонарною (тобто такою, що кожного разу, коли система переходить у стан і, приймається те ж саме рішення). Разом з тим справедлива така теорема про стаціонарні стратегії [25]. Теорема 6.1. Завжди існують єдині скінченні значення уь що задоволь- няють функціональні (екстремальні) рівняння (6.60), і детермінована стаці- онарна стратегія, яка відповідає цим значенням, є оптимальною. Методи послідовних наближень. Для розв’язання функціональних рів- нянь (6.60) можна скористатися тими самими методами, що й для функціональ- них рівнянь (6.58) для детермінованих систем - методами ітерацій за крите- рієм і стратегіями. Метод ітерацій за критерієм. Розглянемо алгоритм методу ітерацій за критерієм для розв’язання функціональних рівнянь (6.60), який складається з таких етапів [25]. Крок 1. Виберемо у}0) довільно і покладемо п = 0. Крок 2. Визначимо у}"+1) зумов у «•£>(() (6.61) для кожного /=1,М Крок 3. Якщо > УІ"\ то переходимо до другого кроку чергової ітерації, > поклавши л=п+1. Якщо ж = у}я) для всіх і=1,М то закін- чується робота алгоритма. Отримуємо у, “ Уі"*° • 286
Зазначимо, що у процесі виконання ітерацій кожна з величин у}"> збігається до своєї межі у,, проте у загальнішу випадку ця збіжність не є скінченною. Якщо всі величини си £ 0, а всі у® £ 0, то значення у/"* зростають монотонно. За будь-якого су можна досягти збіжності таким чином. Вибираємо пробну стаціонарну стратегію, для якої для спрощення запису будь-який розв’язок позначимо через «/'. Далі розв’язуємо систему лінійних рівнянь стосовно не- відомих уг. для кожного і=\,К N / Уі- ЕР(їІ«.= <*/•• /-і Отримані розв’язки у/0) підставляють у співвідношення (6.61). Якщо на довільно вибраній ітерації л зупинитися і використати безпосередньо знайде- ну із співвідношень (6.61) оптимальну на л-му кроці стратегію як стаціонарну для нескінченного планового періоду, то відповідні значення ІДВ не переви- щуватимуть значення у/*4. Метод ітерацій за стратегіями. Наведемо опис алгоритми методу іте- рацій за стратегіями для розв’язання функціональних рівнянь (6.60). Він складається з таких кроків [25]. Крок 1. Обираємо довільну початкову стратегію і покладемо л = 0. Крок 2. Для заданої пробної стратегії «/'обчислимо значення у^ з рів- нянь для кожного і: N У? - Е Р(і І і, = Су, (6.62) /-і де</'- рішення, що приймається у стані і. Крок 3. Перевіримо можливості покращення стратеги: обчислимо для кожного і № Т.Р(і\і^)ауія}+су =#л). (6.63) Крок 4. Припиняємо обчислення, якщо =уР для всіх і=1,М Поточна стратегія оптимальна. Якщо ж у/"’ для деяких і, замінюємо стратегію в кож- ній вершині (у кожному стані) к, де У*"’ <уР,і викорнстовумо ту стратегію, що дає У*м У (6.63). Покладемо л = л+1 й перейдемо до другого кроку наступної ітерації. 287
Алгоритм ітерацій за стратегіями має такі важливі особливості: у}'*1* £ уР у будь-якій вершині і тау/"*4 < у/я), якщо У*(я) < у*(я). Алгоритм збігається за скінченне число ітерацій. У разі зупинки алгоритму стратегія, що відповідає значенням ¥к, є опти- мальною. Приклад 6.7. Модель керування запасами. Для ілюстрації застосування функціональних рівнянь розглянемо стохастичну задачу керування запаса- ми з нескінченним плановим періодом, детермінований еквівалент якої опи- сано в підрозділі 6.6. Числові дані цієї задачі такі: попит імовірнісний р(</=2)=^; р(«/=4) = |; обсяг виробництвах обмежений 0£х£5; кінце- вий рівень запасів ] £ 4; Л=1; витрати на виробництво та зберігання продук- ції описуються співвідношенням ?(х,у)=с(х)+Лу, де с(х) = 0, якщо х=0; 13+2х, якщо х>0. Поточний стан системи і визначається поточним запасом (і - 0,1,2,3,4). Очевидно, якщо обсяг виробництва дорівнює х, то майбутні стани системи з урахуванням імовірності попиту б/= 2 та «7= 4 такі:у ” і + х - 2;/ ” і + х - 4, при цьому р(і + х-2|і,х)=р(і + х-4|і,х)=і. Нехайуі - мінімальні ІДВ за умови, що початковий запас дорівнює і. Тоді функціональні рівняння типу (6.60) для цієї задачі матимуть вигляд Уі = тіп|с(х) + ф + х - 3] + а • |[у/+х_2 + У/+х-4 за і - 0, 1, 2, 3,4; 0£ а £ 1, де мінімум відшукується за всіма цілими х, що задовольняють умову 4-і £ х £ тіп(5; 6-і). Вихідні дані задачі наведено в табл. 6.12. Розв’яжемо задачу методом ітерацій за критерієм а = 0,9, починаючи з у/0) = 0,9 для всіх і. Результати послідовних ітерацій наведено у табл. 6.13. Розглянемо тепер розв’язання цієї ймовірнісної задачі керування запа- сами методом ітерацій за стратегіями. Як пробну стратегію оберемо таку: 288
х = 4 - і, і “ 0, 1, 2, 3, 4, п = 0. Складемо відповідну цій стратегії систему рівнянь для визначення величини уі, для чого використаємо дані табл. 6.12: (1 - 0,5а)уо _ О,5ау2 = 22; -О,5ау0+- 0,5ау2 = 20; -О,5уо+(1-0,5а)у2 =18; -О,5ау0-0,5а у2 +Уз = 16; -0,5ауо - 0,5ау2 + Л = 1» де а = 0,9. Її розв’язком є = 202; уі = 200; уі = 189; уз = 196; = 181. Таблиця 6.12 і х-4«Р(0 /,0) • 1 2 3 4 си 0 4 1 2 0 1 2 0 0 22 5 0 £ 2 0 1 2 0 25 1 3 1 2 0 1 2 0 0 20 4 0 1 2 0 1 2 0 23 5 0 0 1 2 0 1 2 26 2 2 1 2 0 1 2 0 0 18 3 0 1 2 0 1 2 0 21 4 0 0 1 2 0 1 2 24 3 1 1 2 0 1 2 0 0 16 2 0 1 2 0 1 2 0 19 3 0 0 1 2 0 1 2 22 4 0 1 2 0 1 2 0 0 1 1 0 і 2 0 1 2 0 17 2 0 0 1 2 0 1 2 20 289
Таблиця 6.13 Початкевні рівень запасів,/ N Нескінченні періед 1 2 3 18 28 38 я/1» у,т *,т ят У? уГ /»<*» Лі я 0 4 22 4 40 5 543 122,9 163,8 178,0 5 185,7 1 3 20 5 343 5 493 117,8 158,7 173,0 5 180,6 2 2 18 4 323 4 473 115,8 156,7 171,0 4 178,6 3 1 16 3 303 3 453 113.8 154,7 169,0 3 176,6 4 0 1 0 19 0 33,6 102,1 143,0 1573 0 164,9 Далі перейдемо до методу ітерацій за стратегіями, для чого скористаємося рівнянням (6.62). Результати послідовних ітерацій навед ено у табл. 6.14. Таблиця 6.14 Рівень запасів,/ N Г,т 8 1 2 лГ> Я® л/т Я® Я® 0 4 202 4 202 5 185,7 185,7 1 3 200 5 196,5 5 180,6 180,6 2 2 189 4 194,6 4 178,6 178,6 3 1 196 3 192,6 3 176,6 176,6 4 0 181 0 181 0 164,9 164,9 Як бачимо, процес обчислень закінчується після п ” 2, оскільки = для всіх і, а відповідна стратегія х£2) є оптимальною, що збігається з розв’язком, отриманим методом ітерацій за критерієм. Оптнмізація марковськоТ системи за критерієм еквівалентних середніх витрат. Функціональні рівняння. Розглянемо практично важли- вий випадок, коли за критерій оптимальності взято СВ (середні витрати), і виведемо відповідні функціональні рівняння (аналогічно тому, як це зробле- но для детермінованої моделі в підрозд. 6.6). 290
Нехай існує деяка стратегія п (не обов’язково детермінована). Позначимо через у/а) мінімальні ІДВ для системи, що починає функціонувати зі стану і, де а розглядається як параметр. Стратегія я* визначається як оптимальна за а - 1, якщо у/ (а) “ уДа) для кожного і та для всіх а, досить близьких до одиниці. Інакше кажучи, стратегія я* оптимальна, якщо існує а* < 1 таке, що для всіх а на відрізку а* £ а £ 1 очікувані ІДВ у, ( а ) у разі вибору стратегії я дорівнюють мінімально можливим. Тут, як і у випадку а < 1, справедлива теорема про стаціонарну стратегію, яка стверджує, що й за а = 1 завжди існує детермінована стаціонарна стратегія, яка є оптимальною [25]. Отже, припустимо, що детермінована стаціонарна стратегія я* є оптимальною. Тод і, якщо значення а досить близьке до одиниці, матимемо N = Е /•і де </ означає рішення у стані і, що визначається оптимальною стратегією я*. Нехай І-І [^ (6.64) де д{ - стаціонарні ймовірності стану, обчислені з рівнянь (6.59), для стратеги я*. Величину СГ можна вважати очікуваними середніми витратами за інтервал часу в разі використання стратегії я* і нескінченного інтервалу функціонування. Щоб вивести функціональні рівняння для імовірнісної моделі за а “ 1 скористаємося тим самим підходом, що і для детермінованої моделі (щдрозд. 6.6). Розглянемо очікувані ЕСВ (1 - а)у( і визначимо вагові коефіцієнти м», за допомогою співвідношення (1 - а)уі (1 - ефу, + СГ для всіх і. Тоді функціональні рівняння (6.64) можна записати у вигляді С? £ / ... ^\( о.С? | = шш У г(/т,а) аи', +- +си . 1-а--------------------------и \ 1 1-а^ и (6.65) 291
З урахуванням того, що £ р(/| /,</)=!, після нескладних перетворень 7-і вираз (6.65) зводимо до вигляду *» + £* = тіп^ £ р(/1«. -^и і, підставляючи а = 1, отримуємо . N (6.66) для всіх і=1, N. Рівняння (6.66) - це екстремальні (або функціональні) рівняння для мар- ковської системи за критерієм мінімуму середніх витрат за інтервал часу. Як і для детермінованої моделі, величину м'і називають «вагою» і-го стану, а різ- ницю щ - м) можна розглядиш як приріст очікуваного ефекту (середніх витрат), якщо система починає функціонування зі стану і, а не зі стану /. Якщо множина величин задовольняє систему рівнянь (6.66), то й мно- жина +а (де а - довільна константа) також задовольнятиме цю систему. Тому для визначення шуканих значень вводиться умова нормування ” 0. Розглянемо деяку стаціонарну стратегію я*, що містить рішення </. Не- хай м’*, С* - розв'язки рівнянь Мі =0, >-1 для всіх і. Тоді справедливе таке твердження (достатні умови оптимальності) [25]: 1. За заданої детермінованої стаціонарної стратегії я*, коли значення та С*, що знайдені з рівнянь (6.67), задовольняють функціональні рівняння (6.66), величина С* буде найменшою для всіх стратегій, а відповідна їй стратегія я -оптимальною. 292
2. Якщо величина С* не є найменшою, то розв’язки н>* та С* із рівнянь (6.67) не задовольнятимуть рівняння (6.66). Отже, для визначення оптимальної стратегії, що мінімізує С, треба розв'язувати систему рівнянь (6.66). Метод ітерацій за стратегіями. Розглянемо метод ітерацій за страте- гіями для розв’язання функціональних рівнянь (6.66). Цей метод є узагаль- ненням відповідного методу для детермінованої моделі. Дня спрощення припустимо, що для кожної пробної стратегії я*, яка оці- нюється на другому кроці алгоритму, існують єдині стаціонарні ймовірності. Алгоритм складається з таких кроків. Крок І. Обираємо довільну стаціонарну стратегію й покладемо п = 0. Крок 2. За заданій пробної стратегії її на ітерації л розв’яжемо систе- му рівнянь для визначення ваг н£я)=0, ^-) + С(-)= £р(/|і,іГ)^")+скГ, V/, 7-і де <1 - розв’язок у стані і, який визначається стратегією я*. Крок 3. Обчислимо , . N -С(я), V». (6.68) /фок 4. Закінчуємо обчислення, якщо И^я) = м{я) для всіх і, при цьому значення мінімальне. Якщо ж И'/я^ * то замінюємо стратегію в кож- ній вершиш (у кожному стані) к, де і використовуємо ту стратегію, яка дає значення Идя) у рівнянні (6.68). Переходимо від л до (и + 1) і поверга- ємось до другого Кроку за нової пробної стратегії. Викладений алгоритм збігається за скінченне число ітерацій. Приклад 6.8. Розглянемо знову стохастичну задачу керування запасами, вихідні дані для якої наведено у табл. 6.12. За критерій оптимальності обере- 293
мо мінімум середніх витрат за л відрізків часу С*. Щоб знайти оптимальну стратегію, застосуємо метод ітерацій за стратегіями. Запишемо систему функціональних рівнянь для цієї задачі: мі+С* =тш|с(х)+1[і+х-3]+|[м4+х_2 + м4+х_4]|. (6.69) Крок І. За пробну стратегію оберемо стратегію випуску мінімального допустимого розміру партії: х-4-і, /-0,1,2,3,4. Крок 2. Складемо таку систему рівнянь для визначення і=0: к0+С’=с(4)+1[1]+|м-0 + |^=22+|м-0 + ^; і=1:щ+С’*=20+^м'о + іи»г; /=2:м^+С* =18+^мі) + |м^; і=3: мі + С* = 16+|мь + і=4:»у4+Сг=1+-мі#+-мі, мь=0. Знайдемо розв’язок ціа системи: н£0) - 0; - -2; Ц0) - -4; - -6; >40) --21; С® -20. Крок 3. Перейдемо до процедури поліпшення ваг та обчислимо згідно зі співвідношенням (6.68): /Г0(0) -0, - -б-; - -8^; - -10-; 2 2 2 =-21. Оскільки /Р/0) < ^°> для/- 1,2,3, то перейдемо до другої ітерації. Результати послідовних ітерацій наведено у табл. 6.15. 294
Таблиця 6.15 Пачапгомй зайве,/ N • 1 2 Х)т *іт НУ” Х!т нР 0 4 0 0 4 0 -1.25 5 0 0 1 3 -2 -6,5 5 -6,5 -6.5 5 -5,43 -5,43 2 2 -4 -«.5 4 -8,5 -8.5 4 -7,43 -7,43 3 1 -6 -103 3 -10,5 -103 3 -9,43 -9,43 4 0 -21 -21 0 -21 -1 0 -203 -203 с» 20 "і 17- 7 Як бачимо, алгоритм збігається вже на ітерації л - 2, оскільки тут вико- нується умова ж/2’ “ %<2> для всіх іж 0,1, 2, 3,4. Шукана оптимальна стра- тегія Хо “ 5; хі “ 5; хз “ 4; - 3, Хч " 0, а оптимальний розв’язок системи рівнянь (6.69) такий: С* =17^; щ=-5у; и^=-7у; м^=-9^; »у4=-20^; =0. Отже, і в цьому прикладі мінімальні СВ за інтервал часу С* = 17 -. Розглянемо рекурентне співвідношення (6.66) для скінченного планово- го періоду. Можна показати, пю у разі достатньо великих п значення функції сумарних витрат за п інтервалів часу для початкового стану пов’язані з мінімальними середніми витратами С співвідношенням /„ (/)=лС* + ні, і=1>. (6.70) Використавши умову нормування м>0 = 0, отримаємо зі співвідношення (6.70) Л(0-Л(0) = І1і-*о = »»ї- (6-71) Вираз (6.71) дає змогу дати таку економічну інтерпретацію величини щ: ваговий коефіцієнт щ дорівнює приросту функції витрат /п за початкового стану і (стосовно стану 0) у нескінченному інтервалі функціонування системи (л=оо). 295
6.8. Нечітка модель динамічного програмування для задач планування на N періодів У попередніх розділах було розглянуто динамічні задачі планування та управління в умовах визначеності та під дією ймовірнісних факторів (мар- ковські моделі). Розглянемо тепер такі задачі в умовах невизначеності. Нечітка система планування за скінченної кількості кроків. Нехай є виробнича система, яка планує свою роботу на N періодів [28]. Позначимо через У, початковий рівень запасів на початок періоду /; Д - попит у періоді і на предмети виробництва, який є нечітким із ФН р(Д), де Д є[Л, або Д є[^шт>^пжх]> Д-ціле ЧИСЛО. Нехай у виробництві виробів використовується деяка виробнича функція УХЛ). де Р, - об’єм виробництва у періоді і, часом виробництва знехтуємо. Тоді основне рівняння балансу [28]: Л+і=Л+^-А^=і»2,...,м Потрібно визначити такі об’єми виробництва продукції Р, за періоди (місяці), за яких очікувані сумарні виробничі затрати за N періодів будуть мі- німізовані за умов забезпечення задовільного попиту Д за періодами: у разі нечітких обмежень балансу С/Л+і) із ФН рс(Л+і). Отже, розглянемо випадок, коли використовується нечітка ЦФ ОЦд та нечіткі обмеження С|(Л. Р» Д) з відомими ФН. Можливі такі варіанти ФН: І.ДляЦФ: а) МС/(х)=езф(-*х), х=Р„ де Р, - ціле число, Р > 0; б)М<%(*) = 1, х = 0; 0<х<Рп1в; чпи .0, хіР^. 2. Для нечітких обмежень: с(7г,р„д)=од+1)=ад+рг-д). 296
Задамось ФН рс(Л+/) такого вигляду: Ис<(Л+і ~ Д) _ 1, якщо 7, +Р,-О, =0; «ф{Д(Л+?, - Д)}. «вдо Л+і =Л+Ц - Д <0; ®ф{-Д(Л+Д-Д)},«що 7,+/?-Д >0; 0,якщо7,+/’-Д £-6, або ^+РІ-Оі^к. Запишемо ОРС ДП [28], розглянемо л-й крок. Використано метод Белмана-Заде: /В(7И)=т«{иод (Р„)л(7„ + Р„ - Д)л/И+1(7И + Р„ - Д,)} Тепер розглянемо к-й крок (к- 1,2,.... л): /»(Л)=п“х{>*<4 (Д) Л Не* (Л + Д ~ Д ) л Л+і(-4 + Д - Д )}• (6.72) Розв’яжемо задачу в зворотному напрямку, використовуючи ОРС (6.72). Крок 1. За умови п ” N знаходимо Лг(Дг) - л Д+Д "А»)}- Тоді Л-й крок Л(Д) = {Рбь (Д)л Ис* ОД+Д - Д)л а • А+і(Л + Д - Д)}. де а - коефіцієнт дисконтування. Нечітка скстема планування виробництва в разі нескінченного пла- нового періоду. Розглянемо систему у випадку нескінченної кількості кроків N -> со. При цьому для того, щоб задача мала розв’язок, припустимо, що не- чіткий попит Д однаковий для всіх періодів Л=1,Х, тобто Д =И із ФН р(Д. У такому випадку, переходячи до межі, отримуємо таке функціональне рівняння ДП [28]: /(7) = тах{ц0(Р,7)лцс(7+Р-Р)ла /(7+Р-В)}, 0<а<1, (6.73) де а - коефіцієнт дисконтування. Для зручності вважатимемо, що 7“ 7о - початковий інвентаризаційний запас. Рішення, що приймається, Р, залежить від інвентаризаційного запасу 7/7?(7/).Нехай 7( може набувати т скінченних значень {^},/ = 1,т. 297
Дня розв’язання такого рівняння можна застосувати метод ітерацій за стратегіями та метод ітерацій за критерієм [28]. Метод ітерацій за критерієм. Перша ітерація. Беремо />(7)=0, V/. 1. Задаємося початковою стратегією Р^0\Р)=Р0(гІ), і=1,т. 2. Підставляючи Ро у рівняння (6.73), обчислюємо /^(У,). 3. Шукаємо /2)(У)=тах{ро(Р,У)лмс(У+Р-£))лс/,)(/+/’-£>)}- 4. Порівнюємо: якщо < е Д®1 вс“ *=^т< тод* припиня- ємо обчислення, інакше переходимо на наступну ітерацію. При цьому функція сумарного доходу /*4)(Л) монотонно зростає (не строго). Вказані ітерації повторюють доти, поки на деякій ітерації к не почне ви- конуватись умова |/^*)(/<)-/<*-,)(Л)|< е Д®1 вс’х '• Метод ітерації за стратегіями. Перша ітерація. 1. Задаємося початковою стратегією Р^Х^) для всіх рівнів 2. Підставляючи її в рівняння (6.73), обчислюємо /^(У,). 3. Далі для кожного Л шукаємо тах: ЛЛ) ЛЧЛ)=тах{ро(Р,Л) а МЛ + Р~ О) а а • /’ЧЛ+Р -О)), і знаходимо нові стратегії Р^Х-іі), і=1,т. 4. Порівнюємо: якщо Р®\.іІ)=Рт(.ІІ) для всіх і, тоді припиняємо об- числення, інакше замінюємо для кожного У, стратегію Р®Х^) на Р^Р/) (кінець першої ітерації). Наступні ітерації проводимо аналогічно. Вказані ітерації проводимо доти, поки після деякої ітерації к не отрима- ємо Р(І)Ц) = Р(І_1)(У/) для всіх рівнів запасу і=1,т. Оскільки кількість різних стратегій та станів Л ї=1,т скінченні, то ме- тод закінчує роботу за скінченну кількість ітерацій. 298
Запитання для самоконтролю 1. Сформулюйте властивості задач, до яких можна застосувати метод ДП. 2. Сформулюйте іфинцят оптимальності Р. Белмана та поясніть його зміст. 3. В яких випадках задачі ДП вирішуються у прямому напрямку, а в яких у зворотному? 4. Запишіть ОРС для розв’язання задачі про використання трудових ресурсів у прямому та зворотному напрямках. 5. Запишіть ОРС ДП для задачі з двома та трьома обмеженнями. 6. У чому полягає «прокляття вимірності» Р. Белмана? 7. Які способи Вам відомі для зменшення вимірності задач ДП? 8. Запишіть ОРС ДП для динамічної задачі управлінні запасами 9. Які способи оцінювання нескінченних послідовностей ефектів (витрат) Вам відомі? 10. Запишіть функціональне рівняння ДП для задачі ДП на мережах. 11. Сформулюйте теорему про стаціонарну стратегію для задач ДП на мережах. 12. Опишіть метод ітерацій за стратегіями для розв’язання функціональних рівнянь ДП для задач прийняття рішень на мережах. 13. Опишіть метод ітерацій за критерієм для розв’язання функціональних рівнянь ДП для задач прийняття рішень на мережах. 14. Наведіть ОРС для динамічної задачі управління запасами з нескінченним плано- вим періодом. 15. Опишіть метод ітерацій за стратегіями для розв’язання динамічної задачі управ- ління запасами з нескінченним плановим періодом. 16. Дайте визначення мадковського процесу. 17. Що таке ергодичний марковський процес? 18. Сформулюйте теорему про стаціонарну стратегію для мцжовського процесу з дохо джин. 19. Запишіть функціональні рівняння ДП для марковської системи з доходами за критерієм ІДЕ. 20. Запишіть функціональні рівняння ДП для марковської системи з доходами за критерієм СЕ (СВ). 21. Опишіть метод ітерацій за критерієм для розв’язання функціональних рівнянь для марковської системи з доходами. Які його властивості? 22. Опишіть метод ітерацій за стратегіями для розв’язання функціотльнях рівнянь для марковської системи з доходами. Які його властивості? 23. Опишіть метод розв’язання задачі управління запасами з імовірнісним попитом, яка описується марковським процесом. 299
24. Сформулюйте постановку задачі та наведи* математичну модель нечіткої динаміч- ної задачі упрвжліпна запасами зі скінченним плановим періодом. 25. Сформулюйте постановку задачі та наведіть математичну модель нечіткої динаміч- ної задачі управлінні запасами з нескінченним плановим періодом. 26. Запишіть ОРС ДП для розв’язанні нечіткої динамічної задачі управління запаса- ми з нескінченним плановим періодом. 27. Опишіть метод ітерацій за стратегіями для нечіткої динамічної задачі управлінні запасами з нескінченним плановим періодом. 300
7. ПРИЙНЯТТЯ РІШЕНЬ У КОНФЛІКТНИХ СИТУАЦІЯХ 7.1. Основні поняття і визначення теорії ігор У попередніх розділах було розглянуто задачі й методи прийняття рішень в умовах визначеності, невизначеності дії стохастичних факторів середовища. Між тим, досить часто виникають ситуації, коли рішення необхідно приймати в умовах протидії - у конфліктних ситуаціях. Цей клас задача розглядається в теорії ігор. Іграми людство займається із сивої давнини. Існують різні види ігор: са- лонні, спортивні тощо. Якщо розглядати салонні ігри, то гра починається з деякої початкової позиції й складається з послідовності ходів, які травці роб- лять по черзі. Деякі ходи можуть бути випадковими (наприклад, кидання кістки, тасування колоди карт). У деяких іграх, наприклад у шахах і шашках, немає випадкових ходів. Крім того, є ігри з повного інформацією, коли поточ- ний хід супротивника відомий, і з неповною інформацією, коли він невідомий і гравець має робити наступний хід, не знаючи точної позиції три. Позащійніігрн. Загальне уявлення про тру включає такі три елементи [42]: 1) множину ходів, які можуть бути як особистими, так і випадковими; ходи гравців чергуються; 2) наявність інформації про тру, яка може бути повного або неповною; 3) функцію виграшу. Насамперед визначимо топологічне дерево, або дерево гри, як скінченну сукупність вузлів (вершин), які сполучені ребрами, так, що утворюється зв’язний граф, що не містить простих (замкнених) циклів. У результаті отримуємо таке визначення [25]. Визначення 7.1. Нехай є Г-топологічне дерево з виділеною початковою вершиною А. Будемо говорити, що вершина С йде слідам за вершиною В, як- що послідовність ребер, що сполучають А і С, проходить через В. Говоритимемо, що С йде слідом за В безпосередньо, якщо існує ребро, яке сполучає В із С. Вершину х називають кінцевою, якщо за х не йде слідом жодна вершина ЗОЇ
Визначення 7.2. Позиційною грою п осіб називатимемо гру, в якій зада- но такі елементи: - топологічне дерево Г з виділеною вершиною А, яку називають почат- ковою позицією гріє, - функцію виграшу, яка ставить у відповідність кожній кінцевій позиції (вершиш) дерева деякий л-вимірний вектор (л - кількість гравців); - розбиття множини всіх неостаточних позицій (тобто неостаточних вершин) дерева Г на (л + 1) множин: які називають множинами черговості, де 5® - позиція з випадковим ходом; - імовірнісні розподіли для кожної позиції із 5^ на множині позицій, що йдуть слідом за нею безпосередньо; - розбиття множини 5, для кожного гравця (/=1, 2, ..., л)напідмноживя які називають інформаційними множинами. При цьому позиції з однієї й тієї самої інформаційної множини мають однакову кількість позицій, що йдуть слідом за ними безпосередньо, і ніяка позиція не може слідувати за іншою по- зицією з тієї ж самої інформаційної множини; - для кожної інформаційної множини 5/ задано множини індексів разом із взаємно однозначними відображеннями множини //, на множині альтер- натив кожної позиції з 5/. Позначатимемо гру також через Г. У цьому визначенні перераховано всі елементи гри. Пояснимо зміст умов: - умова 1 встановлює, що є початкова позиція; - умова 2 задає функцію виграшу; - умова 3 розділяє множину неостаточних позицій на позиції з ходом випад- ку ( 50) й особисті позиції, які відповідають кожному з гравців (50,..., 5, ). Приклад 7.1. «Гра в орла». Гравець І вибирає решку (Р) або герб (Г). Гравець П, не знаючи вибору гравця І, також вибирає Р або Г. Якщо обидва супротивники роблять однаковий вибір, то гравець П виграє у гравця І, інак- ше програє (тобто гравець І виграє одиницю). На дереві гри (рис. 7.1) вектори на кінцевих позиці ях вказують на функцію виграшу. Затінена область охоплює позиції з однієї інформаційної множини. 302
Визначення 7.3. Гру Г називають грою з поєною інформацією для гравця і, якщо кожна його інформаційна множина 5/ складається з одного еле- мента. Інакше кажучи, гра є грою з поєною інформацією, якщо в Г кожний гравець має повну інформацію. Наприклад, шахи і шашки - це ігри з поєною інформацією, а бридж і покер - ні. 7.2. Стратегія гри. Нормальна форма гри. Антагоністичні ігри Важливим елементом гри є стратегія, під якою розуміють план розгор- тання гри [25]. Визначення 7.4. Стратегія гравця і-це деяка функція, яка ставить у відповідність кожній інформаційній множині 5/ цього гравця деяку альтер- нативу із множини альтернатив, що описується відповідним індексом із множини І, (множини індексів всіх альтернатив). Множину всіх стратегій гравця і позначатимемо X,. Насправді треба встановити (також як і учасникам гри), які зі стратегій є найкращими з по- гляду максимізації частки кожного гравця у виграші (зрозуміло, кожний гра- вець і прагне максимізувати /-ту компоненту функції виграшу). Оскільки результати випадкових ходів відомі тільки в імовірнісному значенні, то природно розглядати математичне сподівання функції виграшу, визначене у разі, коли гравці використовують заданий набір стратегій. Тому для математичного сподівання функція виграшу за умови, що гравець і оби- рає стратегію а, є X,, використаємо такий вираз: 303
ЩсрО,,.... в,)=[ПХСрСі,о,), П^Срві»..., <т,),..., 11.(0,, ст2,...»о,)], тобто його можна записати у вигляді л-вимірної таблиці л векторів розмір- віспо л. Якщо л “ 2, її можна подати у вигляді деякої матриці А = ||ау ||. Таку матрицю називають нормальною формою гри, де ац - виграш першого гравця якщо він обрав стратегію і, та, відповідно, програш другого гравця якщо вій обрав стратегію у. Приклад 7.2. У грі в орла кожний гравець має дві стратегії: решку (Р) або герб (Г). Нормальною формою три буде така матриця: /у р г р (-І-.1) Г «Я) Н;і) Визначення 7.5. Гру називають скінченною, якщо її дерево містить скінченну кількість вершин (наприклад, шашки, шахи). Зазначимо, що в скінченній грі кожний гравець має лише скінченну кількість стратегій. Ситуація рівноваги. Важливу роль в теорії ігор відіграють ситуації, або стратегії, рівноваги. Визначення 7.6. Нехай є гра Г. Кажуть, що ситуація (тобто набір стратегій а,,...,а*) рівноважна, або що вона є ситуацією рівноваги, якщо для будь-якого і=1,2,...,п і для будь-якого а|є£| справджується нерівність ПДо,,®І,...,<т’м, а„см,...,о*)іП/Ора2,...,<£„...,а’). Інакше кажучи, ситуація рівноважна, якщо жоден гравець не має ніяких розумних підстав для зміни своєї стратегії, за умови, що решта гравців зби- рається дотримуватися своїх стратегій. У цьому випадку, якщо кожний тра- вень знає, як гратимуть інші, то він має підстави дотримуватися тієї стратегії, яка відповідає цій ситуації рівноваги, тобто гра стає стійкою. Приклад 7.3. Розглянемо тру Г\ у нормальній формі, яка задана такою матрицею: ‘У & Ь О| (2;1) (0;0) сц «м» (іа> 304
Як (аьРО, так і (а2,Рг) є стратегіями рівноваги. Не кожна гра має ситуації рівноваги (наприклад, гра в орла). Взагалі, якщо гра не має ситуацій рівноваги, то звичайно деякі травці нама- гаються відгадати стратегії решти учасників, зберігаючи власні у таємниці. Можна д овести, що в іграх з повного інформацією ситуації рівноваги є завжди. Розкладання грн. Розглянемо питання про розкладання три. Казатиме- мо, що гра Г розкладена в деякій позиції X, якщо не існує інформаційних множин, які містили б позиції з таких двох множин одночасно: а) позиція Хі всі наступні за нею позиції; б) решта позицій дерева три. У цьому випадку можна ви ділити підгру Гх, що складається з позицій X і всіх наступних за нею позицій, і фактор-гру Г/Х, що складається з усіх по- зицій, які залишилися, та позиції А, тобто розкласти гру Г. Для фактор-три позиція X буде останньою (кінцевою). Якщо розкласти тру в X, то можна також розбити стратегію о на дві частини: - олх є обмеженням о інформаційними множинами з Г/Х\ - о« п є обмеженням о інформаційними множинами з Гх. Навпаки, стратегія для Г/Х і стратегія для Гх можуть бути з’єднані у стратегію для всієї три Г. Теорема 7.1. Нехай Г розкладена у позиції X Для в, єЕ( поставимо у відповідність позицію X (що розглядається як остаточна позиція для Г/Х) виграш П.ж(с1/Г,сі,Г,...,аЯІГ). У цьому випадку П(<т,, 02,...,стя) = = ^г/»(°иг/к»°ип*»•••• °»ігіх ) • На підставі цієї теореми можна довести таке твердження: нехай тру Г розкладено в X і нехай о, є Е,така, що: а) Оиг,»°ї/г,.°м/г, - ситуація рівноваги для Гх; б) аигіх>аигіхг—г°яіпх ~ ситуація рівноваги Г/Х з виграшем ГВугіх > °2/г/х»•••» °*/г/х > визначеним для останньої позиції X. Тоді (врО,, ..., ов) є ситуацією рівноваги. Доведення Нехай (^єЕ, і ГЦо^.ст^,...,а^) є ситуацією рівноваги для Гх, тоді маємо 305
П/^Г. »•••» »•••» ®я/Г, ) » ®І/Г, »•••» ®я/Г, )• Наразі з умов (б) теореми випливає, що якщо позиції X приписаний ви- граш ...» аипі Оі/г/х,...» а^гіх)^(°гг/х» °і/глг>•••» °ипх.°«/г/х) Вшраш у цій ситуації є зваженим середнім виграшів у деяких кінцевих позиціях. Отже, якщо виграш гравця і в цій остаточній позиції (Л) зменшується, то йото очікуваний виграш за будь-якого вибору стратегій або залишатиметься тим самим, або зменшиться. Тешу, застосувавши теорему 7.1, отримаємо нерівність ПДо,,..., Оі о„) £ 11,(0, а, а,), так що (о,,..., ав) є ситуацією рівноваги. Тепер можна довести наступну дуже важливу теорему [25; 45]. Теорема 7.2. Будь-яка скінченна гра п осіб з поєною інформацією має ситуацію рівноваги. Доведення. Визначимо довжину три як найбільш можливу кількість ре- бер, яку необхідно пройти перш ніж потрапити в кінцеву позицію, тобто най- більшу можливу кількість ходів до кінця гри. Очевидно, що скінченна гра має скінченну довжину. Доведення проведемо за індукцією з використанням довжини гри. Якщо Г має довжину 1, то не більше ніж один гравець має змогу зробити хід і він досягає рівноваги, обираючи найкращу альтернативу. Якщо гра Г має довжину т, то з огляду на те, що інформація повна, вона розкладається на декілька підігор довжиною меншою, ніж т. Тоді за припу- щенням індукції кожна з цих підігор має ситуацію рівноваги і на підставі теореми 12 вони утворюють ситуацію рівноваги для гри Г. Антагоністичні ігри. Розглянемо суть антагоністичних ігор. Визначення 7.7. Гру Г називають грою з нульовою сумою, якщо в кожній остаточній позиції функція виграшу (П,, П2 Пя) задовольняє умову £п,=о, м тобто сумарний вшраш рівний сумарному програшу. 306
Визначення 7.8. Гру двох осіб з кульовою сумою називають анта- гоністичною, або строго конкурентною. У випадку антагоністичної гри можна просто задавати першу компонен- ту вектора виграшів. Друга компонента обов’язково рівна першій із проти- лежним знаком. Назвемо першу компоненту просто виграшем. Покажемо, що анта- гоністична гра відрізняється від решти ігор тим, що в ній немає підстав для будь-яких переговорів між гравцями, оскільки якщо один виграє, то інший програє. Значення цієї властивості випливає з такої теореми [45]. Теорема 73. Нехай (о,,^) і (т,,т2) - дві ситуації рівноваги антагоністичної гри. Тоді й (о„т2), й (т,,а2) також є ситуаціями рівноваги, гри цьому П(арС2) = П(ТрТ2) = П(ОрТ2) = П(ТрО2). (7.1) Доведення. Ситуація (ора2) -рівноважна, отже П(ОрО2)£П(т,,<т2). Між тим, (ТрТ2) теж ситуація рівноважна, тому П(тІ,с2)^П(т,,т2). Звідси випливає, що П(Ор<т2) £ П(тр<т2) 2» П(т„т2). Але за аналогією: П(ТрТ2) £ П(ОрТ2) 2» П(сгрсг2). Ці дві системи нерівностей доводять рівність (7.1). Далі для будь-якого в, П(ст!,о2) £ П(СрС2) = П(ТрО2), і для будь-якого о2 П(ТрОі) £ П(трХ2) = П(ТрО2). Отже, ситуація (Тр<г2) є ситуацією рівноваги. Аналогічно буде рівно- важною й ситуація (<ТрТ2). Нормальна форма три. Нормальна форма антагоністичної три зводиться до деякої матриці А=|о^||, де рядки і = 1,т відповідають стратегіям гравця Г, а стовпці/ = 1,л - стратегіям гравця 2; а* - виграш гравця 1 (програш гравця 2), якщо гравець 1 вибирає стратегію і, а гравець 2 - стратегію у. 307
Як буде показано далі, ситуація - пара стратегій (/, у) буде рівноважною тоді й тільки тоді, коли відповідний елемент а* буде найбільшим у стовпці й одночасно Приклад 7.4. Нехай матриці гри А« має такий вигляд: ’5 1 О -З 1 О Ця матриця має сідлову точку ап - 2. Якщо гравець 1 відмовиться від вибору стратегії і - 2 і вибере стратегію і - 1, то гравець 2 також вибере стратегію у = 2, і виграш гравця 1 складе ац = 1 < Оп~2. Аналогічною буде ситуація у випадку і - 3. Якщо ж гравець 2 відмовиться від своєї стратеги У - 2 й вибере стратегію у - 1 або у - 3, то його програш збільшиться. Отже, стратегії і - 2, у ” 2 є рівноважними й їм відповідає сідлова точка 022-2 матриці А. Назвемо величину =тахггшгау нижньою ціною гри (це гарантований виграш першого гравця за будь-якої стратегії гравця 2), а величину У2 = тахггшш, - верхньою ціною гри (гарантований програш гравця 2 за будь-якої стратегії гравця /). У загальному випадку проте якщо матриця А має сідлову точку ам>/в, то тахпшій^ = пшгтахг^ = ам>/0. Отже, у разі наявності в матриці А сідлової точки ам>/0 оптимальні стра- тегії обох гравців такі (^,У#), і при цьому ^ = И2 = И, де V-цінагри. 7.3. Теорема про мінімакс Дж. фон Неймана .. та її застосування Розглянемо антагоністичну гру двох осіб із платіжною матрицею А в за- гальному випадку, коли А не має сідлової точки. Введемо поняття змішаної стратегії [25]. 308
Визначення 7.9. Змішаною стратегією гравця 1 в антагоністичній грі двох осіб називатимемо вектор Х = [х,] і = 1,іи, такий, що 0£х,£1 й £х, = 1. м Визначення 7.10. Змішаною стратегією гравця 2 в антагоністичній грі двох осіб називатимемо вектор ¥=[у,], У = І,л, такий, що Уу^°й£уу=1. м Величина х, трактується як імовірність вибору гравцем 1 стратегії і, у, - відповідно імовірність вибору гравцем 2 стратегіїу. Визначення 7.11. Якщо Зх,= 1, відповідно Зу( = 1, то такі стратегії називають чистими. Нехай гравець 1 використовує свою змішану стратегію X, а гравець 2 свою змішану стратегію V. Тоді математичне сподівання виграшу першого гравця (програшу другого) И(Х,¥) = ХГА¥, при цьому гравець 1 прагне максимізувати свій виграш за будь-якої відповіді гравця 2, а гравець 2 - мінімізувати свій програш. Визначення 7.12. Нижньою ціною гри називатимемо гарантований виграш гравця 1 за будь-якої відповіді гравця 2: тахтіпХгА¥ = К. я V 1 Визначення 7.13. Верхньою ціною гри називатимемо гарантований мінімальний програш гравця 2 за довільної стратегії гравця 1: тіптахХгА¥ = V,. ¥ Я 2 Справедлива така основна теорема матричних ігор двох осіб, сформу- льована Дж. фон Нейманом (теорема про мінімакс) [25; 42]. Теорема 7.4. Кожна антагоністична гра двох осіб має розв'язок в чис- тих або змішаних стратегіях, і при цьому нижня ціна гри дорівнює верхній ціні гри й дорівнює ціні гри, тобто: 309
тяхпппХгА¥ - тттахХгА¥ = ХІА¥в - У, де (Хо, ¥в) - оптимальні змішані стратегії гравців 1 і 2 відповідно. Ця теорема має фундаментальне значення для всій теорії ігор двох осіб. Доведення. Використаємо теорію двоїстості ЛП. Нехай іравець 2 виби- рає свою чисту стратегію/ (тобто стовпець А/), тоді Ух = тахтіпХгАу. Таким чином, задачу травня 1 можна записати як задачу ЛП: тах і; заумов ___ /= 1л м х,£0. У свою чергу, нехай іравець / вибирає чисту стратегію і (тобто рядок А)> Гравець 2 прагне мінімізувати свій програш: У2 = пйптахА/¥, тоді задачу гравця 2 можна записати так: тіп^ заумов А,У^У2, і=\т, >1 Запишемо ці дві задачі в розгорненому вигляді: -задача гравця 1: тах^ (7.2) заумов (7.з) £*,=!; (7.4) х,*0, і=1,т; (7.5) 310
- задача гравця 2: шіп^ (7.6) за умов ~2Х.У/ + >2^0» »=1.»я. (7-7) 2>,= 1. (78) у,2:0,/=1л. (7.9) Неважко побачити, що задачі іравців / і 2 є парою двоїстих задач ЛП. Якщо як двоїсті змінні в задачі гравця 1 (7.2)-(7.5) вибрати ур і = 1,л та г2, то отримаємо задачу іравця 2 Тоді на підставі основної теореми двоїстості про оптимальні рішення ЦФ обох задач мають бути рівними для оптимальних розв’язків, тобто тах =тіпР^ =У, що і треба було довести. З описаного доведення випливає, що для знаходження оптимальних стратегій іравців у матричній грі двох осіб з нульовою сумою можна засто- сувати апарат ЛП, якщо записати відповідну задачу іравця 1 (або іравця 2) Тоді, знайшовши розв’язок прямої задачі й оптимальну стратегію одного іравця, можна одночасно знайти і стратегію іншого іравця як розв’язок двоїстої задачі. Приклад 7.5. Розв’язати матричну гру з матрицею методом ЛП: '3614 5 2 4 2 14 3 5 Розв’язання. Запишемо задачу максимізації виграшу гравця 1: тахУ 3^+5^+л^^^ 6^ + 2х1+4х}^: у; ^+4^+Зл^^к 4х^+2л^+5х^у; ХрХг.х, 2:0; шахИ -Зх^ -5^-д^ + уіО, -бХ[ - 2х, - 4х, + V £ 0, -X; -4х^ -Зх, + у і 0, —4^-2І,-5х, + уіО, д^ + х2 + з^=1; Х^Х^Х^О. ц; «»; “зі и4> Введемо вільні змінні ні, «а, «з, и4 та штучну змінну у в ЦФ зі штрафним коефіцієнтом М та в останнє обмеження. Тепер функція має такий вигляд: тах(Р’-А()'1). 311
Побудуємо табл. 7.1 та розв’яжемо її звичайним симплекс-методом. Результати ітерацій симплекс-методом наведено в табл. 1.2-1 А. Таблиця 7.1 *1 *2 Хз V VI «2 «3 їй Уі 0 0 0 1 0 0 0 0 0 Д, 4 4 4 4 4 -4» 4 4 4 0 "1 0 -3 -5 -і 1 і 0 0 0 0 0 «2 0 -6 -2 -4 1 0 1 0 0 0 0 “1 0 -1 -4 -3 1 0 0 1 0 0 0 “4 0 -4 -2 -5 1 0 0 0 1 0 «—м Уі 1 1 1 1 0 0 0 0 0 1 А -м -м -А4 -А4 -1 0 0 0 0 0 Т ТЬбгауя 7.2 Х1 *} V “1 “3 «} “4 0 0 0 1 0 0 0 0 д, 4 4 4 4 4 4 4 4 4 0 “1 3 0 -2 2 1 і 0 0 0 0 и2 б 0 4 2 1 0 1 0 0 <-0 и1 і 0 -3 -2 1 0 0 1 0 0 «4 4 0 2 -1 1 0 0 0 1 0 1 1 1 1 0 0 0 0 0 А 0 0 0 0 -1 0 0 0 0 т ТЬбгауя 7.3 *2 *3 V V] •42 «3 їй 0 0 0 1 0 0 0 0 Д, 4» 4 4 4 4 4 4 4 4 0 "1 2 0 і 4 0 і 0 -1 0 0 “2 5 0 7 4 0 0 1 -1 0 1 “2 1 0 -3 -2 1 0 0 -1 0 <—0 “4 3 0 5 1 0 0 0 -1 1 0 1 1 1 1 0 0 0 0 0 А 1 0 -3 -2 0 0 0 1 0 т 312
Таблиця 7.4 ц Хі V И/ «2 «2 0 0 0 1 0 0 0 0 В, 4 4 4 4 •4* 4 4* 4 А 0 ц 1/8 і 0 0 0 1/8 1/8 -1/4 0 0 *2 1/2 0 1 0 0 1/6 -1/6 0 0 0 X, 1/8 0 0 0 0 -13/24 19/24 3/4 1 0 *} 3/8 0 0 1 0 -7/24 1/24 1/4 0 1 V 13/4 0 0 0 1 1/12 5/12 1/2 0 А 13/4 0 0 0 0 1/12 5/12 1/2 0 Згідно з останньою таблицею маємо ^’"2: >:=*•’ *-*> г=4- 7.4. РОЗВ'ЯЗАННЯ ІГОР З МАТРИЦЯМИ [2хл] та [тх2] Розглянемо графоаналітичний метод розв’язання ігор з матрицями [2 хл] та[тх2]. Задача [2 х л]. Нехай матриця А має вигляд Ці Ці Ц/ Ц. .Ці аі/ Ц«_ Запишемо задачу гравця /: шаху,; црс.+а^^у,, /=1,и. Цю задачу подамо у вигляді ітхпші(а|/х1+а2/х2); (7.10) х, + *2 =1; х1=1-х1. (7.11) 313
Підставимо рівняння (7.10) у (7.11), отримаємо тахшіп^ + (а2/-а^). На інтервалі [0;1] побудуємо функцію /у(х2)=а1/Пряма проходить через точку за х2 =0 та точку а2/ за х2 = 1. Визначимо нижню обвідну /(х^) = + (°2/ ~ )-х2і знайдемо її максимум. Нехай максимум досягається на перетині прямих /уО^) та ЛСч)- Тоді запишемо систему рівнянь, де у, - нижня ціна гри: ЦЛ+а»ух2 = ’'«’ +*і=1; ХІ,Х,*О. Розв’яжемо задачу графоаналітичним методом (рис. 7.2). Розв’яжемо цю систему: 0,^+а,^ =0^+0^; % +(а2/~аі/)х2 =аи +(вм та знайдемо та х,° = 1 -х£. Приклад 7.6. Розв’язати задачу і знайти стратегії обох гравців: Г2 З 1 5‘ -[4 160’ Разе ’язання. Для розв’язку задачі використаємо графоаналітичний метод (рис. 7.3). 314
Рис. 7.3 Стратегію гравця / визначимо таким чином: Зх, +х2 = у,; ^+бх,= у,; хІ+х2= 1. Звідси отримуємо, що 17 7 ' Стратегію іравця 2 визначимо так: ЗЛ+Л- Уг+6Уз = Л+Л“ і- Звідси отримуємо, що у2 = 17 у2 = у;Л=0;Л = 0. 7 л = 7 Задача [тх2]. Нехай матриця А має вигляд ЯіІ °І2 Да Оа А= : ап ап 5-І в-2. Задача іравця 2 у разі обрання першим і-ї стратегії матиме вигляд у2 =іпіптах(а,1у1 +а12у2), у,+у2 = 1; тттахСап+Сап-ая)^); 0£у2£1. Тепер визначимо верхню обвідну Х(у2) і знайдемо її мінімум, який однозначно визначає суттєві стратегії іравця /, а саме та і,. 315
Приклад 7.7. Розв’язати таку задачу: 2 4* *=’ 1 1 6 5 0 Розв'язання. Для розв’язку скористаємося графоаналітичним методом (рис. 7.4). Із рис. 7.4 випливає, що шукана точка мінімуму Уз міститься на перетині прямих, що відповідає третьому та четвертому рядкам матриці А. Тому скла- демо такі рівняння: у,+6у2=у2; «У, = *2; У2+Уз = 1- Звідси у, +6у2 =5у,; 6у2 =4у„ тоді у, = у2 = у2 =3. 7.5. ІГРИ З НЕНУЛЬОВОЮ СУМОЮ. БХМАТРИЧНІ ІГРИ На практиці трапляються задачі, які є іграми з ненульовими сумами. Визначення 7.14. Біматрична гра — це гра, в якій задано матрицю ви- грашу А гравця 1 і матрицю виграшу В гравця 2 у разі вибору відповідних стратегій: А=|ог||, і = 1,т, у=1,л; В = ||і>г||, і = 1,т, У=ї,л. 316
Є такі види біматричних ігор: - некооперативна гра (іравці діють незалежно на ринку); - кооперативна гра (іравці можуть вступати у коаліцію). Позначимо змішані стратегії обох іранців: - іравець 1: X=[х,], і = 1,т, = 1; м - іравець 2: У =[у,], у = 1,л, = 1. і-і Тоді для гравця / оптимальна стратегія визначається з умови шахтіпХгА¥, для гравця 2-з умови тахтіпХГВ¥. Розглянемо бімагричну гру двох осіб [25; 45]. Визначення 7.15. Стратегію (Х*, ¥') називають стратегією рівноваги, якщо для УХ' * X* УК' # ¥* і виконуються такі нерівності: Х*ГА¥* і Х*ГА¥’; Х^ВГ £ Х*ГВ¥. Теорема 7.5. Кожна біматрична гра має хоча б одну стратегію рівноваги. Під час біматричної гри двох осіб за відсутності коаліцій гравець 1 на- магається максимізувати свій виграш: тах тіл Хг А¥ = и; * у цього прагне також і іравець 2: тахтіпХгВ¥ = V . 9 » Нехай X та ¥ - довільні змішані стратегії обох гравців. Нехай іравець 1 вибирає і-ту чисту стратегію-рядок А,, тоді його виграш А,¥. Введемо величину с, =тах{0;А,¥-ХгА¥}. Нехай гравець 2 вибирає свою стратегію В/( тоді його виграш дорівнює хгвг 317
Введемо величину = шах{О;ХгВ7 - ХГВ¥}. Введемо таке перетворення стратегій: Г(Х,¥) = (Х',Г), де ^=Л+с/; (7.12) 1+5С< = <713> і = 1,т, /= 1,л. Покажемо, що отримані стратегії також є змішаними: м і+£с, м м також £_>>; = = і, 7-І 7-І Тоді справедливе таке твердження [25]. Твердження 7.1. Рівність (Х’,¥’)=(Х,¥) виконується тоді й тільки тоді, коли (Х,¥) - стратегія рівноваги. Якщо (Х,¥) - стратегія рівноваги, то коли гравець / відмовиться від неї, то його виграш зменшиться, тобто А,¥ £ ХГА¥, V/=1,/я. Те саме справедливе й для іравця 2, тобто ХгВу£ХгВ¥, ¥/=1,л. Звідси с, = 0 для довільного і та = 0 для довільного/ 318
Тоді з виразів (7.12) та (7.13) отримаємо = хр¥ітау] =УІ,'^І- Припустимо, що (Х,¥) не є стратегією рівноваги, тоді існує таке X, для якого виграш буде більший: Х*А¥ > ХГА¥, Оскільки X=[*<] - не змішана стратегія, то існує таке «і, що Ал¥ > ХГА¥ (знайдеться така чиста стратегія, X + с за якої виграш буде більший). Звідси с. #0 й /л = а „ 0 * хп- і+Ес, 1-і Аналогічно, якщо ¥ не є стратегією рівноваги, то існує таке ¥, що ХГВ¥ > ХГВ¥. Оскільки ¥ - це суміш чистих стратегій, то існує таке /і, що ХгВу1 > ХГВ¥. Звідси випливає, що # 0 та у’^ * у. Перетворення Т у (7.12) відображає відрізок [0;1] в аналогічний відрізок [ОД] (рис. 7.5) Це означає, що існує точка, яка відображаєтьсясама в себе, а оскільки відображення Т є неперервним і замкненим, то за теоремою Брауера про нерухому точку існує така точка 3(Х,¥) що: Г(Х,¥) = (Х',¥')=(Х,¥). А це і є стратегія рівноваги. На відміну від ігор з нульовою сумою, якщо (Х',¥') - одна стратегія рі- вноваги, а (Х',¥*) - друга стратегія рівноваги, то стратегії (Х',¥") і (Х’,¥') не є стратегіями рівноваги. Приклад 7.8. Розглянемо біматричну гру з матрицею Г(4;1) (0;0) 1(0;0) (1;4) . Очевидно, що (Х' = [1;0} ¥’ = [1;0]) - перша стратегія рівноваги, а (X*=[0;1] ¥* = [ОД ]) - друга стратегія рівноваги. Але водночас (Х',¥*) і (Х*,'¥г) не є стратегіями рівноваги. 319
7.6. КООПЕРАТИВНА ГРА ДВОХ ОСІБ. ТЕОРЕМА НЕША Розглянемо випадок біматричної гри двох осіб, в якій гравці можуть вступати в коаліцію, при цьому припускається спільний вибір змішаних стра- тегій, а корисність (частка виграшу) може передаватись від одного гравця до іншого. Потрібно визначити умови такої коаліції. Нехай для обох гравців задано пару функцій корисності та розглядається множина результатів такої коаліції: 5(м,у) - допустима множина результатів кооперації (коаліції); и - корисність першого гравця; V - корисність другого гравця. Розглянемо властивості функції 5*(и,у): - обмеженість (виграші обмежені); - замкненість (точки межі цієї області включені в 5(и,у)). Якщо допустити можливість створення лотерей, а функція корисності лінійна, то 8(и, V) опукла. Зрозуміло, що іравці будуть вступати в коаліцію, коли їх виграші будуть більшими, ніж у разі відсутності коаліції. Нехай (А,В) - біматрична гра. Позначимо: и = тахтіл ХГА¥ - гаран- тований вшраш гравця 1 без коаліції, де = 1; = 1. Гарантований • і вшраш гравця 2: V* = тахтиХГВ¥. Виграш («,у) у разі утворення коаліції має задовольняти таку умову: и^и'; уку*. Нехай 5 - допустима множина результатів кооперації й відомі и та у*, необхідно знайти таку вирішальну функцію <р, яка забезпечить найбільший вшраш кожного гравця <р: <р(5’,м*,у*)=(м,у) - арбітражний розв’язок іри. Цю задачу досліджував американський математик Неш, який сформу- лював такі аксіоми [25; 45]: А1. Аксіома розумності: (м,у) £ (и*,у*). А2. Аксіома допустимості: (н,у) є 5(«,у). 320
АЗ. Оптимальність за Парето. Якщо існує така пара (и’,\Г), що (і/, у*) 2» (м,у) та («', V) є 8(и,и), то (и*, у*) = (ц,у). А4. Незалежність від сторонніх альтернатив. Якщо арбітражне рішення (и,у)є Тс5 і <р(5,м’,у*) = (и.у), то розв’язок гри на меншій підмножині Тзадовольняє умову ф(Ли*>у*) = (м,у). А5. Лінійність. Якщо перетворення Г:(м',у9 отримується із 5 (и, у) за допомогою лінійного перетворення, де + 0,, у*= а2у + 02 та <рС$,і4*’,у*) = (и,у), то <р(£,і/,у') = (і/,у'), які також пов’язують лінійні пере- творення: и =0,14 + 0,; у =а2У+02- Аб. Симетрія. Якщо (и,у)є5 тоді й тільки тоді, коли (у,«)є5 й при цьому їх гарантовані виграші збігаються: и =ч , то також збігаються їх арбітражні виграші и = у . Справедливою є така теорема [25; 45]. Теорема 7.6 (Неша). Існує єдина функція <р, що визначена для задачі про угоди, яка задовольняє аксіоми А1-А6. Доведення цій теореми грунтується на двох лемах. Лема 7.1. Якщо існують такі допустимі результати и>и й у>у* та (ц,у) є 5, то функція Неша вигляду Я(м,у) = (м-«*Ху-у*) досягає свого максимального значення тільки в одній точці (м,у). Доведення. Припустимо, що це не так. Нехай існують дві точки макси- муму (і/, у,) та (и',И) й ці точки різні, тобто: тахя = М = я(и',у9 = £(«', О. Припустимо, що и’>и*, тоді Оскільки множина 5(и,у) опукла, то розглянемо точку - опуклу комбінацію (и,у), де - и'+и* - їҐ+уГ _ 2 ; У = 2’ ("’у)є5- 321
Обчислимо функцію #(и,у): - = [(и,-и*)4-(и,-и*)] [(у*-у )4-(^-у*)]_ (і/ - и^У' - у') («' - «’Х** - V ) . («' - и'Х»' - **) = - 2 —+ ї + 4 1 / Л 1 / • Лі (м'-и’ХИ-у') =“«(«. +“£(«ЛО+——-у—-= 2 2 4 4 тобто отримано точку, в якій значення функції & більше від максимального, що суперечить твердженню про те, що тах = ^(и’,^) = М. Звідси точка (и, у) =агатах#(м,у) є єдиною. Лема 7.2. Нехай 5,м,у мають той самий зміст, що в лемі 7.1, і нехай функція Л(и,у)=(у-у*)і/+(«-«*)у. Тоді, якщо (и,у)є5, то для всіх (и,у)є5 справедливе таке: Л(«,у) £ Л(«,у). (7.14) Доведення. Припустимо, що це не так. Нехай існує (я,у) таке, що Л(і/,у)>й(м,у). Візьмемо деяке єє[0;1] й оберемо точку (и,у), яка є опуклою комбінацією ((и,у) й («,у)): и = и + є(и-м); у = у +є(у-у). Обчислимо &(и,у)=^(м,у)+єА(м -и; у-у)+є2(и -и)(у-у). Нехай є-»0,тоді ^(м,у)=^(і/,у)+єА(м-«; у-у)+еї(і/-мХу-у)>^(м»у)- (7.15) Отриманий вираз (7.15) суперечить лемі 7.1, оскільки точка (м,у) є точ- кою максимуму. Ця пряма є дотичною до допустимої області рішення: зазначимо, що кут нахилу дотичної 322
У-У и - и Доведення теореми Неша. Припустимо, що виконано умови леми 7.1. Тоді існує тільки одна точка (и,у), яка максимізує функцію Неша #(и,у). Ця точка задовольняє аксіоми А1 і А2 за побудовою. Вона задовольняє також і аксіому АЗ, оскільки, якщо (и,у)2*(и.у) й (и,у)Х(«,у),то #(и,у)>#(и,у); вона задовольняє також аксіому А4, оскільки, якщо вона максимізує &(«,*) на мно- жині 8, то тим більше вона максимізує цю функцію і на меншій множиш Т. Аналогічно, вона задовольняє й аксіому А5, бо якщо и' = а,а + Р! і у*=сцу+Р2, то $(«'.*') = {[«’ - (сци*+р, )](✓ - (а2и* + р2)]} = а,а2^(м, у). Звідси випливає, що якщо (и,у) максимізує функцію #(м,у), то яОДу')=тах#(и',у'). Крім того, вона задовольняє й аксіому Аб. Отже, видно, що точка (м,у) задовольняє шість аксіом Неша. Тепер потрібно показати, що ця точка є єдиною, і вона задовольняє усі аксіоми. Розглянемо множину £/ = {(«, у): й(«,у)£Л(«,у)} .згідно з лемою72 8с.І/. Введемо деяке лінійне перетворення: и-и у-у тоді в перетворених координатах и'=1 та у'=1. Запишемо рівняння (7.14) у перетворених координатах: Т = {(«',у*): м'+у^г}, м'2:0, V 2:0, й крім цього, м” =у“ =0, тобто маємо дві додаткові одиниці корисності, які розділені між гравцями (рис. 7.6). Унаслідок симетрії « = у, тому маємо єдиний розв’язок: и' = ? = 1. 323
Припустимо, що умови леми 7.1 не виконуються, тобто не існує точки (и,у)є5, для якої и>и,у>у. Враховуючи опуклість множини 5, якщо існує точка (м,у) є 5, для якої и = и, к у > у*, то за (м,у) візьмемо точку в 5, яка максимізує у за обмежень и = и. Згідно з лемою 7.2, якщо межа множини 5 гладка (тобто вона має дотич- ну в точці (м,у)), то пряма, на якій функція Л(и,у) постійна, є дотичною до 5 у цій точці. Але нахил дотичної до межі множини 5 у довільній точці є відно- шенням, в якому корисність може передаватися від одного гравця до іншого. Інакше кажучи, схема Неша стверджує, що додаткова корисність повинна ділитися між гравцями в такому ж відношенні, в якому вона повинна пере- даватися. А оскільки не передбачається, що корисність лінійно трансфера- бельна, то в загальному випадку молю існувати лише одна точка, в якій ко- рисність передається у цьому співвідношенні (рис. 7.6). У випадку лінійної трансферабельної корисності завдання ставиться простіше. Справді, можна припустити (змінивши за потреби шкали корис- ності), що відношення, в якому додаткова корисність може передаватися від одного іравця до іншого, буде таким: 1:1. Отже, 5 містить усі точки, які ле- жать на деякій прямій и'+V=К або нижче за неї, де Я - максимально мож- лива корисність, яку ці два травці можуть отримати спільно і, разом з тим, вище і правіше за точку (і/,у*) (рис. 7.7). Розв’язком Неша буде така точка (и,у): у‘)+*. и‘)+* 2 2 Додаткові одиниці корисності діляться навпіл між обома учасниками: 324
. - . Л-(и’+у*) . - . Л-(и*+у‘) Ди = и-и =------'------'• Ду = у-у =----'-----; 2 2 - . - . Л-(м’ + у‘) Дт] = и-и = у-у =------- Стратегія погроз. Основним недоліком розглянутого вище підходу є те, що стратегія Неша не враховує можливостей стратегії погроз, однак внаслі- док різних ситуацій один із гравців може опинитися у більш вигідному становищі й шантажувати іншого гравця щоб отримати більший виграш. Роз- глянемо приклад. Приклад 7.9 (ситуація «продавець проти покупця»). Нехай продавець має товар, який швидко псується, і він хоче якомога швидше його продати. Продавець має такі стратегії: а=1- продати за високою ціною товар, с, = 10і грн; а=2 - продати за низькою ціною товар, с2 = 500гри; а = 3 - не продавати товару. Покупець має свої стратегії: Ь=1 - заключити угоду; Ь-2 -відмовитися від угоди, при цьому вія має заплатити штраф 20 грн. У випадку а = 3 збиток продавця становить 200 гри, а у випадку Ь = 2 збиток покупця становить 20 грн. Платіжна матриця (А. В) матиме вигляд А (800;100) (-200;-20) (300-.600) (-200;-20) (-200*)) - З матриці видно, що можливе шантажування з боку другого гравця, ос- кільки, обравши другу чисту стратегію 5}, він несе маленький збиток, а пер- ший гравець - великий збиток. Урахувавши стратегію погроз, Неш запропонував таку трикрокову схе- му розв’язання: - перший гравець пропонує свою стратегію погроз X/, - другий гравець пропонує свою стратегію погроз 325
- вони торгуються між собою і намагаються знайти компромісний розв’язок - укласти угоду. Якщо укласти угоду не вдається, іравці мають ре- алізувати свої стратегії погроз. Пошук рішень. Якщо діє механізм погрози і іравці не домовились, то ви- трат обох гравців складає [25]: 1/, = Х>¥,; Г, = Х>¥,- Стратегія першого гравця є такою: І/ = 1/, -»шах, аналогічно стратегія другого гравця: ¥= К7-»тах. За наявності погроз функція Неша матиме вигляд Справедливі такі теореми для випадку дії погроз [45]. Теорема 7.7. Кожна біматрична гра має хоча б одну точку рівноваги у стратегії погроз. Цю теорему доводять аналогічно теоремі про звичайну біматричну тру. Теорема 7.8. Якщо (х'.у’) і (х*,у*) - дві ситуації рівноваги у стратегіях погроз, то і (х'.у*) і (х*,У) - також ситуації рівноваги, при цьому виграші гравців збігаються. Доведення цій теореми аналогічне доведенню теореми для гри з нульо- вою сумою. Постає питання, як знайти оптимальні стратегії за наявності погроз. Відповідне рішення залежить від вигляду межі 5(н,у), але завдання спро- щується, якщо припустити, що корисність лінійно трансферабельна між дво- ма гравцями. У такому разі можемо вибрати такі шкали корисності, за яких корисності між гравцями передаватимуться у відношенні 1:1. Тоді застосу- вання цієї теорії дає таке рішення (арбітражна ціна для точки Неша) [25]: як- що Я - загальна кількість одиниць корисності, то арбітражна ціна ->л;(а-в)у,^. аі6) (7.17) 326
Неважко побачити, що: Х'(А - В)¥л - виграш гравця 1 з матрицею (А - В); Х'(В - А)¥, - виграш гравця 2 із матрицею (В - А). Отже, щоб знайти стратегії погроз, потрібно знайти рішення гри із нульо- вою сумою з матрицею (А - В). Тоді рішення бімагричної кооперативної гри за наявності погроз визначають так: - знаходимо (Х7,¥7) в задачі тпахтіпХ(А-В)¥; - знаходимо величину К; - обчислюємо виграші іравців у випадку дії погроз и, та V, згідно з вира- зами (7.16) та (7.17). Дрмкмд 7.10. Розглянемо бімаггричну тру, яка задається матрицею (А, В): (А,1»/(<У0) <-^1. Ц-з>0 №4) ) Знайти розв'язок бімагричної три для таких випадків: - за відсутності коаліції знайти найкращі стратегії обох гравців і відпо- відні виграші; - у кооперативній грі двох осіб визначити доцільність створення коаліції та знайти точку Неша; - перевірити вплив ДІЇ погроз, визначити арбітражний розв’язок у разі дії погроз і порівняти з точкою Неша. Розв’язок. Знайдемо гарантовані виграші обох гравців за відсутності коаліцій. Для гравця /: м* = тахХгА¥; £х,=1;Х,£0,І = 1,ія, і тахи за умов 6л^-3д^=и; -1х1 + 8х2=и; хі + х, = 1; 7х,-11^ = 0. 327
м ... 11 7 . 45 5 Знайдемо оптимальні змішані стратеги: х1 = —; х, = —; и = — = -. 1о 1о 1о 2 Для гравці 2: за умов у =пмхХгВ¥; тах у ІОУі-4у2 = у, -1Уі+4Уї = у; л+я-і; Уі.УїЖ 11у,-8у2 = 0. Знайдемо оптимальні змішані стратегії: у, = А- =11- 19’Л“19’ у = — «1,895. 19 Вважатимемо, що маємо гру з лінійно-трансферабельною корисністю. Оскільки для двох стратегій рівноваги ^ = [1;0], у, = [1;0] та ^ = [0;1], у2 = [0; 1] суми виграшів не однакові (6 + 10*8+4), то перепорюємо масштаб по осі у:у'=аг так, щоб корисності гравців ділилися і передавалися у відношенні 1:1: 6+10а = 8+4а, звідси ба = 2, а=1. З У перетворених координатах матриця (А,В*) така: Побудуємо область допустимих рішень «натягнувши» лінійну оболонку на точки, які відповідають чистим стратегіям (рис. 7.8).
Знайдемо точку Неша: - = (и- у)+К = (5/2)—(12/19)-(28/3) = 2,5 - 0,6315 + 9,333 2 2 2 ’’ (¥**-«*)+ К „ ___ '---------- - з 733. 2 - у/ У вихідних координатах V = — = 3-3,733 = 11,197. а Оскільки точка N виходить за межі допустимої області 5(и,у), то за точ- ку Неша обираємо найближчу точку допустимої області, - це точка С, отже, точка Неша буде такою: и = б; V=10. Знайдемо стратегії гравців в умовах дії погроз. Будуємо матрицю (А - В'): ’ 8 1 ‘ (А-В*) = 3 3 . 8 20 . З 3. Знайдемо розв’язок антагоністичної гри для гравця 1: шахи; 8 8 1 20 -х. +—х,=и; 3^ 3 7 28 3х* З 4 5 1 24 8 м = — = - 5 15 5 8 тоді, Х'(А - В)¥7 = - і знаходимо точку Неша з урахуванням погроз: 2 2 2 . - А •« е. ТОДІ У= =11,6. а 329
Оскільки ця точка знову виходить за межі допустимої області, то по- трібно вибрати найближчу до неї точку в допустимій області на відрізку СО. Неважко побачити, що це та ж сама точка (и=б; V = 10). 7.7. Ігрові моделі прийняття рішень в умовах невизначеності Моделі та методи прийняття рішень у конфліктних ситуаціях в останні роки широко застосовують у задачах прийняття рішень в економіці в умовах дії конкуренції. Теоретичною основою пошуку оптимальних стратегій є тео- рія ігор як антагоністичних, так і неантагоністичних, зокрема її розділ - тео- рія кооперативних ігор. Пошук оптимальної стратегії в умовах можливої кооперації поміж гравців оснований на теорії Неша, зокрема на пошуку найкращого компромісного рішення - точки Неша. Проте цей класичний під- хід грунтується на припущенні, що іравці мають повну інформацію про стан навколишнього середовища. Таким чином, рішення приймається в умовах достовірної інформації про платіжні матриці А та В. Проте на практиці такої спрощеної ситуації, зазвичай, не спо- стерігається, а іравці приймають рішення в умовах неповної та недостовірної інформації відносно платіжних матриць. Отже, розглянемо та узагальнимо теорії кооперативних ігор двох осіб у ситуації, коли немає повної та дос- товірної інформації про платіжні матриці гравців. Нечітка постановка задачі матричних ігор. Розглянемо спочатку ан- тагоністичні ігри двох осіб в умовах невизначеності [28]. Нехай є два гравці з протилежними інтересами, які породжують антагоністичну гру двох осіб з нульовою сумою. Нехай матриця гри є нечіткою: А=||а#||, і = 1,т, у = І.л.де а* - виграш першого гравця (програш другого) є нечітким числом з відомою ФН р(а#). Потрібно визначити оптимальні стратегії обох іранців. Позначимо через X=[*,], і = 1,т змішану стратегію іравця /, а через V=Гу.],1 = 1." - відповідну стратегію іравця 2 так, що 330
МІ у,ш Іу/=1 /-і Аналогічно, яків чіткій матричній грі двох осіб, введемо очікуваний ви- граш гравця 1 - К(х,у) = ХгА¥, який є нечітким числом. Маємо нечіткий аналог теореми про мінімакс. [28]: нечітка нижня ціна гри двох осіб V/ дорівнює нечіткій верхній ціні гри у2 та дорівнює ціні гри: тах тіл Хг А¥ = тіп тах Хг А¥, де А - нечітка платіжна матриця. Запишемо нечітку задачу іравця І як задачу ЛП з нечіткими параметрами [28]: таху (7.18) заумов А^иїг } = 1,п, (7.19) £х,=1, (7.20) 1-І х,£0, (7.21) Щоб знайти максимізуючу стратегію Х°, яка не домінується зі степенем а, запишемо додаткові умови: ц(а¥)^а, і = їт, 7=Ей. (7.22) Розв’язавши нерівності (7.22), можна знайти нижню та верхню межі ін- тервалу рівня а, так що а* є[а^;а^]. Задача (7.18}-(7.21) є задачею параметричного програмування, всі рі- шення цієї задачі лежать між розв’язками задачі «песиміста» [28]: таху( за умов Ч. У = 1.". МІ £*і=і» м ________ х,£0, і=1,т, 331
та розв’язками задачі «оптиміста»: таху( за умов £а“ х, £ур _/ = 1,л, м їл=1 м х,£0, і=1.т. Позначимо через Х£ оптимальний розв’язок задачі «песиміста», через - «оптиміста» відповідно, у,, - нижня ціна три для задач «песиміста» та «оптиміста» відповідно. Тоді всі множини оптимальних змішаних страте- гій гравця 1 для рівня а можна записати так: Х°=*Х2+(1-*)Х“, Де*є[0;1]. Виграш гравця 1 (нечіткий) визначається так: у, є Лу^+(1-і)у^. Аналогічним чинена можна побудувати та розв’язати нечітку задачу ЛП для гравця 2, при цьому, якщо позначити через уи та у,, нижню та верхню межі ціни три для гравця 2 у задачі «песиміста» та «оптиміста», то отримаємо такі варіанти нечіткої теореми про мінімакс: у1£=у2ж, у1в =у2і. Кооперативна біматрнчна гра двох осіб у нечітких умовах. Розгля- немо постановку біматричної гри двох осіб в умовах невизначеності [28]. Нехай є два гравці: гравець 1 із платіжною матрицею А = |о#||, і = 1,лі,у = 1,л та гравець 2 із платіжною матрицею В = ||^||, при цьому матриці А та В є нечіткими, де а, - нечіткі числа з ФН ц(ау); - не- чіткі числа з ФН у(Ь9), відомими гравцям. Кожний із гравців може вибирати стратегію незалежно. Позначимо че- рез и гарантований виграш гравця 7, а через у* - гарантований виграш грав- ця 2 поза коаліцією, де і/та у* є нечіткими числами: и є [і£;и“], у* є [і^;у“], де «2, и“, - розв’язок задачі «песиміста» та «оптиміста» рівня а для гравця 7; у?, - розв’язок задач «песиміста» та «оптиміста» рівня а для гравця 2. 332
Розглянемо випадок, коли гравці можуть вступати в коаліцію для отримання більших виграшів. Потрібно знайти найкращі стратегії їх поведінки в нечітких умо- вах. Позначимо ці рішення через и та V. Нехай 5(и,у) -множина вихідних резуль- татів (виграшів) коаліції в нечітких умовах. Ця множина зяютеня, тя, крім того, як- що припустити можливість лотереї, вона випукла. Потрібно знайти таку вирішальну функцію <р(5;и*;у*;а), и*> ;у )» де (и ;у ) - найкраще ком- промісне рішення для іравців 1 та 2 в коаліції рівня а (точка Неша для нечпкої три). Справедливі такі аксіоми для (и ; V ), які є аналогами аксіом Неша для чіткого випадку: А1. Аксіома допустимості: (и ;у )є5(н;у;а). А2. Аксіома розумності: и £и*“, V £у*“. АЗ. Аптимальність за Парето: якщо існують и°£иа, у°2у , то и* =и , у’=у -точкаНеша. А4. Аксіома лінійності: якщо перейти до нової системи координат і/ = к,м+Р1,у'=Х,у+р,, де Х|>0, Х,>0 й «"=1,1/+ Р, та у" = Х2у*+Р2, тоді для нечіткої точки Неша в нових координатах и = Х]м+рітау =Х2у+Р2. А5. Аксіома симетрії: якщо (у,и)є5 тоді й тільки тоді, коли (и,у)є5 та и =у*, то и =У . Справедлива така теорема. Теорема 7.9. Нехай Зи, и>и", Зу, у>у*, тоді існує сімейство разе ’язків и .V , на якому досягається максимум функції Неша: £„(«, у)=(и - и’Ху - V*) -> шах, де (и*,у*)є5(и,у);(у,и)є5(и,у). Функція £х(м,у) є нечіткою і залежить від нечітких параметрів (и’,у’). Відповідно до принципів узагальнення Заде-Орловського [25] її ФН у (и’,у‘)= шах тіп{р(и*);р(у*)}. 333
Аналогічно до нечіткої антагоністичної гри двох осіб можна записати відповідні задачі «песиміста» та «оптиміста»: а) задача «песиміста»: тпах#(и, V) = тах(и - ~ ¥'і°) за умови (и,у)є£(и,у); б) задача «оптиміста»: тпах#(м,у)=тах(и -и7*Ху ~К") за умови (и,у)є5(и,у). Д ш задач з лінійно трансферабельними функціями корисності гравців мож- на знайти аналітично найкраще компромісне рішення - нечітку точку Неша [28]: а) для «песиміста»: =«-уГ)+*2. й=(уГ-«Г)+Д;. 2 2 б) для «оптиміста»: _(иГ-уГ)+А,*. -• ’ 2 ’ ' 2 Врахування впливу погроз. Розглянемо нечітку біматричну коопера- тивну тру двох осіб із врахуванням дії механізму погроз. Як відомо, у звичайній біматричній грі двох осіб (у випадку три з лі- нійно трансферабельною функцією корисності), щоб знайти точку Неша у разі дії погроз необхідно розв’язати антагоністичну гру двох осіб з матриця- ми А та В та знайти тпах тіл ХГ(А -В)¥. Для нечіткої три з нечіткими матрицями А та В можна, використавши результати підрозділу 7.3 для нечіткої антагоністичної три, знайти підмно- жину рівня а: А* та В", й розв’язати відповідні задачі: - задача «песиміста»: тпахішпХг(А’ -В*)¥; - задача «оптиміста»: тахтіп ХГ(А* -В*)¥. 334
Позначимо відповідні розв’язки задачі «песиміста» як та «оптиміста» як {х^;. Тоді можна знайти найкраще компромісне рішення біматричної гри з урахуванням погроз у нечітких умовах (нечітка точка Неша) згідно з такими співвідношеннями [28]: - для задачі «песиміста»: х;(а;-в;>¥х+к;; -х;(а;-в;)ух+к;; - для задачі «оптиміста»: -« _ Х^,(А° -В“)¥„ + -------------- ; -« ХЧВ“-А")¥ +Я“ ” 2 Приклад 7.11. Вирішити нечітку біматричну гру з такою матрицею (А, В): (*.В).[<,;,2) <-4;2)1, |_(-2;4) (15;10) де аИ,ЬИ, - нечіткі числа з ФН и(а.,) =-* _ _ та у(6в) =---~ ' * * І + ^-а,)2 1 + (^-М2 відповідно. Для цього потрібно: 1) у біматричній грі у коаліції знайти гарантовані виграші обох гравців рівня а=0,5; 2) дослідити ефективність утворення коаліції та знайти компромісний розв’язок (теорема Неша) рівня а: {и“;у“} та 3) в умовах дії погроз знайти найкращий компромісний розв’язок <Уу',Уу) та порівняти із розв’язками (и ;у ) без урахування погроз. Розв'язати. Знайдемо інтервали рівня а = 0,5 для нечітких виграшів а* та Ьу: - ----=---і0,5->(^-а»)251; -а»І£1; = а» -1 £ $ а» +1== б» -1 £ +1=. 335
Отже, отримано дві матриці нечітких виграшів рівня а=0,5: - для задачі «песиміста»: (А£,В£) - для задачі «оптиміста»: (А.,В.) (-5;1)1 (14;9)]' (-3;3)‘ (8;11) ,(-3;3) (10;13) Знайдемо гарантовані виграші обох іравців без коаліції (и*;у’) : а) для задачі «песиміста»: -задача іравця 7: и£->шах; 8хі-Зх2=и£; -5х1 + 14х2=и£; дц + х2=1; 13хІ-17х2=а, 17 13 . 8 17-3 13 136-39 __ ЗО ЗО 1 зо зо -задача іравця 2: у£->шах; ііл+1ишп; Зуі+9у2=*г; Уі + Уі=Ь У1*% 8Уі-8у2=0; Уі = у2 = ~; <=6, отже, для задачі «песиміста» гарантовані виграші гравців рівня а=0,5, =3,2, «2=6; б) для задачі «оптиміста» складемо: -задача іравця 7: и„ —>шах; КЦ-х^и,,; -Зхі + 16х2=ии; дц + х2 = 1; „ 17 13 . 1017-13 157 __ 13х.-17х,=0;х =—;х,=—; и„ =-----------= ——=5,2; -і -2 ,-і 3(), -2 30» . 30 30 336
- задача гравця 2: ув—►птах; 13Уі + ЗУї=К; 5>і + Иу2=у,; Уі+Уї=і; у,£0; у2£0; «л -*Уі = 0; Уі=Уг=< = « Отже, для випадку «оптиміста» виграші без коаліції и* = 5,2; у* = 8. Знайдемо виграші гравців у коаліції для випадку «песиміста». Оскільки 8+11*14+9, то знайдемо таке перетворення координат у' = ау, для якого сума виграшів гравців для обох стратегії рівня а=0,5 буде однаковою: 8+11а = 14+9а->2а=6, а=3. МИ1ВД(ЛЛ)-[®Й» (-зд1. 1 и [(-3;9) (14;27)] Отже, загальна корисність, що поділяється обома гравцями, =8 + 33 = 41 та у[ = ау[ = 3-6 = 18. Знайдемо точку Неша для задачі «песиміста»: -для гравця 7: - _ = 3,2-18+41 _ 13. 1 2 2 -для гравця 2: —' (у’-и,)+Я, 18-3,2 + 41 .о — V, 28 _ _ у, =—-----4---4 =-—'------«28 та у, = 4 = ®9,3. 1 2 2 1 а З Для випадку «оптиміста» знайдемо масштабний множник 10 + + 13а=16+11а->2а=6, а=3. Тоді матриця гравців матиме такий вигляд: "(10,39) (-3;9)" _(-1;15) (16,33) * Загальна корисність, що поділяється гравцями, 7^=10+39 = 49 та •9 • ги =ау,=24. 337
Точка Неша для задачі «оптиміста» буде такою: ~ = (<<ї*А = 5.2-24+49 • 2 2 (К“«2) + ^ 24- 4,86+ 49 • 2 2 , - V. 33,9 у початкових координатах виграш гравця 2 становитиме V, = — = ——- * 11,3. а З Отже, нечіткі виграші рівня а=0,5 у коаліції гравців такі: йє[13;15]; у є [9,3; 11,3]. Розглянемо тепф дію погроз і знайдемо виграші гравців. Для задачі «песиміста»: Г-25 -8 А‘ £“ -12 -13 ’ шахи; 8 221 18 18 =-12,6, тоді виграші гравців з урахуванням погроз: -для гравця 7: - -12,6+41 28,4 “*----г-----Г’МА - для гравця 2: * 2 а З Оскільки их > и£ , а ух < у£ > то механізм погроз корисний для гравця 7. Для випадку «оптиміста» маємо таку матрицю: А.-В' -29 -16 -12 -17 338
Розв’язуємо задачу антагоністичної гри для іравця 1: шахи,; -29*!-ІбХз =иг; і -17 18’ 18 12 289 -ЗОЇ « =----------=-----= —16,6, ' 18 18 18 тоді виграші іравців з урахуванням дії погроз становитимуть: - для гравця 7: -16,6+49^32,4 2 2 -для гравця 2: 32.8 та в початкових координатах V,. = -у-=10,9. Очевидно, що як у випадку «песиміста», так і у випадку «оптиміста», и^>ия та V,. < V,. Отже, механізм погроз більш вигідний для гравця 1. Нечіткі виграші гравців у коаліції з урахуванням дії погроз (рівня 0,5) перебувають у таких інтервалах: и, є[14,2;16,2]; у, є[8,9;10,9]. Запитання для самоконтролю 1. Д айте визначення позиційної гри. 2. Назвіть основні компоненти гри. 3. Дайте визначення нормальної форми три. 4. Дайте визначення стратегії рівноваги. 5. Що таке гра з нульовою сумою? 6. Сформулюйте властивості стратегії рівноваги для антагоністичних ігор двох осіб. 7. Що таке нижня ціна гри, верхня ціна гри? 8. Д айте визначення чистої та змішаної стратегії грн. 9. Сформулюйте теорему про мінімакг. Дж. фон Неймана. 10. Викладіть графоаналітичний метод розв’язання ігор 2 *п та т *2. 11. Що таке біматричні ігри? Сформулюйте й доведіть теорему про рівноважні стра- тегії для бімагричної гри. 339
12. Сформулюйте аксіома Неша та дайте їх інтерпретацію. 13. Сформулюйте теорему Неша та поясніть П зміст. 14. Поясніть механізм урахування погроз у коопсрвіавній теорії Неша. 15. Які властявості мас точка Неша? Які співжідвсжаеяня виконуються а точці Неша? 16. Д айте визначення лотерей, поясніть їхні властивості. 17. Сформулюйте нечітку теорему про мінімакс та порівняйте П з теоремою про мінімакс Дж. фон Неймана. Задачі для самостійного розв'язання Задача 7.1. Знайти розв’язок біматричної гри (А, В) для таких випадків: - у разі відсутності коаліції знайти найкращі стратегії обох гравців і відповідні виграші* - у кооперативній грі двох осіб з’ясувати доцільність створення коаліції та знайти точку Неша; - перевірити вплив дії погроз, визначити арбітражний розв’язок у ви- падку дії погроз і порівняти з точкою Неша: /АВІ=Г (3:9) (2ї"2)‘ 1 ' |_(-1;-3) (12;3) ’ Задача 7Л. Знайти розв’язок біматричної гри (А,В) для таких випадків: - у разі відсутності коаліції знайти найкращі стратегії обох гравців і відповідні виграші; - у кооперативній грі двох осіб з’ясувати доцільність створення коаліції та знайти точку Неша; - перевірити вплив дії погроз, визначити арбітражний розв’язок у разі дії погроз і порівняти з точкою Неша: ґав1=Г(4;6) 0ї4)‘ ( > [(-3;1) (8;4) ’ Для антагоністичної три двох осіб із матрицею А записати відповідні ЛП- задачі для визначення оптимальних стратегій гравців і знайти їх стратегії: 2 3 16 5 4 3 2/ 340
Задача 13. Знайти розв’язок біматричної гри (А,В) для таких випадків: - у разі відсутності коаліції знайти найкращі стратегії обох гравців і відповідні виграші; - у кооперативній грі двох осіб з’ясувати доцільність створення коаліції та знайти точку Неша; - перевірити вплив дії погроз, визначити арбітражний розв’язок у разі дії погроз і порівняти з точкою Неша: (АВ)=[(6;10) ("1;-4)' ( > [(-3;-1) (8;4) ' Для антагоністичної три двох осіб із матрицею А записати відповідні ЛП-задачі для визначення оптимальних стратегій гравців і знайти їх: а_Г5 6 3 2 1' “[1 2 4 5 7' Задача 1А. Знайти розв’язок біматричної гри (А, В) для таких випадків: - у разі відсутності коаліції знайти найкращі стратегії обох гравців та відповідні виграші; - у кооперативній грі двох осіб з’ясувати доцільність створення коаліції та знайти точку Неша; - перевірити вплив дії погроз, визначити арбітражний розв’язок у разі дії погроз і порівняти з точкою Неша: (а,в)=Г(8;4) <*5 * } ІМ;і) (4;Ю)] 341
8. ОСНОВИ ТЕОРІЇ КОЛЕКТИВНОГО ВИБОРУ. КООПЕРАТИВНІ ІГРИ п ОСІБ У попередньому розділі було розглянуто задачі прийняття рішень в умо- вах протидії або в конфліктних ситуаціях, коли є два учасники (гри), інтереси яких не збігаються, причому можливі два випадки, коли їх інтереси повністю протилежні (антагоністичні ігри), або вони можуть вступати в коаліцію та шукати компромісне рішення. Проте такими випадками конфліктні ситуації не вичерпуються, на практиці досить часто трапляються задачі прийняття рішень, коли кількість учасників більше двох і їх інтереси не збігаються. От- же, потрібно приймати колективні рішення. Теоретичною основою таких рішень є теорія колективного вибору, що грунтується на понятті колективної корисності, та теорія кооперативних ігор п осіб. 8.1. Принципи розподілу корисності Розглянемо загальний випадок: є л учасників (членів) системи прийняття рішень, кожний з яких має свою функцію корисності, тоді корисність колек- тиву описується вектором У=[«і>«2....•••» «.]. де и{ - корисність і-го індивідуума. Виникає запитання: як порівнювати різні вектори корисності між собою? Відомі два різні підходи до такої оцінки. 1. Принцип егалітаризму, який визначає корисність колективу за ко- рисністю найбіднішого учасника [41]. Тоді корисність набору ІГ,(17) = тш{и,}. Потрібно знайти такий розподіл, для якого В^(1/) = шіп{и,}-> шах. 2. Принцип утилітаризму, який визначає корисність колективу як сумарну корисність усіх учасників: ^(£/) = Еиі_>тах- 342
Приклад 81. Розпиваю задачу про поділ пирога. Є два брати, які праг- нуть розділити між собою пиріг, причому перший брат удвічі більш голодний, ніж другий. Припустимо, що довжина пирога дорівнює одиниці й функції ко- рисності обох братів м,(х) і и2(х) є монотонно зростаючими і вгнутими. Потрібно щонайкраще розділити пиріг між братами, користуючись принципами утилітаризму й егалітаризму. Позначимо через х частку пирога, що віддається першому братові. При цьому и,(х) = 2и,(х). Оптимальний розподіл на основі утилітаризму ш«{и1(х)+м2(1-х)}. Це задача вгнутого програмування. Її розв’язок отримаємо з умови «’(х)-иі(1-х)=0. Оскільки ц(х) = 2и,(х) й и'(х) убуває (не зростає зах), маємо <(*’) = | «'(1-х*) -> «,'(**) < <(1 - х‘). (8.1) З виразу (8.1) випливає х* > - . Отже, класичний утилітаризм віддає більший шматок голоднішому братові, який робить більший внесок у суспільний д обробут, що добре зрозуміло. На противагу цьому, принцип егалітаризму компенсує другому братові знижений апетит, виділяючи йому більший шматок пирога, ніж першому братові. Справді, егалітарний розподіл випливає з умови и, (х) = и2 (1 - х) -> -» и,(х) = |и,(1 -х), де 0 5 х і 1. Звідси м,(х) < и,(1 -х) й, отже, х < -. 2 2 Визначення 8.1. Вектор У' називають упорядкованим лексимінно, якщо виконуються такі умови: и1 і и’2 5... 5 и’, і им і... і и„. Визначення 82. Розглянемо два вектори У та V, які впорядковані лексимінно. Іш Вектор У лексикографічно переважає вектор V, У >- К, якщо виконується умова и\>и\. 343
Визначення 83. Нехай компоненти векторів V та Увпорядкоеяйлекааанно, тоді вектор V називають кращим за вектор V, якщо виконуються такі умови: иі“*і.................та«*+і >П+і................... або __ и, = у„ і = 1,£; и, >у„ і=к+1. Визначення 8.4. Вектор V = (м() називають оптимальним за Парето, якщо не існує такого вектора У = («,), що виконується умова (У IV), (8.2) причому хоча б одна з нерівностей (8.2) (хоча б для одного і) буде строгою. Визначення 8.5. Вектор С7 = (м,) слабко оптимальний за Парето, (тобто (У »- (/) на деякій множині 5(С7)» якщо не існує такого У є 5, що для всіх компонентів V, >и„ VI. Розглянемо егалітарну функцію корисності: И^(С7) = пип{и,}. Введемо позначення: 5, - множина розв’язків завдання 1У,(Ц)- =пііп{и,}->піах. < ' иая Справедлива така лема [40]. Лема 8.1. На множині 5, усі вектори будуть слабко оптимальними за Парето й існує хоча б один вектор, який буде оптимальним за Парето. 8.2. Порядки колективного добробуту Функції колективної корисності та їх властивості. Для того, щоб по- рівнювати між собою вектори корисності, потрібно ввести деяке відношенні переваги. Розглянемо деяку множину 5(17) > Де ОДО с • Уведемо відношення К а 5м х Е*"’ між векторами корисності й назвемо це відношення порядком колективного добробуту (ПКД). Будемо говорити, що І/ й У перебувають у цьому відношенні, якщо між ними існує такий взаємозв’язок: 17>-УІ ЦКУ^ь к И-УІ 344
Інакше кажучи, К -відношення нестрогої переваги, тобто К = Р\Л, де Р - відношення строгої переваги; І - відношення байдужності (індиферентності): ЦРУ++У>У-, ШУ<+и~У. Якщо розглядати вектор У = [м,] за компонентами, то У>У VI,3^ :и(1> >\) Розглянемо властивості порядків колективного добробуту. 1. Анонімність-, якщо переупорядкувати компоненти вектора У = = [ц]=> (му), то відношення порядку не зміниться, а саме: г={у,}->г={уД уку^уку. 2. Одностайність: якщо ЦРУ <-> V >- V, то УРУ', цсУ-пУ' (Кта У') отримані переупорядкуванням відповідних координат. Визначення 8.6. Порядок колективного добробуту В відображається на [Е’хЕ*] функцією колективної корисності (ФКК) Ж(ї/), якщо викону- ються умови [40]: ЦВУ оЖ(С/)^Ж(к); ту *+і?(у)=ір(у). Але не всі ПКД можуть бути подані у вигляді своєї ФКК. Визначення 8.7. Порядок колективного добробуту В слабко відоб- ражається за допомогою ФКК на [Е* х £”], якщо виконуються умови [40]: Ж(С/)>І?(И)=>СИИ; Ж(С/)=Ж(К)=>С7Г, а зворотне співвідношення може не виконуватися. Властивості ФКК: 1. Анонімність: Ж(и„ и2, .... м.)=Ж(м,, и^, .... м,). Вона означає незалежність від перестановки аргументів. 2. Одностайність: якщо ї/ £ У, то У (У) і У (У). Визначення 8.8. Порядок колективного добробуту К називають неп^зервним 345
на 5(1/). якщо дляЧи.Уь 5(1/) й таких, що ПВУ існує такий в околі £, що якщоН'є^Ц) й У'єе(У), то иКУ'. Теорема 8.1. Будь-який неперервний ПКД В слабко подається за допо- могою неперервної ФКК. Визначення 8.9. Порядок колективного добробуту В називають неза- лежним від нуля, якщо для будь-яких векторів И,У,2еЕ’ виконується ияу -»(у+2)я(у+2) Визначення 8.10. Порядок колективного добробуту В називають неза- лежним від масштабу, якщо для будь-яких П,У,2єЕ" виконується ІЛІУ=>(Ц2)к(У2),де Ц2 = {(и, г,)}, і~їіі. Визначення 8.11. Порядок колективного добробуту В називають неза- лежним від загального нуля, якщо для ЧИ, У еЕ’ и X > 0 виконується ПВУ+ ке)К(У + Хе), е = [11...И17. Визначення 8.12. Порядок колективного добробуту В називають неза- лежним від загального масштабу, якщо ЧИ,У єЕ," та X > О виконується ЦВУ <->(ХІ/)Я(ХК). Визначення 8.13. Функцію колективної корисності називають незалежною від загального нуля, якщо: ЧИ, УсЕ? та Х>0: Ж(ї/)^»Г(Г)^ІГ(Хе+ї/)^Ж(Хе+К). Визначення 8.14. Функцію колективної корисності >Г(С/) називають незалежною від загального масштабу, якщо: чи, Кє£1"’та Х>0: Ж(1/)*Ж(Г)оЖ(ХС/)*Г(ХР). Твердження 8.1. Функція колективної корисності Неша не залежить від загального масштабу: Твердження 8.2. Будь-який ПКД, незалежний від загального масштабу, слабко подається за допомогою ФКК Неша. 346
Визначення 8.15. Порядок колективного добробуту Я називають сепа- рабельним, якщо для будь-яких V, V, V, V' таких, що: а) и1 = и'Іг V, = и', якщо і є/; б) иу =уу, =у^, якщо = справедливе таке співвідношення: Інакше кажучи, к цЛ=>к *4,]- Зміст цього твердження такий: якщо виберемо два вектори V та V, в яких частина компонентів різна, а частина однакова, і між ними є відношення Я, то зі зміною однакових значень іншими однаковими значеннями це не вплине на відношення Я. Порядок ПКД є сепарабельним, якщо відповідна ФКК є сепарабельною функцією, тобто де а,(ц) - монотонно зростаюча функція. Теорема 82 (Робертсона) [41]. Припустимо, що ПКД Я є неперервним і се- парабельним порядком на Е*, причому л £ 3. Відтак ПКД Я не залежить від за- гального нуля тоді й тільки тоді, коли його можна подати у вигляді такої ФКК: а) И,(С/)=£У', р>0; (8.3а) 6)^(1/)=-^^, р<0; (8.36) №4 В) Г(С/)=£ц. Порядок колективного добробуту Я не залежить від загального масшта- бу тоді й тільки тоді, коли він подається ФКК такого вигляду: а) 9>0; (8.4а) б)іф)=-£и;, 9<0; (8.46) в) ік(і/)=х;іпі/і. 347
Виникає запитання: чи існує клас функцій, який має одночасно власти- вості незалежності від загального нуля й загального масштабу? Такою фун- кцією є утилітарна ФКК: 1-1 Якщо покласти для (8.36) та (8.46) р -> -со й ц -> -со, то отримаємо на межі лексимінний ПКД. Приклад 8.2 (задача гро поділ продуктів). Два агенти отримують загальний подарунок, в який входять а одиниць продукту А та Ь одиниць продукту В. їм потрібно поділити цей подарунок між собою. Обидва агенти мають лінійні переваги, але з різними граничними коефіцієнтами заміщення. Нехай їхні функції корисності такі: “(ЦЛ) = 2°, +*.; Щ(аігЬг) = аг+2Ьг. Зауважимо, що як нуль корисності обрано нуль-розподіл (иі(аі, Ьі) = 0; и2(а2, Ь2) = 0). Необхідно знайти найкращий розподіл пари продуктів аь Ьі такий, що аї+а2 = а,Ьї^-Ь2 = Ь. Максимізуючи ФКК Неша на допустимій множині, оберемо оптималь- ний за Парето розподіл, використовуючи суто порядкові міркування. Оптимальний розподіл визначається як розв’язок задачі тахЦ(цЛ) «2(а2.*2) = (2а, + 4)[(а - а,) + 2(Ь - Ь,)]. 04^1* Множину 5 показано на рис. 8.1 допустимих векторів корисності за а= 1,2іЬ= 1. Оптимальні за Парето вектори корисності містяться на відрізку С, Г> за Ьі = 0, тобто Ьі = Ь, і на відрізку ИЕ за аі =а. 348
Залежно від нахилу СЮ, тобто від значення Ь/а, ФКК Неша, лінія рівня якої симетрична щодо бісектриси позитивного ортанта, може досягати мак- симального значення між точками С і £>, у точці О й між точками О і Е. Розглянемо випадок І: Ь£~. 2 Оптимальний вектор корисності міститься на відрізку С£>, оптимальний розподіл такий: а1 = ^(а+2Ь); Ь2=ЬЬ2=Ь. У випадку 2: а^<,Ь^2а, а<2Ь. Оптимальний вектор корисності міститься в точці О, оптимальний роз- поділ а1 = а; а2 = 0; Ь, = 0; і>2 = Ь. Для випадку 3: Ь^2а. Оптимальний вектор корисності перебуває на відрізку ОЕ, оптимальний розподіл Ь, = ~ (Ь - 2а); Ь2 - (Ь+2а); а, = а; а2 = 0. 8.3. Скорочення нерівності в доходах. Принцип передачі корисності Пігу-Дальтона Принцип Пігу-Дальтона полягає в такому: передача частини корис- ності від більш багатого учасника до біднішого, яка не збільшує розриву їх добробуту, не може зменшити їхнього колективного добробуту [41]. Визначення 8.16. Будемо говорити, що ПКД В задовольняє принцип Пігу-Дальтона, якщо для двох векторів II. V таких, що компоненти для кожної пари (і, і) задовольняють такі умови [41]: випливає = V,, і # /,/, к = 1, п; (8.5а) и,+иу=у,+ур (8.56) иІ-и) УВІІ. (8-5в) Строгий принцип Пігу-Дальтона означає, що з (8.5а), (8.56), (8.5в) вип- ливає V >- II, тобто УРН. 349
Інакше кажучи: ПКД Я задовольняє строгий принцип Пігу-Дальтона, якщо кожна передача корисності від більш багатого до біднішого учасника не зменшує (збільшує) їх колективного добробуту. Нехай ПКД К відповідає неперервна й сепарабельна функція корисності: м де а - монотонна функція, що зростає, ккі/=>Еа(и,)^Х“(ч); м м а(ц)+а(иу) £ а(у,)+а(у,). Нехай и,=х, и/=у + г, у( = х+е, У, = у, х<у,тот а(у,)-а(и,)^ а(и7)-а(уу); а(х+є)-а(х) £а(у+є)-а(у), Х/у>х. (8.6) З умови (8.6) випливає, що функція а(х) - увігнута за х. Розглянемо сепарабельні ФКК, які не залежать від загального нуля: 1. Функція - опукла (р>0). м 2. Функція - увігнута ( р < 0 ). Наступні ФКК, незалежні від загального масштабу (шкали), увігнуті: 9<0; М2>и(. І Теорема 8.3. Неперервний і сепарабельний ПКД задовольняє принцип Пігу-Дальтона, якщо його ФКК ^(П) така, що [41] дії(и) дії(и) ди, ди, ‘ ' Доведення. Вибираємо и„ и, такі, що и, < и, й є < (иу -«,) Нехай и' = и, +є; м' =и) -є. 350
Нехай є -> 0 та знайдемо відношення 4 . Де 1]т МР(и) _ ЛГ(и) = 5ІГ(и) ди, д(Р(и) ди/ А,-й> Де ск ди, де ди де (о -і\ = ,ди, =1;^ = -11 = а,Г(и)- ^(и) £ ' дг ’ Зе ди, ди, ди. ди. Вираз (8.7) справедливий для увігнутої функції. Щоб перевірити, чи задовольняє ФКК принцип Пігу-Дальтона, можна використати криву Лоренца. Нехай є вектор V, упорядкований лексимінно: V =[«*,«*,.и'£ и’£....£ . Визначення 8.17. Кривою Лоренца називають вектор Ь(Ц), який визна- чається так [41]: Ь(и)=[«‘, <+«,’» ... Х“<". ••• Е“< ]. де к -та компонента - дохід перших к членів. Визначення 8.18. Будемо говорити, що вектор І) домінує за Лоренцом к # і вектор V, якщо його крива Лоренца Ц11)>Ь(У) (8.6), тобто Уц для кожного к = ї,п й хоча б одна із цих нерівностей строга. Лема 8.2. Якщо вектор V домінує за Парето вектор 11 або він отриманий з V однієї або декількома передачами Пігу-Дальтона, то вектор V домінує за Лоренцом вектор V, тобто якщо V >-11 за Парето, то ЦІЇ) > ЦУ). 8.4. Кооперативні ігри л осіб з розподілом витрат і прибутків. Ядро гри Нехай маємо п учасників гри, які можуть вступати між собою в коаліцію. Нехай N = {1, 2,3,..., л) максимальна коаліція, а 5 £ N деяка коаліція. Всього можливі 2" - л коаліцій. У відповідність коаліції 5 поставимо витрати коаліції С(5). Позначимо через С(А/) загальні витрати коаліції У, через С - індивідуальні витрати учасників, які не вступають у коаліцію, через х, - вит- рати і -го учасника в коаліції: у х, = С(У). 351
Наведемо принципи стійкості утвореної коаліції. 1. Принцип виокремлення (принцип утворення коаліції). Будемо говорити, що коаліція задовольняє принцип виокремлення, а саме, коаліція 8 не виокремиться, якщо при цьому її витрати будуть зростати [41], тобто £х, ^С(5), 48 (8.8) *•! 2. Принцип відсутності субсидій. Жодна коаліція не повинна платити менше, ніж додаткові витрати на її обслуговування, тобто ^х,^С(^)-С^\5). (8.9) Покажемо еквівалентність виразів (8.8) і (8.9). Враховуючи (8.9), отримаємо: С(Л/\$)£С(ЛГ)-£х,= £х(. Зробивши заміну }4\8->8', отримаємо вираз (8.9). Визначення 8.19. Грою п осіб з розподілом витрат називають пару [М,С},де N = {1,2,3 и} - множина учасників (агентів), яка ставить у від- повідність кожної коаліції 5 с N її витрати С(5). Визначення 8.20. Ядром гри п осіб з розподілом витрат називають та- кий вектор X = [х,], що £х, = С(1Г) й задовольняє принцип виокремлення ко- аліцій, тобто для кожного 8 С N витрати агентів у складі максимальної коаліції менші від витрат у разі виокремлені коаліції 8 [41]: Е*,*С($), 48 Визначення 8.21. Функцію витрат С називають субадитивною, якщо для кожних двох коаліцій 8 і Т таких, які не перетинаються (тобто 8Г\Т = 0/ справедливе: С(5СІ7’)£С($) + С(Г). Визначення 8.22. Грою п осіб з розподілом прибутку називають пару {Лї, V}, де N = {1,2,3,..., и} - множина учасників (агентів), яка ставить у від- повідність кожній коаліції 8 с N її прибуток V(8) [41]. 352
Визначення 8.23. Ядром гри п осіб із розподілом прибутку називають такий вектор X = [х(], що £х, = И(Л9 й задовольняє принцип виокремлення коаліцій, тобто для кожного 5 £ N прибуток коаліції 8 у складі максимальної коаліції більший від прибутку в разі її виокремлення: ^х,^И(5), У8<^^ де И(5) - прибуток коаліції 8 у випадку її виок- ремлення. Кожній грі з розподілом витрат відповідає гра з розподілом прибутку: Г(5) = £С,-С(л). іаЗ Визначення 8.24. Функцію прибутку V називають су пер адитивною, якщо для кожних двох коаліцій 5 і Т таких, що не перетинаються, тобто 5 П Т = 0, справедливе Г(5и7’)^И(5) + К(7’). <8.10) Приклад 8.3. Три міста А, В, О будують систему водопостачання (вони можуть вступати в коаліцію). Нехай індивідуальні витрати кожного міста становлять: СА = 120-10’ у.о.; Св = 140-103 у .о.; Сп= 120-103 у.о. У коаліції витрати становлять: {А,В}:С(А,В)= 170 103 у.о.; {Я, О}: С(А, И) = 160-103 у.о.; {В, £>}: С(В, И) = 190-103 у.о.; {Я, В, О}: С(А, В, ОУ 255 103 у.о.; Д С(А, В) = Са + Св- С(А, В) = 260 - 170 = 90-103 у.о.; Д С(А, О) = СА + СВ- С(Я, £>) = 80-103 у.о.; Д С(В, О) = Св + Со- С(В, И) = 70103 у.о.; Д С(А, В, П) = СА + Св + Сг>-С(А, В, И) = 125-103 у.о. Знайдемо ядро гри. Позначимо: хі - витрати міста А; х2 - витрати міста В; Хз- витрати містаР в максимальній коаліції. 353
Отряімпт смстецу рівнянь та нерівностей : х, + х,+X, = С(Л, В, В)=255; х,£С,=120; х,$С, = 140; ^5Сс = 120; х,+х,£С(Л,Л)=170; х,+х,£С(Л,£>)=160; х,+Х!$С(В,і>)=190; х,-255-хі-х1<120 -»255-120<Хі+х2<170; Х|+хз“255-ха< 160 —»95<х2< 140; х2+хз-255-Х! < 190 -» 65 <хі< 120; 135<хі+х2< 170. З цю системи нерівностей вик- х- лючили хз, щоб зобразиш область "* ' я.,мЧ« вдра на площині (рис. 82). Як бачимо з рисунка, область ядра не порожня. , ~ч Умови існування ядра три. Збалансовані крн. Одна з головних Іфоблем у дослідженні кооператив- них ігор л осіб - це перевірка, чи 4 2»._____________________ існує ядро три, та знаходження , „ ____ Рис. 8.2 роав язку, який належить ядру. Розглянемо тру з розподілом прибутку: (V, Р). Необхідна умова існування ядра гри: функція прибутку Р(5) має бути супераднтивною [41]. Визначення 8.25. Функцію У(8) називають суперадитивною, якщо для будь-яких коаліцій 5 і Т, що не перетинаються, виконується така нерівність: Г(5)+У(П^К(5пТ). (8.11) Якщо коаліція N розбита на к коаліцій 5», 5-ь..., що не перетинаються, у5,=М де 3,^ = 0, (8.12) тоІ^)5Г(Л0. 354
Нерівність (8.12) є узагальненням виразу (8.11) Визначення 8.26. Покриття - відображення множини всіх ігор Т ” 2уIVу вектор {5,}, де5-усіможливі коаліції. Визначення 8.27. Покриття називають збалансованим, якщо £8, = і. «МІ де б, > 0, і є 5, і підсумовування ведеться за всіма коаліціями, що включа- ють іравця/. Теорема 8.4. Ядро з розподілом корисності є непорожнім, якщо для кожного збалансованого покриття виконується таке [41]: £б/(5)$К(ЛГ). «МІ Доведемо достойність. Нехай {х(} - розподіл з ядра гри, 5, - збалансоване покриття. Тоді Ех,*К(я)ЛзС*. (8.13) МІ Помножимо (8.13) на 6в: МІ Підсумовуючи за всіма 5, отримаємо: = Е*. £8, * £8/(5); (8.14) «МІ МІ МІ «МІ «МІ ХсХ Ех(=к(зо^^б/(з), •сЯ отже, отримали умову (8.13). Теорема 8.5. Ядро гри (Я, С) з розподілом витрат непорожнє тоді й тільки тоді, коли для кожного збалансованого покриття справедливе [41]: Е8,С(я)^С(/У). «МІ Метою теорії кооперативних ігор є знаходження розв’язку гри, що доз- воляє знайти раціональний розподіл витрат або прибутків для коаліції. 355
Розглянемо такий приклад. Нехай максимальна коаліція Л^” {1,2, 3,4,5}. Виберемо і —1 та знайдемо всі коаліції, які включають іравця 1: 5І={ І}; 5, = {1,2}; - {1,3}; 5, - {1,4}; 54 - {1.5}; 53 - {1,2,3}; 4 - {1,2,4); 87 = {1, 3, 4}; £ - {1, 2, 5}; 8, - {1, 3, 5}; 810 - {1, 4, 5}; 5ц - {1, 2, З, 4}; 5« = {1,2,3,5}; 5із - {1,3,4,5}; 5М = {1,2,4,5}; {1,2,3,4,5} = N. Поставимо у відповідність компоненту вектора покриття кожній коаліції £ 5, -» 5„ /є 1...14. Тоді умову існування ядра гри запишемо так: І&У№У(Ю, де £б =1,6 £0. 8.5. Вектор Шеплі, його властивості та застосування в теорії кооперативних ігор Якщо ядро три існує, то найбільш справедливий розподіл прибутків або витрат дає вектор Шеплі. Він використовує ідею розподілу витрат, основану на маргінальних вигодах, тобто частка витрат (прибутки), що припадає на і-го учасника три, обчислюється як середні маргінальні витрати (прибуток), додані учасником і у кожну можливу коаліцію, (И(зиі)-К(з)) - маргінальний прибуток. Визначення 8.28. Для певної гри (//, У) з розподілам прибутку вектор Шеплі В = (В,, В„ ..., В,.В,) визначає частку загального прибутку, що надається і-му учасникові. Розглянемо коаліцію £ 5с#,і<5;5сЛ^\і. Частка прибутку, яку вносить і-й учасник у коаліцію £ Г(5иі)-К(5), |5|=з<л. Розглянемо коаліцію, в якій учасник і стоїть на з + 1-му місці: {іі, іі, із, ..., і» й+і.... Ц. Вважатимемо, що К(ф) = О й ^ = -1—-—121 _ л! імовірність утворення коаліції 5. Тоді компоненти вектора Шеплі у грі з роз- поділом прибутків визначаються таким виразом: В, = 2 — Е(7(5 и і) - Г(5)). (8.15) Пі 9ЛО 356
Вектор Шеплі дає справедливий розподіл прибутків (витрат) з ядра. Його недолік - він не завжди належить ядру, однак існує клас ігор, в яких вектор Шеплі належить ядру й міститься в центрі Це «опуклі ігри». Опукла гра - це така гра, в якій зростають доходи від підвищення розмірів кооперації. Визначення 8.29. Гру (Я, V) називають опуклою, якщо для кожної ко- аліції 8,ТсN: Г(5)+Г(Т)5Г(5иТ) + Г(5пГ). (Прибуток від збільшення розмірів кооперації зростає, або чим більші масштаби кооперації, тим більший маргінальний внесок іравця і, шо включа- ється до її складу.) Визначення 8.30. Гру (М С) називають вгнутою, якщо для кожної ко- аліції 8,Тсії: С(8)+С(Г)>С(8г>Т)+С(8иГ). Теорема 8.6. Якщо гра (N,7)- опукла, або гра (Я, С) - вгнута, то век- тор Шеплі належить ядру гри [41]. Кожний компонент 9, визначається маргінальним внеском і-го учасника в усі коаліції: К(5оі)-Е(5), У$СЛ\І Для опису зв’язку й призначення вектора Шеплі вводиться оператор значення три [41], Ф0О, “жй є відображенням множини всіх ігор у множину розподілів прибутків учасників: ф(П=[ф,(ПІ 1=1..л; £ф,(Ю“П*). де | N | = п - потужність множини Я; Ф,(И) - прибуток і-го учасника. Визначення 8.31. Оператор значення <р є анонімним, якщо він комутує з перестановкою учасників (тобто перестановка учасників не змінює опе- ратора значення). , Визначення 8.32. Оператор значення <р є маргінальним, якщо ф,(Г) - розподіл частки і-го учасника - залежить тільки від маргінальних внесків учасника і в усі коаліції, Ф,(К): К(яиі)-И(к), УксЛГ\і. 357
Теорвлш 8.7 (теорема Янга - існування оператора значення) [41]. Існує єдиний оператор значення, що має властивості анонімності та маргі- наяьності-це вектор Шеплі. Характеристика вектораШалім Шалі Шеплі поставив задачу аксіома- тичнсго визначення вектора Шеплі Для цього задається адитияасть оператора зна- чення <р, а маргінальність випливає як наслідок аксіом «анонімності» та «дурня». Аксіома адитивності. Нехай є дві гри: (М V) та (У. Оператор зна- чення адитивний, якщо виконується ф(К+гр)=фСП+фОО. УР.ІР. Аксіома кдурняж Якщо для гравця і: Е(5чиІ)-Е(5) = 0,У5£ІЇ\і, то Ф, = (X, такого гравця називають вдурнем». Теорема 8.8 (теорема Шепді) [41]. Існує єдиний оператор значення, що задовольняє аксіоми анонімності, адитивності й адурня» - це вектор Шеплі, який має вигляд (8.15). Вектор Шеплі широко використовують у задачах кооперативних ігор, коли потрібно знайти частку виграшу кожного з учасників у грі або знайти справедливі витрати у спільному проекті. 8.6. Розподіл витрат на спільний проект. Види податків Розглянемо задачу розподілу витрат на колективний проект. Позначимо: п - кількість учасників, с - витрати на проект, Ь{ - дохід, який отримує і-й учасник. Потрібно знайти такий розподіл витрат{*,}, що м Розглянемо такі варіанти: а) рівномірний розподіл витрат х, = с!п„ і=1..л»; може виникнути варіант: х, > Ь, й гравець і не вступить у коаліцію; б) рівномірний розподіл прибутку: -с, ** м де Пе - сумарний прибуток; П- середній прибуток, -с). 358
Тоді втрата Х( =Ь(-Ц = “4 Можливий такий випадок: х, < 0, тобто і-й учасник отримує субсидію, на що не погодився інші учасники. Отже, раціональним буде 0<Хі<Ьь інакше нема рації вступати в коаліцію (не буде прибутку). Потрібно знайти найкращий розподіл витрат між учасниками спільного проекту. Розглянемо цю задачу як задачу теорії кооперативних ігор. Нехай Р(х) - дохід коаліції5, тоді К(5)=шах|^Ь, -с; о|. Позначимо через X/ розподіл витрат з ядра, якщо виконується принцип виокремлення: IV Визначення 8.33. Подушний податок - такий розподіл витрат х=[х,, ..., х,], який задовольняє х 6 Л = {у„.... У.}, : £у, = с, 0 £ у, $ Ь„ Уі}, Х=[х,,...хв]>У, для всіх У є А, Іш де знак >- означає лексимінну перевагу, тобто х, > у,. Якщо с є відносно малим, то подушний податок збігається з рівномірно розподіленими витратами. Визначення 8.34. Рівневий податок - такий розподіл витрат х=[х)....хя], який задовольняє ХєА = {у1...у.}, |у: ±у, = с, 0 £ у, £ Ь„ V/}, [й, -х^.... Ьш -хв]> [і»! -у,,..., Ь, - у,] для всіх У є А, де >- - лексиміяний порядок на £", тобто [і, -х^і [Ь, -уД Уу. 359
Якщо с велике, то це дає рівномірний розподіл прибутків: ^=-(Ейі -с)- м и м Щоб знайти подушний та рівневий податки, розглянемо такі теореми. Лема 8.3. Для визначення подушного податку необхідно знайти розв’я- зок X* з рівняння [41]: £тіп(А,6() = с, тоді х, =тіп(А’,6(). Для визначення рівневого податку необхідно знайти розв’язок X’ зрівняння £тт(М,) = ЗД ~с> (8.16) тоді х, = Ь, - тнХГ.А,). (8.17) Розглянемо алгоритм знаходження подушного податку. Крок 1. Покладемо А,=с/л, усі Ь, впорядкуємо за зростанням: Ь^Ь^^Ь,. Порівнюємо А, £6,: якщо умова виконується, то Ае=А‘, х, =х2 = ... = х, = А’, інакше х1=Ь1 й переходимо на крок 2. Крок 2. Покладемо А, = — (с-х,), порівнюємо А, £Ьа. Якщо умова п—1 виконується, то ха = ха =... = х, = А*, інакше ха = Ь2 й переходимо на крок 3. » Крок (к + 1). Покладемо Аа =(1/я-ЛХс-£ *,)» порівнюємо Аа£бм. м Якщо умова виконується, то хм =...=х, = А*, інакше продовжуємо роботу ал- горитму. Розглянемо алгоритм знаходження ріаневого податку. Крок 1. Покладемо А, =1/л(£б,-с )• Порівнюємо А(^6,. Якщо умова виконується, то А, = Х‘ й тоді х1=ЬІ-А*, ха=Ла-А’, .... х,=6,-А‘, інакше х, = 0 й переходимо на крок 2. 360
Крок 2. Обчислюємо \ =—7І2І^“С1 Порівнюємо \^Ь2. Якщо и—/ умова виконується, то X, = X*, х, - Ь, - X*, і = 2,л, інакше х2 = 0 й перехо- димо на наступний крок. Крок (к + 1). Покладемо ‘к2=(іІп-к>І Порівнюємо ^».і • А»-*»і 7 Якщо умова виконується, то X, = X*, х, =Ь, - X*, *=(* + !),.... п. Ці два способи розподілу витрат несправедливі, тому що найбідніші учасники отримують дуже мало або взагалі не отримують прибутку, або не несуть ніяких витрат. Тому розглянемо більш справедливий механізм розпо- ділу-ЛГ-ядро. К-ядро - це такий розподіл витрат, який відповідає принципу егалі- таризму. Визначення 8.35. К-ядро - це розподіл загальних витрат, який визна- чається зумов [41]: 1 " 1) ЯКЩО С < то розв’язуємо відносно X рівняння тоді (8.18) (8.19) 2) якщо с > - ±Ь,, то розв’язуємо рівняння тоді У першому випадку витрати не перевищують половини доходу, у дру- гому - прибуток для учасників не перевищує половини доходу. Алгоритм знаходження ТУ-ядра. Розглянемо два можливі випадки: Випадок І. Нехай 361
Крок 1. Покладемо X, =с/я. Порівнюємо X, ^6(/2: якщо умова вико- нується, то X, = X*. х, = ха =... = х, = X*, інакше х, = Ьл /2 й переходимо на крок 2. Крок 2. Для X, =---(с-х,) порівнюємо X, £6а/2. Якщо умова вико- я—1 нується, то х2 =х, =... = хя = Х‘, інакше ха =Ь2/2 й переходимо на крок (і+1). Крок (к + 1). Покладемо Ха =—-І с-^х, І Порівнюємо Ха £бм/2, я—лА м 7 якщо умова виконується, то X, = Х", хм =...=х„ = X*, інакше хм =ЬМІ2. Випадок П. Нехай с>-£б(. Покладемо X, = -Г£б,-сі Порівнюємо 2 я\м ) Х(£6(/2. Якщо умова виконується, то X, =Х”, х,=6,-Х‘, інакше хІ=61/2; Х|=-Ц(£л,-с+х1]іт.д. Я — 1\м / Приклад 8.4. Розглянемо задачу розподілу витрат на спільний проект за таких даних: я - 5 (п’ять учасників). Нехай доходи учасників Ьі - 10, Ьі ” 12, &з“ 18,64-20, Ьз-ЗО, а спільні витрати на проект с - 40; с - 75. Знайти розподіл витрат відповідно для подушного, рівневого податку та К-ялрл. Нехай с - 40. Подушний податок: Х.=£ = ^ = 8. • я 5 Оскільки X, £ 6„ то X, = X*- 8, х, = ха =... = х, = X*. Рівневий податок. |(90-40)=10; Х. = 6„ Х‘ = Х,=10, х,=6(-Х*; х,=0, ха =12-10 = 2, ха=8, х4=10, х, =20. 362
1 " И-ядро. Оскільки с < - “ 45, то використовуємо формули (8.18), (8.19): Х. = ^=8»Х.>^, х,-|=5; Х,=1(«-5)Л5=8і:Х,>|; = * Х,.|(40-5-6) = ^>|=9; х, = | = », X, = '(«І-5-«-9)-10 = *', X, =Х' = І0, х.=х1=І0=Х*. 2 2 6 40 4 Пропорційний податок: х‘=с^^~^^ = д^і- Покладемо с - 75. Подушний податок: X =- = — = 15- • п 5 1о>^; Хі =^ = 10; Х,=±(75-10)=1б|, Х,>^; 4 4 ^=^ = 12; 1 53 2 Х2 = |(75 -22) = ^=17|<6г; • • 2 Х2 =Х , Х3 =х4 =х$ =Х =17^. Рівневий податок: X, =^(90-75) = 3^5, =10=>Х,=Х' = 3; х, -X’, х1 =7, х,=9, х,=15, х4=17, х,=27. И-ядро. Використовуємо формули (9.18), (9.19): Ч = |(^-^=3<Ь./2 = 5, х, =7, Хі =9, Хі =15, х4 =17, х, =27. Пропорційний податок: Ьі 75к 5, X = с—*- = —о. = -Ь. Я>і 90 ‘ б ‘ 363
8.7. Механізми розподілу колективних витрат Дамо огляд деяких важливих результатів в області розподілу витрат [41]. Нехай є задача розподілу витрат: доходи учасників ЬігЬ, й витрати с. Визначення 836. Для співтовариства #={1,2,...,я) учасників ме- ханізмом розподілу витрат на проект називають деяке відображення X, що ставить у відповідність задачі розподілу витрат вигляду (.... Ьш, с) вектор Х(Л,с)=[хХМ]: м Визначення 837. Для співтовариства N = {1,2,я} учасників у завдан- нях розподілом прибутків (с/,.... сж г) механізмом розподілу прибутків нази- ватимемо вектор У(с,г)=[я(с.О]: Іу,М = г, де г - загальний розподілений прибуток; с, - виграти учасників. Визначення 838. Механізм розподілу витрат, що децентралізуються - такий механізм, за якого витрати і-го учасника залежать тільки від його доходу Ьі загального доходу й загальних витрат с та не залежать від розподілу витрат інших учасників: ^(Ь.с)=/(6/Л,с). Визначення 839. Механізм розподілу прибутків, що децентралізується - такий механізм, за якого прибутки і-го учасника залежать тільки від його витрат с* загальних витрат і загального прибутку г: УІ(с,г)=/І(сІ,сї.г). Маємо коаліцію 5 і децентралізований розподіл витрат, тоді виграти і-Г коаліції залежать від загального доходу, доходу коаліції й загальних витрат: Е хХМ=ф(Е ьІгЬі,с). Іа <сі Подушний, рівневий податки, #-адро не є децентралізованими ме- ханізмами, пропорційний податок є децентралізованим. Теорема 8.9 (теорема Мулена). Існує єдиний механізм розподілу витрат, що децентралізується, погоджений з ядром - це пропорційний податок х, (якщо співтовариство складається з п 2 3 учасників). 364
(Нагадаємо, що погодженість із ядром 0 £ х,(Ь,с) £ Ь(,Уі,Ь,с.) Доведення. Пропорційний податок децентралізований за визначенням. Розглянемо анонімний механізм: хДЬ.с) = /,(*, А,с); ^х±Ь„ хі=ЬІ^— = ЬІ~. Застосовуємо до коаліції: 5| = Е *і *і(М = /іАА.с) А.с) - фСЬ, +Ь? А,с). (8.20) Рівняння (8.20) - функціональне, його розв’язок ЛАА.с) = ЛоА,с)+6, -Л, А,с) (8.21) Знайдемо невідомі функції /і,,(5}.,с) й й^.с): а) розглянемо початкову умову Ь, = 0, тоді /і(Ь<А.с) = О = Ло(Лі,с); б) розглянемо кінцеву умову: Ь, = Ь^, тоді ДОМЧЛМ-Ф)- Отже, №і№~^с, що збігається з пропорційним податком. Сепарабельний механізм розподілу витрат. Зауважимо, що пропор- ційний розподіл витрат задовольняє більш сильну властивість, ніж децентра- лізованість. Нехай співтовариство N розбите на К коаліцій 5, и...о5г: N = 81 тоді можна обчислити пропорційний розподіл витрат на другому етапі. Спочатку обчислюємо пропорційний розподіл витрат між гру- 365
лами, вивши Ьі = ^іЬІ. Далі обчислюємо остаточний розподіл втрат усере- дині кожної групи. Визначення 8.40. Механізм розподілу витрат х(6,с)=[х|(6,с)] назива- ють сепарабельним, якщо для V Ь,Ь' і с,с' й для будь-якої коаліції УЗ с N. якщо Ь^Ь^ієЗ та якщо ^х(АІ,с) = ,с^, справедливе Ні Ні х(Ь„с) - х^Ь,, с*), У і є З, тобто розподіл втрат усередині коаліції залежить лише від доходів членів коаліції Ь, й повних втрат цієї коаліції С. Механізм розподілу прибутків називатимемо сепарабельним, якщо для 9 V г,г‘ й с, с та для будь-якої коаліції УЗ с Лг, якщо с, = є,, і є 5 та якщо Еу«(с.г) = ЕУі(с'» Н. справедливе у,(с,г) = уДс'.г'), У і є 3. Ні Ні Зазначимо, що властивість сепарабельності доповнює властивість де- централізованоті. Параметричне подання механізму розподілу витрат. Розглянемо дійсну функціюЛ(Х,6), де 6^0 й О^Х^Х = ХЮИ, X -фіксована. Нехай Л(Х, Ь) - неспадна й неперервна за X функція у разі фіксованого Ь, й крім того, А(0,6) = 0; Л(Х,Ь) = 6 для всіх Ь^О. Поставимо у відповідність функції Л такий параметричний механізм розподілу втрат. Для задачі (^,...,6Я, с) знайдемо єдиний розв’язок X* з умови Я = с, де с- загальні втрати, м Враховуючи монотонність Н, отримаємо, що втрати і-го учасника х, і = 1,...,л. __ я Якщо X збільшується від 0 до X, то значення функції непе- і-і рервно зростає (або залишається постійним) від 0 до = Ь. і Якщо й(Х,Ьі)ктш(Х,6і), де Х = оо,то маємо подушний податок. Збб
Якщо — -тіл (ХОД), де X = <ю, то це рівневий податок. Якщо/^Х.А,)-ОД, X = 1,то пропорційний податок (X = с/^ГЬ, )• і Наведемо властивості параметричного методу розподілу втрат. Він є сепарабельним, тобто можна показати, що для кожної коаліції 5 с N і двох задач розподілу витрат: (Ьіг Ь* Ьз, Ь*, с) і фОД,А,,.якщо Аі “А|, Уіє$, і крім того £дОД,с)- £дОД’,с'),то Мі Мі £а(*Л)=£л(Х',л;) => л(аод)=л(Х',л;). мв гав Отже, сімейство параметричних механізмів розподілу витрат має такі власти- вості (Янг): анонімність, відповідність ядру, неперервність, сепсрабельність [41]. 8.8. ЗАСТОСУВАННЯ ТЕОРІЇ КООПЕРАТИВНИХ ІГОР л ОСІБ В ЕКОНОМІЦІ Модель економіки виробництва суспільного продукту. Важливою сферою застосування теорії кооперативних ігор п осіб є економіка. Розглянемо деякі задачі економіки, які описуються ігровими моделями [41]. Нехай є п потенційних учасників спільного виробництва. Позначимо: у — обсяг виробництва суспільного продукту, с(у) - сукупність витрат на ви- робництво продукту, Ь,{у) - дохід і-го учасника від виробництва, х{ - витра- ти і-го учасника, м'ї - обсяг капіталу (обсяг ресурсу), який може передавати- ся від одного учасника до іншого. Тоді (-х,) - залишок ресурсу після виробництва. Важливою особливістю цієї задачі є те, що допускається х,< 0 (мож- ливість отримання субсидій), тобто витрати можуть бути більшими за особи- стий капітал учасників, л Очевидно, що ^х, = с{уУ м Позначимо через С7|(м'| -хпу) функцію корисності і-го учасника вироб- ництва. Потрібно знайти такий обсяг виробництва, для якого МІ * 367
Е Ц'(*І-хІ,у) = О. м Припустимо, що Ц(*’ї -хму) “ Ь,(у) +м', -хо тоді Е ЦО*і-Хі»у)шЕМу)-сЬ’)+Е*’г М і я Сумарний ресурс Х41/ ~ сопА може передаватися від учасника до учас- ті ника. Умова оптимальності ^Ь, (с) -с’(у) = 0 означає, що маргінальний дохід м дорівнює маргінальним витратам: 1>, (с)=с'(у)- м Розглянемо коаліцію 8 і позначимо дохід коаліції У(з) = = тах(ЗД(у)-с(у);О). Розподіл витрат учасників х,: £х(=с належить й< М м* ядру три, якщо виконується принцип виокремлення коаліції: ЕШ*)-Х,^И(5),У5С^ «ш Виникає запитання: коди існує ядро такої три? Відповідь: завжди, якщо функції Ь,(у) - увігнуті, а с(у) - опукла або квазіопукла (лінійна). Приклад 8.5. Нехай задано задачу економіки виробництва спільного продукту з такими даними: и = 2, ^Су) = 1п(>'+1);62О') = 27у»с(у) = 3/2у. Визначити оптимальний випуск, кооперативний прибуток та розподіл витрат з ядра. 2 • Знаходимо £Ьі(с) = с'(у) та оптимальний план випуску: м М1+у))+(1/л/7)=3/2->/=1. Оптимальні виграти становитимуть с(у*) = 3/2. 368
Знаходимо оптимальний прибуток коаліції: У(1,2) = Ь1(у*)+ +М/)-«(/)=и9. Знайдемо оптимальний прибуток учасників поза коаліцією: {З 1 1п(1+у)--у;0к 2 ] ї^ = 1; 2 = 3+3Г. , = ,=0. Отже, витрати перевищують дохід, тому прибуток учасника 1: Г(1) = 0; Г(2) = тах{2Л/у-’у ^ = ^=>у2 = ^; Г(2) = 0,67. 7У 2 9 АГ = Г(1Д) - Г(1) - Г(2) = 1,19 - 0,67 = 0,52. Визначимо умови для ядра гри: 6і(у’)-х>Г(1) = 0 =>х; ^(/) = 1п2 = 0,69; ЬгІУ'і-х} £К(2) = 0,67=> х^ <і 2 - 0,67 = 1,33. Для коаліції х, +х'2 =3/2. Побудуємо область допустимих рішень цих нерівностей та рівнянь (рис. 8.3). Рис. 8.3 369
Знайдемо розподіл прибутку згідно з вектором Шеплі (для цього обчис- лимо маргінальні внески): АГ,' = И(1) - К(0) = К(1) = О, АР/ =И(1,2)-И(2) = Ц9-0,67 = 0,52; АК2 = И(2) - И(0) = И(2)=0,67; АЕ22=И(1»2)-Г(1) = Ц9; К, = |к(1)+’(/(и)-Е(2)) = ^0,52 = 0,26; У2 = |г(2)+|(7(і»2)- Г(1)) = |о,67 + |Ц9=0,93. Ля Ля Ля Ля Загальний прибуток 9, + 92 = И(1,2) = 1,19. Знайдемо витрати учасників: = кі =>*і’ =0,69 -0,26 = 0,43; ^Су’)-*2 =>*2 = 2 - 0,93 = 1,07. Очевидно, ЩО X!* +х2 = ІД Мяргкальне цівоутвореяия в моделі осономЬоі Ь суспільним продуктом. Ціни Лінделла. Часткова рівновага. Аналогом конкурентного ціно- утворення в моделі економіки із суспільним продуктом є система індивідуальних цін, які призначає кожний учасник на спільний продукт. Визначення 6.41. Ринок називають збалансованим, якщо: 1) кожний учасник призначає такий самий обсяг випуску у’; 2) сума ін дивідуальних цін - платежів учасників за виробництво продук- ту - дорівнює загальній ціні на виробництво: І,Р,Г=с(Г), м де Рі - ціни на виробництво, що призначаються кожним учасником, їх нази- вають цінами Лінделла. Якщо функція витрат лінійна, то с(У) = СУ й тоді "^Р, = С. «-і 370
Визначення 8.42. Розглянемо випадок, коли с(у) - лінійна. Точку Р„, У) називають точкою цінової рівноваги за Лінделлом, якщо ви- конується [41] Ц(*ї “V./) = и«Ц(*і ~РіУ»У )> і = 1.. де у - оптимальний обсяг виробництва, при цьому Ц0»і-«»*»/) =піахЦ(и'(-х< ,у ), і=1.п. УА Ціни Ліцделла дозволяють знайти оптимальний випуск і розподіл витрат для випадку, коли с(у) лінійна. Розглянемо випадок, коли с(у) нелінійна, тоді використовуємо часткову рівновагу х,=г,с(Г), де г, £ 0, £г, = 1 м Визначення 8.43. Вектор [х,..х„,у*^ називають точкою часткової рівноваги, якщо оптимальну корисність кожного учасника визначають так [41 ]: Ц(*і -V-/)=пМЦО*'! -п • <>').>’)). VI=1,..., п, ГіО Я при цьому X/ =г/с(у*},дсгІ^0,^гІ=1. м Виникає питання про приналежність часткової рівноваги ядру гри, від- повідь на яке дається в теоремі Фоулі-Канеко [41]. Теорема 8.10 (Фоулі-Канеко). Якщо функції корисності є спадними від витрат, то часткова рівновага дає розподіл з ядра гри (якщо ядро існує). Приклад 8.6. (Умови беремо з прикладу 8.5). Розглянемо умови задачі л = 2; ^(у)=1п(у+1); б2(у)=27у; с(у) = |у. Позначимо ціни, які призначають учасники: Р/ - ціна учасника /; Р2 - ціна учасника 2. Для першого учасника знаходимо: тах{^)-ду,} => —-рї =0, хі = р^. у 1+У1 Для другого учасника знаходимо: тах рц(у2) - Р2У2 } =* г~ ~ Р2 = 371
З першої умови рівноваги випливає уі = у2 = у, з другої умови рівноваги маємо + р2 = с=3/2, тоді 1,1 З У1= -1 = у2 = 2;ру+р2=, Р\ Р2 2 113 1 1А + г = 0=>л = 0; Рг= і- 1 + у у 2 2 У = І- Знаходимо розподіл витрат: Хі = р^у =0,5; Х2=Р2У =1- Егалітарний селектор ядра в моделі економіки із суспільним продуктом. Визначення 8.44. Егалітарний селектор - це механізм, який дозволяє знайти розподіл витрат учасників з ядра гри (якщо ядро існує) або з антияд- ра (якщо ядра не існує) [41]. Нехай с(у) -витрати, />,(у) - дохід і-гоучасника, хІ -витратаі-гоучасника, Ц(и; -х,,у) - корисність і-го учасника. л л Потрібно знайти - х„у) = ЗД(у) - с(у) ->тах. 1-і /-і у Л 9 Запишемо умову оптимальності: У/», (у) - с'(у) = 0 —> у — оптимальний І-І випуск у коаліції. Знайдемо такий розподіл витрат, шоб він належав ядру гри: V® (ж), ж с N. Визначення 8.45. Егалітарний еквівалент - обсяг виробництва у, за якого прибуток коаліції без урахування витрат буде дорівнювати оптималь- ному доходу коаліції з урахуванням витрат [41]: І"! І«1 Якщо витрат немає, то дохід збігається з чистим прибутком, тоді маємо такс рівняння: 372
ЕШ) =$>,(/) - </). І=1 І=1 Розв’язуючи це рівняння, знайдемо у без урахування витрат: х* = Ь^у). Приклад в. 7. Розглянемо задачу із прикладу 8.6: л = 2; />,(>) = 1п(у+1); Ь2(у) = 2у[у-, с{у)=^у, у*=1; 1п(1 + у) + 2-/у = 1п(1 + у*) + 2^у* - 3 у =1,19. Розв’яжемо це рівняння методом половинного ділення й знайдемо ега- літарний еквіваленту = 0,24, тоді х* = 61(у‘)-іі(у)=1п2-1п1,24 = 0,49; х* = Л2(у‘) -Ь2(у) = 2>І2- 2^024 = 1,01. 8.9. Методи голосування 8.9.1. Загальна характеристика проблеми. Основні методи голосування Більшість суспільних рішень приймається на основі голосування. Голо- суванням вибираються президенти, голосуванням приймаються рішення в парламенті, на засіданнях вчених рад університетів та факультетів, на за- сіданнях кафедр тощо. Хоча практика голосування нараховує кілька тисячоліть, наприклад, го- лосування проводились у римському сенаті, проте фактичне його вивчення та дослідження почалося понад 200 років тому в працях французів Жана Шарля Борда (1733-1799) - фізика, математика, політика, члена французької ака- демії наук) та Жана Антуана Ніколя де Кондорсе (1745-1794) математика, філософа, члена французької академії наук (див. гл. 2). Розглянемо найбільш уживані на практиці методи голосування [10; 41]. Нехай N = {ї,и} - множина виборців, А = [а, в, с, ...} = = {а1,а2. --. ат } ~ множина «кандидатів». Кожен виборець задає індивіду- 373
альну перевагу на множині кандидатів у вигляді строгого ранжування, тобто задає лінійний порядок ЦА) - повне транзитивне асиметричне бінарне відношення (див. гл. 2). Систему індивідуальних переваг називають профілем. Розглянемо про- філь у табл. 8.1. Таблиця 8.1 Кількість ГОЛОСІВ 6 4 6 5 Ваорадкуванна кавдвдатів а а ь с а а с а с ь а ь ь с а а Цей профіль містить інформацію про те, що шість перших виборців на перше місце поставили кандидата а, на друге - ф на третє - с, на четверте - Ь. Аналогічно наступні виборці розмістили кандидатів у такій послідовності: а, <і, Ь, с. Таким чином, маємо л = 21 виборців і т = 4 кандидатів. Правило (метод) відносної більшості. На перше місце 10 виборців поставили кандидата а (па = 10), б виборців - кандидата Ь (пь = 6) і 5 виборців - с (пс = 5), кан- дидата не обрав ніхто (л^ = 0). Перемагає той кандидат, за якого проголосувала більшість виборців (у цьому разі - а). Випадок рівності голосів не розглядається. Цей метод поважає волю більшості у тому сенсі, що якщо за певного кандидата проголосувала абсолютна більшість (50 % плюс один голос), то він є переможцем. Правило відносної більшості з вибуванням (відносна більшість у два тури, «абсолютна більшість»). За подібним правилом відбуваються вибори президента України. Якщо деякий кандидат набрав більше половини голосів, то він - переможець, інакше у другий тур проходять два кандидати, що на- брали відносну більшість голосів (тому «відносна у Таблиця 8.2 два тури»). Для розглядуваного профілю у другий тур проходять кандидати а і Ь. Після «відсіювання» інших кандидатів (тому «відносна більшість з вибу- ванням») переваги виборців після першого туру не змінюються (табл. 8.2). У другому турі па= 10, пь = 11, тобто перемагає кандидат Ь (перемагає «абсолютно», набираючи більше половини голосів, тому метод і називають «методом абсолютної більшості»). 6 4 6 5 а а ь Ь ь Ь а а 374
Правило Борда («підрахунок очок»). У правилі Борда за останнє місце кандидата йому нараховують нуль балів, за передостаннє - один бал, за пер- ше - (т - 1) бал. Розглянемо профіль в табл. 8.3. Маємо: па= ЗО, пь- 27, пс= 33, па= 36. Перемагає кандидат, що набрав більшу кількість балів - це кандидат </. Правило Кондорсе. За цим правилом переможцем оголошується той кандидат, який перемагає всіх інших у попарних порівняннях. Так, у поііе- Таблиця 8.3 6 4 6 5 5 а а ь с 3 а а с а 2 с ь а ь 1 ь с а а 0 редньому профілі 10 виборців поставили кандидата а вище за Ь, 11 виборців поставило кандидата а нижче за Ь (позна- чимо це так а.Ь = 10:11). Маємо Ь:с = 10:11, с:д = 11:10, а:с = 10:11, Ь.гі = 6:5, а:гі = 10:11. Єдиний кандидат, який перемагає всіх інших - це кандидат с. Зазначимо, що правило Кондорсе здається дуже логічним, переможець перемагає всіх інших претендентів у єдиноборствах. Ллє тут виникає природне запитання: як бути, якщо кожен кандидат когось перемагає, а комусь програє? У цьому випадку, за визначенням, переможця за Кондорсе не існує. Розглянемо ще один з «парадоксів голосування». Найпростіший його ви- падок маємо за т = п - 3. Нехай для першого виборця а кращий за Ь, Ь кра- щий за с, тобто а>-Ь>-с, для другого Ь>-с>-а, для третього с>-а>~Ь. Цей профіль називають «Циклом Кондорсе». Маємо: а:Ь = 2:1, а:с = 1:2, Ь:с = 2:1. Розглянемо тепер введені правила голосування. Вони всі здаються логічними, кожне з них має свої переваги. Але їх застосування до одного і того самого профілю дає абсолютно різні результати. Це другий «парадокс голосування». Розглянемо знаменитий «парадокс Ерроу», роботи якого лягли в основу сучасної теорії голосування [10]. Нехай на основі індивідуальних переваг експертів необхідно знайти не лише колективного переможця, а й колективний порядок. Причому нехай, як і раніше, індивідуальні переваги будуть строгими (тобто кандидати в індиві- дуальних перевагах не повинні ділити місця), разом з тим колективний поря- док може бути і нестрогим. Найпростіший метод побудови колективного по- рядку за цим правилом голосування такий: переможець виключається з 375
профілю, для отриманого в результаті профілю знову знаходять переможця, який посідає друге місце в колективній перевазі й т. д. Наприклад, для про- філю, наведеного в табл. 8.1, після виключення переможця а для правила відносної більшості отримано такий профіль (табл. 8.4). Для цього профілю переможцем буде кандидат </, після його виключення маємо інший профіль (табл. 8.5), для якого переможцем буде с. Отже, правило відносної більшості дає таку колективну перевагу: а > <і >- с >- Ь. Аналогічно правило абсолютної більшості дає колектив- ну перевагу Ь>-с >-<!>-а (зазначимо, що ця перевага повністю протилежна попередній). Правило Бордадає А>-с>-Ь>-а, аКондорсе с>-(і>-Ь>-а. Отже, видно, що досить обгрунтовані різні правила побудо- ви колективного порядку дають різні результати, тому для вибо- ру методу голосування застосуємо інший аксіоматичний підхід. Задамо розумні апріорні вимоги для колективного ранжування у вигляді аксіом [10; 41]. А1. Аксіома повноти: для будь-яких кандидатів а та Ь колективний поря- док встановлює, що або а>-Л , або а~Ь, або Ь>- а. Скорочено можна записати, що V а, Ь € А: (а>-6)у (а “ Ь) V (а>-Ь). А2. Аксіома транзитивності: (а £ А)л (Ь ь с) => (а к с). АЗ. Аксіома одностайності: якщо для всіх виборців а ь Ь, то й у колек- I і тивному порядку Атакожа £ Ь (V/ є ЛГ: а £ Ь => а к Ь). А4. Аксіома незалежності: розміщення будь яких двох кандидатів а і Ь у колективному порядку залежить лише від їх взаємного розміщення в індивідуальних порядках і не залежить від розміщення інших кандидатів. Дамо інтерпретацію цих аксіом. Відмова від першої аксіоми (повноти) може привести до ситуації «вибори не відбулися», відмова від транзитив- ності теж виглядає досить нелогічною, порушення аксіоми одностайності од- нозначно свідчить про «фальсифікацію» виборів, відмова від аксіоми неза- лежності приводить до можливості маніпулювання шляхом зняття чи виведення нових кандидатів 376
Теорема 8.11. «Парадокс Ерроу» (1951 р.) [41]. Єдиним колективним по- рядком, що задовольняє аксіоми А1-А4, є «диктаторський», тобто існує ви- борець к є N такий, що колективний порядок збігається з його індивідуа- льним порядком. Парадокс Ерроу в свій час вразив науковий світ. Він дає пояснення, чому наша цивілізація пройшла через диктаторські режими. Між тим, теорема Ерроу стверд- жує не лише те, що колективний порядок задасться індивідуальним порядком «дик- татора», але й те, що індивідуальний порядок збігається з колективним порядком. Якщо до аксіом А1-А4 приєднати аксіому ВД (відсутності диктатора), то цим аксіомам згідно з теоремою Ерроу відповідатиме «порожній вибір». Щоб запобігти цьому явищу, можна послабити аксіому ВД, замінити її аксіомою ДД (допустимість диктатора). Доведемо теорему 8.10 [10]. Визначення 8.46. Будь-яку підмножину М множини виборців N назива- ють коаліцією. Коаліцію М називають К-вирішальною для кандидата а про- ти кандидата Ь тоді й тільки тоді, коли з того, що всі члени коаліції М ставлять а вище за Ь (а >- Ь), а всі виборці, що не входять до М, ставлять Ь ь вище за а, випливає а > Ь. Це запишемо так: М-К(а, і єМц №а> Ь, V] єМЛ£ а * Ь-> а > Ь). Визначення 8.47. Якщо для будь-яких двох кандидатів аіЬ коаліція Мє К-вирішальною для а проти Ь, то її називають простою К-вирішальною: М~К(а,Б)У а, Ьє А. Зауважимо, що повна множина N є ^-вирішальною (відповідно до аксіоми АЗ). Порожня множина не може бути .К-вирішальною для довільних а, Ь. Лема 8.4. Існує пера кандидатів (а, Ь), для якої задається коаліція Ь, що складається з одного виборця {!}= І така, що Ь= К(а, Ь). Доведення. Позначимо через Т множину таких коаліцій М, для кожної з яких існує пара (а, Ь) така, що М=К(а, Ь). Множина Т непорожня, оскільки Л/с Т. Візьмемо у коаліції Т коаліцію £, що містить мінімальну кількість виборців. Оскільки Т * 0, то £ має не менше ніж одного виборця (|£І £ 1). 377
Нехай |£| £ 2. Розіб’ємо £ на дві непорожні щдмвожини, що не перетинаються: одна £'£{/} складаться з одного елемента, а друга £* -з усіх інших. Розглянемо профіль, заданий в табл. 8.6. Таблиця 8.6 г V а с ь ь а а с ь с к Оскільки коаліція £ є /С-вирішальною, то а >- Ь. Якщо к с >- 6, то £' є /С-вирішальною «с проти Ь». Але в £* менше виборців, ніж у множині £, яка за визначенням мінімальна. Отже, с не може бути кращим за Ь, звідси (відповідно до к к к аксіоми повноти) Ь >- с. Отже, а >- Ь, Ь >- с, і з аксіоми тран- зитивності а >- с. Але за визначенням £'є £Г-вирішальною для а проти с, що суперечить мінімальності £. Лему доведено. Лема 8.5. Коаліція £ = {/} з одного виборця, існування якої доведено у лемі 8.3, є К-вирішальною. Доведення. Нехай с - довільний кандидат. Розглянемо перший профіль .. * (табл. 8.7). Оскільки у) “ К(а, Ь), то а>~Ь. З аксіоми одностайності випливає к к к б>~с,у свою чергу (з А2), а>Ь. З аксіоми незалежності маємо, що а >- с є неза- лежною від Ь, звідки {/} =К(а, с). Таблиця 8.7 Профіль 1 {'} • а ь с с ь а Таблиця 8.8 Профіль 2 {'} М{/} а с а а с а Аналогічно для будь-якого кандидата А, розглянувши другий профіль (табл. 8.8), мож- на довести, що д > с. Отже, {/} = /Цс, 4) для Ус,«7. Теорема 8.12. Виборець, описаний в лемі 8.5, є диктатором. Доведення. Розглянемо профіль іііііі ... >- а >-...>- с >-...>- Ь >-... . Нехай усі інші виборці ставлять с вище за а та Ь, а інші кандидати розміщуються довільно. Оскільки коаліція £ = {/} є А’-вирішальною, 378
* * * то а >- с, відповідно до АЗ с >- й; за А2 а >- &. Виключаючи кандидата с, відповідно до аксіоми незалежності маємо: а >- Ь та а >- Ь, незалежно від розміщення а та Ь у перевагах інших виборців. Теорему доведено. Розглянемо методи голосування, що широко застосовуються на прак- тиці. Спочатку узагальнимо правила Борда та Коцдорсе. Задамо неопадну послідовність дійсних чисел з0 £ £... £ . Виборці ранжують кандидатів, причому балів дається за останнє місце, д, за передостаннє і т. д. Вибираємо кандидата з максимальною сумою балів, тим самим отримуємо «узагальнене правило Борда» або метод голосування з підрахунком балів. Правило відносної більшості, таким чином, є окремим випадком методу голосування з підрахунком балів (у ньому з0 = з, =, .... = з»_2 = 0, =1). І звичайно, саме правило Борда є окремим випадком цього методу (50 =0; 5] =1, ..., 5^ = л»-1). Цікаво порівняти правила Коцдорсе та Борда (узагальнене правило). У певному сенсі вони є «не- сумісними»: існують профілі, за яких переможець Коцдорсе не може бути переможцем Борда ні за якої системи балів. Розглянемо профіль (табл. 8.9). Нехай спочатку 50 < 5, < з2 (строгі нерівності). Для цього профілю с - переможець Коцдорсе (в чому можна переконатись безпосередньо). Між тим, сума балів кандидата а більша за суму балів кандидата с: Таблиця 8.9 3 2 1 1 8 с а а ь »2 а ь с с «1 ь с ь а «0 Твердження залишається справедливим і для випадку не- опадної послідовності балів. Нехай , 50<*2- У профілі, що задається у табл. 8.10, а - переможець Коцдорсе (а Ь - 10 9, а : с = 10 : 9), але Таблиця 8.10 6 4 4 5 8 а с Ь Ь 31 ь а а с з\ с ь с а Зо па=6з2 +8,і +5з0»и* =9а,+Ц +4і0 і л*-па =3з2-2з1 - 50 >0. Найчастіше використовують два правила (Коплецда та Сімпсона), що узагальнюють ме- тод Коцдорсе. 379
Таблиця 8.11 Юяигість гадосіа 6 4 6 5 Вшрадкувшжя кацщкгів а а ь с а а с а с ь а ь ь с а а Правило Коплецда. Позначимо через К(а, х) кількість виборців, для яких кандидат а кращий за х (а / х). Порівняємо кандидата а з будь-яким іншим кандидатом х. Припишемо К(а, х) “ + 1, якщо для більшості виборців а кращий зах, інакше КЦа, х) =* -1; 0 - у разі рівності. Оцінкою Копленда кан- дидата а є К(а)=^К(а,х). Переможцем Коплецда називають кандидата дам (або кандидатів) з найбільшою оцінкою Коплецда. Розглянемо табл. 8.11. Неважко підрахувати, що оцінки Коплецда: К(а) - -3; К(д) —1; К(с) - 3; = 1. Отже, переможцем Коплецда є кан дидат с. Правило Сімпсона. Аналогічно 5(а, х) - кількість виборців, для яких кандидат а кращий зах (а/х). Оцінкою Сімпсо- на кандидата називають 5(а)=тт5(а,х). Переможцем Сімпсона назива- х+а ють кандидата (кандидатів) із найвищою оцінкою Сімпсона. Отже, для того, щоб перемогти за правилом Коплец да, необхідно ви- грати у найбільшої кількості інших кандидатів. Для виграшу за правилом Сімпсона необхідно, щоб ніякий інший кандидат не зібрав переважної більшості голосів. Зазначимо також, що правило Коплецда відповідає «утилітарному» критерію вибору, правило Сімпсона - «егалітарному». Очевидно, що переможець Коцдорсе (якщо він існує) буде також пере- можцем і Коплец да, і Сімпсона. Очевидно також, що правила Коплецда і Сімпсона, на відміну від правила Кондорсе, завжди визначають переможця (або переможців). Розглянемо попередній приклад (табл. 8.11). Очевидно, що 5(а, 4) =* 10; 5(а, с) = 10; 5(а, О) -10, отже, 5(а) -10. Аналогічно 5(4) - 6; 5(с) -11; 5(4) -10. Таким чином, переможцем за правилом Сімпсона є кандидат с. Розглянемо основні властивості, які мають задовольняти правила голо- сування [10]: А5. Аксіома анонімності: імена виборців не мають значення - якщо два виборці поміняються голосами, то результат не зміниться. 380
А6. Аксіома нейтральності: імена кандидатів не мають значення - якщо поміняти місцями кандидатів а та Ь у вподобаннях кожного виборця, резуль- тат голосування зміниться відповідно (якщо раніше вибирали кандидата а, то тепер віддають перевагу кандидату Ь, і навпаки). Зазначимо, що аксіоми А5 та Аб забезпечують рівноправність виборців. Має виконуватися також і аксіома АЗ (опгимальність за Парето). Наве- демо її узагальнене формулювання. АЗ'. Аксіома ефективності: якщо кандидат а для всіх виборців кращий за кандидата Ь, то Ь не може бути вибраний. Розглянуті правила голосування Борда, Копленда, Сімпсона анонімні, нейтральні й оптимальні за Парето. Те саме справедливе і для будь-якого правила голосування з підрахунком балів, якщо останні різні (я0 < я, <... < з*), у разі рівності балів опгимальність за Парето може порушуватися. Якщо ж потрібно виділити єдиного кандидати із застосуванням правил підрахунку балів Коплецца або Сімпсона, то у загальному випадку це неможливо зроби- ти без порушення або анонімності, або нейтральності. Розглянемо властивість монотонності, за якою більша підтримка канди- дата не може зменшити його шансів бути обраним. Цю властивість назива- ють позитивним зворотним зв’язком. А7. Аксіома монотонності: нехай а вибирається за певним профілем, і профіль змінюється так, що положення а покращується, а відносне по- рівняння пари будь-яких інших кандидатів для будь-якого виборця залишається незмінним. Тоді для нового профілю а також буде вибраним. Легко зрозуміти, що узагальнене правило Борда, прави- ла Копленда та Сімпсона є монотонними. Правило відносної Таблиця 8.12 6 5 4 2 а с Ь Ь ь а с а с ь а с більшості з вибуванням, що широко застосовується на прак- тиці, є немонотонним. Розглянемо два профілі (табл. 8.12, 8.13). Другий про- філь відрізняється від першого лише останнім стовпцем, в якому положення а порівняно з Ь покращується. Легко пе- Таблиця 8.13 6 5 4 2 а с Ь а ь а с ь с ь а с ревірити, що для першого профілю переможцем за правилом відносної біль- 381
шості з вибуванням є а, для другого профілю - с. Отже, маємо парадокс - по- кращення позиції а призводить до його поразки. Легко перевірити, що немонотонним є також і наступний метод. Метод альтернативних голосів. Виключаємо тих кандидатів, хто от- римав меншу кількість голосів. Потім знову підраховуємо голоси виборців для кандидатів, що залишилися, і знову виключаємо - доти, поки не зали- шиться один кандидат (або декілька з однаковою кількістю голосів). Наступна властивість була вперше введена А. Смітом (1973 р.) та Г. Ян- гом (1974 р.) і відома як аксіома Янга про поповнення. А8. Аксіома поповнення (однозначні правила голосування): дві трупи ви- борців N1 і N1, що не перетинаються, вибирають одного й того самого кандидата а із множини А. Тоді виборці із множини = також обирають а. Відповідно до цієї властивості виборці розбиваються на територіальні дільниці або законопроект розглядається в декількох підкомісіях. А8*. Аксіома поповнення (відображення голосування): нехай виборці з М виби- рають кандидатів із множини 4» а виборці з - із множини А2, П^2 =0, Д ПА, #0. Тоді виборці з # = 11^ оберуть кандидатів з П А2. Теорема 8.13 (Янг, 1975 р.). Усі правила голосування, що грунтуються на підрахунку балів, задовольняють аксіому поповнення. Якщо у разі рівності очок вибір відбувається на основі фіксованого порядку на А, то відповідні правила також задовольняють аксіому поповнення. Правило Кондорсе (або його узагальнення) не задовольняє аксіоми поповнення. Таблиця 8.14 ^9- Аксіома участі: нехай кан дидат а є А обирається ви- 3 3 5 4 борцями із множини N. Нехай до множини виборців додасться а а а а а ь а с новий виборець і {і є ?/). Тоді виборці з ЛГІ) {і} повинні вибра- с ь с а ти або а, або кандидата, який для виборця і є сірого врвщим за а. ь с а а Розглянемо профіль (табл. 8.14). Переможця за Кондорсе для нього не існує, переможцем за Сімпсоном є кандидат а: До) “ 6; Дд) “ 4; Де) “ 3; Дф “ 5. Нехай до розглянутого про- філю додадуться ще чотири виборці з перевагами: е>-а>- Ь>~<1. Для нового профілю переможцем буде Ь: 5(а) = 6; Дд) =* 8; Де) - 7; Д<0 =* 5. Отже, чо- тирьом новим виборцям краще залишитися вдома, щоб переміг а. 382
Теорема 8.14 (Мулен, 1986 р.) [41]. Для всіх правил голосування з підра- хунком очок, коли у разі рівності очок вибір відбувається за допомогою задано- го порядку на А, аксіома участі виконується. Якщо А має хоча б чотирьох кан- дидатів, то для правил типуКондорсе не задовольняється аксіома участі. Щоб викласти один із найбільш відомих результатів теорії голосування скористаємося такою аксіомою. А10. Аксіома неперервності: нехай виборці з вибирають а є А, з вибирають Ь є А, а / Ь, ПУ2 =0- Тоді існує досить велике натураль- не число т, таке що (тУ^СІЛ^ вибере а. Теорема 815 (Янг, 1975 р.). Відображення голосування грунтується на правилі підрахунку балів тоді й тільки тоді, коли задовольняє такі чотири аксіоми: анонімності, нейтральності, поповнення та неперервності. Доведення цієї теореми (що обгрунтовує правило підрахунку очок) є до- сип* складним. Правило з послідовним виключенням. Задається по- слідовність кандидатів, наприклад а, Ь, с, А. Перші два канди- дати порівнюються і за правилом більшості виключається один із них. Тоді кандидат, що лишився, порівнюється з на- ступним і т. п., й у разі рівності голосів залишається, наприк- лад, «лівий)» кан дидат (той, що йде першим за переліком). За таким методом у конгресі США організовується процес прийняття поправок до законопроектів (а - поправка до закону; Ь - поправка до поправки; с - початкова редакція, ії - аіашз цію). Цей метод, очевидно, є методом типу Коцдорсе, якщо а є пере- Таблиця8.І5 1 2 і 1 а а а ь ь ь с с а с а а с а ь а Таблиця 8.16 1 1 1 ь а с а а ь а с а с ь а можцем за Коцдорсе, то він виграє. Очеви дно, що метод не є нейтральним - по- рядок виключення («порядок денний») впливає на результат. Нехай маємо такий профіль (табл. 8.15). Для послідовності (а, Ь, с, А) переможцем буде А, для (а, Ь, А є) - с, для (а, А Ь,с)~ Ь, для (Ь, А а, с) - а. Отже, галова ради (спікер), який визначає по- рядок денний, може впливати на результат. Цікаво зазначити також, що цей ме- тод може порушувати оптимальність за Парето. 383
Тепер розглянемо ще один профіль (табл. 8.16). Для послідовності (а, Ь, с, /і) переможцем буде </, хоча кандидат а для всіх виборців кращий за </. Розглянемо правило, яке широко використовується (особливо у спорті) - правіло паралельного виключення. Для заданої послідовності кандидатів, наприклад, (а, Ь, с, 4), за правилом більшості а порівнюється з Ь, а с з д («пів- фінал»), потім переможці в парах порівнюються між собою (фінал). Цей метод є методом типу Кондорсе: якщо немає рівності під час парних порівнянь, він зберігає опгимальність за Парето. Якщо ж рівності можливі, то опгимальність за Парето може порушуватись. Під час голосування за правилом відносної більшості з вибуванням іноді виборцю буває доцільно віддати голос не найкращому для себе канди- дату, а комусь іншому: «Якщо я знаю, що найкращий для мене кандидат все одно не пройде, оскільки кандидати Ь і с гарантовано наберуть більше голо- сів, тому я краще допоможу тому кандидату Ь або с, який для мене більш переважний». Природно виникає запитання: чи існує «захищене від маніпулювання» правило голосування, тобто таке правило, коли кожен із виборців, перебува- ючи в кабіні для голосування, завжди захоче правдиво вказати свій пріоритет (свої переваги)? У випадку бінарного вибору (наприклад, за наявності двох кан дидатів - другий тур виборів Президента України) голосування за правилом більшості є, очевидно, неманіпульованим. Якщо ж кан дидатів не менше трьох, то єди- ним неманіпульованим правилам голосування є диктаторське правило. Цей результат, аналогічний теоремі Ерроу, був доведений А. Пббардом (1973 р.) і М. Саттервайтом (1975 р.) Зрозуміло, що диктаторське правило не може бути прийняте як най- більш несправедливе для абсолютної більшості виборців, однак для будь- якого іншого недиктаторського правила голосування існує профіль переваг, за яким деякому агенту вигідно не повідомляти правдиво своєї переваги. Таким чином, голосування не є механізмом збідніння інформації про переваги виборців, який завжди буде об’єктивним. 384
Виникає питання, як подолати негативний наслідок цього висновку. Теорема Гіббарда-Саттервайта. Головною особливістю цієї теореми є те, що будь-який профіль переваг є допустимим «входом» для правил голо- сування. Якщо можна із змістовних міркувань обмежити область переваг, то загрози маніпуляцій можна уникнути. Нехай, наприклад, профіль переваг змінюється в області, в якій перемо- жець Кондорсе завищи існує. Тоді голосування за правилом більшості (що обирає в точності переможця Кондорсе) є захищеним від маніпулювання. Сформулюємо теорему Гіббарда-Саттервайта строго. Нехай £(Л) - мно- жина лінійних порядків на скінченній множині кандидатів А (повних, транзи- тивних, асиметричних відношень на А), нехай N - скінченна множина вибор- ців. Думку виборця і є N молена записати за допомогою функції корисності щ: А -> £*, що відображає порядок на А. Наприклад, и{(а) > и{(Ь) > и{(с) > ... означає, що для і-го виборця кандидат а перебуває на першому місці, Ь - на другому місці й т. д. Правило голосування є однозначним відображенням 5 £(Л)Я —> А, що ставить у відповідність коленому профілю и = (и{,івЯ) результат виборів 5(и). Нехай 5 є відображенням «на»: для кожного а існує такий профіль и, що 5(м) = а (ніякий кандидат не може бути відкинутий апріорі). Визначення 8.48. Правило голосування захищене від маніпулювань, якщо для будь-якого профілю и є £(Л)* і будь-якого виборця і є N вико- нується нерівність иІ(8(и))^иі(5(иі,имн}) для цє£(Л). Тут ц - перева- га (яка можливо, відрізняється від істинної), яку виборець і може повід- омити замість своєї істинної переваги и«. Якщо він так зробить, то отримаємо профіль (ц, и^м), в якому всі компоненти иу не змінюється, крім компоненти і. Теорема 8.16 (Гіббарда-Саттервайта). Якщо А має більше двох канди- датів, то правило 8 є захищеним від маніпулювань тоді й тільки тоді, коли воно є диктаторським: 5 = 5і" для деякого виборця і — диктатора, де (и)=шахи^ для всіх и є £(Л)Я. 385
Доведення. Дня доведення теореми використаємо допоміжне поняття строгої монотонності, й крім того, таке визначення: будемо говорити, що за заданих профілів и, V та результатів голосування а, а зберігає або підсилює свою відносну позицію у разі переходу від и до у, якщо для всіх і та Ь*а иі(а) > пі(Ь) -> у/(п) > у/(6). Далі будемо говорити, що профіль у отримано з профіля и підйомом а, якщо: 1) и та V збігаються на Аіа, тобто для всіх і та всіх Ь,с*а иі(Ь) > и/(с) -* у/(5) > у/(с); 2) а зберігає свою відносну позицію з переходом від и до V, 3) V * и, тобто позиція а підсилюється принаймні для одного агента (виборця). Визначення 8.47 [45]. Правило голосування 5 називають строго монотон- ним. якщо для всіх профілів м, у та будь-якого результату а виконується таке: (у отримано із и підйомом а)-> {$(«) = 5(у), або 5(у) = а). Зміст цього визначення полягає в тому, що якщо правило голосування є монотонним, то підсилення будь-якого кан дидата може або підтвердити його обрання, або результати попереднього голосування, і не може привести до обрання деякого третього кандидата. Поняття строгої монотонності можна порівняти із властивістю звичайної монотонності, яку записують так: (якщо профіль V отримано з и підйомом а) та {5(и) = 5(и) -а. Наступні леми розкривають зміст строгої монотонності Лема 8.6. Правило 5 є строго монотонним тоді й тільки тоді, коли для довіль- них и, а виконується таке: якщо а є 5(и) і кандидат а або зберігає свою позицію, або підсилює її при переході від профілю и до г, то 5(г) - а. Наприклад, нехай и/Ь) > иХО > и/п) > и/е) > «/</) > «X/)» тоді можна замінити його на довільний профіль и в якому кращими є канди- дати Ь, су довільному порядку, а гіршими - кандидати Ф е, / у довільному порядку. Обрання кандидата а залежить тільки від підмножини кандидатів, кращих за а для різних виборців. 386
Лема & 7. Припустимо, що множина кандидатів А складається не менше ніж з трьох осіб. Тоді правило голосування 5 строго монотонне, якщо воно є диктаторським. Доведення. Зафіксуємо виборця Г та перевіримо, що диктаторське правило 5(и) = іори(, тобто збігається з вибором виборця ї. Цим буде дове- дено достатність умов леми. Для доведення необхідності фіксуємо строго монотонне правило голосування. Введемо таке позначення: К(и, а, підмножина виборців, для яких а краще за Ь за профілем и. Крок 1. Для довільної коаліції Т й результатів голосування (а, Ь) покладемо и Є.ЦА/ і для і є Т, а - найкращий кандидат для профіля и/і ¥(Т а Ь -другий за порядком; для і є К\Т:Ь - найкращийкандидат,а кандидата - другий за порядком. Доведемо еквівалентність таких трьох тверджень: Твердження 1: 8(и, Т, а, Ь) = {а}. Твердження!: існує профіль нє£(л)*; М(и,а,Ь)=ТІ,8(и)=а. Твердження 3: для всіх и є £(л)", #(п, а, Ь) -> 5(н) * Ь. Зрозуміло, що з твердження 1 випливає твердження 2 (для цього досить розглянути довільний и є17(Т, а, 5). Тепер припустимо, що твердження 2 ви- конується, а твердження 3 - ні. Для деякого и: N(1/, а, б) “ Т і 5(и) “ а, тоді як для деякого профіля V виконується И(у, а,Ь)~Т,а 8(у) “ Ь. Піднімаючи а та Ь угору та зберігаючи відносну позицію а по відношенню до Ь, перетвори- мо профільне и', а профіль гу V'. и' є Т(а,Ь) та V є Т(а,5). Суперечність полягає у тому, що з переходом від и' до V зберігається відносна позиція а Припустимо нарешті, що виконано твердження 2 та розглянемо профіль и з С/(Т, а, Ь). Згідно з твердженням 3 5(и) * Ь водночас для профіля и маємо два кращих (оптимальних) за Парето результатів: а, Ь. 387
Отже, якщо правило 5 вибирає кращого за Парето кандидата, то має бу- ти 5{и) “ а і твердження 1 доведено. Легко перевірній оптимальність за Парето правила 5. Оскільки 5 є «відо- браженням на», то для будь-якого а є А існує такий профіль и, що 5(и) - а. Піднімаючи а на вершину коленої переваги в и( молена зберегти його об- рання, отже за строгої монотонності {а - найкращий кандидат для кожного и/} -> {5(и) = а} (822) Розглянемо профіль и, для якого а переважає за Парето кандидата Ь. Якщо 5(и)=Ь, то підняття а та Ь угору зі збереженням їх відносних позицій, знову підтверджує вибір Ь, що суперечить (822). Це завершує доведення ек- вівалентності твердження 1- твердження 3. Позначимо через В(а, Ь) множину коаліцій, які задовольняють умови твердження 1- твердження 3. Потрібно до- вести, що АГ є В(а, Ь) для всіх а,Ь. Крок 2. (Доведення аналогічне доведенню теореми Ерроу). Обиремо мі- німальну за виключенням коаліцію ТвДх, у), (х,у)еАхА .Нехай Т с.В(а,Ь). Припустимо, що Т складається більше ніж з одного елемента. Розіб'ємо Тна Г; І) Т^так, що ні Г/ ні Т2 не належать В(х, у) ні за яких х, у. Оберемо тре- тій результат с, відмінний від а та Ь, та побудуємо профіль (табл. 8.17). У цьому профілі кожний інший результат домінуєгься результатами а, Ь або с. Оскільки Ми, а, Ь) - Ті ТеВ(а,Ь), то з твердження 3 випливає що 5(и)*Ь. Оскільки Ми, а, с) ~ Т і ТеВ(а,с), то із твердження 2 випливає,що5(м) = а. Оскільки АА)“Ті і Ті еВ(с,Ь), то з твердження 2 випливає, що 5(и)=с. Таким чином, маємо суперечності з опимальніспо за Парето 5, а отже, множина Т- сд&жл&кшвя, наприклад Г“ {1}. Перевіримо далі, що {1}єВ(х,у)для всіх х,уеА. Візьмемо третій результат <1 і розглянемо профіль (табл. 8.18), за якого результати а, Ь, <1 домінують за Парето будь-який інший результат. Таблиця 8.17 Ті Ті мт а с ь ь а с с ь а Таблиця 8.18 {1} М{1) а ь ь а а а 388
Оскільки А(и, а, Л)“ {1} і {1}єВ(а,А), то 5(и)#6. Але також £(и)#</, оскільки </ домінується Ь, отже, 5(и)-а Оскільки И(и, а, ф - {1} то із твердження 2 випливає, що {1} =В(а,сГ). Для доведення {1}єВ(с,</) для всіх с використовують аналогічні міркування. Лишається довести, що виборець 1 є диктатором. Зафіксуємо перевагу Н] єЦЛ) з найкращим результатом а. Розглянемо профіль в якому для кожного результат а є кращим. Тоді А(и, а, Л) = {1} для всіх А*а;отже Щи^и^їЬ згідно з Тв. З, звідки 5(и1,у_1) = а. Нарешті, візьмемо будь-який профіль и_і для коаліції М{1}. Оскільки а зберігає або підсилює свою відносну позицію з переходом від до то отримаємо 5(ирИ_]) ш а. Це і доводить, що виборець 1 є диктатором. Доведення теореми Пбб<ц>да-Саттервсшта. Достатність (неманіпульо- веність диктаторського правила) є очевидною. Для доведення необхідності припустимо, що 5 - сірого монотонне. Для цього фіксуємо профіль и вибор- ця і деяку іншу перевагу виборця і, яку отримано із иІ підйомом а. Потрібно довести, що «_,) дорівнює 5(и) або а. Припустимо споча- тку, що 5(м) = д#а. Якщо 5(у(,ич)=с і с*а, то отримуємо або и|(б)>и|(с) та и,(Ь)>иІ(с), або «,(&)< і«,(с) та уі(А)<уі(с) (оскільки від- носна позиція Ь по відношенню до с не змінилась). У першому випадку “-і)) > "-і)) виборець і маніпулює за повідомляючи и(. У другому випадку и<(£(*/,и^))>и/(5'/(и/,и_,)). Отже, виборець і маніпулює за («„«_,), пові- домляючи V,. Припустимо далі, що 5(м) ” а. Якщо 5'(у|,и_1) = д# а, то маємо або и((б) > и,(а), або м((А) < и((а), й рД6) < т((а) (оскільки V/ отримано із и, під- йомом а). У першому випадку агент і маніпулює за (и„ ич), повідомляючи V/. У другому випадку він маніпулює за повідомляючи 14 Отже, теорему доведено. 389
Запитання для самоконтролю 1. Назвіть принципи розподілу корисності й дайте їх харахтеристиху. 2. Дайте визначених лексимінної впорядкованості. 3. Дайте визначення опгимальності за Парето та слабкої опгимальності за Парето. 4. Що таке порядок колективного добробуту? Назвіть його властивості. 5. Дайте визначення ФКК, назвіть її властивості. 6. Що таке незалежність ПКД від загального нуля? 7. Що таке незалежність ПКД від загального масштабу? 8. Сформулюйте достатні умови незалежності ПКД від загального нуля (теорема Робертсона). 9. Сформулюйте достатні умови незалевшості ПКД ВІД загального масштабу. 10. Що таке сепярабельність ПКД? Які умови сепарабельності? 11. Назвіть достатні умови, за яких ПКД задовольнятиме сірої ий принцип Пігу- Дальтона. 12. Що таке крива Лоренца? Як її використовують? 13. Сформулюйте принцип від ділення (утворення коаліції) та поясніть його зміст. 14. Сформулюйте іцшнцип відсутності субсидій для коаліції та поясніть його зміст. 15. Дайте визначення три з розподілом витрат. 16. Дайте визначення три з розподілом прибутків. 17. Дайте визначення я дра три з розподілом витрат. 18. Дайте визначення ядра три з розподілом прибутків. 19. Наведіть необхідні умови існування ядра три з розподілом витрат та ядра три з розподілом прибутків. 20. Яку функцію називають субадитивною та суперадитивною? 21. Сформулюйте достатні умови існування ядра три з розподілом витрат та розподі- лом прибутків. 22. Що таке вектор Шеплі? Опишіть його властивості. 23. Що таке оператор значення гри? Опишіть його властивості. 24. Сформулюйте теорему Янга щодо вектора Шеплі. 25. Наведіть умови, за яких вектор Шеплі належить ядру три. 26. Які види податків ви знаєте? 27. Дайте визначення подушного податку та сформулюйте алгоритм його відшукання. 28. Дайте визначення ріввевого податку та сформулюйте алгоритм його відшуканих. 29. Дайте визначення //-ядра та сформулюйте алгоритм його відшукання. ЗО. Опишіть властивості //-ядра. Де і як його використовують? 31. Дайте визначення механізму розподілу витрат на спільний проект. 32. Що таке децентралізований механізм розподілу витрат? 390
33. Сформулюйте теорему Мулеяа. 34. Наведіть умови оптимального випуску Семюельсона ди моделі економіки виро- бництва спільного продукту. 35. Наведіть умови оптимального випуску Семюельсона ди моделі економіки виро- бництва особистого продукту. 36. Що таке ціни Лінделла? 37. Що таке точка часткової рівноваги в моделі економіки виробництва спільного продукту? 38. Наведіть егалітарний селектор ядра в моделі економіки виробництва спільного продукту. 39. Дайте визначення маргінальних цін у моделі економіки виробництва продукту особистого користування. 40. Дайте визначення рівноваги при маргінальних цінах у моделі економіки вироб- ництва продукту особистого користування. 41. Що таке еквівалент постійних доходів? Як його використовують ди знаходжен- ня ядра гри в моделі економіки виробництва продукту особистого користування? 42. У чому полягає метод голосування за правилом відносної більшості? 43. У чому полягає метод голосування Коцдорсе? 44. У чому полягає метод голосування за правилом Борда? 45. Назвіть основні аксіоми голосування. 46. Що таке «диктаторський порядок»? 47. Дайте визначення вирішально! коаліції 48. Розкрийте зміст правий голосування Копленда. 49. Поясніть зміст аксіом анонімності та нейтральності. 50. В чому полягає зміст аксіоми ефективності? 51. Сформулюйте теорему Янга та поясніть її змст. 391
Задачі для самостійного розв'язання Задача 8.1. Нехай є п’ять учасників спільної діяльності, л=5. Припус- тимо, що доходи учасників відповідно: 2^=4, 2^=8, Л,=12, 2>4=20, 6, =26, а загальні витрати на проект складають: а) С=30 одиниць: б) С=50 одиниць. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)Мддра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 15 000 грн, а борги кредиторам становлять відповідно 6000, 8000, 10 000 грн. Знайти справедливе розподілення майна фірми між кредиторами. Задача 8.2. Нехай є п’ять учасників спільної діяльності, л=5. Припус- тимо, що доходи учасників відповідно: 2} =10, А, =12, 2^=18, 2>4=20, Ь5 = 30, а загальні витрати на проект складають: а) С = 40 одиниць; Є) С = 75 одиниць. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г).У-ядра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 10 000 грн, а борги кредиторам становлять відповідно 4000, 6000, 8000 грн. Знайти справедливе розподілення майна фірми між кредиторами. Задача 83. Нехай є п’ять учасників спільної діяльності, л=5. Припус- тимо, що доходи учасників відповідно: 2\=6, А, = 10, 2^ = 14, 64=20, Ь5 = 24, а загальні витрати на проект складають: а) С=30 одиниць; 392
б) С=60 одиниці». Необхідно знайти розподіленні витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)^-ядра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 12 000 грн, а борги кредиторам становлять відповідно 6000, 8000,12 000 грн. Знайти спра- ведливе розподілення майна фірми між кредиторами. Задача 8.4. Нехай є п’ять учасників спільної діяльності, и = 5. Припус- тимо, що доходи учасників відповідно: 2}=8, />2=12, А, = 20, Ач=24, А3=32, а загальні витрати на проект складають: а) С=36 одиниць; б) С=70 одиниць. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)Мядра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 16 000 грн, а борги кредиторам становлять відповідно 4000, 6000, 10 000 грн. Знайти справедливе розподілення майна фірми між кредиторами. Задача 83. Нехай є шість учасників спільної діяльності, п = 6. Припус- тимо, що доходи учасників відповідно: ^=10, А2 =12, А, = 18, А„=20, А, = 30, Ьл = 36, а загальні витрати на проект складають: а) С=50 одиниць; б) С=90 одиниць. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)Л-ядра. 393
Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 20 000 гри, а борги кредиторам становлять відповідно 4000, 6000, 18 000 гри. Знайти справедливе розподілення майна фірми між кредиторами. Задача 8.6. Нехай є шість учасників спільної діяльності, п=6. Припус- тимо, що доходи учасників відповідно: 1\ = 4, = 8, Л, = 12, 64 = 20, Ь} = 26, = 30, а загальні витрати на проект складають: а) С=48 одиниць; б) С=84 одиниці. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)Л/-ядра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 15 000 грн, а борги кредиторам становлять відповідно 6000, 8000, 10 000 грн. Знайти справедливе розподілення майна фірми між кредиторами. Задача 8.7. Нехай є шість учасників спільної діяльності, л=6. Припус- тимо, що доходи учасників відповідно: ^=6, />2=10, 6, =14, 64 = 20, Ь5 = 24, = 36, а загальні витрати на проект складають: а) С = 50 одиниць; б) С=80 одиниць. Необхідно знайти розподілення витрат учасників відповідно до: А) подушного податку; Б) рівневого податку; В) пропорційного податку; Г)2У-адра. Нехай є фірма, яка збанкротувала. Ь залишкове майно складає 12 000 грн, а борги кредиторам становлять відповідно 6000, 8000, 12 000 грн. Знайти справедливе розподілення майна фірми між кредиторами. Задача 8.8. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними: л=2, йі(у) = 21п(1+2у), ^(у)=^у. 394
1 , Функція витрат має вигляд С(у)=-у . 4 Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у*, а також розподілення витрат, яке належить ядру гри. Знайти розподілення витрат, яке відповідає вектору Шеплі, а також Мядру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному екві- валенту, й перевірити приналежність його ядру три. Задача 8.9. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними- Функція витрат має вигляд С(у) = ±у. Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у*, а також розподілення витрат, яке належить ядру гри. Знайти розподілення витрат, яке відповід ає вектору Шеплі, а також ЛГ-ддру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному еквіва- ленту, й перевірити приналежність його ядру три. Задача 8.10. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними: л=2, £\(у)=2у, ^(у) = 41п(1+у). Функція витрат має вигляд С(у)=^у2. 4 Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у*, а також розподілення витрат, яке належить ядру гри. Знайти розподілення витрат, яке відповідає вектору Шеплі, а також И-ялру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному еквіва- ленту, й перевірити приналежність його ядру три. 395
Задача 8.11. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними: л=2, і\(у)=21п(1+у), Ьг(у)=4^. З 2У- Функція витрат має вигляд С(у) = Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у , а також розподілення витрат, яке належить ядру три. Знайти розподілення витрат, яке відповідає вектору Шеплі, а також Мядру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному еквіва- ленту, й перевірити приналежність його ядру три. Задача 8.12. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними: і і «=3, ЛіО-) = 6у2. Ьг(у) = 2у2, Ь,(у)=41п(1+у). Функція витрат має вигляд С(у) = 2у. Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у*, а також розподілення витрат, яке належить ядру три. Знайти розподілення витрат, яке відповідає вектору Шеплі, а також ЛА-ядру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному еквівален- ту, й перевірити приналежність його ядру три. Задача 8.13. Нехай є економіка виробництва суспільного продукту з та- кими початковими даними: л = 2,1\(у)=2у, Ь2(у)=1п(1+4у). 1 2 2У- Функція витрат має вигляд С(у)= Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у*, а також розподілення витрат, яке належить ядру гри. Знайти розподілення витрат, яке відповідає вектору Шеплі, а також Мадру. Знайти точку часткової рівноваги і відповідне розподілення витрат. 396
Визначити розподілення витрат, яке відповідає егалітарному еквіваленту, й перевірити приналежність його ядру гри. Задача 8.14. Нехай є економіка виробництва суспільного продукту з та- кими початковими д аними: л=2, 4(у) = 1п(1+у), Ь2(у)=2уІу. Функція витрат має вигляд С(у) = - у. Побудувати кооперативну ТП-гру і знайти оптимальний план об’єму ви- пуску у\ а також розподілення витрат, яке належить ядру гри. Знайти розподілення втрат, яке відповідає вектору Шеплі, а також Мядру. Знайти точку часткової рівноваги і відповідне розподілення витрат. Визначити розподілення витрат, яке відповідає егалітарному еквіва- ленту, й перевірити приналежність його ядру гри. 397
СПИСОК ЛІТЕРАТУРИ 1. Аверкин А. Н. Нечеткие семиотические системи управлення / А. Н. Аверкин // Интел- лектуальное управление: новие интеллектуальние технологии в задачах управлення. - М. : Наука. Физматлит, 1999. -С. 141-145. 2. Айвазян С. А. Прикладная статистика в задачах и упражнениях / С. А. Айвазян, В. С. Мхитарян. - М.. Изд. ЮНИТИ-ДАНА, 2001. - 270 с. 3. Акоф Р. Основи иследования операций : [пер. с антл.] / Р. Акоф, М. Сасиени. - М. : Мир, 1971.-534 с. 4. Батищев Д. И Генетические алгоритми решения зкстремальньїх задач : учеб. пособие Воронежского гос. техн. ун-та, Нижегородского гос. ун-та / Д. И. Батищев. - Воронеж : ВІТУ, 1995. - 69 с. 5. Батищев Д. И. Зволюционио-генетический подход к решения задач невипуклой опти- мизации ІД. И. Батищев, С. А. Исаев, Е. К. Ремер // Оптимизация и моделирование в ав- томатизированнмх системах: Межвуз. сб. науч. тр. - Воронеж: ВІТУ, 1998. - С. 20-28. 6. Борисов А. Н. Принятие решений на основе нечетких моделей. Примери нспользования І А. Н. Борисов, О. А. Крумберг, И. А. Федоров. - Рига : Зинатне, 1990. - С. 321. 7. Букатова И. Л. Звоинформатика. Теория и практика зволюционного моделирования / И. Л. Букатова, Ю. И. Михасев, А. М. Шаров. - М. : Изд. Наука, 1991. - 206 с. 8. Гермейер Ю. Б. Введете в теорию исследовакия операций ІЮ. Б. Гермейер. - М.: Наука, 1971.-383 с. 9. Проблеми создания интеллектуальних систем поддержки принятия решений / под ред. В. Л. Волковича. - К., 1990. - 190 с. 10. Волошин О. Ф. Моделі і методи прийняття рішень: навч. посіб. для студ. ВНЗ / О. Ф. Волошин, С. О. Мащенко. - 2-ге вид., перероб. і доп. - К. : Вид.-полігрф. центр «Київський університет», 2010.-336 с. 11. Вороновский Г. К. Генетические алгоритми - искусственние нейронние сети и про- блеми виртуальной реальности / Г. К. Вороновский, К. В. Махотило, С. Н. Петрашев, С. А. Сергеев. - X. : Основа, 1997. - 212 с. 12. Герасимов Б. М. Нечеткие множества в задачах проектирования, управлення и обработки информации / Б. М. Герасимов, Г. Г. Грабовский. Н. А. Рюмшин. - К. : Изд-во Техника, 2002.-140 с. 13. Гнатіснко Г. М. Експертні технології прийняття рішень: монографія / Г. М. Гнатенко, В. С. Сніпок. - К. : Тов. «Маклаут», 2008. - 444 с. 14. Головко В. Н. Нейрокомпьютери и их применение. В 5 кн. / В. Н. Головко. - Кн. 4. Нейронние сети: обучение, организация н примеиенне. - М. : Изд-во Равдиозлектро- ника, 2001. - 368 с. 15. Горбань А. Н Обучение нейронних сетей / А. Н. Горбань. -М.: СІ І Параграф, - 1990. - 160 с. 398
16. Горбань А. Н. Нейроннме сети на персональном компьютере / А. Н. Горбань. Д. А. Росснев. - Новосибирск : Наука, 1996. - 278 с. 17. Дьяконов В. Математические пакети расширення МАТЕАВ / В. Дьяконов, В. Круглов. - СПб.: Изд-во ПИТЕР, 2001. - 472 с. 18. ДюбуаД. Теория возможностей, приложения к представленню знаний в информатике / Д. Дюбуа, А. Прад. - М. : Радио н связь, 1990. - 288 с. ХЧ.Дюран Б. Кластерний анализ / Б. Дюран, Г. Смит. - М.: Статистика, 1987. - 289 с. 20. Заде Л. Понятие лингвистической переменной н его применение к принятию прибли- жЄнньіх решений / Л. Заде. - М. : Мир, 1976. 165 с. 21. Заде Л. Роль мягких вичислений и нєчЄткой логики в поиимании, конструнровании и развитии ннформационнмх интеллектуальньїх систем / Л. Заде і' Новости искусствен- ного интеллекта. - № 2Б. - 2001. - С. 7-11. 22. Зайченко Ю П. Нечеткие модели н методи в интеллектуальньїх системах / Ю II. Зай- ченко. - К. : Изд. дом «Слово», 2008. - 354 с. 23. Зайченко Ю. П. Основи проектування інтелектуальних систем / Ю. П. Зайченко К Вид. дім «Слово», 2004 -352 с. 24. Зайченко Ю П. Неметкий метод индуктивного моделирования в задачах прогнозиро- вания макрозкономических показателей / Ю. II. Зайченко і! Системні дослідження га інформаційні технології. - № 3. - С. 25-45. 25. Зайченко Ю. II. Дослідження операцій: підручник / Ю. П. Зайченко. - 7-ме вид, перс роб. і доп. - К. : Вид. дім «Слово», 2006. -816 с. 26. Зайченко О. Ю. Дослідження операцій. Збірник задач : навч. посіб. для студ. ВНЗ О. Ю. Зайченко, Ю. II. Зайченко. - К. : Вид. дім «Слово», 2007. 472 с. 27. Згуровский М. З Системний анализ. Проблеми, методология, приложения / М. З Згу- ровский, Н. Д. Панкратова. - 2-е изд., перераб. н доп. - К. : Наук, думка, 2011. 725 с. 28. Згуровский М. 3. Модели и методи принятия решений в неметких условиях / М. 3. Зіу- ровский, К) П. Зайченко. - К. : Наук, думка, 2011. - 270 с. 29. Ивахненко А. Г. Принятие решений на основе самооргаиизадии ' А. Г Ивахненмі, Ю. II. Зайченко, В. Д. Димитров. - М : Сов. радио, 1976. 363 с. 30. Катренко А В. Теорія прийняття рішень І А. В. Катренко, В. В. 1 Іасічник. В. 11.1 Іасько К. : Вид. група ВНУ, 2009. - 448 с. 31. Кини Р. Л. Принятие решений при многих критериях: предпочтения, замещепня / Р. Л Кини, X. Райфа. - М. : Радио н связь, 1981 - 560 с. 32. Кофман А. Введение в теорню нечстких множеств І А. Кофман - М. : Радно и связь, 1982. 432 с. 33. Корнєев В. В. Бази дачних. Интеллектуальная обработка информации '' В В. Корнеев А Ф. Гареев, С. В Васютии, В В Райх. - М. : Нолидж, 2002. - 444 с 399
.3 4 Курейчик В. М. Генетические алгоритми / В. М. Курейчик. - Таганрог : Изд-во ТРТУ, 1998. - 242 с. 35. Ларичев О. И. Качественние методи принятия решений / О. И. Ларичев, Е. М. Мошко- внч. - М. : Наука; Физматлит, 1996. - 208 с. 36. Ларичев О. И. Теория н методи принятия решений / О. И. Ларичев. - М. , 2002. 302 с. 37. Малніиев Н. Г. Нечеткие модели для зкспертних систем в САЙР / Н. Г. Малишев, Л. С. Берштейн, А. В. Боженюк. - М. : Знергоатомиздат. 1991. - 136 с. 38. Медведев В. С. Нейронние сети. МАТБАВ6 / В. С. Медведев, В. Г. ПотЄмкин. - М. ДИАЛОГ-МИФИ, 2002 - 490 с. 39. Микони С. В. Многокритернальньїй вибор на конечном множестве альтервагив: учсб пособне І С В Мнконн. - СІІб. : Изд-во «Лань», 2009. - 272 с. 40. Митюшкин Ю. И. Бой сотриііп^: идентификация закономерностей с нечбткими база- ми знаний / Ю. И. Митюшкин, Б. И. Мокин, А. П. Ротштейн. - Вінниця : Вид-во УНІВЕРСУМ. 2002. -217 с. 41. Мулен 3. Теория игр с примерами из математической зкономики / 3. Мулен. - М. : Мир, 1985.-200 с. 42. Мулен 3. Кооперативнеє принягие решений: аксиоми и модели / 3. Мулен. - М., 1991. - 464 с. 43. Нейман Дж Теория игр н зкономическое поведение / Дж. Нейман, О. Моргенштерн. - М. : Наука, 1970. - 707 с. 44. Нечеткие множества в моделях управлення н нскусственного интеллекта / под ред. Д. А. Поспелова. - М. : Наука, 1986. - 396 с. 45. Орловский С Л. Проблеми принятия решений при нечеткой исходной информацин / С. А. Орловский. - М.: Наука, 1981. - 208 с. 46. Оузн Г. Теория игр / Г. Оузн. - М. : Мир, 1971. - 228 с. 47. Ногин В. Д. І Іарето-оптимальние решения многокритернальних задач ' В. Д. Ногин - М. : Наука, 1982.-256 с. 48. Подиновский В. В. Оптимизация по последовательно применяемим критериям В. В. Подиновский, В. М. Гаврилов. - М. : 1975. - 360 с. 49. Нрикладньїе нечеткие системи / под. ред. Т. Тдрано, К. Асаи, М. Сугено. - М. Мир. 1993. - 368. 50. Нечеткие множества в моделях управлення н нскусственного интеллекта / под ред. Д. А. Носпелова, А. Н. Аверкина, И. 3. Батьіріпина. - М. : Наука; гл. ред. физ.-мат. лит.. І986.-311 с 51. Поспелов Д. А. Моделирование рассуждений і Д. А. Поспелов. - М. : Радно и связь, 1989. - 184 с. 52. Саати Т. Принятие решений: метод анализа нерархий / Т. Саати. - М. : Радно и связь, 1993. - 278 с. 400
53. Силов В. Б. Приятие решений в нечбткой обстановке, БНРКО-РЕСЮ / В. Б. Силов. - М„ 1995. - 228 с. 54. Тарасов В. Б. Зволюционная семиотика - новое синергетическое налравление в нскус- ственном интеллекте І В. Б. Тарасов // Искусственний интеллект. - № 1-2. - К., 1997. - С. 9-20. 55. Тельнов Ю. Ф. Интеллектуальние информационние системи (в зкономике) 11О. Ф. Телиюв. М.: Изд-во СИНТЕГ, 1998. - 216 с. 56. Трахтенгерц 3. А. Компьютерная поддержка принятия решений /ЗА. Трахтені'ерц. М.: СИНТЕГ, 1998.-376 с. 57. Трахтенгерц 3. А. Неопределенносгь в математических моделях компьютерной оценки решений 13. А. Трахтенгерц. - М.: ИПУ, 1998. - 320 с. 58. Чаухдхури С. Технологах баз данньїх в системах поддержки принятия решений / С. Чаухдхури, У. Дайал, В. Ганти Н Откритие системи. - № 1. - 2002. - С. 15-17. 59. Нечеткие множества и теория возможностей І йод ред. Р. Ягер, пер. с англ. В. Б. Кузь- мина. - М.: Радно и связь, 1986. - 405 с. 60. Ярушкина Н. Г. НечСткие нейронние сети / Н. Г. Ярушкина // Новости нскусственного интеллекта. - № 36. - 2001. - С. 47-51. 61. Козко В. Неигаї Неїтуогкз апд Еиггу Бувіептз І В. Ковко. - Ргепіісе-Наїї, Еп{>1є\уоо<1 СІіЯз, 1991.-449 р. 62. Казко В. Еиггу Бузіетз А8 Бпіуегзаі Арргохітаїогз / В. Ковко Н 1ЕЕЕ Тгапвасііоп оп Сотриіегв. - N 11. - 1994. - Р. 1329-1333. 63. Козко В. Еиггу Епціпесппв І В- Ковко. - Не» Зегзеу, Ргетісе Наїї, 1996. - 549 р. 64. 2аіеИ Б А. Еиггу всів / Б. А. 2адеЬ Н ІпіогтаПоп агИ Сопігої, 1965. - V. 8. - N 3. - Р. 338-353. 65. 2аЯек Б А. Еиггу веіз аз а Ьазів Еог а іЬеоту оГ роввіЬіІііу / Б. А. 2а4еЬ // Еиггу зеїз апсі Бузіетз. - N І. - 1978. - Р. 3-28. 66. ТхміеИ Б А. ТЬе Сопсерс оГ а Біп^иіяіс уагіаЬІе агИ ііз арріісаііоп Іо арргохітаТе теазопіп^ / Б. А. 2адеЬ// Рал 1 ап4 2, ІпГогтагіоп Бсіепсез. - 1975. - V. 8. - Р. 199-249,301-357. 67. 2а<іек Б А. ТЬеогу оГ соттопзепзе кпотуїед^е / Б. А. ХахіеЬ // Азресіз оГ уавиепезв. - ОогдгесЬі: О. Кеідеї, 1984. - Р. 257-296. 68. 2аЯек Б А. Еиггу Іодіс Гот іЬе Мапаветпепі оГ БпсеЛаіпТу / Е<1іІе<1 Ьу Б. А. ХахІеЬ, 3. Касрггзук. - ЗУіІеу, ІЧезу Уогк, 1992. - Р. 492. 69. 2аускепко У Р. ТЬе Еиггу Огоир МеЙкхі оГ Лата НапШіп^ ап<1 Ііз Арріісаііоп Іо Йіе Тазкз оГ іЬе Масгоесопотіс Іпдехез Еогесазііпв! ¥п. Р. ХаусЬепко, 1. О. 2ае1з. - Бузіет Апаїу- вів МодеІІіпв Бітиіаиоп. - N 43 (10). - 2003. - Р. 1321-1329. 70. 2аусНепко У. ТЬе Еиггу Огоир МеіЬод оГ Ваіа Нап<І1іп£ ап<1 Ііз Арріісаііоп Гог Есопоті- саі Ргосеззев Гогссазііпв І V. ХаусЬепко // БсіепІіЯс Іпциігу. - Уоі. 7. - N 1. - Зипе, 2006. - Р. 83-98. 401
предметний покажчик А Аксіома - анонімності 360 - «дурня» 358 - голосування 376 - відображення голосування 382 - ефективності 381 - монотонності 381 - незалежності 376 - нейтральності 381 - неперервності 383 - одностайності 376 - повноти 376 - про поповнення (однозначні правила голосування) 382 - транзитивності 376 - участі 382 - Неша 320, 321 Алгоритм знаходження Л-ядра 362 — подушного податку 300 — рівневого податку 360 Б Багатокритеріальний вибір альтернатив за декількома нечіткими відношеннями 143 Багатокритеріальні задачі ЛП 201 --з нечіткими критеріями 219 нелінійного програмування з нечіткими параметрами (БКНП -задачі) 225 Біматрична гра в умовах коаліції 320 Біматричні ігри 316 Бінарні - властивості 44,45 - відношення 45 402
в Вектор Шеплі 356 Верхня ціна гри 309 Види податків 358 Властивості задач динамічного програмування 244, 245 Гра N осіб з розподілом витрат 351 ------прибутків 352 Графоаналітичний метод розв’язання матричних ігор двох осіб 313 д Двохетапні задачі стохастичного програмування 93 Децентралізований механізм розподілу витрат 364 Динамічні задачі управління запасами 258 ------з нескінченним плановим періодом 279 Достатні умови існування ядра гри 355 Е Егалітарний еквівалент в моделі економіки виробництва суспільного продукту 372 Еквівалентність векторів (множин) критеріїв 190 Етапи експертного оцінювання 40 - процесу прийняття рішень 31 з Загальна задача НМП 159 Задача багатокритеріальної оптимізації (БКО) 187 Задачі послідовного прийняття рішень 246 Захищеність правила голосування від маніпулювань 385 Збалансоване покриття 355 Змішані стратегії гри 309 І Ігри з нульовою сумою 306 Інтегральний дисконтований ефект (ІДЕ) 266 403
к Класифікація багатокритеріальних задач оптимізації 208 --експертного оцінювання 49 Колективне ранжування об’єктів 52 Композиція нечітких відношень 135 Критерій - Гурвіца 28 - Севіджа28 - Вальда28 - Лапласа 28 м Маргінальний внесок учасника і в коаліції 357 Методи оцінювання нескінченних послідовностей ефектів (витрат) 265 Медіана - Кемені-Снелла 53 - Кука-Сейфорда 58 Мережеві задачі ДП з нескінченним плановим періодом 274 Метод аналізу ієрархій (МАІ) 64 - випадкового пошуку 114 - вирішення задач НМП 162 ідеальної точки 208 ітерацій за критерієм в моделі відновлення 272 управління запасами з нескінченним плановим періодом 286 - - за стратегіями для оптимізації марковських систем 293 — ітерацій за стратегіями в моделі відновлення 273 - - — ітерацій за стратегіями в моделі управління запасами з нескін- ченним плановим періодом 280 ЛП для розв’язання матричних ігор двох осіб 311 множників Лагранжа для зниження вимірності задач динамічного програмування 255 404
- обмежень в задачі БКО 197 - попарних порівнянь (Мі 111) 66 - послідовних поступок в задачах БКО 212 - пошуку найкращого розв’язку біматричної грн в умовах коаліції (точки Неша) 323 - розв’язання нечіткої біматричної гри 334 - - - матричної гри двох осіб 310 - - біматричної гри в умовах коаліції при наявності погроз 334 - - БКНП-задач з нечіткими параметрами 226 - - динамічних задач управління запасами 258 - стохастичних квазіградієнтів (СКГ) 169,109 - стохастичної апроксимації 113 Методи нестрогого ранжування об’єктів 60 Методика оцінювання корисності 22,23 Мінімаксна задача БКНП з нечіткими параметрами 229 Модель відновлення у нескінченному плановому періоді 268 н Найкращий компромісний розв’язок задачі БКО 210 Недоміновані альтернативи в загальній задачі НМП 162 Незалежність ПКД від загального масштабу (шкали) 346 - від загального нуля 346 Непрямі методи стохастичного програмування 84 Нсстроге ранжування об’єктів 60 Нечітка задача планування при нескінченному плановому періоді 297 -при скінченному плановому періоді 296 - множина 129 - - множина недомінованих альтернатив 139 Нечітке відношення 132 - нестрогої переваги 136 Нижня ціна гри 309 Нормальна форма гри 307 405
о Одностайні задачі стохастичного програмування 84 Оператор значення кооперативної гри 357 Операції над нечіткими відношеннями 134 --множинами 128 Опукла гра 357 Основне рекурентне співвідношення (ОРС) динамічного програмування 245 п Парадокс Ерроу 377 Параметричний механізм розподілу витрат 366 Парето-оптимальиа, або ефективна альтернатива в задачі БКО 189 Парето-оптимальний розв’язок рівня а 228 Податок Мядро для розподілу витрат 360 - подушний 359 - пропорційний 364 - рівневий 359 Позиційна гра 302 Порядки колективного добробуту (ПКД) 344 Правило альтернативних голосів 374 - голосування 373 - абсолютної більшості 374 - Борда (підрахунок очок) 375 - відносної більшості 375 - з послідовним виключенням 375 Кондорсе 375 - Сімпсона 380 Принцип відокремлення коаліції 352 - відсутності субсидій 352 - егалітаризму 342 - оптимальності Беллмана 245 406
- передачі корисності Пігу-Дальтона 349 - узагальнення Заде 149 - Орловського 150 - утилітаризму 342 Прокляття вимірності динамічного програмування 255 Профіль голосування 374 Прямі методи стохастичного програмування 108, 113 Р Ранжування альтернатив у методі аналізу ієрархій 74 Рівновага при цінах Лінделла 371 с Сепарабельний механізм розподілу витрат 365 Стратегії рівноваги 305 Строге ранжування об’єктів 54 Субадитивна функція витрат 352 Суперадитивна функція прибутку 353 Теорема Пббарта-Сатгервайта (про захищене від маніпулювань правило) 385 - Мулена (щодо пропорційного податку) 364 - Неша 321 - про мінімакс Дж. фон Нсймана 308 - про оптимальні стратегії в нечіткій матричній грі 332 для марковських систем 286 - про умови збіжності методу СКТ 109 - Робертсона при ПКД, що не залежать від загального нуля та шкали 347 - Фоулі-Канеко про належність часткової рівноваги ядру ірн 371 - Шеплі про оператор значення 358 - Янга про існування оператора значення 358 - (щодо аксіоми про поповнення) 382 - (щодо відображення голосування) 383 407
Теорія корисності Дж. фон Неймана 22 Топологічне дерево гри ЗОЇ У Узагальнене нечітке відношення переваги 151 Умови Семюсльсона для моделі економіки виробництва суспільного продукту 368 Ф Функціональні рівняння Беллмана для марковських систем з доходами 286 Функція колективної корисності 345 - належності 128 ц Ціни Лінделла 371 ч Часткоаа рівновага 372 Чисті стратегії 309 ш Шкали вимірювання результатів оцінювання 42 - оцінок МПП 67 Я Ядро гри 353 408
Зміст ВСТУП...........................................................................з 1. ЗАГАЛЬНА ХАРАКТЕРИСТИКА ЗАДАЧ ПРИЙНЯТТЯ РІШЕНЬ...............................10 1.1. Історія розвитку методологи прийняти рішень................................10 1.2. Загальна характеристика та класифікація задач прийняття рішень.............19 1.2.1. Прийняття рішень в умовах визначеності................................21 1.2.2. Прийняття рішень в умовах ризику................................26 1.2.3. Прийняття рішень в умовах невизначеності.................................27 1.3. Основні етапи процесу прийняття рішень.....................................31 1.4. Основи теорії корисності...................................................36 Запитання для самоконтролю......................................................39 2. ЕКСПЕРТНІ МЕТОДИ ТА ТЕХНОЛОГІЇ РИЙНЯТТЯ РІШЕНЬ..............................40 2.1. Системний аналіз проблеми експертного оцінювання...........................40 2.1.1. Шкала вимірювання.....................................................42 2.2. Бінарні відношення.........................................................43 2.3. Класифікація задач експертного оцінювання..................................46 2.3.1. Класифікація задач експертного оцінювання за способами подання даних..46 2.3.2. Математичні моделі експертного оцінювання.............................49 2.3.3. Цілі експертного оцінювання...........................................49 2.4. Методи та алгоритми строгого ранжування об’єктів...........................51 2.4.1. Задачі колективного ранжування об’єктів та їх формалізація............51 2.4.2. Послідовний алгоритм розв'язання задачі строгого результуючого ранжування об'єктів......................................54 2.4.3. Процедура відсіювання безперспективних варіантів у задачі строгого ранжування об’єктів..................................56 2.5. Послідовний алгоритм розв’язання задачі визначення колективного ранжування за мірою незбіжності рангів об’єктів (ГВ-медіани)..........................58 2.6. Методи й алгоритми нестрогого ранжування об’єктів..........................60 2.6.1. Процедура послідовного аналізу та відсіювання варіантів за обмеженням на цільову функцію.....................................................60 2.6.2. Алгоритм знаходження результуючого ранжування.........................62 2.7. Метод аналізу ієрархій.....................................................64 2.8. Метод попарних порівнянь...................................................66 2.9. Дослідження методу парних порівнянь........................................71 2.10. Адитивна композиція критеріїв у методі аналізу ієрархій...................74 2.11. Дистрибутивний (розподілений) та ідеальний режими методу аналізу ієрархій.76 Запитання для самоконтролю......................................................80 409
3. ПРИЙНЯТТЯ РІШЕНЬ В УМОВАХ Дії ВИПАДКОВИХ ФАКТОРІВ........................82 3.1. Загальна характеристика задач прийняття рішень в умовах дії випадкових факторів. 82 3.2. Одностайні задачі стохастичного програмування...........................84 3.3. Двохетапні задачі стохастичного програмування...........................93 3.4. Метод проектування стохастичних квазіградієнтів..........................108 3.5. Метод стохастичної апроксимації..........................................113 3.5.1. Застосування методу стохастичних квазіградієнтів до задач стохастичного програмування..............................................115 Запитання для самоконтролю..................................................116 Задачі для самостійного розв’язання.........................................117 4. ПРИЙНЯТТЯ РІШЕНЬ У НЕЧІТКИХ УМОВАХ......................................128 4.1. Нечіткі множини та операції над ними...................................128 4.2. Нечіткі відношення. Операції над ними..................................132 4.3. Нечітке відношення переваги............................................136 4.4. Багатокритеріальний вибір альтернатив на основі нечіткого відношення переваги.. 143 4.5. Узагальнення нечіткого відношення переваги. Принципи узагальнення Заде-Орловського.....................................149 4.6. Загальна задача нечіткого математичного програмування і методи її розв’язання.... 159 4.7. Лінгвістичні змінні....................................................169 4.7.1. Застосування лінгвістичних змінних................................171 Запитання для самоконтролю..................................................178 Задачі для самостійного розв’язання.........................................179 5. ПРИЙНЯТТЯ РІШЕНЬ З ВЕКТОРНИМ КРИТЕРІЄМ ОПТИМАЛЬНОСТІ....................187 5.1. Постановка багатокритеріальної задачі прийняття рішень та її властивості.187 5.2. Метод обмежень для пошуку компромісних рішень у задачах векторної оптимізації............................................197 5.3. Багатокритеріальні задачі лінійного програмування......................201 5.4. Методи багатокритеріальної оптимізації.................................208 5.5. Багатокритеріальні задачі лінійного програмування з нечіткими цільовими функціями............................................219 5.6. Багатокритеріальне нелінійне програмування з нечіткими параметрами.....226 Запитання для самоконтролю..................................................233 Задачі для самостійного розв’язання.........................................234 6. ДИНАМІЧНІ ПРОЦЕСИ ПРИЙНЯТТЯ РІШЕНЬ......................................239 6.1. Основна ідея та особливості методу динамічного програмування...........239 6.2. Задачі послідовного прийняття рішень..................................246 6.3. Динамічне програмування для задач із кількома обмеженнями та змінними....253 410
6.4. Динамічні задачі керування запасами.................................258 6.5. Задачі динамічного програмування з нескінченним числом кроків.......265 6.6. Задачі динамічного програмування на мережах................................274 6.7. Динамічне програмування для марковських процесів....................284 6.8. Нечітка модель динамічного програмування для задач планування на N періодів.... 296 Запитання для самоконтролю......................................................299 7. ПРИЙНЯТТЯ РІШЕНЬ У КОНФЛІКТНИХ СИТУАЦІЯХ....................................ЗОЇ 7.1. Основні поняття і визначення теорії ігор............................ЗОЇ 7.2. Стратегія гри. Нормальна форма гри. Антагоністичні ігри....................303 7.3. Теорема про мінімакс Дж. фои Неймана та її застосування.............308 7.4. Розв’язання ігор з матрицями [2хл] та [лі*2]...............................313 7.5. Ігри з ненульовою сумою. Біматричні ігри............................316 7.6. Кооперативна гра двох осіб. Теорема Неша............................320 7.7. Ігроаі моделі прийняття рішень в умовах невизначеності..............330 Запитання для самоконтролю...............................................339 Задачі для самостійного розв’язання......................................340 8. ОСНОВИ ТЕОРІЇ КОЛЕКТИВНОГО ВИБОРУ. КООПЕРАТИВНІ ІГРИ п ОСІБ.................342 8.1. Принципи розподілу корисності.......................................342 8.2. Порядки колективного добробуту......................................344 8.3. Скорочення нерівності в доходах. Принцип передачі корисності Пігу-Дальтона.349 8.4. Кооперативні ігри п осіб з розподілом витрат і прибутків. Ядро гри.........351 8.5. Вектор Шеплі, його властивості та застосування в теорії кооперативних ігор.356 8.6. Розподіл витрат на спільний проект. Види податків...................358 8.7. Механізми розподілу колективних витрат..............................364 8.8. Застосування теорії кооперативних ігор п осіб в економіці...........367 8.9. Методи голосування..................................................373 8.9.1. Загальна характеристика проблеми. Основні методи голосування.373 Запитання для самоконтролю...............................................390 Задачі для самостійного розв’язання......................................392 СПИСОК ЛІТЕРАТУРИ........................................................398 ПРЕДМЕТНИЙ ПОКАЖЧИК......................................................402 411
Навчальне видання Зайченко Юрій Петрович Теорія прийняття рішень Підручник Редагування і коректура Н. В. МурашовоІ Комп’ютерне верстання М. А. Марченко. А. М. Мушницького Темплан 2014 р., поз. 1-1-005 ІІідп. до друку 25.06.2014. Формат бОхМ'/ц. Папір офс. Гарнітура Типе». Спосіб друку - офсет. Ум. друк. арк. 23,95. Обл.-вид. арк. 39,73. Наклад 500 пр. Зам. № 14-144. ПТУУ «КІН» ВП1 ВПК «Політехніка» Свідоцтво ДК № 1665 від 28.01.2004 р. 03056, Київ, вул. Політехнічна, 14, корп. 15 тел./факс (044) 406-81-78