/
Author: Зайченко Ю.П.
Tags: искусственный интеллект моделирование информационные технологии искусственные нейронные сети
ISBN: 978-966-8407-79-6
Year: 2008
Text
Зайченко Ю.П.
Нечеткие
МОДЕЛИ И МЕТОДЫ
в интеллектуальных
__ системах ______
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ УКРАИНЫ
Ю.П.ЗАЙЧЕНКО
НЕЧЁТКИЕ МОДЕЛИ И МЕТОДЫ
В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ
Рекомендовано Министерством образования и науки Украины
как учебное пособие для иностранных студентов высших учебных
заведений, направления «Компьютерные науки»
Под общей редакцией
академика М.З.Згуровского
Киев 2008
УДК 004.8(075.8)
ББК 32.813я73
3 17
Рекомендовано Министерством образования и науки Украины
как учебное пособие для иностранных студентов
высших учебных заведений, направления «Компьютерные науки»
(Письмо №1.4/18Г1689 от 08.07.2008 г.)
Реценз₽нты.Волошин А.Ф. - д.т.н., профессор, Киевский Национальный
университет им. Т.Шевченко;
Лопатин А.К. - д.ф.-м.н., профессор, зав. кафедрой инф. техноло-
гий и математики Национальной академии управления;
Печурин Н.К. - д.т.н., профессор. Национальный авиационный
университет.
3 17 Ю.П. Зайченко. Нечеткие модели и методы в интеллектуальных системах.
Учебное пособие для студентов высших учебных заведений. - К.:«Изда-
тельский Дом «Слово», 2008. - 344 с.
ISBN 978-966-8407-79-6
Книга посвящена одному из направлений в области искусственного интел-
лекта системам с нечёткой логикой и нечётким нейронным сетям и их применению
в различных практических задачах. Описан сравнительно новый метод индуктив-
ного моделирования. Рассмотрены многочисленные примеры применения НМГУА
в задачах прогнозирования в макроэкономике и финансовой сфере, системы логи-
ческого вывода с различными алгоритмами нечёткого вывода и нечёткие нейрон-
ные сети (ННС). Приводятся результаты их применения в задачах прогнозирования
в макроэкономике и на фондовых рынках, дан сравнительный анализ их эффектив-
ности. Описана система нечёткой логики для задач классификации NEFClss, а
также её новая модернизация. Рассмотрено применение ННС NEFClass в актуаль-
ной практической задаче распознавания объектов электрооптических изображений
в условиях помех. Рассмотрены задачи кластерного анализа в условиях неопределён-
ности и описаны современные методы нечёткой кластеризации - к-средних и' Гус-
тавссона - Кесселя, приводятся результаты их применения в задачах автоматичес-
кой классификации в экономике.
Описана актуальная задача анализа инвестиционного портфеля в условиях неопре-
делённости. Изложен современный нечётко - множественный подход для оптими-
зации инвестиционного портфеля - описаны примеры применения этого подхода
для построения оптимального портфеля в условиях неполноты и неопределённости
и проведен сравнительный анализ полученных решений с использованием как клас-
сического метода Марковитца, так и нечётко - множественной модели.
Книга ориентирована в первую очередь на студентов и преподавателей направле-
ний «компьютерные науки» и «компьютерная инженерия», и может служить учеб-
ным пособием по курсу «Системы искусственного интеллекта». Она будет полезна также
лицам, занимающимся разработкой, исследованием и применением интеллектуаль-
ных систем принятия решений, а также всем тем, кто интересуется современными
направлениями в области искусственного интеллекта и его многочисленных приложе-
ний в задачах прогнозирования, распознавания образов, классификации и кластер - анализа.
©Ю.П.Зайченко, 2008
© Издательский Дом «Слово», 2008
Содержание
Предисловие................................................. 7
ГЛАВА 1. НЕЧЕТКИЙ МЕТОД ИНДУКТИВНОГО
МОДЕЛИРОВАНИЯ............................................... 9
1.1. Общая характеристика и основные принципы МГУА ......... 10
1.2. Нечеткий МГУА. Основные идеи. Вывод математической мо-
дели НМГУА ................................................. 14
1.3. Описание алгоритма НМГУА .............................. 17
1.4. НМГУА с гауссовскими и колоколообразными ФП ........... 17
1.4.1. Нечеткие числа с гауссовской ФП...................... 18
1.4.2. Нечеткие модели с колоколообразной функцией принадлеж-
ности ...................................................... 21
1.5. Нечеткий МГУА с различными видами частичных описаний ... 22
1.5.1. Исследование ортогональных полиномов в качестве частич-
ных описаний алгоритмов НМГУА.............................. 22
1.5.2. Исследование тригонометрических полиномов в качестве
частичных описаний алгоритма МГУА ........................ .27
1.5.3. Исследование АРКС-моделей в качестве частичных описа-
ний алгоритма МГУА ........................................ 29
1.6. Адаптация коэффициентов линейной интервальной модели . 30
1.6.1. Основные положения.................................. 30
1.6.2. Применение метода стохастической аппроксимации для
адаптации параметров линейной интервальной модели ......... 32
1.6.3. Применение рекуррентного метода наименьших квадратов
(РМНК) для адаптации параметров линейной интервальной модели 34
1.7. Экспериментальные исследования НМГУА в задачах прогно-
зирования в экономике ..................................... 36
1.7.1. Анализ результатов ................................. 38
1.7.2. Результаты проведенных экспериментов с различными ФП ... 41
1.8. Сравнительный анализ результатов прогнозирования по чет-
кому и нечеткому МГУА ..................................... 42
1.9. Экспериментальные исследования разных видов частичных
описаний и методов адаптации в задачах прогнозирования..... 46
Выводы к главе 1 .......................................... 59
Вопросы для самопроверки к главе 1 ........................ 59
3
Содержание
ГЛАВА 2. НЕЧЕТКИИ МЕТОД ГРУППОВОГО УЧЕТА
АРГУМЕНТОВ ПРИ НЕОПРЕДЕЛЕННЫХ
ВХОДНЫХ ДАННЫХ............................................ 61
2.1. Общий вид математической модели НМГУА с нечеткими
входными данными............................................ 62
2 2. Вид математической модели для случая треугольных ФП . ... 63
2.2.1. Формализованная постановка задачи для треугольных ФП. 65
2.3 Вид математической модели для случая ФП Гаусса.......... 68
2.4 . Экспериментальные исследования НМГУА и анализ получен-
ных результатов............................................. 72
2.4.1. Прогнозирование индекса РТС.......................... 72
2.4.2. Прогнозирование индекса РТС-2 ....................... 80
2.4.3. Прогнозирование курсов акций ........................ 83
Выводы к главе 2 ........................................... 85
Вопросы для самопроверки к главе 2.......................... 86
ГЛАВА 3. СИСТЕМЫ НЕЧЕТКОГО ЛОГИЧЕСКОГО ВЫВОДА
И НЕЧЕТКИЕ НЕЙРОННЫЕ СЕТИ
И ИХ ПРИМЕНЕНИЕ В ЗАДАЧАХ
ПРОГНОЗИРОВАНИЯ........................................... 87
3.1. Алгоритмы нечеткого логического вывода................. 88
3.1.1. Нечеткий алгоритм Мамдани ........................... 91
3.1.2. Нечеткий алгоритм Цукамото .......................... 92
3 1 3. Нечеткий алгоритм Сугено........................... 93
3.1.4 Нечеткий алгоритм Ларсена.......... .. .94
3.2 Методы приведения к четкости .... ... 96
3.3. Теоремы об универсальной аппроксимации ................ 97
3.4. Нечеткие нейронные сети с выводом Мамдани и Цукамото .. 100
3.4.1. Нечеткий контролер на базе нейронных сетей ......... 100
3 4.2. Алгоритм обратного распространения ошибки в ННК Мамдани . 105
3.5. Градиентный алгоритм обучения ННС Мамдани и Цукамото ... ПО
3.6. Нечеткая нейронная сеть ANFIS. Структура и алгоритм обучения 114
3.7. Нечеткие нейронные сети TSK и Ванга-Менделя. Гибридный
алгоритм обучения ......................................... 120
3.7 .1. ННС TSK ........................................... 121
3.7 2. Структура сети Ванга-Менделя ....................... 124
3.7 3. Гибридный алгоритм обучения нечетких нейронных сетей 126
3.8 Нечеткая нейронная сеть NEFPROX ....................... 131
3.8.1. Применение нечетких нейронных сетей для аппроксимации
функции.................................................... 131
3.9. Экспериментальные исследования нечетких нейронных сетей в
задачах прогнозирования в макроэкономике и финансовой сфере .. 139
3 9.1 Постановка задачи прогнозирования ................... 139
4
Содержание
3.9.2. Прогнозирование в макроэкономике с использованием НН К
Мамдани и Цукамото ........................................ 141
3.9.3. Прогнозирование макроэкономических показателей с ис-
пользованием нечеткой нейронной сети ANFIS ................ 145
3.9.4. Сравнительный анализ результатов прогнозирования разны-
ми методами ............................................... 146
3.10 . Применение ННС для прогнозирования в финансовой сфере ... 148
Выводы к главе 3........................................... 154
Вопросы для самопроверки к главе 3......................... 155
ГЛАВА 4. НЕЧЕТКИЕ НЕЙРОННЫЕ СЕТИ В ЗАДАЧАХ
КЛАССИФИКАЦИИ ............................................ 156
4.1. ННС NEFClass. Архитектура, свойства, алгоритм обучения
базы правил и параметров ФП ............................... 156
4.2. Анализ свойств NEFClass. Модифицированная система нечёт-
кой классификации NEFClassM ............................... 162
4.3. Экспериментальные исследования ННС NEFClass. Сравни-
тельный анализ ННС NEFClass и NEFClassM в задачах классифи-
кации в экономике ......................................... 166
4.4. Распознавание объектов электрооптических изображений. По-
становка и анализ задачи .................................. 171
4.4.1. Обшая характеристика работы системы, исторические сведения 171
4.4.2. Концепция мультиспектральных электро-оптических систем. Основ-
ные определения .......................................... '172
4.4.3. Виды сенсоров. Мультиспектральные и гиперспектральные
системы.................................................... 174
4 4 4. Принципы формирования изображения системы ....... 176
4.5. Применение системы NEFClass в задаче распознавания объек-
тов электрооптических изображений ......................... 177
4.5.1 Градиентный алгоритм обучения в системе NEFClass .... 177
4.5.2. Метод сопряженных градиентов для системы NEFClass.. 179
4.5.3. Генетический метод обучения для системы NEFClass ... 181
4.5.4. Эксперименты по распознаванию объектов на реальных дан-
ных 183
Выводы к разделу 4 ....................................... 193
Вопросы для самопроверки к главе 4......................... 194
ГЛАВА 5. ННС И СИСТЕМЫ С НЕЧЕТКОЙ ЛОГИКОЙ
В ЗАДАЧАХ КЛАСТЕРНОГО АНАЛИЗА .......... 195
5.1. Кластер-анализ. Постановка задачи. Критерии качества и мет-
рики кластер-анализа ...................................... 196
5.2. ННС с самоорганизацией. Нечеткий метод /^-средних --- 199
5.2.1. ННС с самоорганизацией ............................. 199
5
Содержание
5.2.2. Алгоритм нечёткой самоорганизации А'-средних........ 200
5.3. Определение начального размещения центров кластеров. Ме-
тоды пикового и разностного группирования ................. 202
5.3.1. Алгоритм пикового группирования .................... 202
5.3.2. Алгоритм разностного группирования.................. 203
5.4. Алгоритм нечеткого кластер-анализа Густавссона-Кесселя. 205
5.5. Применение нечетких методов А'-средних и Густавссона-Кес-
селя в задачах автоматической классификации ............... 206
Выводы к разделу 5 ........................................ 220
ГЛАВА 6. СИСТЕМЫ С НЕЧЁТКОЙ ЛОГИКОЙ И НЕЧЁТКИЕ
МНОЖЕСТВА В ФИНАНСОВОМ АНАЛИЗЕ.................... 222
6.1. Классические методы прогнозирования банкротства....... 223
6.1.1. Общая характеристика понятия «риск банкротства»..... 223
6.1.2. Многомерный дискриминантный анализ.................. 225
6.2. Комплексная оценка риска банкротства корпорации на основе
аппарата нечётких множеств................................. 232
6.2.1. Модель риска банкротства корпорации................. 234
6.2.2. Метод оценки риска банкротства...................... 236
6.2.3. Анализ на основе только количественных оценок....... 245
6.3. Применение нечетких нейронных сетей для анализа риска
банкротства................................................ 247
6.3.1. Входные данные для анализа риска банкротства........ 248
6.3.2. Описание экспериментов.............................. 249
6.3.3. Сравнительный анализ различных методов оценки риска
банкротства................................................ 262
6.4. Анализ инвестиционного портфеля....................... 268
6.4.1. Постановка задачи оптимизации инвестиционного портфеля . 269
6.4.2. Чёткая задача оптимизации портфеля (задача Марковица) и
её решение................................................. 270
6.4.3. Постановка нечёткой задачи портфельной оптимизации... 273
6.5. Метод решения нечёткой задачи оптимизации портфеля..... 275
6.6. Сравнительный анализ результатов решения чёткой и нечёткой
задач оптимизации инвестиционного портфеля................. 282
6.7. Экспериментальные исследования нечетко-множественной
модели с различными функциями принадлежности............... 291
Выводы к разделу 6 ........................................ 297
Приложение ................................................ 298
Список сокращений ......................................... 333
Литература ................................................ 334
6
Предисловие
Данная монография подготовлена на основе соответствующе-
го курса, который автор читает для магистров специальности
«Интеллектуальные системы принятия решений» в Институте
прикладного системного анализа национального технического
университета Украины «КПИ».
В последние годы системы с нечёткой логикой и нечеткие
нейронные сети получили широкое применение в интеллекту-
альных системах принятия решений в задачах распознавания об-
разов и классификации, в кластерном анализе, в экономике и
финансовой сфере для прогнозирования и стратегического ана-
лиза, оптимизации инвестиционного портфеля и оценки риска
банкротства корпорации. Трудно найти сейчас сферы принятия
решений, где бы активно не использовались методы и модели,
основанные на нечеткой логике.
В настоящей монографии нашли отражение многие извест-
ные работы в области применения систем с нечеткой логикой и
нечетких нейросетей (ННС) в задачах и системах искусственного
интеллекта (ИИ). Особенностью данной монографии является
то, что в большинстве разделов представлены результаты автора,
полученные в области разработки и применения систем нечеткой
логики и ННС в задачах прогнозирования, классификации, кла-
стеризации.
В первой главе представлен разработанный автором нечеткий
метод группового учёта аргументов (НМГУА). Его изложение ил-
люстрируется большим числом примеров применения в задачах
прогнозирования в экономике и финансовой сфере.
Вторая глава посвящена развитию и обобщению НМГУА на
случай, когда входная информация задана нечетко в форме ин-
тервалов неопределённости. Такой случай неопределенности ис-
ходных данных широко распространен на практике. В моногра-
фии приводятся многочисленные примеры применения НМГУА
с нечеткими входами для прогнозирования фондовых индексов
и курсов акций на фондовом рынке.
Третья глава посвящена рассмотрению систем с нечеткой ло-
гикой и нечетких нейросетей (ННС). Рассмотрены ННС с выво-
дом Мамдани и Цукамото, описаны их алгоритмы обучения. Да-
лее описаны нечеткие нейронные сети с выводом Сугено,
ANFIS и её развитие TSK, описаны алгоритмы обучения этих сетей.
7
Предисловие
Далее в этой главе приведены результаты многочисленных экс-
периментов ННС с выводом Мамдани, Цукамото и Сугено в за-
дачах прогнозирования в макроэкономике и финансовой сфере,
даётся сравнительный анализ их эффективности, преимуществ и
недостатков в сравнении с обычными нейронными сетями в
данной сфере. Здесь также представлены и обобщены результаты
собственных исследований автора.
Четвертая глава посвящена рассмотрению ННС в задачах клас-
сификации. Здесь описана известная ННС NEFClass, её структура,
алгоритм обучения базы правил и параметров функций принад-
лежности. Далее описана модификация ННС NEFClass, предло-
женная автором, и приводятся сравнительные эксперименты NEFClass
и модифицированной системы NEFClass-M.
В этой главе рассмотрена также задача распознавания объек-
тов электрооптических изображений на фоне помех с использо-
ванием систем с нечеткой логикой и описаны результаты приме-
нения для этой задачи ННС NEFClass.
В пятой главе даётся широкий обзор методов кластерного
анализа при нечетких условиях. Описаны известные методы: не-
четкий метод /Передних, метод кластеризации Густавссона-Кес-
селя и другие. Применение методов иллюстрируется многочис-
ленными примерами автоматической классификации экономиче-
ских систем.
Шестая глава посвящена исследованиям и применению систем
с нечеткой логикой и нечетких множеств в финансовой сфере. Здесь
рассмотрены задачи оценки риска банкротства корпорации, а также
важная задача оптимизации инвестиционного портфеля с использо-
ванием нечетко-множественного подхода и метод её решения.
Выполнен сравнительный анализ полученных результатов с
классическим решением задачи Марковица.
Данная монография ориентирована на специалистов в области
систем искусственного интеллекта в его многочисленных приложе-
ниях и на лиц, собирающихся применять нечеткие методы и модели
в своей научной и практической деятельности, а также на студентов
ВУЗов бакалавратов «Прикладная математика», «Компьютерные нау-
ки» и преподавателей соответствующих специальностей.
Зайченко Ю. П.
Киев, 2007
8
ГЛАВА
Моему учителю
Алексею Григорьевичу Ивахненко
ПОСВЯЩАЕТСЯ
Нечеткий метод
индуктивного
моделирования
ВВЕДЕНИЕ
Данная глава посвящена исследованию нечеткого ме-
тода индуктивного моделирования, известного под названием
метода группового учета аргументов (МГУА) в задачах моделиро-
вания и прогнозирования в макроэкономике.
Проблема состоит в построении прогнозирующих моделей и
нахождении неизвестной функциональной зависимости между
прогнозируемой величиной и заданным набором макроэкономи-
ческих показателей по экспериментальным данным. При этом
аналитический вид модели (функциональной зависимости) неиз-
вестен.
Преимуществом метода индуктивного моделирования МГУА
является возможность построения «объективной» модели в про-
цессе работы алгоритма, а также возможность работать на корот-
ких выборках. Особенностью нечеткого МГУА является получе-
ние интервальных оценок для прогнозируемой переменной, что
позволяет судить о точности получаемого прогноза.
В главе дается обзор основных результатов, полученных в об-
ласти нечеткого метода самоорганизации, выполнен анализ при-
менения различных видов функций принадлежности (ФП), оце-
ниваются перспективы использования нечеткого МГУА в задачах
прогнозирования в макроэкономике и финансовой сфере и от-
мечаются некоторые направления его дальнейших исследований.
9
Нечёткие модели и методы в интеллектуальных системах
1.1. ОБЩАЯ ХАРАКТЕРИСТИКА
И ОСНОВНЫЕ ПРИНЦИПЫ МГУА
Постановка задачи
Задано множество исходных данных: входные перемен-
ные {Л(1), А'(2),...,А'(ЛГ)} и выходные переменные {У(1),У(2),...,
Y(N) , где X - [х, »дс2,...,лсл] - «-мерный вектор, N- число точек
наблюдения.
Требуется на основе наблюдаемых данных построить мо-
дельУ = р(х1гх2,...,х„), адекватную наблюдаемым данным, при-
чем полученная модель должна быть в определенном понимании
наименьшей сложности. В частном случае при решении задачи
прогнозирования в качестве выходной переменной используется
модель X(N + K) = /(^(1)..X(N)), где К - величина интервала
упреждения.
Отличительными особенностями данной задачи являются:
1) вид функциональной зависимости не известен, а определен
только класс моделей, например, полиномов произвольной сте-
пени нелинейности или гармонический ряд (Фурье),
2) короткая выборка данных;
3) временные ряды х,(г) в общем случае нестационарные.
В таком случае применение классических методов статисти-
ческого анализа, например, регрессионного или дисперсионного
анализа, невозможно и необходимо использовать «нестандарт-
ные» методы, основанные, например, на применении идей ис-
кусственного интеллекта.
К их числу относится метод группового учета аргументов
(МГУА), предложенный в работах А.Г.Ивахненко [50], и разви-
тый в многочисленных работах А.Г.Ивахненко и его учеников
[50; 51]. Он является методом индуктивного моделирования
сложных систем.
Метод заимствует идеи из биологии, а именно механизмы
эволюции:
1) скрещивание или гибридизация родительских пар (аргу-
ментов) и генерация потомков;
2) селекция и отбор лучших.
Основными преимуществами метода, которые обусловили его
популярность и широкое использование не только в Украине, но
и за рубежом, являются следюшие:
10
Глава 1. Нечеткий метод индуктивного моделирования (МГУА)...
— метод не требует задания модели в явном виде, модель
конструируется сама в процессе работы алгоритма;
— метод работает на коротких выборках (когда число опреде-
ляемых коэффициентов модели п больше числа точек наблюде-
ния М).
Вместе с тем классический метод МГУА обладает рядом не-
достатков:
— при близких экспериментальных точках возможно явление
вырожденности матрицы нормальных уравнений Гаусса (“инду-
пит” в терминологии А.Г.Ивахненко). вследствие чего возникает
необходимость применения специальных методов регуляризации;
— метод дает точечную модель (прогноза), а в ряде случаев
желательно иметь доверительный интервал, который характери-
зует точность прогноза.
Поэтому в последние годы ведутся интенсивные исследова-
ния, направленные на разработку новых методов, лишенных ука-
занных недостатков.
Таким методом является нечеткий МГУА (НМГУА), который
строит интервальную модель регрессии, и для нахождения моде-
ли (прогноза) не использует метод наименьших квадратов (МНК).
Поэтому явление вырожденности здесь отсутствует.
Основные принципы МГУА
Напомним основополагающие принципы МГУА, которые
справедливы и для нечеткого его варианта. Полная зависимость
между входами X(i) и выходами Y(i) в классе полиномиальных
моделей может быть представлена с помощью обобщенного по-
линома Колмогорова—Габора.
Пусть имеетсяX = (х|,х2,...,х„), тогда полином Колмогоро-
ва—Габора имеет вид:
У = о0 + £о,х, + f Zfl.-x,x, + Z Z 1а.кх,х,хк +... ,
i-l • У-l/S) V i-ljiikiJ
где все коэффициенты неизвестны.
При построении модели (при определении значений коэф-
фициентов) в качестве критерия используется критерий регуляр-
ности (точности):
N ы
где N — объем выборки наблюдений.
11
Нечёткие модели и методы в интеллектуальных системах
Необходимо обеспечить минимум е2.
Принцип множественности моделей: существует множество мо-
делей на данной выборке, обеспечивающих нулевую ошибку
(достаточно повышать степень полинома модели). Те., если име-
ется N узлов интерполяции, то можно построить целое семейство
моделей, каждая из которых при прохождении через эксперимен-
тальные точки будет давать нулевую ошибку;
е2 = 0.
Принцип самоорганизации. Обозначим 5 - сложность модели
(определяется числом членов полинома Колмогорова—Габора).
Значение ошибки е2 зависит от сложности модели. Причем по
мере роста сложности, сначала она будет падать, достигает ми-
нимума, а затем начинает возрастать. Нам же нужно выбрать та-
кую оптимальную сложность, при которой ошибка будет мини-
мальна. Кроме того, если учитывать действие помех, то можно
выделить следующие моменты:
1. При различном уровне помех зависимость е2от сложности
S будет изменяться, сохраняя при этом общую направленность
(имеется ввиду, что с ростом сложности она сначала будет умень-
шаться, а затем - возрастать).
2. При увеличении уровня помех величина min е2 будет воз-
5
растать
3. С ростом уровня помех, величина оптимальной сложности
5g = arg min е2 будет уменьшаться (оптимальное значение слож-
ности будет смешаться влево). Причем е2 (5„)>о, если уровень
помех не нулевой.
Теорема неполноты Гёделя. В любой формальной логической
системе имеется ряд утверждений и теорем, которые нельзя ни
опровергнуть, ни доказать, оставаясь в рамках этой системы ак-
сиом.
В данном случае эта теорема означает, что выборка всегда
неполна.
Один из способов преодоления неполноты выборки данных,
которая является следствием теоремы неполноты Геделя — прин-
цип внешнего дополнения. В качестве внешнего дополнения ис-
12
Глава 1. Нечеткий метод индуктивного моделирования (МГУА)...
пользуется дополнительная выборка (проверочная), точки кото-
рой не использовались при обучении системы (т.е. при поиске
оценочных значений коэффициентов полинома Колмогорова-
Габора).
Поиск наилучшей модели осуществляется таким образом:
• Вся выборка делится на обучающую и проверочную:
Л/ - N + /V
1 'еыб 1 ^нбуч ~ 1 'ярое*
• На обучающей выборке N„ey4 определяются значения Яд,
• На проверочной выборке N„po, отбираются лучшие модели.
Принцип свободы выбора (неокоичателыюсти промежуточного
решения):
1. Для каждой пары х,и х, строятся частичные описания (все-
т
го С*) вида:
— э
Или - ip(x.,Xj) = Qq +о.х. +OjXj, s = 1..C* (линейные);
— 2 2
. или Г = <p(x.,xy) = % + х. + ajXj + О..х. + л.х.х. + а „х.,
т
5 = 1..С* (квадратичные).
2. Определяем коэффициенты этих моделей по МН К, ис-
пользуя обучающую выборку, т.е. находим
al aij—'aNN'
3. Далее на проверочной выборке для каждой из этих моделей
ищем оценку по критерию регулярности:
_ N 2
6Л=77^' .
пров 1 = 1
где У(к) — действительное значение выходной переменной в Л-той
точке проверочной выборки; у (к) ~ выходное значение в Л-той
точке проверочной выборки в соответствии с s-той моделью,
— число точек проверочной выборки;
13
Нечёткие модели и методы в интеллектуальных системах
или по критерию несмещенности:
1 пров г
N =----!Z IЬ - / I ,
сл« TVj +N2 1 V k k J
где вся выборка делится на две части /V, и N2, Ук ~ выходы мо-
дели построенной на выборке /V,, у" — выходы модели постро-
енной на выборке N2.
4. Определяем /’лучших моделей по одному из вышеуказан-
ных критериев и выбранные модели у, подаются на второй ряд.
Ишем
Zj = ф(2) (х., Xj) = a<2) + aj2)yf. + а(2)у^. + a^y2 + a^2)yfyj + a^2)y2.
Оценка здесь такая же, как на первом ряде. Отбор лучших осу-
ществляется опять так же, но F2< Ft. Процесс конструирования
рядов повторяется до тех пор, пока средний квадрат ошибки бу-
дет убывать. Когда на слое m получим увеличение ошибки е2 , то
процесс синтеза модели прекращаем.
1.2. НЕЧЕТКИЙ МГУА. ОСНОВНЫЕ ИДЕИ.
ВЫВОД МАТЕМАТИЧЕСКОЙ МОДЕЛИ НМГУА
В работах [30—32; 46] была рассмотрена линейная ин-
тервальная модель регрессии
Y = /nZn + A.Z. + ... + A Z , (1.1)
0 0 11 и и ’ '
где Д - нечеткие числа треугольного вида, описываемые парой
параметров
Л.=(а.,С/),
где а, - центр интервала, с; - его ширина, с, > 0.
Тогда Y- нечеткое число, параметры которого определяются
следующим образом:
центр интервала
= £«,*/ =aTz, (1.2)
14
Глава 1. Нечеткий метод индуктивного моделирования (МГУА)...
ширина интервала
cy=^c/hj=cTH- (1-3)
Для того, чтобы интервальная модель была корректной, необ-
ходимо, чтобы действительное значение выходной величины У
принадлежало интервалу неопределенности, что описывается
следующими ограничениями:
[ Т Т । .
a z-с И<у;
а.4)
Т Т I I
a Z+С •|г|>у.
Например, для частичного описания вида
= Aq + A[xj + + A^x.Xj + Лдх2 + Tl5xJ (1.5)
в общей модели (1.1) необходимо положить
2 2
г0=1’ г1 = V Z2=X/’ <3 = V,’ z4=xi ’ z5 = xj'
Предположим, что мы наблюдаем обучающую выборку
U|,Z2’—’ Тогда Для адекватности модели
вида (1.1) необходимо найти такие (а.,с ) —, для которых бы
' 1 i = 1,л
выполнялись соотношения^вида:
aTz -сГ lz,l<y, -,
к | к\ 'к
aTz, + J.LI > у
к \ к\ к
Сформулируем основные требования к оценочной линейной
интервальной модели для частичного описания вида (1.5).
Найти такие значения параметров (а„ с,) нечетких коэффици-
ентов, при которых:
а) наблюдаемые значения ук попадали бы в оценочный интер-
вал для ук\
б) «суммарная ширина» оценочного интервала была бы ми-
нимальна.
к = \.М.
15
Нечёткие модели и методы в интеллектуальных системах
Эти требования можно свести к следующей задаче ЛП:
(
min С,
л/
О л/+С1 S |хл;.|+с2 Z
К — 1 К —
.2
ki
М
= 1
м
Ml^J’
kj
ki "kj
(1.7)
при условиях:
2 2
“О + а1хЛ/ + a2x kj + a3xkixkj + а4^/ + а5х kj "
-(с0
+ С1|хЛ/| + С2х4/
+ C3xki'xkj +C4\xki
+ C5|x#|)-yfc
М
•4 X
к = 1
2
М
3 *
к = 1
2 2
а0 +а1Хк.+а2Хк.+а3хк.хк] + <*4*ki+*5xkj +
к = \,М ,
С > 0, /7 = 0,5,
Р
(18)
(1.9)
где к - номер точки измерения.
Как видим, задача (1.7)—(1.9) является задачей ЛП. Однако
неудобство формы (1.7)—(1.9) для применения стандартных ме-
тодов ЛП состоит в том, что нет ограничений неотрицательности
для переменных а,. Поэтому для ее решения переходим к двойст-
венной задаче, введя двойственные переменные {5*} и {5*.+м},
к = 1, М . Решив двойственную задачу симплекс-методом и найдя
оптимальные значения двойственных переменных {5*.}, {5^м},
найдем также оптимальные значения искомых переменных с.,
а„ / = 0,5, а также искомую нечеткую модель для частичного
описания (1.5).
16
Глава 1. Нечеткий метод индуктивного моделирования (МГУА)...
1.3. ОПИСАНИЕ АЛГОРИТМА НМГУА
Дадим краткое описание алгоритма [46].
1. Выбор общего вида модели, которым будет описываться
искомая зависимость.
2. Выбор внешних критериев оптимальности (критерия регу-
лярности 5 или несмещенности 7V„).
3. Выбор общего вида опорной функции (вида частичных
описаний), например, линейного или квадратичного.
4. Разбиение выборки на обучающую N„6 и проверочную Nnpu,.
5. Присваиваем нулевые значения счетчику числа моделей к и
счетчику числа рядов г.
6. Генерируем новую частичную модель f вида (1.5) на обу-
чающей выборке. Решаем задачу ЛП (1.10)—(1.12) и находим ис-
комые значения а„ с,.
7. Определяем по проверочной выборке Nnpoe значение внеш-
него критерия () или (5^\г)).
8. к = к + 1. Если к > , то к= 0, r= г + 1.
9. Вычисляем наилучшее значение критерия для моделей г-й
итерации (N^ или 5^\л)). Если r = 1, то переходим на шаг 6,
СМ
иначе - на шаг 10.
10. Если IjV (г)
| ои' '
N (г -1) < е , то переходим на шаг 11,
СМ |
иначе - отбираем F лучших моделей и переходим на шаг 6 и вы-
полняем следующую (г + 1)-ю итерацию.
11. Из F моделей предыдущего ряда находим по критерию ре-
гуляризации наилучшую модель.
1.4. НМГУА С ГАУССОВСКИМИ
И КОЛОКОЛООБРАЗНЫМИ ФП
В первых работах, посвященных нечеткому МГУА
[30—32], рассматривались функции принадлежности нечетких
коэффициентов треугольного вида. Поскольку нечеткие числа
могут иметь и другой вид ФП, то представляет интерес рассмот-
рение других классов ФП в задачах моделирования на основе
17
Нечёткие модели и методы в интеллектуальных системах
МГУА. В работе [36] рассмотрены нечеткие модели с гауссов-
скими и колоколообразными ФП.
1.4.1. Нечеткие числа с гауссовской ФП
Назовем нечетким числом В с гауссовской ФП нечет-
кое множество с ФП вида:
। (*-<?
Я в(х) = е 1 ‘2
(1.10)
Такое НЧ задается парой чисел р = (а,с), где а — центр, ас —
величина, характеризующая ширину интервала (рис. 1.1).
Рис. 1.1. Подмножество уровня а
Пусть оценочная линейная интервальная модель для частич-
ного описания НМГУА имеет вид (1.5). Тогда задача ставится
так: найти такие нечеткие числа Л„ т.е. параметры (а„ с,), чтобы:
1) наблюдение ук принадлежало данному оценочному множе-
ству ук со степенью, не меньшей, чем а, 0 < а < 1.
2) ширина оценочного интервала уровня а была бы мини-
мальна.
Ширина оценочного интервала уровня а равна (см. рис. 1.1):
da=y2-y]=2(y2-a}'
где (у2 - а) определяется из условия:
18
Глава 1. Нечеткий метод индуктивного моделирования (МГУА)...
a = exp-
^2~a}2
с2
(111)
Отсюда da = 2c-V-21na . Для текущей точки k: d* =
= 2c V- 2 In a , и тогда целевая функция может быть записана в
к
виде:
M M
min Е dk = min E 2C. 7-2 In a =
Jt = l a Л = 1 K
M n
= 2-J- 2 In a min E Z C. L .
* = !/ = ! 1 1
(I.12)
Так как 2-J- 2 In a - положительная константа, не влияющая
на набор с;, который минимизирует целевую функцию (1.12), то
можно разделить целевую функцию на эту константу, и приведем
целевую функцию к исходному виду.
Теперь рассмотрим первое требование: ц(уЛ) > а.
Оно эквивалентно
ехр
1 (Ук~ак)2
2 с2
ск
Это неравенство приводится к системе неравенств вида:
ак + c^-21na У к'
°к -cAV-21na <уЛ.
(1.13)
С учетом того, что
задача нахождения нечеткой модели сводится окончательно к за-
даче ЛП следующего вида:
19
Нечёткие модели и методы в интеллектуальных системах
min Cg
Л/ М \ \ М I I
+С* л -1+% -1 Ы + С\ L11 w w +
М ,
+ С Л S -X
4 = 1
м
при условиях:
.2
ki
5
ЭЛ = 1
.2
kj ’
(1.14)
а0 + Й1 Xki + - + a5Xkj + (С0 + С1
l5Xi~(C0+Cl
aG+a\xki
5 kj
5 kj
к
к
к = \,М.
(1.15)
Для решения этой задачи, как и в случае ФП треугольного
вида, можно перейти к двойственной задаче вида:
( М М
тах\£Ук-*к + м- £ук
\ к = 1 к = 1
(1.16)
при условиях-равенствах:
М М
Е 8к + М~ 2 6Л=0’
Л = 1 к + м к = \ К
м м
*Xki*k + M-^*
к = 1 к = 1
ki.
i
Л=0’
(1.17)
Л/ М .
Xki дк + М~ Хк =0;
к = 1 KJ К м k = l j
и условиях-неравенствах:
20
Глввв 1. Нечеткий метод индуктивного моделирования (МГУА)...
ММ у
Е + Е Ъ. м S -7===-
л = | k k = \ К V-2lna
М I I
м । . м. । л,к#1
(1.18)
5, > 0 , к = 1,2Л/ .
К
Эта задача решается стандартными методами.
1.4.2. Нечеткие модели с колоколообразной
функцией принадлежности
Распространенный класс нечетких чисел составляют
НЧ с колоколообразной ФП вида:
М в(х) =
1
1+(^—Е)2
с
(119)
Такое НЧ В задается парой чисел В = (а,с), где а — центр, ас —
величина, характеризующая ширину функции (рис. 1.2).
Рис. 1.2. Колоколообразная ФП
21
Нечёткие модели и методы в интеллектуальных системах
Для нечеткой модели
Г = Ло + ZjX. + А2х. + /l3xzxy + А4х^ +
+ А х2
5j '
соответствующая задача ЛП для нахождения неизвест-
ных параметров (а,,с,) имеет вид [36]:
МММ
тш Со • М + q £ |xj + С2 £ |xj + С, £ |xfc/ x*.|
/V — 1 АС — 1 АС — 1
М - м >
А — 1 А — 1
(1.20)
при условиях:
ао
"о
л.х,. + ... + д_х.. + (С + С. х,.+...+ Сс
I ki 5 я/ О 1| га| 5
a x.. +... + а х?. -(Сл + С. х.. +... + С,
1га 5 kj 0 1| га| 5
(1.21)
k = \,M , С. >0, z = 0,5.
Перейдя от нее к двойственной задаче, можно найти искомое
решение стандартными методами ЛП.
1.5. НЕЧЕТКИЙ МГУА С РАЗЛИЧНЫМИ ВИДАМИ
ЧАСТИЧНЫХ ОПИСАНИЙ
1.5.1. Исследование ортогональных полиномов
в качестве частичных описаний
алгоритмов НМГУА
Как известно из общей теории МГУА, модели-пре-
тенденты генерируются на основе так называемых частичных
описаний — моделей определенного вида (например, линейных
полиномов), которые, используя как свои аргументы частичные
описания предыдущих этапов синтеза модели оптимальной слож-
ности, создают модели-претенденты все более сложной структу-
ры Но задача выбора вида частичных описаний не формализо-
22
Глава 1. Нечеткий метод индуктивного моделирования (мгув)...
вана, и этот выбор обусловлен следующими преимуществами ор-
тогональных полиномов в задачах моделирования нелинейных
процессов, характеристики которых априори неизвестны:
• Благодаря свойствам ортогональности вычисление коэффи-
циентов полиномиального уравнения, которое аппроксимирует
процесс, происходит быстрее, чем для неортогональных полиномов.
• Коэффициенты полиномиального аппроксимирующего урав-
нения не зависят от порядка исходной полиномиальной модели;
таким образом, при отсутствии априорной информации о поряд-
ке полинома можно проверить полиномы нескольких порядков,
при этом коэффициенты, полученные для низшего порядка, ос-
таются такими же и для высшего. Это свойство наиболее важно
при исследовании порядка аппроксимирующего полинома.
• Одним из свойств ортогональных полиномов, которые ис-
пользуются в данной работе и являются наиболее широко ис-
пользуемыми в задачах нелинейной аппроксимации, есть свойст-
во почти равных ошибок. Это свойство состоит в том, что ошиб-
ка аппроксимации колеблется в середине диапазона измерений
между двумя почти одинаковыми границами. Благодаря этому
свойству не могут возникать очень большие ошибки, например,
выбросы за пределы диапазона данных, для которых проводится
аппроксимация; наоборот, в большинстве случаев ошибки малы.
Таким образом, происходит «демпфирование» ошибок аппрокси-
мации.
Основные положения
Рассмотрим аппроксимирующее уравнение для одно-
мерной системы:
у(х) = bQFQ(x) + blFl(x) + ... + bmFm(x), (1.22)
где у — исходная величина, которая оценивается, /\(х) — орто-
гональный полином порядка v, который обладает свойством ор-
тогональности, т.е.:
г
Е Г(х)Г(х.) = 0, Vp#v, (1.23)
/ = 0 р
г — длина обучающей выборки.
Или в общем виде (для непрерывных переменных):
23
Нечёткие модели и методы в интеллектуальных системах
Ь
$a(x)F (x)Fv(x)dx = 0 ,
a
(124)
где p,v — неотрицательные целые числа, а>(х) — весовой коэф-
фициент.
Исследование ортогональных полиномов
Чебышева в качестве частичных описаний алгорит-
ма НМГУА
Ортогональные полиномы Чебышева в общем случае
имеют следующий вид [34];
/\,(£) = = cos(v arccos£), -1 < £ < 1, (1.25)
Данные полиномы имеют следующие свойства ортогональности;
1 T^T^d^ 0 п при при fl — V at О'
-1 Vi 2 п при р = v = 0,
(1.26)
где -J1 - t2 — весовой коэффициент ю(£) уравнения (1.24).
Несколько полиномов Чебышева низкого порядка (таблица
1.1);
ТАБЛИЦА 1 1 .
Г0Ю = !
Г2(У = 2^2-1
Tv+l^ = 2^Tv^~Tv-l^
Аппроксимирующий полином для у получают на основе ми-
нимизации функционала S:
5 =
1 Г m
J Ш(О Х0- Z Ь.ТЩ
-11 / = о"
(127)
24
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Откуда следует:
i!
*-1 Jl-^2
2;
Г-1 JT?
Jt = O
k *0.
(1.28)
Отсюда получаем аппроксимирующее уравнение:
у<& = Z bkTk^-
k = 0
(1.29)
Как видно из приведенных соотношений, bk в уравнении
(1.29) не зависит от выбора т. Т.е., переменная т не требует пе-
ресчета bp Xfj < т , в то время как это необходимо при неортого-
нальной аппроксимации, что требует больших затрат времени.
Исследование ортогональных полиномов
Лагерра в качестве частичных описаний
алгоритма МГУА
Полином Лагерра в общем виде записывается следую-
щим образом:
ех dn
(1.30)
л! ax
Аппроксимирующее уравнение для одномерной системы не
изменится:
УМ = bQFQ(x) + bfi (%) + ... + t>mFm(x) , (1.31)
где у — исходная переменная, которая оценивается, Т,(х) — ор-
тогональный полином порядка v, который обладает свойством
ортогональности (1.23) или (1.24).
Аппроксимирующий полином для у получают на основе ми-
нимизации функционала S:
5= и(яи-ХА^(о
-I \ '’° >
(1.32)
25
Нечёткие модели и методы в интеллектуальных системах
Для вычисления полинома Даггера заданного порядка можно
применять следующую рекуррентную процедуру:
А](х) = -х +1;
/^(х^х2-4х + 2; (1.33)
Li(^) = (2я +1 - х)Лп(х) - п2£п_,(х).
Определение наилучшего порядка
аппроксимирующего полинома
Наилучший порядок т* аппроксимирующего полино-
ма может быть получен на основе гипотезы о том, что результаты
исследований y(i), i = 1,2,...,г, имеют независимое гауссовское
распределение возле некоторого полиномиального соотношения
у порядка, например, т’ + р, где
т* + ц
У * Ц) = Z Ь х] , (1.34)
т + р j = о J
а дисперсия о2 распределения у - у не зависит от ц.
Понятно, что для очень малых т (т = 0,1,2,...) о2 уменьшается с
ростом т. Поскольку, в соответствии с принятой раньше гипотезой,
дисперсия о2 сначала уменьшается, достигает минимума, а затем ос-
тается постоянной или начинает расти, то наилучшим порядком т"
является наименьшее значение т, для которого ст = от+1.
Для получения т’ необходимо вычисление аппроксимирую-
щих полиномов разных порядков. Поскольку коэффициенты bj в
уравнении (1.34) не зависят от т, определение наилучшего по-
рядка полинома значительно ускоряется.
Построение линейной интервальной модели
Пусть имеем прогнозируемую переменную Y и входные пере-
менные X], х2, ...х„. Будем искать зависимость между ними в виде:
У = Vl(xl) + V2(x2)+" + АпЫхп}’ (L35)
26
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
где Л, — нечеткие числа треугольного вида. А. = (ои,С.), функции
/определяются следующим образом [34]:
т.
f:(x )= L ЬТ(х). (1.36)
' j=0J J
Порядок /И; функции / определяется с помощью гипотезы, из-
ложенной в предыдущем разделе.
Таким образом, если положить z- = fj(x.), имеем линейную
интервальную модель в ее классическом виде.
7.5.2.
Исследование тригонометрических
полиномов в качестве частичных
описаний алгоритма МГУА
Общие положения
Пусть имеем периодическую функцию с периодом Р,
Р>0:
g(x + Р) = g(x).
(1-.37)
Без потери общности можно рассмотреть любую периодиче-
скую функцию как такую, которая имеет период 2л:
( РхУ
f(x) = g\£- ;
f(x +2tv) = g[-^- + p} = f(x).
(1.38)
Пусть функция fix) — периодическая с периодом 2л и опре-
деленная на интервале [-л; л], и ее первая производная f (х) та-
кже определенная на [-л; л]. Тогда имеет место равенство:
5(х) = /(х); Ухе[-л;я], (1.39)
где
S(x) = ~ + X ^aj Cos(A) + bj sin(jx)). (1.40)
2 7=i
27
Нечёткие модели и методы в интеллектуальных системах
А коэффициенты оу, bj рассчитываются по формулам Эйлера:
1 к
Oj = — J/(x)cos(jx)dx;
"7 (1.41)
bj =- f/(x)sin(jx)dx.
Тригонометрические полиномы
Тригонометрическим полиномом порядка М называ-
ется следующее выражение:
а м
+ Z Ч cos( А)+bj sin(jx)) • (1.42)
2 7=1
Определение линейной интервальной модели
Имеет место теорема, которая доказывает, что ЭМ,
2М < N, которое минимизирует выражение:
' N
£(Л*()-^Ч))2- (1-43)
1=1
При этом коэффициенты тригонометрического полинома оп-
ределяются по формулам:
2 N
ai =^S/U)cosA>
2 Л (1-44)
by=-£/(xi)sinjxi.
Построение линейной интервальной модели
Пусть имеем прогнозируемую переменную У и вход-
ные переменные х,, х2, —х„. Будем искать зависимость между ни-
ми в виде:
у = ^/1(^)+V2(x2} + • + > (1-45)
28
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
где Л, — нечеткие числа треугольного вида: Л(= (a^Q, функции/
определяются следующим образом:
Х(*<)=ЗД- (146)
Порядок М, функции f определяется с помощью теоремы, из-
ложенной в предыдущем разделе.
Таким образом, если положить =fj(x.), получим линей-
ную интервальную модель в ее классическом виде.
При этом следует заметить, что перед началом моделирования
исходные данные следует пронормировать на интервале [-л; л].
1.5.3. Исследование АРСС-моделей в качестве
частичных описаний алгоритма МГУА
Общие положения
Выбор модели авторегрессии скользящего среднего
(АРСС-моделей) для исследования был обусловлен их широким
использованием в задачах моделирования и прогнозирования в
экономике.
Рассмотрим классическую АРСС (л, т) -модель. Как правило
ее описывают в виде разностного уравнения:
y(k) + a}y(k -1) +... + апу(к - л) = b^ufk -1) +... +
+bmu(k -т) + v(k). (1.47)
Или в виде:
у(к) = byu(k -1) +... + bmu(k -т)- а{у(к -1) - ...-
-апу{к-п). (1.48)
В векторном виде эту модель можно представить как:
y(A:) = eS(fc) + v(A:), (1.49)
где 67 = [а, ...а„ Ьх ••/’„] — вектор параметров модели;
уТ(к) = [- у(к - \)-у(к -2)...- у(к -ri) u(k - 1)...и(Л - /я)]
— вектор измерений; у(к) — зависимая переменная, и(к) — не-
зависимая переменная, v(k) — помехи случайного характера.
29
Нечёткие модели и методы в интеллектуальных системах
Вектор параметров модели в оценивается с помощью любого
метода идентификации.
Построение линейной интервальной модели
Пусть 0 — вектор нечетких параметров треугольного
вида. Тогда в уравнении (1.49) исчезнет помеха и мы имеем ли-
нейную интервальную модель в классическом виде:
Y = AgZo +A,z, + ... + Apzp,
где p=n+m\
(a,, / =
|Д_„, i = n + +
Для построения модели оптимальной сложности (т.е., в на-
шем случае, определение п, m и параметров модели) воспользу-
емся многоуровневым алгоритмом МГУА.
На первом уровне синтеза генерируем множество нечетких
моделей-претендентов АРСС где i = l,...,n0; J = l,...,/^ и п0
т0 указываются произвольно из этого множества, с помощью
процедуры селекции отбираем наилучшие модели и передаем на
следующий уровень синтеза и т.д. Очевидно, что при подстанов-
ке АРСС-модели как аргумента в АРСС-модель будем иметь
АРСС-модель.
В результате работы алгоритма МГУА получим модель
APCC(n*,m*), где п" и т' оптимальне значения в смысле МГУА.
1.6. АДАПТАЦИЯ КОЭФФИЦИЕНТОВ ЛИНЕЙНОЙ
ИНТЕРВАЛЬНОЙ МОДЕЛИ
1.6.1. Основные положения
При прогнозировании с использованием методов са-
моорганизации (в частности, нечеткого МГУА), возникает про-
блема, связанная с необходимостью проведения большого объема
повторных вычислений при изменении числа точек обучающей
последовательности хотя бы на единицу, а также при прогнози-
ровании в режиме реального времени, когда желательно быстро
откорректировать имеющуюся модель в соответствии с получен-
ными новыми данными.
30
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
В данной работе для решения этой проблемы предложено ис-
пользовать следующие методы пошаговой адаптации коэффици-
ентов нечеткой прогнозирующей модели: стохастическая аппрок-
симация и рекуррентный метод идентификации — РМНК.
Необходимость исследования сразу нескольких алгоритмов
адаптации коэффициентов нечеткой модели вызвана в большей
степени тем, что алгоритм стохастической аппроксимации, не-
смотря на все его преимущества, является несколько искусствен-
ной надстройкой над алгоритмом НМГУА и имеет следующий
недостаток: при формировании оценки первого из последова-
тельности корректирующих коэффициентов никак не учитывает-
ся информация, полученная при оценивании вектора параметров
модели по ходу алгоритма НМГУА (детальнее см. ниже). Кроме
того, возможность выбора одного из нескольких алгоритмов
адаптации позволяет провести более широкие эксперименталь-
ные исследования и разработать рекомендации относительно ис-
пользования алгоритмов адаптации в задачах прогнозирования.
Учитывать информацию, полученную при оценивании векто-
ра параметров модели для инициализации алгоритма пошаговой
адаптации, возможно двумя путями. Первый из них — путь ис-
пользования рекурсивных методов идентификации — при их ис-
пользовании выходом алгоритма НМГУА является модель опти-
мальной сложности вместе с данными, которые накопились при
оценивании вектора ее параметров, которые можно использовать
для модификации параметров в соответствии с полученными но-
выми измерениями, т.е. оценка параметров на следующем шаге
формируется на основе оценки параметров на предыдущем шаге,
погрешности модели и некоторой информационной матрицы,
которая модифицируется на протяжении процесса оценивания и,
таким образом, содержит данные, которые можно использовать
на следующих шагах идентификации параметров. При этом адап-
тация коэффициентов модели кардинально упрощается: если со-
хранить информационную матрицу, полученную при идентифи-
кации параметров модели оптимальной сложности, структура которой
получена с помощью НМГУА, то для адаптации параметров мо-
дели достаточно будет сделать одну итерацию соответствующим
методом рекурсивной идентификации. Но, несмотря на все при-
веденные преимущества, рекурсивные методы идентификации
в использовании к МГУА имеют существенный недостаток,
а именно нс обеспечивают выполнение одного из условий
31
Нечёткие модели и методы в интеллектуальных системах
корректности интервальной прогнозируемой модели, а именно
(1.6). Поэтому желательно адаптировать алгоритмы РМНК к за-
даче адаптации коэффициентов моделей, полученных с помощью
классического алгоритма идентификации параметров линейной
интервальной модели.
1.6.2. Применение метода стохастической
аппроксимации для адаптации параметров
линейной интервальной модели
Рассмотрим дискретную стационарную систему:
ук =Ф(и1с,р), (1.50)
где Uk — вектор входных переменных модели, р — вектор пара-
метров, который необходимо оценить (идентифицировать), Ф —
заданная функция.
Оценка рл+1 вектора р на шаге (п+1) определяется следующим
образом:
Л+.=А-РЯ О 51>
где — функция, которая зависит от Un и у, р„ — последова-
тельность скалярных корректирующих коэффициентов.
Вектор-функция у/л определяется следующим образом:
Пусть J„(p„)— скалярный показатель качества идентифика-
ции, который определяется в виде [35]:
Л(/’.) = у(Л-«’(С..А))г- 0-Я)
Тогда
fauw'l
5р„
т .............
йр
а<,(Л)
. бРп. ,
(1.53)
32
Глава 1. Нечеткий метод индуктианого моделирования (мгуа)...
Здесь pni,—,p„ — компоненты вектора Д,.
Из соотношения (1.52) имеем:
фя
где
^п,А) = -(^л,Рл)-- (1-55)
дРп
В случае интервальной модели имеем:
Ф(£7Я,Д,)=/>Х, (156)
где
Л=(«1 “г — «т)илиЛ=(С| Q — С^);
tf„=(z, Z, - zm) или U„ = (| z, | | z2 I ... |zm|);
для адаптации коэффициентов а, или Ct соответственно.
Тогда
g(Un,P„) = ^^^ = Un, (1-57)
SP„
и получаем:
^ = (Ф(£/Я.Л)-К)(1 58)
Первый из последовательности скалярных корректирующих
коэффициентов определяется следующим образом:
1 Р1" Ж>дЖ ’ (1-59)
В случае линейной интервальной модели: 1 1 ₽,’и’ и-и-' (1.60)
Таким образом, метод стохастической аппроксимации пред-
ставляет собой удобный инструмент для рекурсивной идентифи-
33
Нечёткие модели и методы а интеллектуальных системах
кации параметров моделей, которые поддаются линеаризации, а
значит, может быть применен для решения проблемы адаптации
коэффициентов модели, полученных с помощью нечеткого мето-
да группового учета аргументов.
Процедура адаптации коэффициентов применяется как к па-
раметрам а,, так и к параметрам С, •
В программной реализации адаптация коэффициентов моде-
ли может осуществляется либо пользователем в режиме пошаго-
вого прогнозирования, либо в процедуре автоматического про-
гнозирования на несколько периодов вперед по следующему
принципу: адаптация коэффициентов модели выполняется в
том случае, когда истинное значение прогнозированной пере-
менной выходит за границы доверительного интервала, спрог-
нозированного моделью.
Недостатком данного алгоритма является то, что при форми-
ровании оценки первого из последовательности корректирующих
коэффициентов никак не учитывается информация, полученная
при оценивании вектора параметров модели по ходу алгоритма
НМГУА.
Поэтому желательно модифицировать алгоритм оценивания
параметров линейной интервальной модели таким образом, что-
бы выходом алгоритма НМГУА была модель оптимальной слож-
ности вместе с данными, которые накопились при оценивании
вектора ее параметров, которые можно использовать для моди-
фикации параметров в соответствии с полученными новыми из-
мерениями. Именно такой подход изложен в следующем разделе.
1.6.3. Применение рекуррентного метода
наименьших квадратов (РМНК)
для адаптации параметров линейной
интервальной модели
Рассмотрим модель вида:
y{k) = eT'¥(k)+v(k'), (1.61)
где у(к) — зависимая переменная, 'У(к) — вектор измерений, v(k) —
возмущения случайного характера, в — вектор параметров, кото-
рый необходимо оценить.
34
Глааа 1. Нечеткий метод индуктивного моделирования (мгуа)...
Искомая оценка вектора параметров в на шаге N проводится
по следующей формуле [35]:
0(N) = 0(W-l) + y(W)[XW)-0r(W-l)4XW)], (1.62)
где y(N) — вектор-коэффициентов, который определяется по
формуле:
P0V-1W0 . (163)
1 + Ту (TV)P(TV-1)T(TV)
Здесь P(N- 1) — информационная матрица, которая опреде-
ляется по формуле;
1 + (N - 1)P(TV - 2)T(TV -1)
Адаптация параметров линейной интервальной
модели
Как видно из (1.64), информационную матрицу мож-
но получить независимо от процесса оценки параметров и парал-
лельно к нему. Адаптацию двух векторов параметров — в[ =
= , 02г = — будем проводить следующим образом:
Необходимо одновременно адаптировать как параметры аи
так и С,. Поэтому будем одновременно оценивать два вектора
параметров по следующим формулам [35]:
0! (TV) = 0j (N -1) + П (N)[y(N) - 0^ (TV -1)^ (TV)],
02 (TV) = 02 (TV -1) + y2 (TV)[yc (TV) - 02T(TV - 1)T2 (TV)], (1.65)
где
Tlr=[4...zm];4-2r=[|Z||...|zra|]
»
yc(N)=\y(N)-0lT(N-\^l(N)\
35
Нечёткие модели и методы в интеллектуальных системах
1.7. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
НМГУА В ЗАДАЧАХ ПРОГНОЗИРОВАНИЯ
В ЭКОНОМИКЕ
В работах [30; 31; 46] проводились исследования алго-
ритмов нечеткого МГУА с треугольной ФП в задачах прогнози-
рования макроэкономических показателей Украины. В качестве
выходной прогнозируемой величины был выбран ИПЦ — индекс
потребительских цен. В качестве существенных входных пере-
менных по результатам регрессионного анализа были выбраны
следующие переменные:
ИПЦ текущего периода; ИОЦ текущего периода; денежный
агрегат М2 (лаг—7); объем кредитов, вложенных в экономику
(лаг—7); официальный обменный курс доллара на текущий пе-
риод.
Приведем некоторые из полученных результатов выполнен-
ных экспериментов.
1. Результаты структурной идентификации на окне прогнози-
рования размером в 15 точек, из которых 10 было выделено на
обучающую и 5 — на проверочную выборку. При идентификации
на следующий этап синтеза передавалось 10 лучших моделей те-
кущего этапа.
Используемое частичное описание:
Дю + Д>| *1 + Д}2 ‘ Х2 + Дг *1 Х2 •
Величина среднеквадратичного отклонения (СКО): 0,7119462.
2. Результаты структурной идентификации на окне прогнози-
рования размером в 12 точек, из которых 7 было выделено на
обучающую и 5 — на проверочную выборку. Последние 3 точки,
представленные на графике, спрогнозированы в пошаговом ре-
жиме без адаптации коэффициентов модели. При идентифика-
ции на следующий этап синтеза передавалось 10 лучших моделей
текущего этапа.
Используемое частичное описание:
Дю + Д)I ^1 + Д>2 ^2 + Д 2 ‘ ‘ Х2 + ДI ‘ *1 + Дг Х2
Величина СКО (на выборке, состоящей из обучающих и спрог-
нозированных точек): 0,249623.
3. Результаты структурной идентификации на окне прогнози-
рования размером в 12 точек, из которых 7 было выделено на
36
Глввв 1. Нечеткий метод индуктивного моделирования (мгуа)...
обучающую и 5 — на проверочную выборку. При идентификации
на следующий этап синтеза передавалось 10 лучших моделей те-
кущего этапа.
Используемое частичное описание:
^00 + А1 ' *1 + А? ' Х2 + Аг Xl Х2 + Al ‘ *1 + А? ’ Х2
Величина СКО: 0,116168.
4. Результаты структурной идентификации на окне прогнози-
рования размером в 12 точек, из которых 7 было выделено на
обучающую и 5 — на проверочную выборку. При идентификации
на следующий этап синтеза передавалось 10 лучших моделей те-
кущего этапа.
Используемое частичное описание:
^оо + Ai ' xi Az ' х2 + Аг ’ ’ х2 •
Величина СКО: 0,7151176.
5. Прогноз 10 точек при помощи модели, синтезируемой
единственный раз, без пошаговой адаптации коэффициентов.
Частичное описание, используемое при синтезе прогнози-
рующей модели
4о + Д» • X) + 4)2 • х2 + Д2 • X] • х2 + Д, • х2 + А22 • х2.
Величина СКО на спрогнозированных точках: 0,990959.
6. Прогноз тех же 10 точек, что и в пункте 6, при помощи
пошаговой адаптации коэффициентов прогнозирующей модели
(адаптация использовалась в случае выхода реального значения
прогнозируемой переменной за спрогнозированную полосу).
Частичное описание, используемое при синтезе прогнози-
рующей модели:
Лоо + А1 +Аг х2 + Ап х2 +А| 'Х1 + Аг хг-
Величина СКО на спрогнозированных точках: 0,813633824.
7. Прогноз 11 точек при помощи пошаговой адаптации ко-
эффициентов прогнозирующей модели (адаптация использова-
лась в случае выхода реального значения прогнозируемой пере-
менной за спрогнозированную полосу).
Частичное описание, используемое при синтезе прогнози-
рующей модели:
37
Нечёткие модели и методы в интеллектуальных системах
^00 + -^01 ‘ + ^02 ' Х2 + ^12 ’ ’ Х2 + + А22 * Х2 '
Величина СКО на спрогнозированных точках: 0,88312.
8. Прогноз тех же 11 точек, что и в пункте 8, при помощи
модели, синтезируемой единственный раз, без пошаговой адап-
тации коэффициентов.
Частичное описание, используемое при синтезе прогнози-
рующей модели:
А00 + 4)1 • *1 + 4)2 • Х2 + 4г Х1 Х2 + А1\ Х1 + А22 ‘ Х2
Величина СКО на спрогнозированных точках: 1,16648.
1.7.1. Анализ результатов
Как видно из приведенных ниже графиков (рис. 1.3—
1.5) идентификация структуры моделей с использованием нечет-
кого МГУА дает достаточно высокие результаты при прогнозиро-
вании даже для моделей с линейными частичными описаниями.
Для линейных моделей СКО не превышает значения 0.72, для
описаний вида
Аоо + 41 *1 + 4г • х2 + 4г • х2 + Ап xi + А22 х2 •
СКО не превышает значения 0,3.
Наилучшие результаты структурной идентификации и про-
гнозирования получены на окне размером 12 точек (т.е. при раз-
мерах окна, полученных с помощью регрессионного анализа) при
использовании квадратичных частичных описаний и максималь-
но возможной свободе выбора (на каждом этапе синтеза отбира-
лось 10 лучших моделей).
Долгосрочные прогнозы величины ИПЦ в результате выше-
описанных экспериментов имеют высокое качество (как для моде-
лей с пошаговой адаптацией коэффициентов, так и без нее), что
свидетельствует о возможности успешного применения нечеткого
МГУА в задачах долгосрочного прогнозирования макроэкономи-
ческих показателей для экономики переходного периода. Особый
интерес представляло сравнение результатов прогнозирования с
использованием моделей, которые адаптируются и без адаптации.
Во всех экспериментах точность прогноза с адаптацией коэф-
фициентов модели оказалась несколько выше [46]. Так при про-
38
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
гнозе 10 точек (с 09.1998 по 06.1999) СКО для моделей с адаптаци-
ей и без адаптации составило соответственно 0,813634 и 0,99096.
При прогнозе 11 точек (с 02.1998 по 12.1998) СКО составило —
0,88312 та 1,16648 соответственно. Эти результаты свидетельствуют
о целесообразности применения адаптации для корректировки ко-
эффициентов модели по вновь поступающим данным и позволяют
избежать большого объема вычислений, связанного с повторным
синтезом модели. Однако следует отметить, что в условиях эконо-
мики переходного периода зависимость между входными и выход-
ным процессами может существенно изменяться на коротком от-
резке времени и адаптация коэффициентов модели может не дать
желаемого эффекта, т.к. текущая модель становится не адекват-
ной, и тогда необходим синтез новой модели. Следовательно, для
повышения точности прогноза необходимо определить некоторый
баланс между адаптацией существующей модели и синтезом новой
модели. В частности, существенная ошибка прогноза является
сигналом для синтеза новой модели
Пример 1.1.
Размер скользящего окна: 12 точек. Размер обучаю-
щей выборки: 7 точек.
Размер проверочной выборки: 5 точек
Частичное описание, используемое при синтезе моделей:
Лоо + 4)1 • *1 + 4)2 • *2 + 42 Х1-Х2+ Ац • х{ + А22 Х22 .
Пример 1.2.
Прогноз 10 точек был получен путем прогнозирования
следующей точки при помощи модели с адаптируемыми на каж-
дом шаге коэффициентами:
39
Нечёткие модели и методы в интеллектуальных системвх
Размер скользящего окна: 12 точек.
Размер обучающей выборки: 7 точек.
Размер проверочной выборки: 5 точек.
Частичное описание, используемое при синтезе моделей:
Лоо + ^01 + Ло2 ' Х2 + ^12 ’ *1 ‘ Х2 + ’ Х1 + -^22 ’ Х2 •
Количество описаний, передаваемых на следующий этап син-
теза: 10.
Рис. 1.4.
Пример 1.3.
Прогноз 11 точек был получен путем прогнозирования
следующей точки при помощи модели с адаптируемыми на каж-
дом шаге коэффициентами:
Размер скользящего окна: 12 точек.
Размер обучающей выборки: 7 точек.
Размер проверочной выборки: 5 точек.
Частичное описание, используемое при синтезе моделей:
Лоо + Л0| х, + А02 х2 + Л|2 х, • х2 + Л„ • х? + Л22 xf.
Количество описаний, передаваемых на следующий этап син-
теза: 10.
Рис. 1.5.
40
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
1.7.2. Результаты проведенных экспериментов
с различными ФП
Был проведен эксперимент по моделированию неиз-
вестной функции с использованием программной реализации
описанного выше алгоритма НМГУА с использованием различ-
ных ФП. В качестве входных данных были взяты следующие мак-
роэкономические показатели (данные с апреля 1996г. по июнь
1999 г.):
— номинальный внутренний валовый продукт (НВВП);
— процент изменения индекса потребительских цен (%ИПЦ);
— процент изменения индекса оптовых цен (%ИОЦ);
— индекс реальной промышленной продукции (ИРПП);
— ставка рефинансирования НБУ за прошедший месяц (СР).
Выходной прогнозируемой переменной было значение номи-
нального ВВП в следующем месяце.
Массив входных данных размером 28 точек был разбит на 11
окон (промежутков) данных, на которых строилась модель. Раз-
мер каждого окна составил 12 точек, каждое окно было сдвинуто
на один месяц относительно предыдущего. После этого прово-
дился прогноз НВВП(+1) на 5 шагов вперед.
На каждом этапе синтеза НМГУА выбиралось 7 лучших пол-
ных квадратичных моделей частичных описаний. Соотношения
критериев регулярности и несмещенности в определении по-
грешности частичных описаний: 0,7/0,3. Для гауссовской и коло-
колообразной функций принадлежности задавался уровень зна-
чимости 0,7 (45; 46].
Результаты экспериментов приведены в таблицах 1.1, 1.2:
ТАБЛИЦА 1.1
Номер окна СКО
Треугольная ФП Гауссовская ФП Колоколооб- разная ФП
1 1669,8620 1655,4260 1652,1840
2 458,4141 449,6609 447,6822
3 830,1062 826,8912 826,1713
4 1362,0540 1353,9970 1352,1930
5 1858,8730 1845,2010 1842,1330
Среднее: 1235,8620 1226,2350 1224,0730
41
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 1.2.
Сравнительный анализ гауссовской и колоколообразной ФП
с разными уровнями значимости.
Уровень значимости СКО с гауссовской ФП СКО с колоколообразной ФП
0,3 1368,135 1365,201
0,5 1366,106 1363,162
0,7 1361,489 1361,162
0,8 1361,796 1358,851
0,9 1359,482 1359,201
Проведенные исследования позволяют сделать следующие
выводы:
1. Применение нечеткого МГУА в задачах прогнозирования
экономических процессов со сложной динамикой и неизвестной
функциональной взаимосвязью между процессами является
вполне обоснованным и позволяет получить сравнительно высо-
кую точность прогноза.
2. Применение адаптации коэффициентов найденной нечет-
кой модели по текущим данным позволяет повысить точность
прогнозирования на 15—20%.
3. Результаты прогнозирования по нечеткому МГУА практи-
чески слабо зависят от типа функций принадлежности. Имеется
некоторое предпочтение гауссовской и колоколообразной ФП
перед треугольной. Но основным преимуществом нелинейных
ФП перед треугольной состоит в том, что они определяются за-
данным уровнем значимости а, что может обеспечить дополни-
тельную гибкость алгоритма.
1.8. СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ
ПРОГНОЗИРОВАНИЯ ПО ЧЕТКОМУ
И НЕЧЕТКОМУ МГУА
В качестве исходных данных для прогнозирования
выбирались данные по макроэкономическим показателям Ук-
раины за 2001—2003 гг. В качестве прогнозируемых показателей
выбирался индекс потребительских цен ИПЦ, а также ВВП. В
процессе экспериментов варьировалось число оптимальных мо-
делей передаваемых на следующий уровень F=5, 6, 7 (свобода
42
Глвва 1. Нечеткий метод индуктивного моделирования (мгуа)...
выбора), а также % соотношение между обучающей и провероч-
ной выборками
20 30
80’ 70
80>
20 J
146].
Некоторые из полученных экспериментальных результатов
приводятся ниже (табл. 1.6—1.12)
ТАБЛИЦА 1.6.
Результаты прогноза для соотношения обучающей и проверочной
выборок 40%-60%
Четкий МГУА Нечеткий МГУА
Кол-во переда- ваемых моделей Прогнозное зна- чение СКО % СКО F=5 321055, 2637,49 0,61825 F=6 321081 2310,16 0,5167 F=7 321096 2584,48 0,60180 F=5 321127 2165,15 0,507531 F=6 321527 1369,63 0,306356 F=7 32173 890,911 0,207452
ТАБЛИЦА 1.7.
Результаты прогноза для соотношения обучающей и проверочной
выборок 20%-80%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение СКО %СКО F=5 321012,34 2954,9378 0,635622 F=6 321081,04 2573,8456 0,5745323 F=7 321096,45 2693,3674 0,6114884 F=5 321127,37 2394,7324 0,603422 F=6 321527,67 1672,4382 0,413345 F=7 321731,86 1045,3724 0,378803
ТАБЛИЦА 1.8.
Результаты прогноза для соотношения обучающей и проверочной
выборок 30%-70%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение СКО % СКО F=5 321032,85 2763,2425 0,625315 F=6 321073,81 2473,2324 0,5426213 F=7 321082,91 2602,7313 0,6053482 F=5 321102,43 2283,4662 0,559243 F=6 321404,52 1493,5241 0,359234 F=7 321594,83 943,4321 0,271042
43
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 1.9.
Результаты прогноза для соотношения обучающей и проверочной
выборок 50%—50%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение ско % ско F=5 321089,23 2601,6322 0,608532 F=6 321115,52 2263,5346 0,5035522 F=7 321123,48 2492,4142 0,601432 F=5 321167,35 2087,3253 0,481414 F=6 321672,83 1295,3485 0,286234 F=7 321793,41 832,4143 0,196434
ТАБЛИЦА 1.10.
Результаты прогноза для соотношения обучающей и проверочной
выборок 60%—40%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение СКО % СКО F=5 321103,52 2544,3763 0,591452 F=6 321153,85 2134,2345 0,482231 F=7 321173,74 2405,1245 0,569241 F=5 321208,58 1975,3452 0,458312 F=6 321694,52 1192,4143 0,243535 F=7 321843,12 801,1334 0,167382
ТАБЛИЦА 1.11.
Результаты прогноза для соотношения обучающей и проверочной
выборок 70%—30%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение СКО % СКО F=5 321108,62 2532,4242 0,584325 F=6 321165,23 2104,7921 0,471942 F=7 321191,65 2483,4254 0,561432 F=5 321232,54 1952,5822 0,445886 F=6 321707,75 1174,5322 0,225544 F=7 321893,78 794,7325 0,161422
44
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
ТАБЛИЦА 1.12
Результаты прогноза для соотношения обучающей и проверочной
выборок 80%-20%
Четкий МГУА Нечеткий МГУА
Кол-во пе- редаваемых моделей Прогнозное значение СКО % СКО F=5 321083,53 2954,9378 0,597533 F=6 321112,53 2573,8456 0,493543 F=7 321123,42 2693,3674 0,572453 F=5 321102,54 2044,3323 0,457932 F=6 321465,62 1243,6531 0,233543 F=7 321645,59 820,2354 0,171343
Теперь приведем графики зависимости СКО прогноза от со-
отношения между обучающей и проверочной выборками для
различных значений свободы выбора F (рис. 1.6—1.8).
45
Нечёткие модели и методы в интеллектуальных системах
СКО при различных соотношениях
обучающей и проверочной выборок для F=6
---МГУА
---НМГУА
Рис. 1.7.
СКО при различных соотношениях
обучающей и проверочной выборок для F=6
Рис. 1.8.
1.9 ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ РАЗЛИЧ-
НЫХ ВИДОВ ЧАСТИЧНЫХ ОПИСАНИЙ И МЕТО-
ДОВ АДАПТАЦИИ В ЗАДАЧАХ ПРОГНОЗИРОВА-
НИЯ И АНАЛИЗ ПОЛУЧЕННЫХ РЕЗУЛЬТАТОВ
Для проведения экспериментов по моделированию и
прогнозированию макроэкономических процессов экономики
Украины использовалась база данных, которая содержит ежеме-
сячные измерения 24 макроэкономических параметров украин-
ской экономики с июля 1995 года по июль 2004 года.
46
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Объектами моделирования был выбран Индекс Потребитель-
ских Цен (ИПЦ) и Валовой Внутренний Продукт (ВВП).
При построении прогнозирующих моделей использовалась
технология «скользящего окна», размер которого определялся
автоматически с помощью методов регрессионного анализа. При
определении переменных, которые являются существенными для
моделирования (то есть такими, которые вводятся в модель как
входные), также использовались методы регрессионного анализа.
Были проведены следующие эксперименты:
1. Сравнительный анализ предложенных алгоритмов иденти-
фикации и адаптации между собой на основе решения задачи
прогнозирования макроэкономических показателей экономик
Украины и России с целью определения наилучших из них.
Были проведены следующие экспериментальные исследования:
• Построение прогнозирующих моделей с использованием
треугольной, гауссовской и колообразной функций принадлеж-
ности для прогноза макроэкономических показателей (ИПЦ и
ВВП);
• Построение прогнозирующих моделей, которые базируются
на разных видах частичных описаний (классическом, полиноме
Чебышева, полиноме Лагерра, тригонометрические полиномы,
АРКС — модели) для прогноза макроэкономических показате-
лей, как с пошаговой адаптацией коэффициентов (с использова-
нием разных алгоритмов), так и без нее;
2. Сравнительный анализ предложенных алгоритмов с клас-
сическими, которые широко применяются в задачах прогнозиро-
вания, в частности:
• РМНК;
• Нейронные сети с обратным распространением (back
propagation);
• Классический алгоритм МГУА.
Были проведены следующие экспериментальные исследова-
ния:
• Сравнение качества прогноза, полученного с помощью
классических алгоритмов и с помощью НМГУА с использовани-
ем стандартных частичных описаний без пошаговой адаптации
коэффициентов;
• Сравнение качества прогноза, полученного с помощью
классических алгоритмов и с помощью НМГУА с использовани-
ем стандартных частичных описаний и с использованием разных
47
Нечёткие модели и методы в интеллектуальных системах
алгоритмов пошаговой адаптации коэффициентов (стохастиче-
ской аппроксимации, РМНК);
• Сравнение качества прогноза, полученного с помощью
классических алгоритмов и с помощью НМГУА с использовани-
ем разных видов частичных описаний (классического, полиномов
Чебышева, полиномов Лагерра, тригонометрических полиномов,
АРСС — моделей) без пошаговой адаптации коэффициентов;
• Сравнение качества прогноза, полученного с помощью
классических алгоритмов и с помощью НМГУА с использовани-
ем разных видов частичных описаний с использованием разных
алгоритмов пошаговой адаптации коэффициентов.
Анализ полученных результатов
Сравнение разных функций принадлежности
Были проведены экспериментальные исследования
нечетких прогнозирующих моделей со следующими функциями
принадлежности нечетких параметров: треугольной, гауссовской
и колоколообразной. Среднее значение среднеквадратического
отклонения на всем диапазоне исследуемых данных при прогно-
зировании ИПЦ приведено на следующей диаграмме:
Прогнозирование разных ФП-ИПЦ
° Треугол ФП+квад полином
Гауссов ФП+квад полином
° Копоколооб ФП+квад полином
Рис. 1.9.
48
Глава 1. Нечеткий метод индуктивного моделирования (мгув)...
Как видим, наиболее эффективными для построения линей-
ных интервальных моделей являются коэффициенты с колоколо-
образной функцией принадлежности. Также отметим незначи-
тельное преимущество гауссовской ФП над треугольной.
Аналогичная диаграмма при прогнозировании ВВП имеет
следующий вид:
Прогнозирование разных ФП-ИПЦ
Рис. 1.10.
Как видим, общая картина почти не изменилась — наилуч-
шее качество прогноза достигают модели с колоколообразной
функцией принадлежности, отметим также тот факт, что в дан-
ном случае треугольная ФП более эффективная чем гауссовская.
В итоге, можно сказать, что колоколообразная функция принад-
лежности нуждается в дополнительных исследованиях, в частно-
сти с разными частичными описаниями.
Сравнение разных видов частичных описаний
В данной работе были проведены экспериментальные иссле-
дования со следующими частичными описаниями: квадратичны-
ми полиномами, полиномами Чебишева, полиномами Лагерра,
тригонометрическими полиномами и АРСС-моделями. На ниже-
49
Нечёткие модели и методы в интеллектуальных системах
приведенных диаграммах приведено среднее значение средне-
квадратического отклонения на всем диапазоне исследуемых
данных при прогнозировании ИПЦ и ВВП без пошаговой адап-
тации коэффициентов — с целью сравнить эффективность алго-
ритмов в чистом виде. При прогнозировании ИПЦ имеем сле-
дующие результаты:
Сравнение различных частичных описаний
Треугоп ФП+квад полином
° Треугол. ФП +ПОПИН Чебышева
в Треугол ФП+ полин Лагтера
о Треугол ФП+тригон полином
Треугол ФП+ АРСС модель
Рис. 1.11.
Как видим, наилучшие результаты при моделировании имеют
модели, которые используют тригонометрические полиномы в
качестве частичных описаний. Несколько хуже оказываются ре-
зультаты классических квадратичных полиномов. Явный аутсай-
дер — АРССмодели, что можно объяснить тем, что они являются
линейными функциями одной переменной, которая является не-
сомненным недостатком при использовании многоуровневого
итеративного алгоритма МГУА.
При прогнозировании ВВП были получены следующие ре-
зультаты (рис. 1.12):
50
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Сравнение различных частичных описаний
Треугол ФП+квад.полином
° Треугол ФП +ПОПИН Чебышева
Треугол ФП+ полин Лагтера
в Треугол ФП+ тригон полином
в Треугол ФП+ АРСС модель
Рис. 1.12.
Как видим, результаты являются очень похожими на резуль-
таты прогнозирования ИПЦ. Наилучшее качество прогноза' в
данном случае имеют модели с квадратичными полиномами в
качестве частичных описаний, но результаты экспериментов с
моделями тригонометрических полиномов оказались ненамного
хуже. Таким образом, тригонометрические и квадратичные поли-
номы можно рекомендовать к применению в задачах прогнози-
рования макроэкономических процессов как такие, которые спо-
собствуют построению самых качественных моделей.
Сравнение четкого и нечеткого алгоритмов МГУА
Для наиболее полного сравнения эффективности прогнозиро-
вания с использованием четких и нечетких алгоритмов МГУА
существующие реализации четкого МГУА были расширены с це-
лью использования нестандартных частичных описаний — орто-
гональных и тригонометрических полиномов и АРСС моделей.
На следующих 5 диаграммах приведены средние значения сред-
неквадратического отклонения на всем диапазоне исследуемых
данных при прогнозировании ИПЦ для четкого и нечеткого
МГУА для каждого из исследуемых видов частичных описаний, с
51
Нечёткие модели и методы в интеллектуальных системах
использованием разных алгоритмов пошаговой адаптации коэф-
фициентов
Рис. 1.13.
Рис. 1.14.
Как видим из приведенных диаграмм, практически во всех
случаях нечеткий алгоритм МГУА демонстрирует лучшее качест-
во прогноза по сравнению с четким аналогом независимо от ис-
52
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Рис. 1.15.
Рис. 1.16.
пользуемых алгоритмов адаптации коэффициентов. Объяснить
это можно использованием нечетким МГУА аппарата нечеткой
53
Нечёткие модели и методы в интеллектуальных системах
логики, что позволяет учесть в модели факторы, которые невоз-
можно ввести в нее явным образом.
При прогнозировании ВВП имеем следующие результаты
(рис. 1.17-1.20):
Рис. 1.17.
Рис. 1.18.
54
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Рис. 1.19.
Рис. 1.20.
55
Нечёткие модели и методы в интеллектуальных системах
Как видим из приведенных диаграмм, при прогнозировании
ВВП преимущество нечеткого МГУА является вообще подав-
ляющим — лишь в одном случае из двадцати четкий МГУА де-
монстрирует лучший результат.
Таким образом, как убедительно свидетельствуют результаты
проведенных экспериментальных исследований, при прогнозиро-
вании и моделировании сложных и плохо обусловленных систем
использование нечетких методов индуктивного моделирования, в
частности нечеткого МГУА, имеет бесспорное преимущество.
Сравнение эффективности разных алгоритмов адаптации
В данной главе предложено решение задачи пошаговой адап-
тации коэффициентов нечеткой прогнозирующей модели, что
позволяет избежать большого объема повторных вычислений при
поступлении новых данных от моделируемого или прогнозируе-
мого объекта. Экспериментально были исследованы все предло-
женные в работе алгоритмы адаптации — стохастической ап-
проксимации и РМНК. На следующей диаграмме приведены
средние значения среднеквадратического отклонения на всем
диапазоне исследуемых данных при прогнозировании ИПЦ с ис-
пользованием разных видов частичных описаний и разных алго-
ритмов пошаговой адаптации коэффициентов.
Рис. 1.21.
56
Глава 1. Нечеткий метод индуктивного моделирования (мгуа)...
Как видим, использование любого алгоритма адаптации при-
водит к существенному улучшению качества прогноза. Что же
касается самого эффективного метода, то бесспорным является
преимущество рекурсивных методов идентификации над методом
стохастической аппроксимации, что можно объяснить тем фак-
том, что благодаря рассмотренным в разделе 1.6 модификациям
алгоритма нечеткого МГУА оказывается возможным привлечь
информацию, полученную при построении нечеткой прогнози-
рующей модели, к идентификации алгоритма адаптации, которая
значительно повышает его сходимость. При прогнозе ВВП имеем
аналогичные результаты. Таким образом, можно с уверенностью
утверждать, что наиболее перспективными алгоритмами адапта-
ции следует считать рекурсивные алгоритмы идентификации и
именно на них следует обращать внимание при последующих ис-
следованиях.
Результаты сравнительных экспериментов
с нейронными сетями
В следующих экспериментах проводились сравнения
нечеткого МГУА с результатами прогнозирования полученными
при использовании нейронной сеты Back propagation.
Итоговые результаты исследований — значение СКО на 5
прогнозных точках при прогнозировании ИПЦ и ВВП Украины
с 1998 по 2004 год сведены в следующую таблицу 1.13.
Подытоживая полученные в ходе экспериментальных иссле-
дований результаты, можно сделать следующие выводы:
• Качество прогноза нечетких алгоритмов МГУА в преобла-
дающем большинстве случаев лучше, чем у четких аналогов.
• Качество прогнозирования с использованием алгоритмов
индуктивного моделирования (как четких, так и нечетки?) выше,
чем при применении нейронных сетей Backpropagation (по край-
ней мере, для рассмотренных в данной работе реализаций).
• Модификация функций принадлежности параметров нечет-
кой интервальной модели не приводит к существенным измене-
ниям качества прогноза, но наилучшие результаты при прогно-
зировании имеют модели, построенные с использованием коло-
колообразной функции принадлежности. Вообще можно отме-
тить некоторое преимущество гауссовской функции принадлеж-
ности над треугольной и колоколообразной.
57
Нечёткие модели и методы в интеллектуальных системах
л и
ш
Калмана ВВП 294.4599 Г"- СЧ \© \о <н хГ ОО сч \о СЧ хг \£> —< хг СЧ хг Х1- . 04 — Г- Г- —« — ОО О' I ОО —J ХО О' О' ОО I ОО — \О Г"-’ ГЧ — \£> МП СЧ ГЧ — СП »О г-. ЧП — TJ- сп сп сп хГ ел ел ел сп xt
Фильтр ипц 0.16213 ел СЧ ГЧ Xt ЧП СП СП —ч сч хГ О' Г- хЗ ХГ сП S СП ОО ХГ ОО СП — СП XT S О' СП ОО слооаепеп®?\©| * СП ОО с- — оо XJ- ХГ 40 ОО 1 СП ГЧ —и\О—«СПСЧ^кЛ о о ооооо°о
X ВВП 311.953 СЧ Г^ СЧ О' СП хГ хГ \О сч \О СЧ ОО хГ сч оо оо \© сч un Х£) ОО п- Г- х^ Tt | — V) О' if) -- ел сп — сп I г-' об — сч сх об X© сч об Г- с- СП С- \£> О' Г- СП О' СП СП гп хГ СП СП СП ел хГ
1 ипц 0.172711 0.337172 0.293426 0.16473 0.597154 0.191901 0.347382 0.273846 0.177301 0.713684
шрокси- дия ВВП 330.0327 х© хГ — СЧ Xt Г' Г' гп Г' Г* ОО VH ОО ГН СП оо хГ оо — XT О'X© О' О' X© — I О СХ сх ХГ -4 —« о\ || об сч сп об сп об О' об у? ХГ хГ —« СЧ с- ЧП хГ — чт ел чп хГ хГ хГ сп чп
Стох. аг Mai ипц 0.183766 СП ЧП _ - 1Г) Гх Г) - — О' — kJ С4 ОО СЧ СЧ —' сч О О' хГ —< оо х© с- \© "• Хгпхго — — O0II • XT X© ~ ОО О чп О' оо хГ 1 СП сч X© сч СП сч г* о о ° о о о о о о
гттации ВВП х© сч сч <п хг о чп чп х© хт счоогно'счгч—х©х rw V сп х©х©счепг^епо'Ооос ел сп оо хг чп о — — сх г^хГ\© — обхгобсчос СП СП О' СЧ ОО СП О О' ХГ О'. С* ГЧ О' Х£ ID ID Xf X© ЧП
Без ада ипц X© м XT ОО £ — О'СЧГ-Г--^-—<тГО сч сч О' X О' сп сч сч оо чп хг сч хс 2 Г' СЧ — хГОСХО'СЧСНООГ' ОС Л ОО СП £1 — ГЧ СИ ХГ МП —. СЧ СП — О X? X© О L? x©\©x3C40'0'OV)Xj СП . СЧ хГ ГЧООСПХГСПГЧО'ОЧГ' о ° о о оооооооос
Адаптация Алгоритм Ж ? ® > < . е Ж ' 2. . о 2 5 о « Л Во® о. ' „ sj О S' Ч g gio g * £ S 5 = s s Ж О ®3 w F 3 § 1 & о ° § *§^4 о с с 5 X х * U е Ж So Ж ё. d, g s x 2 £ . 2 ox ,, & S “ 5 5 5 £ a« xp U || - = 2 & Il 5 X £ ** ct=e e c exe + + + + s + aa = 0i 5 5 5=x5SS SSgS#£ I§1,lilacs Hu«ib xhio 1- t.1- a.1— 0^ Ж Зтт в-ЖХХ
Нейронная сеть построена с помощью Neural Networks Toolbox 4.0.6 (MathWorks)
Нейронная сеть построена с помощью AlyudaForecaster 1.6 (Alyuda Research)
58
Глввв 1. Нечеткий метод индуктивного моделирования (мгув)...
• Наилучшее из всех предложенных модификаций качество
прогноза демонстрируют модели, построенные с помощью не-
четкого алгоритма МГУА на основе квадратичных и тригономет-
рических полиномов в качестве частичных описаний и алгорит-
мами адаптации на основе рекуррентного МНК.
ВЫВОДЫ К РАЗДЕЛУ 1
Как следует из приведенных выше результатов, в це-
лом нечеткий МГУА дает результаты лучше, чем четкий МГУА в
задачах макроэкономического прогнозирования (меньше СКО)
(34; 35].
Причем с ростом степени свободы выбора, этот выигрыш
становится всё ощутимее. Это связано с тем, что, во-первых, от-
сутствует проблема плохой обусловленности матриц, а, во-
вторых, в нечётком МГУА для спрогнозированных значений
строятся доверительные интервалы, что позволяет проводить
корректировку моделей путем их адаптации в случае явного не-
попадания значения в доверительный интервал. Еще одна инте-
ресная особенность состоит в том, что наилучший результат дос-
тигается при соотношении обучающей и проверочной выборок
примерно 2:1.
Основными преимущствами нечеткого МГУА по сравнению с
четким являются:
— отсутствие явления вырожденности моделей при плохой
обусловленности матрицы ограничений нормальных уравнений;
— возможность получения доверительного интервала для про-
гноза, что позволяет судить о точности получаемых оценок.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
К ГЛАВЕ 1
1. На каких принципах базируется метод МГУА?
2. Сформулируйте принципы самоорганизации.
3. Запишите условие останова алгоритма нечеткого МГУА.
4. В чем состоит практический смысл принципа внешнего
дополнения?
5. Назовите принципиальные отличия нечеткого МГУА от
четкого.
59
Нечёткие модели и методы в интеллектуальных системах
6. Какие виды опорных функций используются в качестве
частичных описаний в НМГУА?
7. Сформулируйте основные достоинства полиномиального
метода МГУА.
8. Укажите основные недостатки полиномиального МГУА.
9. Каким методом находятся коэффициенты модели в обыч-
ном МГУА и в нечетком МГУА?
10. Укажите основные достоинства нечеткого МГУА.
11. Какие алгоритмы адаптации используются в нечетком
МГУА и их назначение?
12. В чем состоят преимущества использования ортогональ-
ных полиномов в качестве частичных описаний в МГУА?
13. Как определить наилучший порядок аппроксимирующего
полинома при использовании ортогональных полиномов в каче-
стве частичных описаний?
14. Как изменится вид модели в задаче ЛП для нахождения
неизвестных коэффициентов в нечетком МГУА при переходе от
треугольных функций принадлежности к Гауссовским и колоко-
лообразным?
60
ГЛАВА Л
Нечеткий метод
группового учета аргументов
при неопределенных
входных данных
ВВЕДЕНИЕ
При построении моделей сложных систем по экспе-
риментальным данным довольно часто встречаются ситуации,
когда входные данные заданы неточно, например, заданы в виде
интервалов неопределённости.
Эти обстоятельства требуют развития и обобщения метода
группового учета аргументов на случай, когда входные перемен-
ные заданы нечетко.
Целью данной главы является рассмотрение и исследование
нечеткого метода группового учета аргументов с нечеткими вход-
ными данными. Этот метод является развитием нечеткого метода
группового учета аргументов, изложенного в первой главе и ис-
пользует его основные идеи. Суть метода заключается в построе-
нии неизвестной функциональной зависимости между входными
и выходными данными, когда входные переменные заданы не-
четко в виде интервалов неопределенности. Для этого на каждом
ряду строятся модели на основе скрещивания пар входных пере-
менных, выбирается определенное количество наилучших и пе-
редается на следующий ряд. Процесс завершается генерацией оп-
тимальной модели.
Модифицированный НМГУА, который оперирует с нечетки-
ми входными данными, основан на нечетком методе группового
учета аргументов, но использует другие математические модели [29].
В разделах 2.1—2.3 выводятся математические модели для
двух видов функции принадлежности: треугольной и гауссовской.
Выбор именно этих видов ФП обусловлено их широким приме-
нением в задсчах моделирования и прогнозирования социально-
61
Нечёткие модели и методы в интеллектуальных системах
экономических показателей. Выведенные математические модели
позволили разработать программный комплекс, который реали-
зует НМГУА с нечеткими входными данными.
Последующие разделы посвящены анализу полученных с по-
мощью разработанного программного продукта эксперименталь-
ных результатов в случаях треугольной функции принадлежности
и функции принадлежности Гаусса.
2.1. ОБЩИЙ ВИД МАТЕМАТИЧЕСКОЙ МОДЕЛИ
НМГУА С НЕЧЕТКИМИ ВХОДНЫМИ ДАННЫМИ
Рассмотрим линейную интервальную модель регрессии:
Y = H0Z0+4Z1 + ...< A„Z„, (2.1)
где А, — нечеткие числа, которые описываются тремя парамет-
рами А, = (А/, А,, А,), где А, — центр интервала, А, — его верх-
няя граница, Л, — нижняя граница, — также нечеткие числа,
которые задаются параметрами (Z,,Z^.Z,), Z, — нижняя гра-
ница, Z, — центр, Zt — верхняя граница нечеткого числа.
Тогда Y — нечеткое число, параметры которого определяются
следующим образом (в соответствии с формулами для умножения
L—/(-чисел) [24]:
Центр интервала:
у = *z,..
I
Отклонение в левой части функции принадлежности:
у-у = ^|a,|-(Z,-Z,) + c,.|z,|.
Откуда нижняя граница интервала:
у=-ЕЫ Д+«. л=z, -
I I
-|a,|-(Z,-Z,.)-c,.|z,|.
62
Глава 2. Нечеткий метод группового учете аргументов...
Отклонение в правой части функции принадлежности:
Откуда верхняя границя интервала:
•У = ^|л/| (,Zt — Z,) + с, |z,| + a, Zt p
Требуется построить оптимальную модель, позволяющую ра-
ботать с нечеткими входными переменными вышеприведен-
ного вида. Для того, чтобы интервальная модель была коррект-
ной, необходимо, чтобы действительное значение исходной ве-
личины Y принадлежало полученному в результате работы метода
интервалу.
Следовательно, основные требования к оценочной линейной
интервальной модели заключаются в том, чтобы найти такие зна-
чения параметров (Д, Д, Д) нечетких коэффициентов, при которых:
а) наблюдаемые значения ук попадали бы в оценочный ин-
тервал для Yk;
б) суммарная ширина оценочного интервала была бы минимальной.
Входными данными в этой задаче являются: Zk=[ Zkl], — вход-
ная обучающая выборка, а также ук — известны нам исходные
значения, к = 1, М , М — количество точек наблюдения.
В данной работе рассматриваются два случая вида функции
принадлежности нечетких величин:
— треугольные функции принадлежности;
— функции принадлежности Гаусса.
Вид частичных описаний был выбран квадратичным:
= Д; + Дх, + A2Xj + A3XiXj + Дх2 + Asx*.
2.2. ВИД МАТЕМАТИЧЕСКОЙ МОДЕЛИ
ДЛЯ СЛУЧАЯ ТРЕУГОЛЬНЫХ ФП
Пусть имеется линейная интервальная модель регрессии:
Y = A0Z0 + AlZl + ... + AnZn,
где А, — нечеткие числа треугольной формы, которые описыва-
63
Нечёткие модели и методы в интеллектуальных системах
ются тройкой параметров А, = (А,,а^А,), где а — центр интер-
вала, Д — его верхняя граница, 4 ~ нижняя граница.
В данной модели рассматривается случай симметричных
функций принадлежности для параметров А, , поэтому их можно
описать парой параметров (а,, с,).
Л, = а, - , Ai = о, + с,,
где с, — ширина интервала, с, > О, Z, — также нечеткие числа
треугольной формы, которые задаются параметрами (Z,, Z,, Z,),
Z, — нижняя граница, Z, — центр, Z, — верхняя граница не-
четкого числа.
Тогда Y — нечеткое число, параметры которого определяются
следующим образом [29]:
Центр интервала: у = £ а, * Z,.
i
Отклонение в левой части функции принадлежности:
I
Откуда нижняя граница интервала:
у = -(Zhl (Z( - Z,) + c,|z,|) + fl, Z, = ^fl, Z, -
i i
-|«,|(^-z,)-c,.|z,|.
Отклонение в правой части функции принадлежности:
у-у = ХИ|(^-2,) + ф,|).
i
Откуда верхняя границя интервала:
J = Ehl (4-г,)+с,|4|+А(-4
/
Для того, чтобы интервальная модель была корректной, необ-
ходимо, чтобы действительное значение исходной величины Y
принадлежало полученному в результате работы метода интерва-
лу. Это можно описать таким образом:
64
Глава 2. Нечеткий метод группового учета аргументов...
t«,Z/-|fl,|(ZI.-Z,.)-c,.|z/|<j*;
tcrz,.+|c,.|-(z,-z,)+c,.|z,.|>^, л = мл
где Zk = \Zk ], — входная обучающая выборка, ук — известные
нам исходные значения; к = 1, М , М — количество точек наблю-
дения.
Следовательно, основные требования к оценочной линейной
интервальной модели для треугольного частичного описания за-
ключаются в том, чтобы найти такие значения параметров (я,,с,)
нечетких коэффициентов, при которых:
а) наблюдаемые значения ук попадали бы в оценочный ин-
тервал для Yk;
б) суммарная ширина оценочного интервала была бы мини-
мальной.
Эти требования можно свести к задаче линейного програм-
мирования [29]
min£|a,.|-(Zi-Z1) + 2C|z,|; (2.2)
'*' i=l
при условиях
fo,..Z-|fl,.|.(Z-Z,.)-c,|Z,.|<^;
.-= 1 (2.3)
La. Z, + |я,| (Z, - ZJ + C,|Z,| > yk, k = ^M.
2.2.1. Формализованная постановка задачи
для треугольных ФП
Рассмотрим частичное описание вида:
f(x,,Xj) = Aq + + A2Xj + A^XjXj + A^x2 + A5x2 . (2.4)
Запишем его в соответствии с моделью (2.1). Для этого в ней
НУЖНО ПОЛОЖИТЬ, ЧТО Zo = 1 , Zt = X/, Z2 = Xj , Z3 = XjXj , z4 = x?,
Z5 = x].
65
Нечёткие модели и методы в интеллектуальных системах
Тогда математическая модель (2.2)—(2.3) запишется в сле-
дующем виде:
м _ м и _
min (2Л/с0 + |а,|£(х* -x,k) +2с,|хй| + |о2|£(xjk -xjk) +
a„ct Дг—1 *=1 * = l
2c2E|xJ +ЫЕ(|*,*|(*а-xjk) +|хл|(х*-х1к)) +2с3£|х;*х J +
к=\ *=1
+ 2|о4|£|х,*|(х,* -x,k) + 2c^xl + 2|а5Мх#|(х,* -х^ + ^с^х1^),
к=\ *=| *=1 *=1
при условиях
ао + а}х1к + a2xjk + о3(Нх»|(х* “х#)~-*/*) + xikxJk) +
+ о4(-2|хЛ|(хЛ - xik) + х,2) + й5(-2|х#|(х# - xjk) + xJk2) - c0 - с,|хй| -
- c2|xA| - f3|x,*x#| - c4x2 - csx]k < yk
a0 + atxik +a2x.k + а3(|хЛ|(хл -xjk) + |x#|(xA -xik)-xikxJk) +
+«4(2 |xft| (x« - x,*) - V ) + as (+2 |x J (.x^ - x]k) - xik2) + c0 + c, I +
+c2 |x# I + c3 |xrtx/t I + c4x2 + c5x2k > yk
c( > 0, I = o3.
Как видно, эта задача является задачей линейного програм-
мирования, но поскольку нет ограничений неотрицательности
для переменных а, , для ее решения переходим к двойственной
задаче, вводя двойственные переменные (б*) и {б*+л/}.
Запишем двойственную задачу:
тах(£ук Ьк.м ~^Ук 5*)> <2-5)
Л=1 к=\
при условиях
м м
~ £5* = 0 »
к=\ к=\
м _ м м _
^2 ' ^к + м ~ 52 — ik ‘ ^к = 52 ^Xik ~ —ik ’
*=1 к=\ к=\
66
Глава 2. Нечеткий метод группового учета аргументов...
м __ м м __
XXJk ^k+M ~^L^jk '^k = ^(XJk ~ —jk) ’
*=1 k=l k=i
M _ _
^2 ” Xjk) + “ Xjk) - XikXjk ) • 8k + M “
Л=1
w
- E ("I*/* |(*7* - ) -1*7* |(*«_ **)+*-**>*) 5* = <2 6)
*=1
M _ _ I- I-
= E <l*<* K*>* - *Jk ) + |*7* k*'* - &k ))’
k = \
M _ M
£(2|хл|(х*-xik)-xik2)-3k+M -E<-4*4**-^*) + *<*2) A =
k=\ k=\
M _
= EIM**
k=\
M _ M
EФлk*J* -Xjk)- xJk2) SktM~X(-2|xft|(x# - xjk) + xJk2) 8k =
*=1 *=1
M —
= EK*|(A>
k=\
M M
E5*^+Es* ^2л/,
k=l k=\
МММ
Е1^*15*+л/ +EIX-*I 5* -2EI-*i*l>
*=i *=i *=i
МММ
E I*A I ‘ £>k+M + E 1*7* I ’ - 2E 1*7* I ’
*=1 *=1 *=1
M MM
E|*,**7*| ‘ ^к^м + E|*<**7*| ‘ $* - 2E|х,*Хд| , (2.7)
*=i *=i *.i
M MM
E *,* 6*^w + E *,* 5* 2E *.* >
*=i *=i *=i
M MM
E Xjk 8k*M + Xjk 8k < ?E^ x2jk ,
*=i *=i *=i
67
Нечёткие модели и методы в интеллектуальных системах
5*^0 ,
- 0 , к - 1, М .
Решив двойственную задачу (2.5)—(2.7) симплекс-методом и
найдя оптимальные значения двойственных переменных {бЛ},
{5*+Л/}, найдем оптимальные значения искомых переменных с,,
а,, i = 0,5, а также искомую нечеткую модель для заданного час-
тичного описания.
2.3. ВИД МАТЕМАТИЧЕСКОЙ МОДЕЛИ
ДЛЯ СЛУЧАЯ ФП ГАУССА
Рассмотрим линейную интервальную модель регрессии:
У = A0Z0 +A1Zi + ... + A„Z„,
где А, — нечеткие числа гауссовской формы, которые описыва-
ются парой параметров (о,,с,), где а, — центр, с, — величина,
что характеризует ширину интервала, ct > 0. Z, — нечеткие числа
гауссовской формы, которые имеют функции принадлежности
следующего вида:
Р(*) =
I (х-а)2
2 с,2
е 1 ,х < а\
I (х-а)2
2 с,2 ’
е 2 х > а.
Тогда такие нечеткие числа описываются тройками парамет-
ров (с,,а,с2), где а — центр, с, — величина, которая характери-
зует ширину интервала в левой ветви функции принадлежности,
с2 — в правой.
В этом случае задача формулируется таким образом: найти
такие параметры (а,,с,) нечетких коэффициентов Л,, чтобы вы-
полнялись следующие условия:
1. Наблюдение ук принадлежало к оценочному интервалу Yk
со степенью, не меньше чем а, 0 < а < 1.
68
Глввв 2. Нечеткий метод группового учета аргументов...
2. Ширина оценочного интервала уровня а была бы мини-
мальной.
Ширина оценочного интервала уровня а равняется:
^=У2~У1- (2-8)
Найти У] и у2 можно из системы:
1 (У2 ~ a?
a = exp- L 2 С/ 1'
ZV Р Vn. 1 (У1 ~ a)2
СЛ — VAJJ 2 c,2 J’
(2-9)
Откуда
у2 = c2V-21na + a;
yt = -с, 7-2 in а + a,
a da = V- 21na(c2 + с,).
Условие 1) можно записать таким образом: p(yt)>a, что
можно свести к такой системе:
Уk <ak+clk4-l\na\
У к >ak~ cuV-21na.
Следовательно, задачу можно записать в таком виде.
M min *=i M * = min (c2k + clk )V- 2 In a , *=1 (2.10)
Ук Ok +c2itV-2ina;
< Ук >ak -c1JtV-21na. (2.11)
Переменные Z, можно также задавать параметрами (Z,, Z(, Z,),
Z^— нижняя граница, Z, — центр, Z, — верхняя граница не-
69
Нечёткие модели и методы в интеллектуальных системах
четкого числа, где
Z, = Z, - , Z,. = Z, + с2,.
Тогда Y — нечеткое число, параметры которого определяются
следующим образом:
Центр интервала:
y = £a,*Z,.
Отклонение в левой части функции принадлежности:
У- У = £(tf,*(Z,-Z,) + C,|z,|).
Откуда нижняя граница интервала
У = !>/*£/-
Отклонение в правой части функции принадлежности:
у-у = YAai*(Zl ~ + c\z\) = YaiZi ~ aizi + c\z\
Откуда верхняя граница интервала
У = TAai*zi+ci\zi\>-
2.3.1. Формализованная постановка задачи
для ФП Гаусса
Рассмотрим частичное описание вида:
= Лд + Aixl + Л2ху + A3x,Xj + Л4х2 + А5х2.
Запишем его в соответствии с моделью (2.1). Для этого в ней
НУЖНО ПОЛОЖИТЬ, ЧТО Zo = 1 > Zi = X, , Z2 = Х},, Z3 = XjXj , z4 = xf,
Z5 = x2j.
Тогда математическая модель (2.10)—(2.11) запишется в сле-
дующем виде [29]:
М _ М М —
min (2Л/с0 +а, £(хк -х 1.)+2с, £|х№| +а2 ^(хл -х ) +
а I , с / k = 1 к = 1 к = 1
70
Глава 2. Нечеткий метод группового учетв аргументов...
М М — _ М ,
2с2 Е Ы + а3 Е -Xjk)+ |хл|(ХЛ - xlk)) +2с3 X I+
4=1 к=\ к=\
м _______ м м ________ м
+ 2fl4 £ |.хл |(х-* - xik) +2с4 £ х2 + 2а5 £ |хд |(xjk - х л) + 2с5 £ х|),
к=\ к=\ 4=1 4=1
(2.12)
при условиях:
a0 +aSxik -V-21na(x,* - xik)) + а2(хjk - V-2 In ct(x#-xJk)) +
+ a}(xikxjk — (jxrt|(x7t — xJk) + |х7<.|(хЛ — xik))-yl— 2 In a) + o4(xf* —
~ 2-7- 2In €x(|xtt|(xft ~ x.ik)) + а^(х^ — 2-7— 2In а(|хд.|(х^ — Хд)))
- -c0-7-21na - c,|xrt[7-21no! - c2|xy*|-7- 2 In a - c3|x,*x#|-7-21na
-c4x,2-7-21na -c5Xjk>l-2lna £ yk, (2.13)
a0 + fljx,* + V-2Ina(x» - x,*)) + a2(xy* + V-21na(x# - xjk)) +
+ ajxlkxjk + (|x,*|(xA ~xJk) + |x#|(x,* - x,*))V- 2 In a) + a4(x,*2 + .
+ 2-J- 2 Inа(|х,*|(хЛ - xtt)) + а$(х/к2 + 2-7-2 Inа(|хЛ|(хд - xJk)) +
+ c0V-21na + c1|x,*|V-21na + с2|^л|^~ 2 In a + с3|хЛх#|-7-21па +
+ c4x,*-7-21na + csx2jkyl- 2 In a > yk, c, > 0, I = 0,5. (2.14)
Как видно, эта задача является задачей линейного програм-
мирования, но поскольку нет ограничений неотрицательности
для переменных а,, то для ее решения переходим к двойствен-
ной задаче, вводя двойственные переменные {бА} и {6*+Af}.
Решив двойственную задачу (2.12)—(2.14) симплекс-методом
и найдя оптимальные значения двойственных переменных {бА},
найдем также оптимальные значения искомых перемен-
ных с, , а,, i = 0,5, а также искомую нечеткую модель для частич-
ного описания.
71
Нечёткие модели и методы в интеллектуальных системах
2.4. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
НМГУА И АНАЛИЗ ПОЛУЧЕННЫХ
РЕЗУЛЬТАТОВ
2.4.1. Прогнозирование индекса РТС
2.4.1.1. Общая информация об индексе РТС
НП Фондовая биржа «Российская Торговая Система»
(РТС) была создана в 1995 году с целью объединения региональ-
ных рынков в единственный рынок ценных бумаг России.
Информация по торгам в РТС является важнейшим источни-
ком данных относительно состояния российского рынка ценных
бумаг, поскольку именно РТС обслуживает значительную часть
иностранных и российских портфельных инвестиций в акциях
российских компаний. РТС является общепризнанным центром
ценообразования из ценных бумаг широкого круга эмитентов.
К торгам в РТС допущено около 270 ценных бумаг, в том
числе более 43 облигаций. В информационных системах пред-
ставлена информация относительно индикативных котировок
около 750 акций и 500 векселей российских компаний.
Индекс РТС является официальным индикатором Фондовой
биржи РТС. Он рассчитывается на протяжении торговой сессии
при каждом изменении цены инструмента, который включен в
список для его расчета. Первое значение индекса является зна-
чением открытия, последнее значение индекса — значением за-
крытия.
Индекс рассчитывается в двух значениях — валютном и руб-
лёвом. Рублевые значения являются вспомогательными и рассчи-
тываются на основе валютных значений.
Индекс рассчитывается при возникновении каких-либо собы-
тий с любыми ценными бумагами, которые входят в список для
его расчета:
а) если заключено соглашение, что отвечает требованиям ме-
тодики расчета РТС;
б) если цена лучшей стандартной заявки на приобретение
превысила последнюю рассчитанную цену по этой ценной бумаге;
в) если цена лучшей стандартной заявки стала меньше по-
следней рассчитанной цены по этой ценной бумаге.
Индекс РТС рассчитывается как отношение суммарной ры-
ночной капитализации ценных бумаг, которые включены в спи-
72
Глава 2. Нечеткий метод группового учета аргументов...
сок для его расчета, к суммарной рыночной капитализации этих
же ценных бумаг на начальную дату, умноженное на значение
индекса на начальную дату и на корректирующий коэффициент:
I = Z ♦ /, ♦
ln I
МСП
мс{ ’
где МС„ — сумма рыночных капитализаций акций на текущее
время, в долларах США:
л
•I
где W,— корректирующий коэффициент, который учитывает ко-
личество ценных бумаг z-го вида в свободном обращении; С,—
коэффициент, который ограничивает долю капитализации цен-
ных бумаг z-го вида; Q, — количество ценных бумаг соответст-
вующего наименования, выпущенных эмитентом на текущую да-
ту; Pt— цена /-й ценной бумаги в долларах США на расчетное
время г, N — число наименований ценных бумаг в списке, по ко-
торым рассчитывается индекс.
Начальное значение индекса:
/,= 100 на 1 сентября 1995 года.
МСХ = $ 12 666 080 264.
Z, = 1.
К, = 4.447.
Расчет рыночной капитализации выполняется на основе
данных о ценах акций и количестве выпушенных эмитентом
акций, с учетом части акций, которые находятся в свободном
обращении.
Входными данными для расчета индекса есть:
информация о соглашениях, которые были заключены в тор-
говой системе на протяжении торговой сессии с ценными бума-
гами, которые входят в список для расчета индекса и имеют объ-
ем не меньший, чем объем, требуемый в правилах торговли к за-
явкам по данным ценным бумагам. При этом цена соглашения
должна быть не ниже, чем цена лучшей стандартной заявки на
73
Нечёткие модели и методы в интеллектуальных системах
приобретение и не выше цены лучшей стандартной заявки на
продажу.
информация относительно текущих лучших ценах стандарт-
ных заявок.
Список ценных бумаг, который используется для расчета ин-
декса РТС складывается из наиболее ликвидных акций россий-
ских компаний, отобранных Информационным комитетом на
основе экспертных оценок. Количество ценных бумаг в индексе
не должно превышать 50.
2.4.1.2. Результаты работы НМГУА с нечеткими
входными данными при прогнозировании
индекса РТС
Эксперимент 1. Прогнозирование индекса РТС (цена от-
крытия)
В данном эксперименте использовалось 5 нечетких входных
переменных, которые представляют собой цены на акции веду-
щих энергетических компаний России, включенных в список для
расчета индекса РТС:
LKOH - акции ОАО ЛУКОЙЛ.
EESR — акции ОАО РАО ЕЭС России.
YUKO - акции ОАО ЮКОС.
SNGSP — привилегированные акции ОАО Сургутнефтегаз.
SNGS — обычные акции ОАО Сургутнефтегаз.
Выходной переменной были значения индекса РТС (иена от-
крытия) за тот же период (03.04.2006 — 18.05.2006).
Размер выборки — 32 значения.
Размер обучающей выборки — 18 значений (оптимальный
размер обучающей выборки для данного эксперимента).
Были получены следующие результаты [29]:
1. Для треугольного вида функции принадлежности:
а) Для нормированных входных данных (нормирование вы-
полнялось по следующей формуле:
л max л min
Результаты эксперимента 1 с треугольной ФП и нормирован-
ными входными данными.
Значения критериев для данного эксперимента составили:
СКО = 0,055557.
74
Глава 2. Нечеткий метод группового учета аргументов...
Рис. 2.1. Результаты эксперимента 1 для треугольной ФП
и нормированных значений входных переменных
б) для ненормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 18, 48657; МАРЕ (среднемодульная относительная
ошибка) = 0,8%.
—♦— Левая граница
—— Центр
л- Правая граница
—«—Реальные значен
Рис. 2.2. Результаты эксперимента 1 для треугольной ФП
и ненормированных значений входных переменных
2. Для случая функции принадлежности Гаусса (оптимальный
уровень a = 0,8).
75
Нечёткие модели и методы в интеллектуальных системах
а) Для нормированных входных данных.
Значения критериев для данного эксперимента составили:
СКО = 0, 028013.
Рис. 2.3. Результаты эксперимента 1 для ФП Гаусса
и нормированных значений входных переменных
б) для ненормированных входных данных:
♦ Левая граница
—Центр
-а Правая граница
к Реальные знамен
Рис. 2.4. Результаты эксперимента 1 для ФП Гаусса
и ненормированных значений входных переменных
76
Главе 2. Нечеткий метод группового учета аргументов...
Значения критериев для данного эксперимента составили:
СКО = 9, 321461, МАРЕ (средняя модульная относительная ошиб-
ка) = 0,4%.
Как видно из результатов эксперимента 1, прогнозирование с
использованием треугольных и гауссовских функций принадлеж-
ности дает хорошие результаты. Результаты экспериментов с ФП
Гаусса являются лучшими, чем с треугольной ФП.
Для нормированных данных:
Треугольные ФП ФП Гаусса
СКО 0,055557 0,028013
Для ненормированных данных:
Треугольные ФП ФП Гаусса
СКО 18,48657 9,321461
МАРЕ 0,8% 0,4%
Эксперимент 2. Прогнозирование индекса РТС (цена закрытия)
В данном эксперименте использовались те же входные пере-
менные, что и в эксперименте 1. Выходной переменной было зна-
чение индекса РТС (цена закрытия) за тот же период (03.04.2006 —
18.05.2006).
Размер выборки — 32 значения.
Размер обучающей выборки — 18 значений (оптимальный
размер обучающей выборки для данного эксперимента).
Были получены следующие результаты:
1. Для функции принадлежности треугольного вида:
а) Для нормированных входных данных. Значение критериев
для данного эксперимента составили: СКО = 0, 057379;
б) Для ненормированных входных данных. Значение критери-
ев для данного эксперимента составили: СКО=18,04, МАРЕ= 0,78.
2. Для функции принадлежности Гаусса (оптимальный уро-
вень а = 0,85):
А) Для нормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 0,029582;
77
Нечёткие модели и методы в интеллектуальных системах
—♦— Левая граница
—— Центр
а Правая граница
—»<—Реальные значен.
Рис. 2.5. Результаты эксперимента 2 для треугольной ФП
и нормированных значений входных переменных
1900
1800
1700
1600
1500
1400
1300
1200
1100
1000
£
—«— Левая граница
Центр
—л— Правая граница
—и—Реальные значен.
ч > \ о,Ч
Рис. 2.6. Результаты эксперимента 2 для треугольной ФП
и ненормированных значений входных переменных
78
Глааа 2. Нечеткий метод группового учета аргументов...
Рис. 2.7. Результаты эксперимента 2 для ФП Гаусса
и нормированных значений входных переменных
Б) Для ненормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 9,302766, и МАРЕ =0,37%.
Как видно из результатов эксперимента 2, прогнозирование с
использованием треугольных и гауссовских функций принадлеж-
ности дает хорошие результаты. Результаты экспериментов с ФП
Гаусса оказались лучшими, чем с треугольной ФП.
Для нормированных данных:
Треугольные ФП ФП Гаусса
СКО 0,057379 0,029582
Для ненормированных данных:
Треугольные ФП ФП Гаусса
СКО 18,04394 9,302766
МАРЕ 0,78% 0,37%
79
Нечёткие модели и методы а интеллектуальных системах
2.4.2. Прогнозирование индекса РТС-2
2.4.2.1. Общая информация об индексе РТС-2
РТС-2 — это индекс акций «второго эшелона». Он
является индикатором торгов на Фондовой бирже РТС акция-
ми, отнесенными ко второму эшелону по критериям ликвидно-
сти и капитализации. Расчет индекса РТС-2 выполняется в ре-
жиме и по формулам для расчета индекса РТС. Эти два индекса
отличаются один от другого списком акций, которые входят в
список их расчета.
Отбор акций для расчета РТС-2 выполняется Информацион-
ным комитетом РТС. В список акций не включаются наиболее
ликвидные и капитализированные акции, а также акции, кото-
рые имеют показатели ликвидности, не достаточные для кор-
ректного определения цены акций, за исключением ценных бу-
маг, которые входят в список наиболее ликвидных и наиболее
капитализированных акций. Пересмотр списка для расчета РТС-
2 выполняется при каждом изменении списка для расчета индек-
са РТС.
Изменения списка для расчета индекса РТС-2 вступают в
действие 15 марта, 15 июня, 15 сентября, 15 декабря.
2.4.2.2. Результаты работы НМГУА с нечеткими вход-
ными при прогнозировании индекса РТС-2
Эксперимент 3. Прогнозирование индекса РТС-2 (цена
открытия)
В данном эксперименте использовалось 5 нечетких входных
переменных, которые представляют собой цены на акции второ-
го эшелона энергетических компаний России, включенных в
список для расчета индекса РТС-2:
BANE — акции ОАО Башнефть.
ENCO — акции ОАО Сибирьтелеком.
ESMO — акции ОАО Центртелеком.
IRGZ — акции ОАО Иркутскэнерго.
K.UBN — акции ОАО Южтелеком.
Исходной переменной были значения индекса РТС-2 (цена
открытия) за тот же период (03.04.2006 — 18.05.2006).
Размер выборки — 32 значения.
Размер обучающей выборки — 19 значений (оптимальный
размер обучающей выборки для данного эксперимента).
80
Глава 2. Нечеткий метод группового учета аргументов...
Были получены следующие результаты [29]:
1. Для треугольного вида функции принадлежности и норми-
рованных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 0,061787.
Рис. 2.9. Результаты эксперимента 3 для ФП Гаусса
и нормированных значений входных переменных
Рис. 2.8. Результаты эксперимента 3 для треугольной ФП
и нормированных значений входных переменных
Для ненормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 6,407928, МАРЕ =0,24%.
2. Для функции принадлежности Гаусса (оптимальный уро-
вень а =0,85).
а) Для нормированных входных данных: »
Значение критериев для данного эксперимента составили:
СКО = 0,033097.
1.*
1.2
1
0.В
0.6
0.4
0п2
О
-0.21
-0.4
81
Нечёткие модели и методы а интеллектуальных системах
б) Для ненормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 3,432511;
МАРЕ = 0,13%.
Рис. 2.10. Результаты эксперимента 3 для ФП Гаусса
и ненормированных значений входных переменных
Как видно из результатов эксперимента 3, прогнозирование с
использованием треугольных и гауссовских функций принадлеж-
ности дает хорошие результаты. Результаты экспериментов с ФП
Гаусса, как и в предыдущих экспериментах оказались лучшими,
чем с треугольной ФП.
Для нормированных данных:
Треугольные ФП ФП Гаусса
СКО 0,061787 • 0,033097
Для ненормированных данных:
Треугольные ФП ФП Гаусса
СКО 6,407928 3,432511
МАРЕ 0,24% 0,13%
82
Глааа 2. Нечеткий метод группового учета аргументов...
2.4.3. Прогнозирование курсов акций
Эксперимент 4. Прогнозирование курса акций
В данном эксперименте входными данными являются цены
на акции 4 ведущих энергетических фирм России:
EESR — акции ОАО РАО ЕЭС России.
YUKO — акции ОАО ЮКОС.
SNGSP — привилегированные акции ОАО Сургутнефтегаз.
SNGS — обычные акции ОАО Сургутнефтегаз.
Прогнозировалась цена на акции другой компании: ОАО
ЛУКОЙЛ за тот же период (03.04.2006 — 18.05.2006).
Размер выборки — 32 значения.
Размер обучающей выборки — 17 значений (оптимальный
размер обучающей выборки для данного эксперимента).
Были получены следующие результаты:
1. Для треугольного вида функции принадлежности:
а) Для нормированных входных данных.
Значения критериев для данного эксперимента составили:
СКО = 0,056481.
—•— Левая |раница
—— Центр
—л—Правая граница
>< Реальные значен
Рис. 2.11. Результаты эксперимента 4 для треугольной ФП
и нормированных значений входных переменных
б) Для ненормированных входных данных: СКО = 0,914998,
МАРЕ = 0,73%.
83
Нечёткие модели и методы в интеллектуальных системах
—•— Левая |ратца
- Центр
Л Правая граница
—«—Реальные значен
Рис. 2.12. Результаты эксперимента 4 для треугольной ФП
и ненормированных значений входных переменных
2. Для функции принадлежности Гаусса (оптимальный уро-
вень а = 0,9):
а) Для нормированных входных данных:
Значение критериев для данного эксперимента составили:
СКО = 0,030464.
♦ Левая |раница
—— Центр
Правая |раница
и—Реальные значен
Рис. 2.13. Результаты эксперимента 4 для ФП Гаусса
и нормированных значений входных переменных
84
Глава 2. Нечеткий метод группового учета аргументов...
б) Для ненормированных входных данных:
Значения критериев для данного эксперимента составили:
СКО = 0,493511, МАРЕ = 0,33%.
Как видно из результатов эксперимента 4, прогнозирование с
использованием треугольных и гауссовских функций принадлеж-
ности дает хорошие результаты. Результаты экспериментов с ФП
Гаусса оказались лучшими, чем с треугольной ФП.
Для нормированных данных:
Треугольные ФП ФП Гаусса
СКО 0,056481 0,030464
Для ненормированных данных:
Треугольные ФП ФП Гаусса
СКО 0,914998 0,493511
МАРЕ 0,73% 0,33%
ВЫВОДЫ К ГЛАВЕ 2
1 В главе рассмотрен нечеткий метод группового уче-
та аргументов с нечеткими входными данными. Он является
дальнейшим развитием нечеткого метода группового учета аргу-
ментов. Он позволяет строить зависимость между экономиче-
скими показателями, заданными нечетко и выходным экономи-
ческим показателем. В результате работы метода можно получить
оценочный интервал для выходной переменной, что более ин-
формативно, чем получение точечной оценки. Достоинством ме-
тода является также то, что не требуется задаваться видом про-
гнозирующей модели — алгоритм строит модель в процессе сво-
ей работы автоматически.
2. Разработана программа, реализующая предложенный метод
и проведены его экспериментальные исследования на задачах
прогнозирования финансовых индексов и курсов акций на фон-
довом рынке (РТС). В процессе экспериментов варьировался вид
функций принадлежности нечетких коэффициентов: треугольный
и гауссовский.
85
Нечёткие модели и методы в интеллектуальных системах
Как следует из приведенных экспериментов, применение как
треугольной, так и гауссовской функций принадлежности позво-
ляет получить хорошие результаты. В случае ФП Гаусса результа-
ты оказываются лучше, чем в случае треугольных ФП.
3. Как показали исследования, оптимальный уровень а для га-
уссовской ФП равняется 0,8—0,9. Оптимальный размер обучаю-
щей выборки составляет 53—60% от общего размера выборки.
Полученные результаты позволяют сделать вывод о целесооб-
разности применения разработанного метода нечеткого МГУА с
нечеткими входными переменными для моделирования и про-
гнозирования финансовых показателей на фондовом рынке.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
К ГЛАВЕ 2
1. С какими входными данными работает нечеткий МГУА с
нечеткими входами?
2. Какие задачи решаются для нахождения неизвестных ко-
эффициентов модели в нечетком МГУА?
3. Какой смысл имеет целевая функция и ограничения в за-
даче ЛП для нахождения коэффициентов нечеткой модели?
4. В чем состоят отличия модели в задаче ЛП для нечеткого
МГУА с четкими входными переменными и нечеткими входны-
ми переменными?
86
ГЛАВА J
Системы нечеткого логического
вывода и нечеткие нейронные
сети и их применение
в задачах прогнозирования
ВВЕДЕНИЕ
В последние годы внимание многих исследователей в
области систем искусственного интеллекта привлекают проблемы
принятия решений в условиях неопределенности, неполноты ис-
ходных данных, качественных критериев.
Появилось новое направление в области теории принятия
сложных решений, которое интенсивно развивается, — принятие
решений в условиях неопределённости. Перспективным аппара-
том решения многих задач ПР в условиях неполноты и неопре-
делённости явился аппарат нечетких множеств и отношений,
созданный Л. Заде.
Введение Л. Заде понятия лингвистических переменных, опи-
сываемых на нечетких множествах, дало толчок к появлению но-
вого класса систем — систем нечеткого логического вывода, по-
зволяющих формализовать нечеткие экспертные знания. Исполь-
зование систем нечеткого логического вывода (систем НЛВ) и
построенных на их основе нечетких нейронных сетей (ННС) по-
зволило решать многочисленные задачи принятия решений в ус-
ловиях неопределённости, неполноты и качественной информа-
ции — прогнозирование, классификации, кластерного анализа,
распознавания образов.
Глава 3 посвящена детальному рассмотрению систем НЛВ. В
ней рассматриваются основные алгоритмы нечеткого вывода
Мамдани, Цукамото, Сугено и Ларсена. Описаны методы приве-
дения к четкости. Далее подробно описаны нечеткие контролле-
ры (НК) Мамдани и Цукамото и классический алгоритм обуче-
ния НК Мамдани на основе метода обратного распространения.
87
Нечёткие модели и методы в интеллектуальных системах
Описан новый алгоритм обучения НК Мамдани и Цукамото для
гауссовских ФП градиентного типа.
Далее рассмотрена ННС ANFIS, приводятся её архитектура и
градиентный алгоритм обучения. Затем описана ННС TSK, яв-
ляющаяся развитием ННС ANFIS, и рассмотрен гибридный ал-
горитм её обучения.
В конце главы приводятся результаты многочисленных экс-
периментальных исследований ННС с разными алгоритмами не-
четкого вывода и функциями принадлежности в задачах прогно-
зирования в макроэкономике и финансовой сфере.
3.1. АЛГОРИТМЫ НЕЧЕТКОГО ЛОГИЧЕСКОГО
ВЫВОДА
Используемый в разных экспертных и управляющих
системах механизм нечетких выводов в своей основе имеет базу
знаний, формируемую специалистами предметной области в виде
совокупности нечетких предикатных правил вида [37; 97]:
П , : если х есть At, то у есть В{;
П2 : если х есть А2, то у есть Д2;
П„ : если х есть А„, то у есть Вп,
где X , X е X — входная переменная (имя для известных
значений данных); У, У 6 ¥ — переменная вывода (имя для
значения данных, которое будет вычислено); А, и В, — функ-
ции принадлежности, заданные соответственно на множествах
X и Y.
Приведем более детальное пояснение. Знание эксперта А -> В
отражает нечеткое причинное отношение предпосылки и заклю-
чения, поэтому его можно назвать нечетким отношением и обо-
значить через R :
R: А В,
где «->» называют нечеткой импликацией.
88
Глава 3. Системы нечеткого логического вывода...
Отношение R можно рассматривать как нечеткое подмноже-
ство прямого произведения X х Y полного множества предпосы-
лок X и выводов Y. Таким образом, процесс получения (нечет-
кого) результата вывода В' с использованием данного наблюде-
ния А' и знания А -> В можно представить в виде композици-
онного правила нечеткий «modus ponens»:
В'= А'• R = А'*(А В),
где «•» — операция свертки.
Как операцию композиции, так и операцию импликации в
алгебре нечетких множеств можно реализовывать по-разному
(при этом будет отличаться и получаемый результат), но в любом
случае общий логический вывод осуществляется за следующие
четыре этапа [45].
1) Введение нечеткости (фаззификация, fuzzification). Функции
принадлежности, определенные на входных переменных, приме-
няются к их фактическим значениям для определения степени
истинности каждой предпосылки каждого правила.
2) Логический вывод. Вычисленное значение истинности для
предпосылок каждого правила применяется к заключениям каж-
дого правила. Это приводит к одному нечеткому подмножеству,
которое будет назначено каждой переменной вывода для каждого
правила. В качестве правил логического вывода обычно исполь-
зуются только операции min (МИНИМУМ) или prod (УМНО-
ЖЕНИЕ). В логическом выводе МИНИМУМА функция принад-
лежности вывода «отсекается» по высоте, соответствующей вы-
численной степени истинности предпосылки правила (нечеткая
логика «И»), В логическом выводе УМНОЖЕНИЯ функция при-
надлежности вывода масштабируется при помощи вычисленной
степени истинности предпосылки правила.
3) Композиция. Все нечеткие подмножества, назначенные к каж-
дой переменной вывода (во всех правилах), объединяются вместе,
чтобы сформировать одно нечеткое подмножество для всех пере-
менных вывода. При подобном объединении обычно используются
операции мах (МАКСИМУМ) или sum (СУММА). При компози-
ции МАКСИМУМА комбинированный вывод нечеткого подмно-
жества конструируется как поточечный максимум по всем нечетким
подмножествам (нечеткая логика «ИЛИ»). При композиции СУМ-
МЫ комбинированный вывод нечеткого подмножества формирует-
ся как поточечная сумма по всем нечетким подмножествам, назна-
ченным переменной вывода правилами логического вывода.
89
Нечёткие модели и методы в интеллектуальных системах
4) Приведение к четкости (дефаззификация, defuzzification). Ис-
пользуется, если нужно преобразовать нечеткий набор выводов в
четкое число. Существует значительное количество методов при-
ведения к четкости, некоторые из которых рассмотрены ниже.
Пример 3.1. Пусть некоторая система описывается следую-
щими нечеткими правилами:
П1 : если х есть А, то w есть D;
П2 : если у есть В, то н> есть Е;
П3 : если z есть С, то w есть F,
где х,у и z — имена входных переменных; w — имя перемен-
ной вывода, a A,B,C,D,E,F — заданные функции принадлежно-
сти (треугольной формы).
Процедура получения логического вывода иллюстрируется
рис.3.1. Предполагается, что заданы конкретные (четкие) значе-
ния входных переменных: х0, у0, z0 •
Рис. 3.1. Иллюстрация процедуры логического вывода
90
Глава 3. Системы нечеткого логического вывода...
На первом этапе, на основании данных значений и, исходя из
функций принадлежности А,В,С, находятся степени истинности
а(х0), а(у0) и aUo) для предпосылок каждого из трех приведен-
ных правил. На втором этапе, происходит «отсечение» функций
принадлежности выводов правил (D,E,F) на уровнях а(х0), а(у0)
и ct(zo)- На третьем этапе, рассматриваются функции принад-
лежности, усеченные на предыдущем этапе, и производится их
объединение с использованием операции max, в результате чего
получается комбинированное нечеткое подмножество, описывае-
мое функцией принадлежности (w) и соответствующее логиче-
скому выводу для выходной переменной w . Наконец, на четвер-
том этапе находится, при необходимости, четкое значение вы-
ходной переменной, например, с применением центроидного ме-
тода: четкое значение выходной переменной определяется как
центр тяжести для кривой р1(и'):
Jw ^(w)dw
wo = --------•
n
Рассмотрим следующие наиболее употребительные модифи-
кации алгоритма нечеткого вывода, считая, для простоты, что
базу знаний организуют два нечетких правила вида:
П, : если х есть А, и у есть , то z есть С,;
П2 : если х есть А2 и у есть В2, то z есть С2,
где х и у — имена входных переменных, z — имя переменной
вывода, Ах,В\,С\,А2,В2,С2 — некоторые заданные функции при-
надлежности. При этом четкое значение z0 необходимо определить
на основе приведенной информации и четких значений х0 и у0.
3.1.1. Нечеткий алгоритм Мамдани
Данный алгоритм соответствует рассмотренному при-
меру на рис. 3.1. В рассматриваемой ситуации он математически
может быть описан следующим образом [37; 38; 45; 96]:
91
Нечёткие модели и методы в интеллектуальных системах
1) Введение нечеткости. Находятся степени истинности для
предпосылок каждого правила: 4(x0),/42(x0), Д(у0), В2(у0).
2) Логический вывод. Находятся уровни «отсечения» для
предпосылок каждого из правил (с использованием операции
МИНИМУМ):
а, =
а2 = Ai(x0) л ВМ,
где через «л» обозначена операция логического минимума (min).
Затем находятся «усеченные» функции принадлежности:
С\ =(а1лС1(?));
С2 = (а2лС2и)).
3) Композиция. Производится объединение найденных усе-
ченных функций с использованием операции МАКСИМУМ
(мах, обозначенная далее как «V»), что приводит к получению
итогового нечеткого подмножества для переменной выхода с
функцией принадлежности:
Pz(z) = C(z) = ОД v C'2(z) = fa, л Ct (V) v (a2 л C2(z)) . (3.1)
Приведение к четкости. Проводится для нахождения z0, на-
пример, центроидным методом.
3.1.2. Нечеткий алгоритм Цукамото
Исходные посылки — как у предыдущего алгоритма,
но здесь предполагается, что функции Q(z),C2(z) являются мо-
нотонными (см. рис. 3.2) [37; 38; 45]:
Введение нечеткости (как в алгоритме Мамдани).
Нечеткий вывод. Сначала находятся уровни «отсечения» а( и
а2 (как в алгоритме Мамдани), а затем решаются уравнения:
«I = C|(z,) и a2 =C2(z2),
определяются четкие значения (^ и z2) для каждого исходного
правила.
92
Глава 3. Системы нечеткого логического вывода...
Определяется четкое значение переменной вывода (как взве-
шенное среднее Zt И Z2Y-
+a2z2
+а2
(3.2)
В общем случае (дискретный вариант нентроидного метода):
Л
z0 =4—
1 = 1
(3.3)
3.1.3. Нечеткий алгоритм Сугено
Сугено и Такаги использовали набор правил в сле-
дующей форме (как и ранее, приведем пример двух правил):
ГЦ : если х есть А| и у есть В( то z{= a^+bjy;
П2: если х есть А2 и у есть В2 то z2=a2x+b2y.
93
Нечёткие модели и методы в интеллектуальных системах
Описание алгоритма (рис. 3.3).
1) Введение нечеткости (как в алгоритме Мамдани).
2) Нечеткий вывод.
Находятся а( = Л,(х0)л Bf(y0), а2 = Л2(х0) л В2(у0) и индиви-
дуальные выходы правил:
Zi = fl,x0 + />1у0;
z2 = о2х0 + Ь2у0.
Рис. 3.3. Иллюстрация к алгоритму Sugeno
Определяется четкое значение переменной вывода:
a,Z, +a2Z2
<о -
a, +a2
3.1.4. Нечеткий алгоритм Ларсена
В алгоритме Ларсена (Larsen) нечеткая импликация
моделируется с использованием оператора умножения.
94
Глааа 3. Системы нечеткого логического аывода...
Описание алгоритма (рис. 3.4).
1) Введение нечеткости (как в алгоритме Мамдани).
2) Нечеткий вывод. Сначала, как в алгоритме Мамдани, на-
ходятся значения:
Д(у0);
ct2 = Л2(х0)л ^(Уо).
а затем определяются частные выходные нечеткие подмножества:
«|(C,U)) a2(C2U)).
3) Находится итоговое выходное нечеткое подмножество:
Ps(z) = C(z) = (afc (z)) v (c^QU)) •
n
(в общем случае n правил:= C(z) = (z))).
При необходимости производится приведение к четкости (как
в ранее рассмотренных алгоритмах).
95
Нечёткие модели и методы в интеллектуальных системах
3.2. МЕТОДЫ ПРИВЕДЕНИЯ К ЧЕТКОСТИ
Выше уже был рассмотрен один из данных методов —
центроидный. Приведем соответствующие формулы еще раз. В
общем случае [45; 96]:
Jz C(z)dz
г’° ° JcW*
Q
для дискретного варианта:
~— •
/=1
(3.4)
Первый максимум (First-of-Maxima). Четкая величина вывода
находится как наименьшее значение, при котором достигается
максимум итогового нечеткого множества (рис. 3.5, a): z0 =
= min
|с^ = maxCft^l-
Рис. 3.5. Иллюстрация к методам приведения к четкости
а — первый максимум; б — средний максимум
Средний максимум (Middle-of-Maxima) Четкое значение на-
ходится по формуле.
96
Глава 3. Системы нечеткого логического вывода...
Z-o =
\zdz
G__
н
(3.5)
где G — подмножество элементов, максимизирующих С (рис.
3.5, б). Для дискретного варианта (С дискретное):
1 v
(3.6)
Критерий максимума (Max-Criterion). Четкое значение выби-
рается произвольно среди множества элементов, для которых С
достигает максимума:
Z : C(z) = max C(U)
u
(3.7)
*о е
Высотная дефаззификация (Height defuzzification). Элементы
области определения Q, для которых значения функции принад-
лежности меньше, чем некоторый уровень а, в расчет не при-
нимаются, и четкое значение рассчитывается соответственно вы-
ражению:
fz-CfzMz
Z° \C(z)dz
(3.8)
где Со — нечеткое множество a-уровня (см. выше).
3.3. ТЕОРЕМЫ ОБ УНИВЕРСАЛЬНОЙ
АППРОКСИМАЦИИ
Возможность использования аппарата нечеткой логи-
ки базируется на следующих результатах [123]:
1. В 1992 г. Ванг (Wang) показал, что нечеткая система яв-
ляется универсальным аппроксиматором, то есть может ап-
проксимировать любую непрерывную функцию на компакте U
с произвольной точностью, если использует набор и (п -> со)
правил:
97
Нечёткие модели и методы в интеллектуальных системах
Ц \ если х есть А, и у есть В,, то z есть С,,/ = 1..л, при
следующих условиях:
• гауссовых функциях принадлежности:
Afx) = exp
Bfy) = exp
(3.9)
C,(z) = exp
1 fz-o,3 Y
2 < J
• пересечения в виде произведения: [/,(x)andB,(y)] = Л,(х)х
*4 GO;
• импликации в форме Ларсена (Larsen): [/,(x)and Z?,(y)]->
->С,(г)=Д(х)В,(у)С,.(г);
• центроидном методе приведения к четкости:
Ео.зА-В,.
г0=^---------, (3.10)
1=1
где а,3 — центры С, .
Иначе говоря, Ванг доказал теорему: для каждой веществен-
ной непрерывной функции g, заданной на компакте U, и для
произвольного е > 0 существует нечеткая система, которая фор-
мирует исходную функцию f(x) такую, что
sup|g(x> - /(х)| < Е ,
xel/
где ||» || — символ принятого расстояния между функциями.
В 1996 г. Кастро (Castro) показал, что логический контролер
Мамдани также является универсальным апроксиматором при [101]:
• симметричных треугольных функциях принадлежности:
Д(х) =
1 - |а,- - х\/
/ai
0,
ес/ш|а, - х| < а,;
еслф, - х| > а,-;
(З.П)
98
Глава 3. Системы нечеткого логического аыаода...
1 %,если\Ь, -у|<₽,-;
О, если [6, - > р,.;
(3.12)
• композиции с использованием операции min:
[A, (xjandB, (у)] = min{4 (х), В, (у)};
• импликации в форме Мамдани и центроидного метода при-
ведения к четкости:
£<?. пйп{Л,(х),В,(у)}
. (3-13)
£min{4(x),B,(y)}
/=i
где с, — центры С,.
В целом, системы с нечеткой логикой целесообразно приме-
нять в следующих случаях [45; 96]:
• для сложных процессов, когда нет простой математической
модели;
• если экспертные знания об объекте или о процессе можно
сформулировать только в лингвистической форме.
Системы, которые базируются на нечеткой логике, применять
нецелесообразно:
• если необходимый результат может быть получен каким-
нибудь другим (стандартным) путем;
• когда для объекта или процесса уже найдена адекватная и
легко исследуемая математическая модель.
Отметим основные недостатки систем с нечеткой логикой:
• исходный набор нечетких правил формулируется экс-
пертом-человеком и может оказаться неполным или проти-
воречивым;
• вид и параметры функций принадлежности, которые опи-
сывают входные и исходные переменные системы, выбираются
субъективно и могут оказаться такими, что не полностью отра-
жают реальность.
99
Нечёткие модели и методы а интеллектуальных системах
3.4. НЕЧЕТКИЕ НЕЙРОННЫЕ СЕТИ С ВЫВОДОМ
МАМ ДАН И И ЦУКАМОТО
Наряду с большими преимуществами системы с не-
четкой логикой обладают рядом недостатков, а именно:
база правил, формулируемых экспертом, может оказаться не-
полной или противоречивой;
функции принадлежности лингвистических переменных мо-
гут оказаться неадекватными реальным моделируемым процес-
сам.
Для устранения указанных недостатков необходимо использо-
вать обучение систем нечеткой логики, т.е. сделать их адаптив-
ными.
3.4.1. Нечеткий контроллер на основе
нейронных сетей
Одним из первых практических применений систем с
нечеткой логикой была сфера управления, для чего широко ис-
пользовались так называемые нечеткие контроллеры (НК) [116].
Для проектирования нечеткого контроллера должны быть за-
даны лингвистические правила и ФП (функция принадлежности)
для представления лингвистических величин. Спецификация хо-
роших лингвистических правил зависит от знания экспертом
системы управления. Но перевод этих знаний в нечеткие множе-
ства — эта задача является не формализованной, и нужно сделать
выбор на основании, например, формы ФП. Качество нечеткого
контролера (НК) достигается путем изменения формы ФП.
Искусственные нейронные сети (НС) представляют собой
высоко параллельную архитектуру и состоят из аналогичных эле-
ментов, взаимодействующих через связи, которые задаются веса-
ми. Используя НС мы можем не только аппроксимировать функ-
ции, но и изучать (исследовать) объекты управления, применяя
обучение и самообучение. Проблема заключается в том, что на
обучение тратится достаточно много времени и при этом не всег-
да гарантируется результат. Но возможно внедрить ранее приоб-
ретенные знания в виде правил уже обученной НМ для упроще-
ния процедуры обучения.
Соединение НК и НС позволяет объединить все их преиму-
щества и избежать их недостатков. Этот подход использует НС
100
Глава 3. Системы нечеткого логического выаода...
для оптимизации конечных параметров обычного НК или для
извлечения правил из данных. Выбор ФП, которая представляет
лингвистический терм, более-менее произвольный. Для примера
рассмотрим лингвистический терм «приблизительно нуль». Оче-
видно, что соответствующая нечеткому множеству ФП должна
быть унимодальной, достигать своего максимума в значении
нуль. Правильный выбор функции принадлежности стал основ-
ной и важнейшей задачей НК.
НС предлагает возможность решения этой проблемы. Метод
прямого распространения (сигналов) в НС допускает выбор фор-
мы ФП, которая зависит от нескольких параметров и может быть
скорректирована в процессе обучения. В качестве ФП можно взять
симметричную треугольную форму, которая зависит от двух пара-
метров, один из которых определяется значением, в каком ФП
достигает максимального значения, а второй — длиной интервала.
Данные обучения должны быть разделены на Г кластеров
Ли...,/?,. Каждый кластер R, отвечает решающему правилу Я,.
Элементы кластера представляются в виде значений в форме (X,
У), где X = [Xj,...,x„J — вектор входных переменных, а К — вы-
ходная переменная.
Рассмотрим динамическую систему 5, в которой управление
осуществляется с помощью переменной С, и ее состояние может
быть описано п переменными х1,...,х„.
Лингвистические значения переменных моделируются функ-
циями принадлежности, а управляющее воздействие, которое
приводит систему к желаемому состоянию описывается нечетким
правилом «если, — то». Чтобы получить искомое значение (то
есть управление), необходимо решить проблему дефаззификации,
для чего мы используем монотонную функцию принадлежности
Цукамото (Tsukamoto), см. на рис. 3.6, где дефаззификация сво-
дится к применению обратной функции.
Такая функция принадлежности ц характеризуется двумя
точками а и b ФП, и она определяется как
(-х+а)/(а-b), если xe[fl,Z>]v(x6[Z>,c]A(a>Z>));
О, в противном случае.
Дефаззификация осуществляется таким путем:
х = М“‘(у) = -у(а-Ь) + а = а + у(Ь - а); у е [0;1].
р(х) =
101
Нечёткие модели и методы в интеллектуальных системах
«2
Рис. 3.6. Дефаззификация с использованием монотонной функции
принадлежности Цукамото.
Для наших целей мы должны ограничить монотонную ФП,
чтобы представить лингвистическое значение исходной перемен-
ной. Для входной величины обычно используют треугольную или
трапециидальную ФП.
На рис. 3.7 представлена структура нечеткого нейронного
контроллера.
Модули х, и х2 здесь представляют входные переменные, и
они посылают свои значения в свои р-модули, которые содер-
жат соответствующие ФП. р -модули связаны с Л-модулями, ко-
торые представляют собой нечеткие правила «если, — то». Каж-
дый р -модуль передает всем связанным с ним R-модулям значе-
ния ФП Р;,(х,) ее входной величины х, . Я-модуль использует
операцию пересечения и находит min{p?(x,)} и передает это зна-
чение дальше — в v -модуль, который содержит ФП, описываю-
102
Глава 3. Системы нечеткого логического вывода...
Рис. 3.7. Структура нечеткого нейронного контроллера
щую выходные значения, v -модуль, используя монотонные функ-
ции принадлежности, вычисляет величины г, и v"‘(r( ) и переда-
ет их в С-модуль, который вычисляет итоговую выходную пере-
менную — управляющее воздействие С согласно формуле (3.14),
то есть использует алгоритм центра масс (СОА):
С = ^—„------ , (3.14)
i=i
где п — число правил вывода; г, — степень, с которой правило
Ri выполняется. Как нетрудно увидеть, система на рис. 3.7 на-
поминает последовательную многослойную НС, где х-, R- и С-
модули исполняют роль нейронов, а ц - и v -модули играют роль
адаптируемых весов связей сети.
Процесс обучения определяется нечеткой ошибкой и работает
параллельно для каждого нечеткого правила. После того как С
выработано контроллером и новое состояние объекта становится
103
Нечёткие модели и методы в интеллектуальных системах
известным, вычисляется ошибка Е, которая распространяется в
обратном направлении. Каждое правило анализирует свой вклад
в выход управления и оценивает свое заключение (т.е. привело
оно к увеличению или уменьшению ошибки). При этом, если
правило действовало в нужном направлении, то оно должно стать
более чувствительным и выработать такое заключение (вывод),
которое увеличивает управление. И наоборот, если правило дей-
ствовало в неправильном направлении, то правило должно стать
менее чувствительным. Учитывая, что ФП описываются двумя
параметрами (ft,, a,,), то один из них фиксируется, а второй меня-
ется. В данном случае меняется а,.
Алгоритм обучения. В работах [117] предложен следующий ал-
горитм обучения ННС. Он сводится к настройке функций при-
надлежности условий и следствий правил.
1. Каждое правило вычисляет ошибку правила:
Д- =
signCi = signCop,-,
signC, * signCop,,
(3.15)
где г, — уровень активации правила Е,; С, — выход i -го v -мо-
дуля; Сор1 — оптимальное управление (желаемый выход ННС).
2. eRj передается в v и р модули. Сначала происходит изме-
нение ФП v -модулей
a* -А|, ak < bk;
a*-ft*|, ak > bk,
(3.16)
где ст— скорость обучения
Если модуль vk используется несколькими Л-модулями, то
его ФП меняется столько раз, сколько R -модулей связано с ним.
3. Корректировка ФП условий:
a
new
А
@jk bjk | ’ @jk < bjk »
ajk>bjk-'
(3.17)
Модуль p связан с модулем Rk через модуль . Этот алго-
ритм называется алгоритмом с подкреплением.
104
Глава 3. Системы нечеткого логического вывода...
Если процесс обучения оказался успешным, то база правил
сформирована верно. Можно организовать процесс обучения та-
ким образом, чтобы не только настраивать ФП правил, но и кор-
ректировать сами правила. Если выход правила соответствует се-
мантике управления, то правило сохраняется в базе. Если его вы-
ход противоположен исходному, то его заключение меняется на
противоположное или же правило совсем удаляется.
3.4.2. Алгоритм обратного распространения
ошибки в ННК Мамдани
Одна из проблем конструирования нечеткого кон-
троллера — это выбор подходящей функции принадлежности.
Данную проблему можно решить с помощью интеграции мето-
дики обучения НС и архитектуры нечеткого контроллера.
Стандартный подход состоит в добавлении еще одного моду-
ля в архитектуру ННК вида на рис. 3.7, учитывая необходимость
коррекции ошибок. [45; 117; 116].
Мы рассматриваем вычисление управляющей переменной по
данным измерения входных переменных как последовательную
процедуру в многослойных НС, где входные сигналы распро-
страняются в прямом направлении (feed forward), но если дейст-
вительные значения выходов отличаются от желаемых, то ошиб-
ка распространяется в обратном направлении с учетом величин,
рассчитанных во время прямого хода.
Рассмотрим теперь полную архитектуру нечеткого контролле-
ра [116; 117]. Она приведена на рис. 3.8.
105
Нечёткие модели и методы в интеллектуальных системах
ННК состоит из следующих компонентов:
MSF — модуль, реализующий процедуру фаззификации,
Т — модуль для агрегации входных данных,
S — модуль для агрегации выходных данных,
DEFUZ — модуль, выполняющий процесс дефаззификации.
Т -модули осуществляют операцию минимизации (пересече-
ния), 5 -модули — операцию максимизации (объединения) соот-
ветственно.
На рис. 3.8 имеется 2 входа х, и х2 для пяти правил, где
MSF заданы как = 1,2.
Значения, полученные MSF-модулями, передаются сначала
Т-модулям, а потом через S'-модуль в модуль дефаззификации.
Выходной сигнал ст сравнивается с желаемым выходным сигна-
лом ст, и определяется ошибка 8. Проблема заключается в на-
стройках входных и выходных MSF-модулей.
Процедура обучения. Ошибка <5„ является комбинацией боко-
вого смещения доменов 7] и зависит от формы функций Т,. Эти
ошибки распространяются в обратном направлении в 5 и Т-
модулях соответственно.
Величины ошибок соотносятся с позицией выходной величи-
ны и ее желаемым значением. В методе обратного распростране-
ния мы должны уделять особое внимание ошибкам, в случае ес-
ли выходное и желаемое значения находятся близко к границам
измеряемого интервала.
Будем рассматривать следующие два метода дефаззификации:
метод центра тяжести (СОА) и метод среднего значения макси-
мума (МОМ). После того, как получено четкое выходное значе-
ние ст = DEFUZ(S), мы должны определить сигнал ошибки 8О
как разницу ст-ст,между выходным значением и желаемым вы-
ходным значением ст,.
Рассмотрим МОМ-процедуру дефаззификации.
Существует 4 возможности для выходной величины прини-
мать неверное значение [45; 117]:
106
Глава 3. Системы нечеткого логического вывода...
1. Если желаемое значение ст, расположено под вершиной 5 ,
но сдвинуто немного влево или вправо (рис. 3.9 а) относительно
фактического значения и.
2. Если желаемое значение принадлежит области определения
нечеткого множества 7}, которое генерирует вершину S,, но а,
не располагается под вершиной S ( рис. 3.9 б).
3. Если желаемое значение не принадлежит области опреде-
ления нечеткого множества 7}, которое генерирует вершину S ,
но оно по-прежнему находится внутри области принадлежности
5 (рис. 3.10 а).
4. Если желаемое значение ст, не принадлежит области опре-
деления 5 (рис. 3.10 б).
В двух первых случаях вершина S сгенерирована правиль-
ным выходным нечетким множеством Т, но она смещена. Мы
предполагаем, что только Т’ влияет на неверное значение выхода
ст. Эту ошибку можно преодолеть, изменяя форму Т’ таким об-
разом, чтобы среднее значение на верхнем «плато» у, было ст,
(прерывистые линии на рис. 3.9).
В третьем случае вершина 5 сгенерирована неверным выход-
ным нечетким множеством. Эта ошибка происходит из-за вход-
ных нечетких множеств, которые мы сначала должны изменить,
чтобы проверить, что вершина 5 сгенерирована правильным
модулем 7].
107
Нечёткие модели и методы в интеллектуальных системах
Рис. 3.10.
Допустим, что вершина 5 сгенерирована Т( и о, принадле-
жит области принадлежности 7}. Следовательно, мы должны
увеличить значения на выходе Tj и уменьшить вели-
чину rnin{p^}. Затем применяем это правило к Ti таким же об-
разом, как и в двух первых случаях.
В четвертом случае, когда о, не принадлежит области опреде-
ления 5,, делаем вывод, что в нашей базе правил присутствует
ошибка.
Это может быть либо в случае, когда не существует правила,
покрывающего область нахождения либо правило не соот-
ветствует действительности. В этом случае мы должны предло-
жить новое правило, которое соответствует данной ситуации.
Эта процедура происходит не автоматически, а выполняется
пользователем.
Алгоритм нечеткого распространения ошибки. Опишем алго-
ритм нечеткого распространения ошибки в нечеткой нейронной
сети (см рис. 3.8.) [45; 117, 116].
108
Глава 3. Системы нечеткого логического вывода...
1. После того как устройство DEFUZ сгенерировало о, оно
передает на обратном ходе правильное значение о, и фактическое
значение выхода ст в 5-модуль.
2. Проверяется условие принадлежности ст, области определе-
ния 5. Если оно не выполняется (т.е. ст, gобласти определения 5),
то эксперт должен добавить новое правило в базу правил и теку-
щее выходное значение должно быть пересчитано перед началом
процедуры обучения. В противном случае переходим на следую-
щий шаг.
3. Если 5-модуль передает в обратном направлении ст и ст„ то
высота S (А^ах) и максимальная высота каждого нечеткого мно-
жества h(Tj), не соответствующего вершине А^ , принадлежат Т-
модулям.
4. Каждый Г-модуль проверяет: Если высота Т\ равна высоте
5, то есть А- = Атах и ст, не принадлежит области определения 7^,
то посылаем А(7}) и понижающий сигнал всем подключенным к
Tt ц-модулям (рис. 3.11).
а. Если А(7]) = А(5)=Атах и ст, принадлежит области определе-
ния Т), но ст,?* ст, то изменяем форму 7} таким образом, чтобы ст,
определяло положение максимума вместо ст.
Ь. Если А(7}) # А(5)=Атахи ст, принадлежит области определе-
ния 7], то посылаем значения высоты А(5), А(Т';) и повышаю-
щий сигнал, всем p-модулям, подключенным к 7], принимаем
А(5) как гшп{ц^)= пйп{цл(7})} и изменяем форму 7] таким об-
разом, чтобы шахр(5) достигался в точке ст„ вместо ст.
с. Если А(7}) Ф h(S) и ст, не принадлежит области определе-
ния Т), то прерываем распространение ошибки в этом модуле.
5. Каждый p-модуль проверяет:
а. Если поступает понижающий сигнал и иР(х,) = А(Т’у), то
изменяем форму так, чтобы Атах,
Ь. Если поступает повышающий сигнал и p,w(x; )< А(5у), то
изменяем форму р-у) так, чтобы р^(х;)= А(5).
109
Нечёткие модели и методы в интеллектуальных системах
(а)
Рис. 3.11. Регулирование а путем увеличения/уменыиения формы всех
или одного из нечетких множеств Г-модулей.
Таким образом мы рассматриваем нечеткий контроллер как
ННС, в которой нечеткие множества хранятся в узлах системы.
Алгоритм обучения определяет модуль, который отвечает за
ошибку в сигнале на выходе и распространяет информацию в
обратном направлении через нейронную сеть, что позволяет мо-
дулю изменять его нечеткие множества (а именно ФП).
3.5. ГРАДИЕНТНЫЙ АЛГОРИТМ ОБУЧЕНИЯ
ННС МАМДАНИ И ЦУКАМОТО
Рассмотренный в разделе 3.4 алгоритм обучения НК
Мамдани носит эмпирический характер, формулы (3.15)—(3.17)
для настройки параметров функций принадлежности теоретиче-
ски необоснованны. Это связано с тем, что в НК Мамдани и Цу-
110
Глава 3. Системы нечеткого логического вывода...
камото используются треугольные ФП, а пересечение условий
правил берется в форме min. В результате получаемые ФП ока-
зываются недифференцируемыми.
В связи с этим целесообразно сконструировать аналитиче-
ский алгоритм обучения, сходимость которого строго доказано. С
этой целью целесообразно перейти к гауссовским ФП, для усло-
вий и правил [44].
Итак, пусть ФП /-го р -модуля связанного с правилом Rk опи-
сывается следующим выражением:
prt(x,.) = exp
1 J*, -grt)2
. 2 °*
(3.18)
где aik, cik— параметры подлежащие настройке в процессе обу-
чения и ФП, vk -модуля имеют следующий вид, аналогичный
(3.18):
/ \ [ 1 (У, - ak )2
P*(Z) = ехр(- - * ,
I 2 ст* J
при этом пересечение условий правил задается в виде произведения.
ГТ / \ V1 1 (*,’ “ aik)
= ПМ*,) = ехР1- Еч-• 2
>=1 /-1 2
Допустим, что дефаззификация происходит по центроидному
методу, тогда общий выход:
Zo=
Пусть для определения следствия правила используется моно-
тонные ФП и zk определяется путём решения следующего урав-
нения (контроллер Цукамото):
CK(Zk)— &к >
где
С к (zk) = exp- -1
z ик
(3.19)
(3.20)
к
к
111
Нечёткие модели и методы в интеллектуальных системах
Тогда решая уравнение (3.19) ex]
1 (zk-ak)2
•z*——2 ->• = «*, нахо-
2 сгл
дим два корня:
I Г
А- ак± 21п—
V а
Первый корень Zlk= ak_ bln— *0* — находится на монотон-
V а
но возрастающем участке кривой C*(zJ, а второй z2* — на моно-
тонно убывающем участке.
Пусть критерий
E(z)=| (z0- z’)2 min,
где z* — фактический выход; a z0 — выход НК,
тогда находим производные [44]:
ЗЕ _ ЗЕ 3z0 3zk
3ak 3z0 3zk 3ak
(3.21)
к
Л-1
3E _ 3E0 5z0 3zk
dok dz0 dzk do k
ak
к
Ё ak
*=i
(3.22)
о
L . 1
2 In — ,
а
на монотонно возрастающем участке кривой ФП CA(zA);
(3.23)
на монотонно убывающем участке кривой.
Для входных р-модулей
ЗЕ _ dE$ Зик
За*
К к
=-/)———Ч—
ы
/
к
Пехг-
А-1
(л -qJ
2 с2
112
Глава 3. Системы нечеткого логического вывода...
к к
* к
8Е _ 8Е Szq 8a к
da ik 8z0 8ak 8s lk
' к
Zk ' — S к
Uo '*’)“* ---—-------П-------
|Sa* I
l к к J
(3.24)
и тогда градиентный алгоритм обучения ННС Мамдани выглядит
следующим образом [44]:
а) для выходных модулей:
дЕ
ак(п +1) = ак(п)-y„— = ak(n)-y„(z0-z )
о**
(3.25)
о,(л + 1) = оДл)-у„-|^ = o*(«) + y„U0 -Z ’)^—* 21п — . (3.26)
8ск z 2Л* V “*
к
б) для входных р -модулей:
а1к(П+1) =ц#)-ул=q#) y„(4-^) к ,(3.27)
La*
a J 'ак I , ч2
а,к{п +1) = о,Д») - учUo - Z *)^----к------I------2 • ’(З-28)
Г
2>*
\ к J
здесь уп,уЯ|,/„/^ - размер шага.
113
Нечёткие модели и методы в интеллектуальных системах
Для сходимости метода необходимо, чтобы выполнялись сле-
дующие условия [44; 45]:
a) -> °> л -> оо,
б) ЕУл = °°.
л=0
В) EyJ <°°-
л=0
3.6. НЕЧЕТКАЯ НЕЙРОННАЯ СЕТЬ ANFIS.
СТРУКТУРА И АЛГОРИТМ ОБУЧЕНИЯ
Рассмотрим адаптивную нечёткую систему с механиз-
мом логического вывода предложенного Сугено на базе правил
ЕСЛИ-ТО [38; 39; 45], которая получила название сети ANFIS
(Adaptive Network Based Fuzzy Inference System). Данная система
может быть успешно использована для настройки функции при-
надлежности и настройки базы правил в нечёткой экспертной
системе. Ниже представлена модель нечёткого вывода Сугено и
структурная схема сети ANFIS (рис. 3.12).
(а)
114
Глава 3. Системы нечеткого логического вывода...
Рис. 3.12. (а) Схема логического вывода Сугено
(б) эквивалентная структура нейронной сети ANFIS
ANFIS система использует следующую базу правил:
Г если х = А, и у = В, то Г, = а,х + Ь,у + г,;
I если х = А2 и у = В2 то f 2= а2х + Ь2у + г2,
где Aj и Bj являются лингвистическими переменными.
a^b^Ti — некоторые константы.
Слои данной нечёткой нейронной сети выполняют такие
функции:
Слой 1. Каждый нейрон данного слоя является нейроном, ко-
торый преобразует входной сигнал х или у с помощью функции
принадлежности (фаззификатор). Чаще всего используют коло-
колоподобную функцию
Мл, W =
(3.29)
или функцию Гаусса
Мл/W = ехр
(3.30)
Слой 2. Каждый нейрон в этом слое, отмеченный как П,
осуществляет пересечение множества входных сигналов, модели-
115
Нечёткие модели и методы в интеллектуальных системах
руя логическую операцию AND и посылает на выход:
= Pa(jc)xMb,(J')u’ = 1.2. (3.31)
По сути, каждый нейрон представляет собой активирующую
силу правила. Фактически любой оператор Т-нормы, который
обобщает операцию AND может быть использован в данных
нейронах.
Слой 3. Каждый нейрон в этом слое вычисляет нормирован-
ную силу правила:
Ч=- W' ,* = 1,2. (3.32)
wt+w2
Слой 4. На данном слое в нейронах формируются значения
выходных переменных:
О,4 = w,/, = wj(aix + Ь,у + (3.33)
Слой 5. В последнем слое получаем выходной сигнал ней-
ронной сети и выполняем дефазификацию результатов:
_ X"* уу f
0s = overall output = Vw,/ = . (3.34)
Нейронная сеть архитектуры AN FIS обучается с помощью
метода градиентного спуска
2. Воссоздание базы правил и настройка параметров функции
принадлежности.
В существующих системах с нечеткими нейронными сетями
одним из важнейших вопросов является разработка оптималь-
ного метода настройки нечеткой базы правил, исходя из обу-
чающей выборки, для получения конструктивных и оптималь-
ных моделей нечетких систем с дальнейшим использованием в
практических системах. В основном нечеткие правила описы-
ваются экспертами или операторами согласно их знаниям и
опыту о соответствующих процессах. Но, в случае разработки
нечетких систем иногда довольно тяжело или почти невозмож-
но сразу получить четкие правила или функции принадлежно-
сти (membership functions) вследствие неясности, неполноты или
сложности систем.
В таких случаях наиболее целесообразным считается генери-
рование и уточнение нечетких правил, используя специальные
116
Глава 3. Системы нечеткого логического вывода...
обучающие алгоритмы. На данный момент широко использует-
ся алгоритм обратного распространения ошибки для нечетких
сетей, описанный в разделе 3.4.2, который позволяет генериро-
вать оптимальные модели нечетких систем и базы правил. Дан-
ный алгоритм был предложен независимо Ичиаши (Ichihashi),
Номура (Nomura), Вангом и Менделем (Wang and Mendel) [45;
123]. Одновременно с ними, Ши и Мицумото предложили дру-
гой метод, который позволяет использовать его для практиче-
ских систем [45].
Основной характерной чертой данного подхода является то,
что настройка параметров нечетких правил осуществляется без
модификации таблицы правил. Без потери общности рассмотрим
данный алгоритм на модели, которая содержит две входные лин-
гвистические (Х|, х2) и одну выходную переменную у. Схема сети
приведена на рис. 3.12.
Рис. 3.13. Структура нейронной нечеткой сети ANFIS
117
Нечёткие модели и методы в интеллектуальных системах
Пусть у нас есть база правил, которая содержит все возмож-
ные комбинации Ап и A2j (i=l... г ; j=l...k ) такие, что:
Правило 1: 2: Ац> А21 — i, А22 = >У1> > У2,
к: Ап, А2к z =>Ук,
к+1: А|2. А2| z => Ук+1,
2к: А2к z =>У2к.
Правило ...
(i-l)k+j: ^iii A2j — > У(И)кч >
Правило гхк: А|п Лгк = => Угхк ,
где Ап та A2j — нечеткие множества для переменных соответст-
венно X! и Х2, а у(И) k+j — действительное число с Y.
Очевидно, что данный набор правил можно представить в ви-
де таблицы:
x,\Xj A21 ^22 А, Агь
Ац yt Уг Уг Ук
А и Уы Ук.2 Ун У2к
Ац Ун-пн
Au У (г-1>Ы Угк
Исходя из вышесказанного, если нам дан набор величин (х,,
х2), то согласно нечеткой базе правил, выход у может быть полу-
чен на основе методов нечеткой логики.
Прежде всего, обозначим степень выполнения условий сле-
дующим образом:
- '4|1СХ1 )-^2у(хг)- (3.35)
Согласно центроидному методу также запишем:
Hi iXi _ Hi 4Лх1)А/(л2)У(<-|)^ з зф
S1=i S/=i ^-пн Hi (Л1Мг/С*?)
118
Гпавв 3. Системы нечеткого логического выводе...
В случае обучения системы с помощью обучающей выборки (х,,
х2; у*), ошибка системы может быть описана как Е = (у*- у)2/2.
Исходя из описания нечетких величин для Ан имеем ои —
центр функции принадлежности, а Ьп — ширину для данной
функции, аналогично для A2j имеем g2j и b2i. Согласно методу
градиентного спуска для минимизации ошибки выхода Е можно
записать формулы для расчета коефициентов ои, a2j, b^ и _у(ц)щ
(/= 1,2,..., г, j = 1,2,..., к) следующим образом:
au(t +1) = о„(0 - a8E I 8au(t) =
= fl„(t) - a(8E / 8y)(8y / c\t /ая1,)(бл1,/го1,(г)) =
а(/ - у)[£*=1 (У«- y)A2J](8Ali / 8a„(t))
= au(t) +----------' г--------------------------> <3-37>
2ji = I 2-ij=l fy-l)**/
bll(f + l) = bli(t)-pdE/8b,l(t) =
= bu(t)-^8E / 8y)(8y / /8AU)(8AU /8t>M =
. (Л ₽</ ' ~ УМуЮА" / 8bv(t))
= MO +------------- v, ~ . (3.38)
a2j(t + l) = a2J(t}-a8E/8a2J(t) =
= a2J(t)-a{8E/ду)(8у /8\,.пкч)(8^/8A2])(8A2j /8a2j(t)) =
= a2J(t) + a(/ /да2,(')) (3 39)
b2j(t + l) = b2j(t)-p8E/8b2J(t) =
= b2J(t) - ^E/Sy^Sy/S^j^^,/8A2j)(8A2J / 8b2j(t)) =
= b2j(t) + P(/ /Sb2j(t)) (3 40)
У+1) =J(M)*+/(0 _ Y^/ =y(i-i)k+j(f) ~
- y(8E 18y}{8y 18y(i^s{t}} =j(/_lu+y(0 + , (3.41)
2^,=12^7=1
где a, p, у — скорость обучения, at — означает итерацию в про-
цессе обучения.
119
Нечёткие модели и методы в интеллектуальных системах
3.7. НЕЧЕТКИЕ НЕЙРОННЫЕ СЕТИ TSK
И ВАНГА-МЕНДЕЛЯ.
ГИБРИДНЫИ АЛГОРИТМ ОБУЧЕНИЯ
3.7.1. HHCTSK
Обобщением нейронной сети ANFIS является нечет-
кая нейронная сеть TSK (Takagi, Sugeno, Kang’a). Обобщенную
схему вывода в модели TSK при использовании М правил и N
переменных ху можно представить в следующем виде [74]
R, -.если х. е лР\х- елР\...,х с
1 1 1’2 2 ’ ’ п п ’
N
у\ = р]0+ p\Jxj'
7 = 1
R если х £ Л(Л/)х е х с
М 1 1’2 2 ’ п п ’
N
ум =рмо+ Лрм jxj'
7 = 1
где А,1*’ — значение лингвистической переменной х, для прави-
ла Rk с ФП (функцией принадлежности)
то
то
В нечеткой сети TSK пересечение условий правила Rk опре-
деляется ФП в форме произведения, т.е.
Л“Й=П
/=1
(3.43)
120
Глааа 3. Системы нечеткого логического вывода...
При М правилах вывода композиция исходных результатов
сети определяется по следующей формуле (аналогично выводу
Сугено):
М
Е wky№
’ <344)
в этом выраже-
где ук(х)
Z Рк
i = \
N
= PkO +
нии веса w, интерпретируются как степень исполнения условий
К
правила: = р^(х), которые задаются формулами (3.43).
Нечеткая нейронная сеть TSK, которая реализует вывод в со-
ответствии с (3.44), задается многослойной структурной сетью,
представленной на рисунке 3.10. В такой сети выделяются 5 слоев:
1. Первый слой выполняет раздельную фаззификацию каждой
переменной x.,i = 1,2,..., TV, определяя для каждого k-го правила
вывода значение ФП ц^\х.) в соответствии с функцией фаз-
зификации, которая применяется, например (3.42). Это парамет-
рический слой с параметрами ,Ь^\ которые подлежат
адаптации в процессе обучения.
2. Второй слой выполняет агрегирование отдельных перемен-
ных х., определяя результирующую степень принадлежности
(к)
'(х) для вектора х условиям к-го правила. Это не па-
раметрический слой.
3. Третий слой представляет собой генератор функций TSK, в ко-
7V
тором рассчитываются значения у, (х) = + X Рк =х .. В этом
J = 1 J J
слое также происходит умножение функций ук (х) на , сформи-
рованных на предыдущем слое. Это параметрический слой, в кото-
121
Нечёткие модели и методы в интеллектуальных системах
ром адаптации подлежат линейные параметры (веса) pk0,pv для
j = \,N,k = 1, М, определяющие функции последствий правил.
4. Четвертый слой составляют 2 нейрона-сумматора, один из
которых рассчитывает взвешенную сумму сигналов (х), а вто-
м
рой определяет сумму весов £ wk .
»-i
5. Пятый слой состоит из единственного выходного нейрона.
В нем веса подлежат нормализации и вычисляется выходной
сигнал у(х) в соответствии с выражением
М
1 : = 1
2 ’ М
Z w.
k = l к
(3.45)
CW a(k) h(k)
первого слоя
Это также не параметрический слой.
Из приведенного описания следует, что нечеткая сеть TSK
содержит только 2 параметрических слоя (первый и третий), па-
раметры которых уточняются в процессе обучения. Параметры
(MX
,b\ ' I будем называть нелинейными, а
параметры третьего слоя — линейными весами.
Общее выражение для функциональной
для сети TSK задается так:
М
РкО+ \Рк
к = 1 •
зависимости (3.45)
> N
N
1
М М
Z п
7 = 1
J
(3.46)
Если принять, что в конкретный момент времени параметры
условий фиксированные, то функция у(х) является линейной
относительно переменной х..
122
Глава 3. Системы нечеткого логического вывода...
Рис. 3.14. Структура нечеткой нейронной сети TSK
При наличии N входных переменных каждое правило
формирует (N +1) переменную/)^ линейной зависимости
При М правилах вывода имеем M(N +1) линейных пара-
метров сети. В свою очередь, каждая ФП использует 3 параметра
(с,с,Ь\ которые подлежат адаптации. При М правилах вывода
получаем 3MN нелинейных параметров. В сумме это дает
+1) линейных и нелинейных параметров, значения кото-
рых должны определяться в процессе обучения. Это очень боль-
шое значение.
С целью сокращения числа параметров, подлежащих адапта-
ции, оперируют с меньшим числом ФП. В частности, можно
123
Нечёткие модели и методы в интеллектуальных системах
принять, что часть параметров ФП одной переменной
фиксируется, например и .
3.7.2. Структура сети Ванга—Менделя
Если в качестве выходных функций у,(х) в правилах
вывода выбрать , то мы получим структуру ННС, которая на-
зывается нейронной сетью Ванга—Менделя (см. рис. 3.15).
Это четырехслойная структура, в которой первый слой вы-
полняет фазиффикацию входных переменных, второй — агреги-
рование (пересечение) условий правил, третий (линейный) —
композицию М правил вывода (первый нейрон) и генерацию
нормализирующего сигнала (второй нейрон), тогда как один
нейрон последнего слоя формирует выходной сигнал у(х), кото-
рый вычисляется так:
И N
Ev nrf'up
k=l ___________
Л/ ДГ
t=l7
(3.47)
Отметим большое сходство структур обоих сетей. Части, оп-
ределяющие условия правил — первый и второй слои — у них
идентичны (т.е. они отвечают компонентам правил «если...»),
расхождения проявляются в представлении следствий правил
(«то...»). В сети TSK выходная функция представляется полино-
мом первого порядка, а в сети Ванга—Менделя константой
vк ~ ск’ где величинУ можно интерпретировать как центр
ФП следствия.
Таким образом, ННС Ванга—Менделя является частным слу-
чаем ННС TSK.
124
Глава 3. Системы нечеткого логического вывода...
Рис. 3.15. Структура нечеткой нейронной сети Ванга-Менделя
Задача обоих сетей состоит в нахождении такого отображения
пар данных (x,J), при котором ожидаемое значение d, которое
соответствует входному вектору х, формировалось бы выходной
функцией сети у(х).
Обучение нечетких нейронных сетей, также как и четких,
может проводиться как в соответствии с алгоритмом с учите-
лем, при котором используется целевая функция
с ।
Е = — х
2
ции без учителя.
-> min, так и с алгоритмом самоорганиза-
125
Нечёткие модели и методы в интеллектуальных системах
3.7.3. Гибридный алгоритм обучения
нечетких нейронных сетей
Рассмотрим гибридный алгоритм обучения ННС, ко-
торый применяется как для сетей TSK, так и для сетей Ванга-
Менделя (у которых все
pkj " °’ а pk0 ~ vk 1
В гибридном алгоритме параметры, которые подлежат адап-
тации, делятся на 2 группы. Первая из них состоит из линейных
параметров р^ третьего слоя, а вторая группа — из параметров
нелинейной ФП первого слоя. Уточнение параметров происходит
в два етапа.
На первом этапе при фиксации отдельных значений парамет-
ров функции принадлежности (в первом цикле — это значения,
которые получены путем инициализации), решая систему линей-
ных уравнений, рассчитываются линейные параметры поли-
нома TSK. При известных значениях ФП зависимость для выхо-
да можно представить в виде линейной формы относительно па-
раметров р^.:
м ( N
= £>* рк0 +
J = |
р, X ..
Pkj j
(3,48)
где
wk
,к = 1, М.
(349)
При размерности обучающей выборки L (/= 1,2,..., L)
и замене выходного сигнала сети ожидаемым значением по-
лучим систему из L линейных уравнений вида:
126
Глава 3. Системы нечеткого логического вывода...
4 4ix!”-- 4ix”’- Ww 4мх!1’- 4м4’
41 41х!2’- 4г$’- 4л/
4i 41#’ 44£) 4л/ 4л/#’ w'lmxh}
Ао
А1
Pin
Рмо
Рш
(3.50)
Pmn
где w£. означает уровень активации (вес) условия /-го правила
при предъявлении £-го входного вектора . Это выражение
можно записать в матричном виде:
Ар = d.
Размерность матрицы А равняется L(N + \)М. При этом ко-
личество строк L обычно бывает значительно больше количества
столбцов (7V + 1)Л/. Решение этой системы уравнений можно по-
лучить как обычными методами, так и за один шаг, используя
псевдоинверсию матрицы А
Р = A+d,
где А+ — псевдоинверсная матрица.
127
Нечёткие модели и методы в интеллектуальных системах
На втором, этапе после фиксации значений линейных пара-
метров рассчитываются фактические выходные сигналы
у^\с = 1,2,..., £, для этого используется линейная зависимость:
у^=Ар. (3.51)
После этого рассчитывается вектор ошибки е = (у - d) и критерий
Г.1 L Шок/о .
= А > J
Сигналы ошибок направляются через сеть в обратном поряд-
ке согласно методу Back Propagation вплоть до первого слоя, где
могут быть рассчитаны компоненты вектора градиента целевой
функции относительно параметров ,Ь^. После вычис-
ления вектора градиента делается шаг спуска градиентным мето-
дом. Соответствующие формулы обучения (для самого простого
метода быстрого спуска) принимают вид:
А% + 1) = А)_П (3.52)
J J с 8с{К)
а(% + 1)=Д%)-па^, (3.53)
J J CCS J '
Л + 1)=Л)-пb^, (3-54)
J JO db(K)
где n — номер итерации.
После уточнения нелинейных параметров снова запускается про-
цесс адаптации линейных параметров функции TSK (первый этап) и
нелинейных параметров (второй этап). Этот цикл продолжается до
тех пор пока не стабилизируются все параметры процесса.
Формулы (3 52)—(3.54) требуют расчета градиента целевой
функции относительно параметров ФП. Окончательный вид этих
формул зависит от вида ФП. Например, при использовании обоб-
щенной колоколообразной функции:
128
Глава 3. Системы нечеткого логического вывода...
(3.55)
соответствующие формулы градиента целевой функции для од-
ной пары данных (x,d) принимают вид:
F М Г N ) 8w
J 4 J ' J
(3.56)
ar M ( N )
—— = (y(x)-J)L po+ Z p x. —fa,
dc{k> r = l rU j = l J Jj da(k)
J v ' J
F M ( N }
——- = {y[x)-d')Y PrQ + Z PrjXj —jfa-
dby> r = l^ j = l J J) 5Ьу}
dw 8w dw
Производные ——7^-, полученные на основе
d№ d<№ dbW
J J J
зависимостей (3.49), принимают следующий вид:
8wr
dc^
м
п
= 1,/ * J
(3.57)
129
Нечёткие модели и методы а интеллектуальных системах
8w
____г
..(к)
doj ’
см
М
п
i = 1,/ * j
J___J_
J
для г = 1,2,--. Л/, где
дельта Кронекера,
X -c^
j J
При практической реализации гибридного метода обучения
нечетких сетей доминирующим фактором их адаптации считается
первый этап, на котором веса р,. подбираются с использованием
130
Глава 3. Системы нечеткого логического вывода...
псевдоинверсии за один шаг. Для уравновешивания его влияния
второй этап много раз повторяется в каждом цикле.
Представленный гибридный алгоритм — один из наиболее
эффективных способов обучения нечетких нейронных сетей. Его
характерной чертой является разделение процесса на два отде-
ленных во времени этапа. Если учитывать, что расчетная слож-
ность каждого алгоритма оптимизации нелинейно зависит от ко-
личества параметров, которые подлежат оптимизации, то умень-
шение размерности задач оптимизации значительно сокращает
объем расчетных операций и повышает скорость сходимости ал-
горитма. Благодаря этому гибридный алгоритм является более
эффективным в сравнении с обычным градиентным методом.
3.8. НЕЧЕТКАЯ НЕЙРОННАЯ СЕТЬ NEFPROX
3.8.1. Применение нечетких нейронных сетей
для аппроксимации функции
Согласно сформулированным в разделе 3.3 теоремам,
нечеткие системы являются универсальными аппроксиматорами
функций. Нечеткие нейронные сети можно рассматривать как
трехслойную ННС прямого действия. Первый слой тут представ-
ляют входные переменные, средний (скрытый) слой — нечеткие
правила и третий — выходные переменные. Иногда используется
5-слойная архитектура, где нечеткие множества представлены в
нейронах 2—4 уровня).
Нечеткие нейронные системы аппроксимируют п -мерные
неизвестные функции, которые частично определены обучающи-
ми данными.
Аппроксимация функций, которая основана на локальных
обучающих стратегиях, является одной из областей применения
НС и, в частности, нечетких НС. Но нечеткие НС имеют пре-
имущества перед обычными НС, так как могут пользоваться ра-
нее полученными знаниями в форме нечетких правил, в то время
как последние учатся с нуля.
Ниже будет рассматриваться модель, которая имеет название
NEFPROX (Neuro Fuzzy Function Approximator), основанная на
нечетком персептроне [118].
Определение 3.1. Трехслойным нечетким персептроном назы-
вается прямая нейронная сеть (U,w,Net, А,О,ex), где:
131
Нечёткие модели и методы в интеллектуальных системах
1. U = U Uj — непустое множество нейронов, М = {1,2,3} —
множество индексов. Для всех i,jeM , Ut ф 0 и Vz * j-.U^
n Uj =0. Ul — входной слой, иг — слой правил, U3 — выход-
ной слой.
2. Структура НС определена как w:UxU -> F(R), где воз-
можно введение связей w(u,v), причем ueU,, v е Ц+1(/= 1,2),
F(Z?) — множество всех нечетких подмножеств R.
3. А — определяет активационную функцию Аи каждого
ueU для вычисления активации аи :
а) для входных нейронов:
Аи : R -> R,au = Au(net) = netu;
б) для нейронов правил:
Аи : RxF(R) F(R)\
аи = Д,(лег„).
в) для выходных нейронов:
Л = Au(netu).
4. О — определяет для каждого и eU функцию выхода Ои
для вычисления значения выхода о„:
а) для входных нейронов и нейронов правил (и е Ut иг):
Ои :R-> R,ou =Ои{аи) = аи-,
б) для нейронов правил:
0„ :£(/?)-> £(Л);
= Ои{ои) = аи.
в) для выходных нейронов и е U3 :
Ои : F(R)~* R,ou = Ои(аи)= DEFUZM,
где DEFUZ(au} — удобная функция дефазиффикации.
5. NET определяет для каждого нейрона и eU функцию
распределения NETU для вычисления входа сети netu :
132
Глава 3. Системы нечеткого логического вывода...
а) для входного нейрона ы е (/, :
NETU : R -* R,netu = exu
(внешний вход);
б) для нейронов правил u е U2 :
NETu:(RxF(R))v' -> [0,1],
netu = r{w(«,«'Xo;)},
где t — функция t -нормы (пересечение)
в) для выходного нейрона и е U3 :
NETU : ([0,1] х £(Л)р -> F(R)
netu : R -> [0,1],net„(x) = t{o'u,T(u’,u\x)},
где t— функция Г-конормы (например, max).
6. ex:(/,-» R определяет для каждого нейрона и eUt его
внешний вход ех(и) = ехи. Для всех остальных нейронов
(и 6 U2 и (/3), ех не определено.
Нечеткий персептрон можно рассматривать как трехслойную
нейронную сеть со специальными функциями активации и рас-
пространения и нечеткими множествами в качестве весов. С дру-
гой стороны, персептрон можно рассматривать как нечеткую
систему, которая представлена в виде архитектуры НС. Система
NEFPROX — это специальный трехслойный нечеткий персеп-
трон со следующей спецификацией [117]:
1) Входные нейроны, обозначенные как х1,...,хл, нейроны
скрытого слоя как Л,,..., R„, нейроны выходного слоя как у,,...,ут.
2) Каждая связь между нейронами х, и Rr обозначается лин-
гвистическим термом А^.
3) Каждая связь между нейронами Rr и у7 обозначается лин-
гвистическим термом .
4) Связи, которые исходят из одного нейрона х, и имеют
одинаковую отметку и один и тот же вес на протяжении всего
времени, называются linked (то есть связанными), а их вес —
разделяющий (shared weight). Тому же условию удовлетворяют
связи, которые входят в выходной нейрон уу.
133
Нечёткие модели и методы в интеллектуальных системах
5) Пусть Lx R — маркированная связь (соединение) между
входным нейроном х и нейроном R (нейроном правил — rule
neuron). Тогда выполняется следующее следствие:
Для всех нейронов R,R' таких, что (Vx, Lx R = Lx R)=> R = R'.
Эго определение дает возможность интерпретировать NEFPROX
как простую нечеткую систему. Каждый скрытый нейрон реали-
зует нечеткое правило типа: ЕСЛИ—ТО. Если бы это следствие
не выполнялось, тогда существовала бы возможность нечетким
правилам, которые представляют одинаковые лингвистические
термы, развиваться по-разному в процессе обучения. Если бы это
следствие отсутствовало, то каждое правило могло бы иметь ин-
дивидуальную ФП, что приведет к неправильной интерпретации
базы правил и является очень нежелательным. Условие 5 означа-
ет, что нет двух правил с идентичными предикатами.
Рис. 3.15. Архитектура NEFPROX
134
Глава 3. Системы нечеткого логического вывода...
Для задачи аппроксимации функций мы можем использовать
алгоритм обучения с учителем, так как правильные значения на
выходе известны для обучающей выборки данных. Если мы ис-
пользуем систему, которая состоит из нечетких правил для ап-
проксимации функций, то мы сможем воспользоваться преды-
дущими знаниями. Это значит, что если мы уже знаем подходя-
щие правила для определенных наборов входных переменных, то
мы можем включить их в нейронную сеть. Остальные правила
могут быть найдены с помощью процедуры обучения.
Если же у нас нет априорных знаний, то начинаем с системы
NEFPROX без скрытого слоя и обучаем все без исключения пра-
вила.
Для обучения будем использовать треугольную ФП, которая
описывается тремя параметрами:
я:Л->[0,1Ь(х) =
(х - a)/(b - а), если х е [a, b J
(с - х)/(с - Ь), если х е [Z>, cj
О, в остальных случаях.
Для обучения можно использовать также и любую другую
форму ФП. Чтоб начать процедуру обучения мы должны точно
определить начальное нечеткое разбиение каждой входной пере-
менной. Это не нужно для выходных величин, для которых не-
четкие множества будут созданы в процессе обучения. Если не-
четкие множества не заданы, то тогда нужно четко определить
начальный диапазон для функций принадлежности (т.е. |с - с|).
Рассмотрим структуру алгоритма.
Имеем систему с п входными нейронами х,......х„, к нейро-
нами скрытого слоя и m нейронами выходного слоя
Ур—.Уд,. Задана также обучающая выборка £ = {(s,, Г, ),(s2,f2
(sr,/r)}, которая состоит из г образцов, каждый из которых со-
стоит из входного образца s е Е^ и образца t е (цель обуче-
ния), и множества ограничений Ф. Алгоритм обучения для пра-
вил, цель которого создать к нейронов правил NEFPROX, со-
стоит из двух этапов.
ЭТАП 1 — обучение базы правил и ЭТАП 2 — обучение
функций принадлежности правил (ФП).
135
Нечёткие модели и методы в интеллектуальных системах
ЭТАП 1.
1. Выбираем следующий образец {s, г} из L.
2. Для каждого входного нейрона х, е Ut находим ФП /dj)
такую, что
= ГДе Х/ = 5/ •
3. Если не существует такого узла правил R для которого
w(xl,R)= w(xn,R)= то нужно создать такой узел и объе-
динить его со всеми узлами выхода.
4. Для каждого соединения из нового узла правил к выход-
ным узлам нужно найти удобный нечеткий вес соответственно
следующей процедуре: для функции принадлежности, связанной
с нейроном выхода у,, находим ФП такую, что =
= АР12а\)И)^)}и ^(С)^0’5-
Если не существует такого нечеткого множества, тогда мы
создаем ФП v^w такую, что v^(r,)=l и добавляем ее к нечет-
ким множествам, связанным с переменной выхода у, и множе-
ством w(R, у) = V®,.
5. Если остались еще не обработанные образцы I1 е L, тогда
идем на шаг 1, иначе оканчиваем создание правил.
6. Мы сгенерировали базу правил. Определяем среднее значе-
ние выхода для каждой переменной выхода каждого правила, ко-
торое создано таким образом, чтобы его правило имело степень
выполнения больше чем 0.
ЭТАП 2.
Алгоритм обучения с учителем нечетких множеств
системы NEFPROX происходит циклически путем использова-
ния выборки, L и повторения ниже следующих шагов, пока не
выполнится заданный критерий остановки алгоритма обучения
(параметрический алгоритм обучения)
1. Выбираем следующий образец (s, /) из выборки L, пропус-
каем его через систему NEFPROX и определяем вектор выхода.
136
Глава 3. Системы нечеткого логического вывода...
2. Для каждого нейрона выхода у, определяем разницу между
желательным и действительным значением выхода: 5У, = tt - оУ1.
3. Для каждого нейрона правил R такого, что его выход
oR > 0, выполняем следующие шаги:
а) Для всех у, е U, определяем изменения параметров a, Ь и
с нечеткого множества w(/?,y,), используя скорость обучения
о > 0.
Если w(R, у, ) > 0 , то
= о 5Л • (с - а) • ок (1 - w(R,yl\ti));
До, = о • (с - а) • Оц + Дй,;
Дс, = -с (с - a) oR + kbi.
Если w(R, у, Xz>) = 0 , то
да, = о • • (с - о)- од (1 - Чл,у,Хл));
До, = sgn(r, - b,) и (с - а) ой + Дй,;
Дс, = -sgn(r, - й,)- о • (с - a) oR + Дй,.
Применяем изменения к м>(/?,у,), если это не нарушает за-
данное множество ограничений (если вес w(/?,y,) используется и
для других связей, то выходит, он должен измениться более од-
ного раза).
б) Определяем ошибку правила:
= оЛ(1-оЛ)- Е(2 и’(Я,у,Хс)-1)-|5>|-
в) Для каждого веса w(x,/?), такого, что w(x,R\ox)> 0 , опре-
деляем изменения для его параметров а, b и с, используя ско-
рость обучения о > 0 :
Дй = о • £я(с - оХ1 - )) sgnfo - й);
До = -о Er (c-a^-w(x, R\ox))+&b;
137
Нечёткие модели и методы в интеллектуальных системах
Ьс = ст • Er(c- aXl - Цх, лХ°х)) + д^-
Применяем изменения к весам w(x,R), если это не нарушает
заданное множество ограничений Ф (если вес w(x,R) использу-
ется в других связях, то в этом случае он должен измениться
больше чем I раз).
4. Процедура заканчивается, если будет выполнен критерий
остановки, иначе идем на шаг 1.
Алгоритм обучения правил выбирает нечеткие правила, кото-
рые базируются на определенном ранее разбиении входного про-
странства. Это разбиение задается начальными нечеткими мно-
жествами. Если алгоритм создает очень много правил, можно
оценивать их, определяя индивидуальные ошибки правил, чтобы
в дальнейшем применять только лучшие правила.
Каждое правило описывает некоторое количество образцов
неизвестной функции в форме нечеткой выборки.
Если правило удаляется из базы, то это значит, что некоторые
образцы из выборки больше не принимаются во внимание. Если
обучение параметров не может компенсировать этого, то качест-
во аппроксимации ухудшается.
Для улучшения интерпретируемости количество правил в
процессе обучения должно уменьшаться. Результат обучения дос-
тигается путем сдвига ФП, что может привести к увеличению
или сокращению области ее определения. Для того, чтоб этого не
случилось, нужно перед началом процедуры обучения задать ко-
нечное множество ограничений. В качестве критерия остановки
можно взять критерий, который применяется в алгоритме обуче-
ния обычных НС: обучение продолжается до тех пор, пока
ошибка Ея не прекращает уменьшаться на протяжении опреде-
ленного числа итераций.
Ограничения, накладывающиеся
на нечеткие множества
Рассмотрим возможные ограничения, накладываемые
на ФП нечетких множеств по входной переменной.
1) Нечеткое множество не должно пересекаться со своим со-
седом, как справа, так и слева во время обучения. Проверить это
можно сравнением: остались ли все параметры треугольной ФП
меньше (больше) своего правого (левого) соседа. Если мы этого
138
Глава 3. Системы нечеткого логического выаоде...
не предусмотрим, то нечеткие множества смогут пересекаться,
что может привести к путанице в интерпретации, хотя при отсут-
ствии этого ограничения можно достичь определенных улучше-
ний. Алгоритм обучения правил выбирает нечеткие правила на
основе предыдущего разбиения входного пространства. Это раз-
биение задается начальными нечеткими множествами.
2) В случае, если обучение происходит ассиметрично, то во
время обучения изменяется только та часть функций принадлеж-
ности (левая или правая), в которой находятся значения входных
переменных.
3) ФП пересекаются в точке 0,5. Если мы примем это пред-
положение, то две соседние ФП будут пересекаться в точке 0,5 и
сумма функций принадлежности для выхода будет всегда равна 1,
это ограничение не является обязательным.
4) Фиксированные веса следствий. Применение этого правила
означает, что веса следствий фиксируются и равны 1. Отсутствие
ограничения означает, что мы должны настраивать веса следствий.
3.9. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
НЕЧЕТКИХ НЕЙРОННЫХ СЕТЕЙ В ЗАДАЧАХ
ПРОГНОЗИРОВАНИЯ В МАКРОЭКОНОМИКЕ
И ФИНАНСОВОЙ СФЕРЕ
3.9.1. Постановка задачи прогнозирования
Для оценки эффективности применения ННС в зада-
чах прогнозирования в макроэкономике и финансовой сфере
были проведены многочисленные экспериментальные исследова-
ния по прогнозированию с использованием нечетких нейронных
сетей с различными алгоритмами вывода.
Исходные данные. В качестве исходных данных были выбраны
макроэкономические показатели экономики Украины, представ-
ленные в виде статистических временных рядов (см. табл. 3.1).
НВВП — номинальный ВВП;
ОПП — объем промышленной продукции, % к соответст-
вующему периоду предьщущего года;
ИРПП — индекс реальной промышленной продукции, % к
соответствующему периоду предыдущего года. ИСЦ — индекс
потребительских цен, % к соответствующему периоду предыду-
щего года;
139
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 3.1.
Макроэкономические показетели Украины
Data НВВП ОПП ИРПП ИПЦ ИОЦ РДН М2 ДБ ВК
1 2358,3 102,2 100,3 103,1 99,6 113,1 1502 840,1 73,7
2 2308,5 102 99,7 101,2 100,3 111 1522,9 846,1 84,6
3 2267,7 103,7 99,9 101,1 99,2 108,1 1562,4 863,5 96,5
4 2428,5 104,3 102,2 101,2 100,7 118 1621,3 917,7 98,2
5 2535,6 102.8 102,5 101,7 102,2 107,8 1686 977,7 118,2
6 2522,8 104,4 103,1 100,5 104,4 105,8 1751,1 1020,7 138,6
7 2956,4 107,8 102,6 100,7 105,4 112,3 1776,1 1019,8 142,6
8 3025,9 103,4 101,7 100,1 105 109 1812,5 1065,6 157,8
9 3074,5 10,55 101,2 100,4 105,3 106,6 1846,6 1067,9 165.5
10 2854,3 103,9 102,1 101,1 105,3 108,5 1884,6 1078,6 158,9
11 2812,5 100,8 101,6 101,6 100,2 107,8 1930 1128,9 163,4
12 2998,4 103,2 99,8 101,5 105,7 106,9 2119,6 1232,6 262,5
13 2725,6 104,9 100,4 102,4 100,5 114,4 2026,5 1140,1 93,8
14 2853,4 1065 101,4 101,6 101,2 116,8 2108 1240,7 110,3
15 2893,1 106,7 101,3 101,1 103,3 115,4 2208,5 1284,5 125,9
16 3014,2 107,1 101,4 101 103,6 109,1 2311,2 1386,8 130,1
17 3102,6 108,5 99,8 100,8 103,9 119,7 2432,4 1505,7 158,8
18 3110,7 107 100,7 100,8 103,9 113,8 2604,5 1534 158,8
19 3192,4 107,1 102,2 100,7 104,9 112,7 2625,4 1510,8 181,9
20 3304,7 105,5 101,4 99,6 105,9 109,8 2683,2 1500,8 185
21 3205,8 108 101,4 100,3 106,9 112,6 2732,1 1484,5 205,8
ИОЦ — индекс оптовых цен в % к соответствующему перио-
ду предыдущего года.
РДН — реальные доходы населения;
М2 — агрегат М2;
ДБ — денежная база;
ВК — всего кредиты, включая кредиты в иностранной валюте.
Ставится задача прогнозирования следующих макроэкономи-
ческих показателей: ИПЦ, НВВП и ОПП по известным макро-
экономическим показателям.
Для построения базы правил необходимо определить значи-
мые переменные и их лаги. В качестве степени взаимосвязи меж-
ду входными переменными хь х2,...хп и выходной переменной Y
используется коэффициент корреляции R, по значению которого
отбирались существенные переменные.
140
Глава 3. Системы нечеткого логического вывода...
3.9.2. Прогнозирование в макроэкономике
с использованием НК Мамдани и Цукамото
Проводились сравнительные эксперименты с НК
Мамдани с треугольными ФП и с гауссовскими ФП, а также НК
Цукамото с линейными ФП [37; 38]. Результаты приведены в
таблице 3.2, где указана СКО на обучающей и проверочной вы-
борках (10 окон). Как видно из приведенных результатов, все три
нечетких контроллера отлично справились с задачей прогнозиро-
вания на проверочных точках. Это свидетельствует как об эф-
фективности алгоритмов обучения контроллеров, так и о целесо-
образности применения систем с нечетким логическим выводом
для прогнозирования в макроэкономике.
ТАБЛИЦА 3 2.
Выбор лучшего метода. Размер окна — 14 первых точек.
№ измер. Мамдани, треугольные ФП, пересечение в форме минимума Мамдани. гауссовы ФП, пересечение в форме произведения Цукамото, линейные ФП
СКО (обуч.) СКО (провер.) СКО (обуч.) СКО (провер.) СКО (обуч.) СКО (провер.)
1 0.02661 0 12793 0 0483 015609 0 0292 0.12881
2 0.03107 0 1348 0.04113 0 05968 0.05605 0.10135
3 006203 0 19753 0.0537 0.11517 0 04518 0.03932
4 0.04227 0.06942 0.06067 0.03355 0.04793 0.09438
5 0.00688 0.03328 0.02823 0.05945 0.03698 0.11423
6 0 01299 0.11387 0 03337 0.09743 0 05396 0.19284
7 0 00813 0.01397 0.08836 0 0748 0.03536 0.08257
8 0 00705 0 0722 0 08238 0 04632 0 02827 0.13531
9 0.02111 0.17541 0.08936 0.16248 0.06276 0.11651
10 0.00847 0.0778 0.09111 0.11834 0.03905 0.11877
Среднее 0.02266 0.101621 0 06166 0.092331 0 04347 0.112409
Как показал первый эксперимент, лучшим, хотя и с неболь-
шим отрывом, оказался контроллер Мамдани с гауссовскими ФП
и нечетком пересечении в виде произведения (СКО на прове-
рочной выборке из 10 точек составляет всего 0,092, относитель-
ная средняя ошибка прогноза 9,29).
Теперь попробуем использовать немного другую функцию
принадлежности для контроллера Цукамото и посмотрим как это
повлияет на качество прогноза.
141
Нечёткие модели и методы в интеллектуальных системах
Проведем еще один эксперимент — при тех же условиях
спрогнозируем показатель, например, ИПЦ, но теперь уже с ис-
пользованием функций принадлежности немного другого вида
(рис. 3.17), и посмотрим, как это повлияет на результат.
—arctg(x
п
если a
ц{а) = О,
—-) + 0.5,
р(х) = •
Рис. 3.17. Монотонная ФП Цукамото
Такая функция похожа на линейную, но возле граничных то-
чек а и b ведет себя более плавно. Как и линейная функция, она
может настраиваться с помощью двух параметров: а и b (а имен-
но с помощью увеличения или уменьшения величины \а—Ь\).
Параметры функций принадлежности и результаты прогноза
приведены в таблицах 3.3 и 3.4.
ТАБЛИЦА 3.3.
Параметры функций принадлежности.
Переменные Термы а b
Ац 99,60 102,03
ИПЦ Ар 102,03 104,46
Ар 104,46 106,90
Aii 100,80 103,37
ОПП А„ 103,37 105,94
Азз 105,94 108,50
Ал 2267,70 2526.95
нввп Ajj 2526,95 2786.20
А33 2786,20 3045.45
А34 3045,45 3304.70
142
Глава 3. Системы нечеткого логического вывода...
Окончание табл. 3.3.
Переменные Термы а Ь
А», А« 73,70 120,90
ВК 120,90 168,10
A43 168,10 215,3
Ан 215,30 262,50
Ал 99,60 101,35
иоц А52 101,35 103,10
ТАБЛИЦА 3.4.
Результаты прогноза
№ Реальное Прогноз Откл. Кв.откл.
12 101,5 101,32 0,18 0,0324
13 102,4 102,16 0,24 0,0576
14 101,6 101,30 0,30 0,0900
15 101,1 100,89 0,21 0,0441
16 101,0 100,71 0,29 0,0841
17 100,8 100,65 0,15 0,0225
18 100,8 100,24 0,56 0,3136
19 100,7 100,22 0,44 0,1936
20 99,6 99,13 0,47 0,2209
21 100,3 99,80 0,50 0,2500
Значение СКО=0,1309.
Для сравнения результатов, полученных при тех же условиях
с линейной функцией принадлежности, приведем соответствую-
щие графики прогнозов и ошибок в табл. 3.5 и на рис. 3.18 и 3.19.
ТАБЛИЦА 3.5.
№ Реальное Прогноз 1 Прогноз 2 Откл. 1 Откл. 2
12 101,5 101,4 101,4 0,19 0,19
13 102,4 102,2 102,2 0,24 0,25
14 101,6 101,3 101,3 0,31 0,31
15 101,2 100,8 100,8 0,2 0,22
16 101 100,7 100,7 0,3 0,3
17 100,8 100,6 100,6 0,15 0,15
18 100,8 100,2 100,25 0,55 0,68
19 100,7 100,3 100,3 0,45 0,49
20 99,6 99,2 99,2 0,47 0,51
21 100,3 99,7 99,7 0,05 0,51
143
Нечёткие модели и методы в интеллектуальных системах
Откл.1 --------------Откл.2
Рис. 3.19.
144
Глава 3. Системы нечеткого логического вывода...
3.9.3. Прогнозирование макроэкономических
показателей с использованием нечеткой
нейронной сети ANFIS
Рассмотрим теперь применение нечеткой нейронной сети
ANFIS в задачах макроэкономического прогнозирования [30; 31; 34].
Для построения базы правил необходимо определить значи-
мые переменные и их лаги. В качестве степени взаимосвязи меж-
ду входными переменными х,, х2,..., хп и выходной переменной Y
используется коэффициент корреляции R, по значению которого
отбирались существенные переменные Далее по величине вза-
имно-корреляционной функции В КФ К (т) определяются ла-
УХ1
ги (запаздывания) исходя из условия т* = arg max К (т).
т ух.
Определение максимального числа термов
Для определения максимального числа термов выпол-
ним прогноз ИПЦ. Значимые переменные и их лаги таковы:
ИПЦ(—2); ОПП(—I); ИРПП(-2).
Были проведены следующие эксперименты [36; 37]:
1. Допустим, что все переменные имеют одинаковое число
термов (лингвистических значений) — 2, и используется полная
Рис. 3.20.
145
Нечёткие модели и методы в интеллектуальных системах
2. Увеличим число термов переменной с наибольшим диапа-
зоном до 5, и используем полную систему правил [31].
Значение СКО при прогнозировании — 0,4224. Как видим,
значение СКО уменьшилось.
Определение оптимального размера базы правил
I. В предыдущих экспериментах при небольшом числе
параметров мы использовали полную базу правил. Определим
оптимальный вид базы правил для большего числа параметров.
Будем выполнять прогноз ИПЦ [38]. Значимые переменные и их
лаги таковы: НВВП(О), ИОЦ(-З); ОПП(З), ИРПП(О).
При прогнозировании значение СКО уменьшилось до
0.3025.
2. Выполним прогноз, используя урезанную базу правил. База
правил выбирается на основании знаний экспертов и содержит
60 правил, что составляет примерно 55% от полной базы. Значе-
ния параметров ФП остаются те же, что в предыдущем экспери-
менте.
Значение СКО при прогнозировании составило 0.3524.
3.9.4. Сравнительный анализ результатов
прогнозирования разными методами
Были проведены исследования эффективности про-
гнозирования и сравнения результатов, полученных с помощью
следующих методов:
— контроллер Tsukamoto с линейными функциями принад-
лежности;
— контроллер Tsukamoto с монотонными функциями принад-
лежности;
— контроллер Mamdani с функциями принадлежности гаус-
совской формы;
— нейронная сеть ANFIS.
В таблице 3.6. и на рис. 3.21 приведены сравнительные ре-
зультаты прогнозирования показателя ИПЦ, полученные разны-
ми методами нечеткого логического вывода.
Как можно увидеть из приведенных результатов, все три не-
четких контроллера отлично справились с поставленной задачей.
Также мы видим, что и сеть ANFIS дает достаточно приемлемый
результат, но хуже, чем нейронные контроллеры. Это свидетель-
146
Глава 3. Системы нечеткого логического вывода...
ТАБЛИЦА 3.6.
Ре- ал ьн. знач. Сеть ANFIS ННК Tsukamoto с линейной ФП ННК Tsukamoto с монотонной ФП ННК Mamdani с гауссовскими ФП
Прогноз Ошибка Прогноз Ошибка Прогноз Ошибка Прогноз Ошибка
101,5 101,28 0,22 101,32 0,18 101,32 0,18 101,34 0,16
102,4 101,69 0,71 102,15 0,25 102,16 0,24 102,34 0,06
101,6 101,43 0,17 101,28 0,32 101,30 0,30 101,48 0,12
101,1 101,54 0 44 100,86 0,24 100,89 0,21 101,07 0,03
101,0 100,92 0,08 100,70 0,30 100,71 0,29 100,94 0,06
100,8 100,73 0,07 100,65 0,15 100,65 0,15 100,70 0,10
100,8 99,83 0,97 100,13 0,67 100,24 0,56 100,73 0,07
100,7 99,88 0,82 100,22 0,48 100,22 0,44 100,65 0,05
99,6 98,86 0,74 99,09 0,51 99,13 0,47 99,44 0,16
100,3 99,54 0,76 99,78 0,52 99,80 0,50 100,18 0,12
СКО: 0,3524 СКО: 0,1577 СКО: 0,1309 СКО: 0,0930
ствует как об эффективности алгоритмов обучения контроллеров,
так и вообще о целесообразности использования систем с нечет-
ким логическим выводом для прогнозирования в макроэкономи-
ке [37; 38].
-----Ряд1
-----Ряд2
....РядЗ
-----Ряд4
-----Ряд5
Рис. 3.21.
147
Нечёткие модели и методы в интеллектуальных системах
3.10. ПРИМЕНЕНИЕ ННС ДЛЯ ПРОГНОЗИРОВАНИЯ
В ФИНАНСОВОЙ СФЕРЕ
Для проверки полученных выводов далее были прове-
дены экспериментальные исследования различных классов не-
четких нейросетей в задачах прогнозирования финансового рын-
ка. Для прогнозирования был выбран рынок акций ОАО «Лу-
койл», допущенных к торгам на НП «фондовая биржа Россий-
ская торговая система» (НПРТС).
Были проведены эксперименты по прогнозированию курсов
акций на РТС, используя разработанный программный продукт
для трех алгоритмов. Для обучения использовалась выборка из
267 ежедневных значений показателей курсов акций ОАО «Лу-
койл» за период с 1.04.2005 по 30.12.2005 [44].
В ходе тестирования экспериментально было установлено,
что наиболее оптимальным является использование трех термов
и пяти правил обучения, так как при таких параметрах мы имеем
самую минимальную СКО и наименьшее время обучения. Обу-
чение параметров ФП производилось градиентным методом с
шагом обучения 0,04.
1. Использование НК Мамдани при прогнозировании курсов акций.
Используя НК Мамдани с треугольными и гауссовскими ФП
были получены следующие результаты прогнозирования курса
акций ОАО «Лукойл». Они приведены в таблице 3.7.
ТАБЛИЦА 3.7.
Результаты прогноза НК Мамдани для ФП Гаусса.
Дата Реальное значение Прогнозируемое значение Отклонение Квадрат отклонения
01.12.2005 58,1 58,23 0,13 0,0169
02.12.2005 58,7 58,54 0,16 0,0256
05.12.2005 59,4 59,14 0,26 0,0676
06.12.2005 59 59,11 0,11 0,0121
07.12.2005 59,85 59,97 0,12 0,0144
08.12.2005 59,6 59,416 0,184 0,033856
09.12.2005 59,9 60,12 0,22 0,0484
12.12.2005 60,65 60,5 0,15 0,0225
13.12.2005 . 60,65 60,54 0,11 0,0121
14.12.2005 61,15 61,32 0,17 0,0289
15.12.2005 60,25 60,1 0,15 0,0225
16.12.2005 61 61,2 0,2 0,04
19.12.2005 61,01 61,24 0,23 0,0529
20.12.2005 60,7 60,54 0,16 0,0256 СКО=0,030239714
148
Глава 3. Системы нечеткого логического вывода...
Теперь произведем прогнозирование при использовании НК
Мамдани для треугольной ФП.
Как показали проведенные эксперименты, лучшим оказался
контроллер Мамдани с гауссовскими ФП (СКО на проверочной
выборке из 14 точек составляет всего 0,03024, относительная
средняя ошибка 3,02%).
2. Далее были проведены эксперименты по прогнозированию
с использованием НК Цукамото с треугольными и гауссовскими
ФП. Результаты прогноза НК Цукамото для ФП Гаусса приведе-
ны в табл. 3.8, а для треугольной ФП в табл. 3.9.
ТАБЛИЦА 3.8.
Результаты прогноза НК Цукамото для ФП Гаусса.
Дата Реальное значение Прогнозируемое значение Отклонение Квадрат отклонения
01.12.2005 58,1 58,37 0,27 0,0729
02.12.2005 58,7 58,47 0,23 0,0529
05.12 2005 59,4 59,1 0,3 0,09
06.12 2005 59 59,25 0,25 0,0625
07.12 2005 59,85 60,19 0,34 0,1156
08.12 2005 59,6 59,37 0,23 0,0529
09.12.2005 59,9 60,27 0,37 0,1369
12.12.2005 60,65 60,48 0,17 0,0289 '
13.12.2005 60,65 60,42 0,23 0,0529
14.12.2005 61,15 61,4 0,25 0,0625
15.12.2005 60,25 60,06 0,19 0,0361
16.12.2005 61 61,22 0,22 0,0484
19.12.2005 61,01 61,28 0,27 0,0729
20.12 2005 60,7 60,48 0,22 0,252857143 0,0484 СКО=0,0667
Сравнение ошибок прогнозирования для НК Цукамото с тре-
угольной и гауссовской ФП приведены на рис. 3.22.
Как показал второй эксперимент, лучшим оказался контрол-
лер Цукамото с гауссовской ФП (СКО на проверочной выборке
из 14 точек составляет всего 0,0667, а средняя относительная
ошибка прогноза 6,67%).
3. В следующем эксперименте проводились исследования
ННС с выводом Сугено. Результаты прогнозирования с исполь-
зованием НК Сугено для гауссовской ФП приведены в табл 3.10,
а для треугольной — ФП в табл. 3.11.
149
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 3.9.
Результаты прогноза НК Цукамото для треугольной ФП.
Дата Реальное значение Прогнозируемое значение Отклонение Квадрат отклонения
01.12.2005 58,1 58,48 0,38 0,1444
02 12.2005 58,7 58,37 0,33 0,1089
05 12.2005 59,4 59,05 0,35 0,1225
06 12.2005 59 59,27 0,27 0,0729
07.12.2005 59,85 60,23 0,38 0,1444
08.12.2005 59,6 59,23 0,37 0,1369
09.12.2005 59,9 60,32 0,42 0,1764
12.12.2005 60,65 60,4 0,25 0,0625
13.12.2005 60,65 60,28 0,37 0,1369
14 12.2005 61,15 61,42 0,27 0,0729
15 12.2005 60,25 59,97 0,28 0,0784
16.12.2005 61 61,27 0,27 0,0729
19.12.2005 61,01 61,34 0,33 0,1089
20.12.2005 60,7 60,38 0,32 0,327857 0,1024 ско=о,ноо 0,1178
150
Глава 3. Системы нечеткого логического вывода...
ТАБЛИЦА 3.10
Результаты прогноза НК Сугено для ФП Гаусса.
Дата Реальное значение Прогнозируемое значение Отклонение Квадрат отклонения
01.12.2005 58,1 58,42 0,32 0,1024
02.12.2005 58,7 58,34 0,36 0,1296
05.12.2005 59,4 59,02 0,38 0,1444
06.12.2005 59 59,29 0,29 0,0841
07.12.2005 59,85 60,24 0,39 0,1521
08.12.2005 59,6 59,29 0,31 0,0961
09.12.2005 59,9 60,3 0,4 0,16
12.12.2005 60,65 60,41 0,24 0,0576
13.12.2005 60,65 60,4 0,25 0,0625
14.12.2005 61,15 61,43 0,28 0,0784
15.12.2005 60,25 60,04 0,21 0,0441
16.12.2005 61 61,25 0,25 0,0625
19.12.2005 61,01 61,31 0,3 0,09
20.12.2005 60,7 60,4 0,3 0,3057142 0,09 СКО=0,0967
ТАБЛИЦА 311.
Результаты прогноза НК Сугено для треугольной ФП.
Дата Реальное значение Прогнозируемое значение Отклонение Квадрат отклонения
01.12.2005 58,1 58,5 0,4 0,16
02.12.2005 58,7 58,31 0,39 0,1521
05.12.2005 59,4 59,01 0,39 0,1521
06.12.2005 59 59,33 0,33 0,1089
07.12.2005 59,85 60,3 0,45 0,2025
08.12.2005 59,6 59,16 0,44 0,1936
09.12.2005 59,9 60,39 0,49 0,2401
12.12.2005 60,65 60,31 0,34 0,1156
13.12.2005 60,65 60,38 0,27 0,0729
14 12.2005 61,15 61,49 0,34 0,1156
15.12.2005 60,25 59,94 0,31 0,0961
16.12.2005 61 61,3 0,3 0,09
19 12.2005 61,01 61,37 0,36 0,1296
20.12.2005 60,7 60,32 0,38 0,370714286 0,1444 СКО=0,14096 0,1513
151
Нечёткие модели и методы в интеллектуальных системах
Сравнения ошибок прогнозирования для НК Сугено с тре-
угольной и гауссовской функциями принадлежности приведено
на рис. 3.23.
Как показал третий эксперимент, лучшим оказался контрол-
лер Сугено с гауссовскими ФП как и в двух предыдущих случаях
(СКО на проверочной выборке из 14 точек 0,0967).
4. Сравнительный анализ результатов прогнозирования кур-
сов акций разными методами.
На рис. 3.24 приведены результаты прогнозирования для НК
Мамдани, Цукамото и Сугено, для гауссовских ФП и ННС AN-
FIS, а на рис. 3.12 для треугольной ФП.
Как демонстрируют приведенные результаты [44], наилуч-
шим, хотя и с небольшим отрывом, оказался контроллер Мамда-
ни с гауссовской ФП. Его СКО составляет всего 0,028236. Даль-
ше по качеству прогноза идет контроллер Цукамото, причем га-
уссовские ФП дают несколько лучший результат, чем треуголь-
ные. Но в целом их прогнозы очень близки (СКО=0,0728 и
СКО=0,0817 соответственно). Это дает основание допустить, что
подбор еще более удачного вида функций принадлежности даст
возможность еще больше улучшить результаты прогноза. И на-
конец, уже на последнем месте (со сравнительно большим отста-
ванием) находятся результаты, полученные с помощью ННС
ANFIS (СКО=0,34312).
152
Глава 3. Системы нечеткого логического вывода...
153
Нечёткие модели и методы в интеллектуальных системах
ВЫВОДЫ К ГЛАВЕ 3
В главе рассмотрены нечеткие контроллеры Мамдани
и Цукамото, нечеткие нейронные сети ANFIS и TSK. Проведены
экспериментальные исследования по прогнозированию в макро-
экономике и финансовой сфере с применением различных клас-
сов нечетких нейросетей, в результате которых получены сле-
дующие выводы:
1. Нечеткие контроллеры Мамдани и Цукамото отлично
справились с задачей аппроксимации контрольной выборки. Это
свидетельствует о работоспособности алгоритмов обучения кон-
троллеров, а также о высокой репрезентативности самой выбор-
ки. Как показал первый тест, лучшим (хотя с небольшим отры-
вом) оказался контроллер Мамдани, работающий с гауссовскими
функциями принадлежности и нечетком пересечении в виде
произведения (СКО на проверочной выборке из 10 точек = 0.09).
2. При анализе влияния числа правил вывода выяснилось, что
для нечетких контроллеров наилучшие результаты достигаются
при использовании полной базы правил, затем при уменьшении
числа правил эффективность прогнозирования сначала падает
(до 50% общего числа правил), а затем начинает немного повы-
шаться, что свидетельствует о наличии оптимального числа пра-
вил для конкретной задачи прогнозирования.
3. Полную систему правил целесообразно использовать для не
более, чем трех переменных. Для четырех и более переменных
целесообразно использовать неполную базу правил, что сущест-
венно упрощает структуру ННС и дает приемлемые результаты
по точности прогнозирования.
4. Проведенные результаты показали большие потенциальные
возможности ННС и подтвердили их эффективность в задачах
макроэкономического и финансового прогнозирования.
5. Сравнительный анализ точности прогнозирования с ис-
пользованием ННС Мамдани, Цукамото и ANFIS показал, что
ННС ANFIS имеет значительно худшие показатели в сравнении
с ННС Мамдани и Цукамото.
154
Глава 3. Системы нечеткого логического выаода...
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
К ГЛАВЕ 3
1. Укажите основные этапы нечеткого логического вывода.
1. Укажите основные методы дефаззификации.
2. В чем состоят отличия алгоритма нечеткого вывода Цука-
мото и алгоритма Мамдани?
3. Какой операцией реализуется пересечение условий правил
в алгоритмах нечеткого вывода Мамдани, Цукамото и Сугено?
4. Как реализуется нечеткая импликация в алгоритмах нечет-
кого вывода Мамдани, Цукамото, Ларсена?
5. Запишите нечеткие правила вывода для алгоритмов Мам-
дани и Цукамото.
6. Запишите нечеткие правила вывода для алгоритма Сугено.
7. Запишите нечеткие правила вывода для алгоритма Ларсена.
8. Сформулируйте теорему об универсальной аппроксимации с
использованием систем с нечеткой логикой и поясните её смысл.
9. Сформулируйте основные преимущества систем с нечеткой
логикой и укажите области их целесообразного применения.
10. Укажите основные недостатки систем с нечеткой логикой.
Какие есть способы их преодоления9
11. Запишите алгоритм обучения для контроллера Цукамото с
треугольными ФП.
12. Запишите градиентный алгоритм обучения для контролле-
ра Цукамото в случае Гауссовских ФП.
13. Приведите структуру нейронной сети ANFIS, запишите
используемые правила вывода и укажите функции слоёв.
14. Запишите алгоритм обучения параметров ФП для ННС
ANFIS.
15. Приведите структуру ННС TSK. Укажите функции слоёв
этой сети и вид нечетких правил вывода.
16. Какие особенности алгоритма обучения ННС TSK? Из ка-
ких этапов он состоит?
17. Приведите структуру ННС NEFPROX.
18. Запишите алгоритм генерации базы правил ННС
NEFPROX.
19. Запишите алгоритм обучения параметров ФП в ННС
NEFPROX.
20. Укажите основные особенности применения ННС и сис-
тем с нечеткой логикой в задачах прогнозирования в экономике
и финансовой сфере.
155
ГЛАВА
Нечеткие нейронные сети
в задачах классификации
ВВЕДЕНИЕ
Целью данной главы является рассмотрение и анализ
нечетких нейронных сетей в задачах классификации, имеющих
широкое применение в технике, экономике, социологии, меди-
цине и т.д.
Рассмотрена базовая нечеткая нейронная сеть для классифи-
кации — NEFClass, алгоритм обучения базы правил и ФП нечет-
ких множеств. Проанализированы достоинства и недостатки сис-
темы NEFClass и описана ее модификация — система NEFClass
М, разработанная автором и свободная от недостатков системы
NEFClass.
Описаны результаты многочисленных сравнительных экспе-
риментальных исследований базовой и модифицированной сис-
темы NEFClass.
Далее в главе рассматривается актуальная в практическом от-
ношении задача распознавания объектов электрооптических изо-
бражений (ЭОИ). Приводятся решение этой задачи с использо-
ванием ННС NEFClass. Проведен сравнительный анализ различ-
ных алгоритмов обучения ННС NEFClass в задаче распознавания
объектов ЭОИ на фоне помех.
4.1. ННС NEFCLASS. АРХИТЕКТУРА,
СВОЙСТВА, АЛГОРИТМ ОБУЧЕНИЯ БАЗЫ
ПРАВИЛ И ПАРАМЕТРОВ ФП
Задача классификации данных в настоящее время яв-
ляется одной из наиболее актуальных сфер приложения систем
искусственного интеллекта. Для ее решения были предложены
различные подходы и направления, среди которых наибольшую
156
Глава 4. Нечеткие нейронные сети в задачах классификации
популярность приобрели решения, сочетающие нейронные сети
и нечеткие системы логического вывода. Одним из таких реше-
ний является система NEFClass (NEuro-Fuzzy CLASSifier), осно-
ванная на обобщенной архитектуре нечеткого перцептрона | ИЗ-
115].
Как оригинальная, так и модифицированная модель NEF-
Class являются производными от общей модели нечеткого пер-
цептрона, описанного в главе 3. Цель модели — вывод нечетких
правил из набора данных, которые можно разделить на некото-
рое количество (четких) непересекаюшихся классов. Нечеткость
возникает в силу несовершенных или неполных измерений
свойств объектов, подлежащих классификации.
Нечеткие правила, описывающие данные, имеют следующую
форму:
если х, является р, и х2 является д2, и ... и х„ является цп,
то образец (х;, х2, .... хп) принадлежит классу i,
где р,, ..., дп — нечеткие множества.
Задача NEFClass — определить эти правила, а также вид
функций принадлежности для нечетких множеств. Тут принима-
ется, что пересечение двух разных множеств является пустым
множеством.
Система NEFClass имеет 3-слойную последовательную архи-
тектуру (см. рис. 4.1). Первый слой содержит входные нейроны,
в которых представляются входные образцы. Активация нейрона
обычно не изменяет входное значение. Скрытый слой содержит
нечеткие правила, и третий слой состоит из выходных нейронов
каждого класса. Активация для нейронов правил и для нейронов
выходного слоя с образцом р вычисляется так:
ЛР)= min W,fl)(4₽))k (4.1)
R xel/J X J
Й(Р)= £ W(c,R)c№, (4.2)
c r&u2 k
или альтернативно
a№ = max l(° </>)}, (4.3)
C R e U2 I R J
где W(x,R) — нечеткий вес соединения входного нейрона х с
157
Нечёткие модели и методы в интеллектуальных системах
нейроном правил R, a W(R,c) — нечеткий вес соединения нейро-
на правил R с нейроном выходного слоя с. Вместо применения
операций взятия максимума и минимума можно использовать
другие функции /-нормы и r-конормы соответственно.
База правил представляет собой аппроксимацию неизвестной
функции (р : R" -> (0,1)” и описывает классификационную задачу,
где <р(х) = (с|э...,ст)такая, что с,=1, ц=0 (у = l.../n,V J * i), если х
принадлежит классу С,.
Рис. 4.1. Система NEFClass с двумя входами и пятью правилами
Каждое нечеткое множество маркируется лингвистическим
термом, таким как «большой», «маленький», «средний» и т.д. Не-
четкие множества соединений, ведущих к одному правилу R, на-
зываются также антецедентами R.
Нечеткие множества и лингвистические правила представля-
ют аппроксимацию классифицирующей функции и определяют
результат системы NEFClass. Они получаются из множества вы-
158
Глааа 4. Нечеткие нейронные сети в задачах классификации
борок путем обучения. Обязательно должно выполняться прави-
ло, что для каждого лингвистического значения (например, «х,
положительное и большое») может существовать только одно
представление нечеткого множества.
Обучение в системе NEFClass
Обучение базы правил
Система NEFClass может быть построена по частич-
ным знаниям об образцах. Пользователь должен определить ко-
личество начальных нечетких множеств для каждого из призна-
ков объекта и задать значение kmax — максимальное число узлов
правил, которые могут быть созданы в скрытом слое. Для обуче-
ния используются треугольные функции принадлежности. Рас-
смотрим непосредственно алгоритм обучения базы правил.
Рассмотрим систему NEFClass с п входными нейронами
х, х„, k<kmax нейронами правил и m выходными нейронами
сЛ ст. Также задано обучающее множество образцов Ъ={(рц
ti),...,(ps, tj}, каждый из которых состоит из входного образца
p€R" и желаемого образца t€{0,1}т. Обучающий алгоритм состоит
из двух этапов.
Этап 1.
Генерация базы правил.
Первый этап, цель которого создать к нейронов правил сис-
темы NEFClass, состоит из следующих шагов [114; 115]:
Выбираем следующий образец (p,t) из L.
Для каждого входного нейрона х, Ct/, находим такую функ-
цию принадлежности , что
= шах {рУ’(А)}. (4-4)
где x,=pi.
Если по-прежнему число узлов правил к меньше ктах и не су-
ществует узла правила R, такого, что
И'(х1,Я) = дл,...,^(хп,Л) = Мл,
то создаем такой узел и соединяем его с выходным узлом с„ если
t/=l.
Если еще остались необработанные образцы в L и Л<=Лтах, то
переходим на шаг 1, а иначе стоп.
159
Нечёткие модели и методы в интеллектуальных системах
Определяем базу правил по одной из трех следующих процедур:
а) «Простое» обучение правил: оставляем только первые к
правил (останавливаем создание правил, если было создано
£=£тах правил).
б) «Лучшее» обучение правил: обрабатываем образцы в £ и
накапливаем активации каждого нейрона правил для каждого
класса образцов, которые были распространены. Если нейрон
правила R показывает большее накопление активации для класса
Cj, чем для класса Ся, который был специфицирован для следст-
вия правила, тогда изменяем следствие R на Cj, то есть соединя-
ем Л с нейроном выхода с7. Продолжаем обработку образцов в £
дальше и вычисляем для каждого нейрона правил функцию:
= (4.5)
peL
fl, если р классифицировано правильно;
[-1, иначе.
Оставляем к нейронов правил с наивысшими значениями VR и
удаляем другие нейроны правил из системы NEFClass.
в) «Лучший для каждого класса» алгоритм обучения: действу-
ем также как и в предыдущем случае, но оставляем для каждого
класса Q те лучшие
m
из правил, следствия которых представ-
ляют класс Cj (где [х] — целая часть от х).
Обучение нечетких множеств
Этап 2.
На втором этапе происходит обучение параметров
функций принадлежности нечётких множеств. Алгоритм обуче-
ния с учителем системы NEFClass должен адаптировать его не-
четкие множества; алгоритм циклически пробегает через всю
обучающую выборку £, выполняя ниже перечисленные шаги,
пока не выполнится один из критериев останова [112—114].
Шаги:
1. Выбираем следующий образец (p,t) из £, распространяем
его через систему NEFClass и определяем выходной вектор с.
160
Глава 4. Нечеткие нейронные сети в задачах классификации
2. Для каждого выходного нейрона с, определяем значение 8С/.
$с, = fi ~ act >
где tj — желаемый выход, aCj — фактический выход нейрона с(.
3. Для каждого нейрона правил R, для которого выход aR >0:
а) Определяем значение 3R, равное
5л=ал-(1-ад)- %W(R,C)5c. (4.6)
Се(/3
б) Находим такое х', что
. |= min (ифс.ЯХд )}. (4.7)
v Л X J X е t/j
в) Для нечетких множеств W(x’,R) определяем смещение па-
раметров ФП Д.а,Д.ь,Д.с, используя скорость обучения а > 0:
А* = а 8R (с - а) sgn(ox. - b), (4.8)
ka=-c-8R(c-a) + 8b, (4.9)
Дс = c-8R (с-а) + 8ь, (4.10)
и выполняем изменения W(x’,R).
г) Вычисляем ошибку правила:
£ = «я (1-йд)- £(2 ^(Л,с)-1)-|5с|. (4.11)
Конец итерации. Повторяем указанные итерации до выпол-
нения условий останова.
В качестве критериев останова можно взять, например, такие:
Ошибка на протяжении п итераций не уменьшается.
Прекратить обучение по достижении ошибкой определенного
(желательно близкого к нулю) значения.
161
Нечёткие модели и методы в интеллектуальных системах
4.2. АНАЛИЗ СВОЙСТВ NEFCLASS.
МОДИФИЦИРОВАННАЯ СИСТЕМА НЕЧЁТКОЙ
КЛАССИФИКАЦИИ NEFCLASSM
ННС NEFClass обладает рядом несомненных досто-
инств, выделяющих ее среди остальных. Среди наиважнейших
следует упомянуть простоту реализации, высокую скорость рабо-
ты алгоритмов обучения, а также, что является наиболее важ-
ным, высокую точность классификации данных — на уровне
лучших систем в данной области. Вместе с тем базовая система
NEFClass имеет ряд недостатков: используемые формулы для
обучения параметров носят эмпирический характер, кроме того,
неясно, как выбирать в алгоритме обучения параметр скорости
обучения о. Ниже будет представлена модификация базовой мо-
дели нечеткой нейронной системы (NEFClassM).
Рандомизация и тщательный подбор константы скорости
обучения о являются отличительными свойствами реализации
модифицированной системы NEFCLASS, дальнейшее развитие
которой представляет собой цель данной работы. Эти свойства
были призваны смягчить влияние некоторых недостатков ориги-
нальной модели и позволили добиться заметного улучшения ка-
чества классификации.
Рандомизация. В силу особенностей алгоритма обучения
«простых» правил и алгоритма обучения нечетких множеств, ре-
зультаты обучения сети по этим алгоритмам в высокой степени
зависят от порядка, в котором представлены образцы обучающей
выборки. Так, если, например, порядок образцов будет отсорти-
рован по классам, то полученная в результате система будет луч-
ше себя вести на образцах одного класса и значительного хуже —
на образцах другого. В идеале, образцы в обучающей выборке
должны быть случайным образом перемешаны, чтобы избежать
этого негативного эффекта; однако, подобное требование может
не выполняться пользователем системы, поставляющим обучаю-
щую выборку.
Реализация модифицированной системы NEFCLASS работы
[40] обходит эту сложность путем «перемешивания» порядка об-
разцов обучающей выборки после ее загрузки — случайным об-
разом. Более того, такое случайное «перемешивание» происходит
перед каждой итерацией алгоритма обучения нечетких множеств.
Как показывают дальнейшие эксперименты, это позволяет до-
162
Глава 4. Нечеткие нейронные сети в задачах классификации
биться более стабильных и, зачастую, лучших результатов клас-
сификации, которые не зависят от того, в каком порядке образ-
цы обучающей выборки были представлены пользователем.
Выбор скорости обучения. В алгоритме обучения нечетких
множеств модели NEFCLASS фигурирует скорость обучения о. К
сожалению, в оригинальных работах [113—115] этой константе не
уделяется должного внимания. Как показали эксперименты, про-
веденные в ходе разработки реализации NEFCLASS, данный па-
раметр играет исключительно важную, если не одну из опреде-
ляющих ролей в успехе всего процесса обучения.
Проведенные эксперименты свидетельствуют, что при прочих
равных условиях для данной конкретной задачи обучения сущест-
вует некое значение о, при котором достигается минимальный
процент ошибочных классификаций после обучения в целом. К
сожалению, аналитическую зависимость получить весьма тяжело,
ибо алгоритмы обучения NEFCLASS в целом весьма эмпиричны
как таковые; тем не менее, методом проб и ошибок было установ-
лено, что для большинства задач оптимальное значение о состав-
ляет около 0,07. Это значение и было установлено для программы,
которая реализует модифицированную модель NEFCLASS [40].
Модифицированная модель NEFCLASS
Рандомизация и тщательный выбор скорости обучения, при-
менённые для реализации оригинальной системы NEFCLASS,
отражают некоторые из недостатков данной модели, устранить
или смягчить влияние которых призвана модификация, предло-
женная в работе [40]. Рассмотрим основные недостатки алгорит-
ма обучения в системе NEFCLass.
Эмпиричность алгоритма обучения нечетких множеств. Ориги-
нальный алгоритм обучения нечётких множеств в системе
NEFCLASS представлен так, «как есть», и, соответственно, его
(суб)оптимальность никак не обосновывается. Эксперименты,
приведенные далее, показывают, что, хотя алгоритм даёт резуль-
таты, не слишком далёкие от оптимальных (правда, для некото-
рых иного вида функций принадлежности нечетких множеств),
все же его оптимальность для треугольных функций можно по-
ставить под сомнение. В пользу этого утверждения также свиде-
тельствует следующий пункт.
Большая чувствительность к изменению параметров обуче-
ния. В процессе обучения сети NEFCLASS на новой выборке
163
Нечёткие модели и методы в интеллектуальных системах
данных зачастую неизвестно какое количество правил и количе-
ство нечетких множеств на переменную (т.е. число значений
лингвистической переменной) является оптимальным. Так, для
набора Wisconsin Breast Cancer хорошие результаты настройки
сети достигаются уже при двух «лучших на класс» правилах и при
двух множествах на каждую из девяти переменных. Однако, воз-
можна ситуация (особенно для нового набора данных), что такая
информация неизвестна заранее, и поэтому обучение начинается
с другими параметрами. Здесь и кроется еще один недостаток
NEFCLASS.
Структура модифицированной модели
Анализ приведенных недостатков показывает, что их
причиной в значительной мере является несовершенство алго-
ритма обучения нечетких множеств NEFCLASS. Поэтому естест-
венным подходом, призванным исправить ситуацию, явилась за-
мена эмпирического алгоритма обучения на строгий алгоритм
численной оптимизации со всеми вытекающими отсюда послед-
ствиями для архитектуры и алгоритмов сети. Дальнейшие экспе-
рименты подтвердили верность такого решения.
Как и оригинальная, так и модифицированная модель
NEFCLASS основывается на архитектуре нечеткого персептрона
[40]. Архитектурные различия оригинальной и модифицирован-
ной моделей состоят в виде функций принадлежности нечетких
множеств, функции r-нормы для вычисления активаций нейро-
нов правил, а также в виде агрегирующей функции (Г-конормы),
определяющей активации выходных нейронов.
Применение численных методов оптимизации требует диф-
ференцируемости функций принадлежности нечетких множеств —
условие, которому треугольные функции принадлежности не
удовлетворяют. Поэтому в модифицированной модели нечеткие
множества имеют гауссовскую функцию принадлежности, опи-
сываемую как
[ (х-а)2
M(x) = expj-V
Конкретная функция принадлежности задается таким образом,
двумя параметрами — а и Ь.
Требование дифференцируемости диктует также вид л-нормы
(пересечения) для вычисления активации нейронов правил. В
164
Глава 4. Нечеткие нейронные сети в задачах классификации
системе NEFCLASS для этого используется функция минимума;
в модификации это произведение соответствующих значений
Наконец, вид агрегирующей функции (r-конормы) для моди-
фицированной модели ограничен только взвешенной суммой.
Причина состоит в том, что функция максимума, которая ис-
пользуется в оригинальной системе, не удовлетворяет условию
дифференцируемости.
Основное изменение, очевидно, касается алгоритма обучения
нечетких множеств. Целевой функцией в модифицированной
системе NEFClass выступает минимизация среднеквадратичной
ошибки на обучающей выборке по аналогии с классическими
(четкими) нейросетями:
1 Л'
min Е = |Р,
Я р=\
где N — количество образцов обучающей выборки, о’/') — апри-
орный вектор активации нейронов выходного слоя для очередно-
го обучающего образца р, а — целевое значение этого векто-
ра для данного паттерна. Компоненты целевого вектора для пат-
терна р равны:
где j — номер класса, которому принадлежит данный паттерн.
Аргументом численной оптимизации, направленной на
уменьшение среднеквадратичной ошибки по обучающей выбор-
ке, является совокупный вектор параметров а и b всех нечетких
множеств сети. В качестве конкретного метода может выступать
любой метод безусловной оптимизации, как, например, гради-
ентный метод или метод сопряженных градиентов; именно эти
два метода были реализованы в данной работе.
165
Нечёткие модели и методы в интеллектуальных системах
4.3. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ
ННС NEFCLASS. СРАВНИТЕЛЬНЫЙ АНАЛИЗ
ННС NEFCLASS И NEFCLASSM В ЗАДАЧАХ
КЛАССИФИКАЦИИ В ЭКОНОМИКЕ
Эксперименты по классификации проводились на че-
тырех наборах данных. Первые два — IRIS и WBC, остальные —
набор данных по процентным ставкам в Российской Федерации
в 1992—1995 гг. и набор данных российских аудиторско-консуль-
тационных фирм за 1999 год.
Выбор IRIS и WBC в качестве тестовых наборов диктовался
двумя соображениями: во-первых, эти наборы уже можно считать
стандартными для задач классификации, а во-вторых, в ориги-
нальных работах авторов модели NEFCLASS проводится тести-
рование модели именно на этих наборах данных. Это позволяет
сравнить результаты созданного программного продукта с автор-
скими, а также проследить влияние рандомизации на процесс
обучения.
Остальные два набора также представляют значительный инте-
рес в силу того, что входные параметры в этих задачах характери-
зуются недостаточной полнотой, а также в силу того, что взяты из
сфер, где применение классификации сейчас особенно актуально.
Набор данных IRIS
Набор IRIS содержит 150 образцов, принадлежащих к
трем различным классам (Iris Setosa, Iris Versicolour, и Iris
Virginica), no 50 образцов каждого класса. Каждый образец ха-
рактеризуется четырьмя свойствами [112]—[114].
Набор IRIS является единственным по своей классификаци-
онной простоте, для которого даже простая стратегия отбора
правил дает хорошие результаты.
В первом эксперименте, в модифицированной модели NEF-
Class-M был выбран «простой» алгоритм обучения правил, а их
количество было ограничено 10 при количестве множеств на пе-
ременную — 3 (для всех остальных параметров были установлены
на значения по умолчанию). В результате система создала 10
правил и достигла результата в 4 ошибочных классификации из
150 (т.е. 97,3% правильных)
Наилучший результат, которого удалось достигнуть при «про-
стом» алгоритме обучения правил — три правила при двух суще-
166
Глава 4. Нечеткие нейронные сети в задачах классификации
ственных переменных, х3 и х4, с тем же порядком ошибочных
классификаций:
Rl: IF (any, any, large, large) THEN Class 3
R2: IF (any, any, medium, medium) THEN Class 2
R3: IF (any, any, small, small) THEN Class 1
Такой же результат наблюдается и для «лучшего» и «лучшего
на класс» алгоритмов обучения правил. Однако, для последних
двух алгоритмов возможно дальнейшее сокращение количества
множеств разбиения для переменных х3 и х4 при следующих пра-
вилах (6 ошибочных классификаций):
Rl: IF (any, any, small, small) THEN Class 1
R2: IF (any, any, large, small) THEN Class 2
R3: IF (any, any, large, large) THEN Class 3
Авторами модели NEFCLASS были получены похожие ре-
зультаты, за исключением того, что в своих экспериментах они
остановились на трех разбивающих множествах для х3 и х4.
Приведенные же данные показывают, что для эффективного
решения проблемы на самом деле достаточно двух множеств на
переменную.
Таким образом, для набора данных IRIS удалось добиться ре-
зультата лучшего, чем в оригинальных работах — исключительно
простого набора правил с двумя переменными с использованием
всего двух разбивающих множеств для каждой переменной.
Если сравнивать полученные результаты с другими системами,
то, например, FuNe-I дает 99% правильных классификаций, но с
использованием 13 правил на всех четырех переменных, и 96% —
с 7 правилами на трех переменных. Отсюда можно сделать вывод
о сравнимости NEFCLASS и FuNe-I по качеству классифициро-
вания, хотя структура и процедура обучения FuNe-I значительно
более сложны. Кроме того, FuNe-I использует концепцию взве-
шенных нечетких правил, семантика которых неясна.
Набор данных WBC
При обработке набора Wisconsin Breast Cancer в сис-
теме NEFClass-M были получены интересные результаты, не
всегда совпадающие с результатами авторов модели
NEFCLASS.
Следуя ходу экспериментов авторов системы NEFCLASS, для
обучения системы был задан максимум из 4 правил с алгоритмом
167
Нечёткие модели и методы в интеллектуальных системах
обучения «лучшие на класс» (три множества на переменную). В
результате были получены показатели ошибочной классифика-
ции для системы NEFClass-M в районе 28 из 663 (95,7% пра-
вильных). Весьма интересным является факт, что в модели NEF-
Class для аналогичных параметров показатель правильности со-
ставил всего 80,4% (135 неправильных классификаций).
Это существенное преимущество модифицированной системы
NEFClass-M можно отнести к тому, что отличает реализованную
модель NEFCLASS от канонической, а именно использованию
алгоритма рандомизации и выбору скорости обучения.
Лучший результат, который удалось получить для набора дан-
ных WBC, — база из 8 правил с пятью существенными перемен-
ными х,, х2, х4, х6 и х, (ошибочных классификаций — 19):
Rl: IF (small, small, any, small, any, small, any, any, small) THEN Class 1
R2: IF (small, small, any, large, any, small, any, any, small) THEN Class 1
R3: IF (small, small, any, small, any, small, any, any, large) THEN Class 1
R4: IF (large, large, any, small, any, large, any, any, small) THEN Class 2
R5: IF (large, large, any, large, any, small, any, any, small) THEN Class 2
R6: IF (small, large, any, small, any, large, any, any, small) THEN Class 2
R7: IF (large, small, any, small, any, small, any, any, small) THEN Class 2
R8; IF (large, small, any, small, any, small, any, any, large) THEN Class 2
Сравнимые результаты (24 ошибочных классификаций) дает
использование максимума из 2 правил («лучшие на класс») со
всеми существенными переменными, кроме х5 и х7:
Rl: IF (small, small, small, small, any, small, any, small, small) THEN Class 1
R2: IF (large, large, large, small, any, large, any, large, small) THEN Class 2
Эти результаты превосходят полученные авторами базовой
модели NEFClass как по количеству правил/существенных пере-
менных, так и по точности классификации. Это подтверждает
целесообразность модификаций, внесенных в модель NEFClass:
рандомизации и правильного выбора скорости обучения.
Набор данных по процентным ставкам
Набор состоит из 48 образцов: 3 класса, отражающие
темпы инфляции, и 4 параметра для каждого образца (различные
процентные ставки). В оригинальном примере решения задачи с
помощью системы NEFCLASS был достигнут результат в 2 оши-
бочных классификации. При этом база состояла из 26 правил, а
168
Глава 4. Нечеткие нейронные сети в задачах классификации
количество разбивающих множеств для каждой переменной со-
ставляло 7 (то есть число значений лингвистической перемен-
ной).
При таком количестве правил и разбивающих множеств закон
классификации данного набора совсем неочевиден. Попытка,
предпринятая в работе [40], была нацелена на сокращение базы
правил и количества разбивающих множеств для переменных.
В результате в системе NEFClass-M были получены те же две
ошибочные классификации при базе правил размерности 19
(обучались «лучшие» правила); количество разбивающих мно-
жеств было успешно сокращено до 5 для всех переменных (для х2
— до четырех). Новая база правил выглядит следующим образом:
Rl: IF (med-large, med-large, med-large, med-large) THEN Class 2
R2: IF (med-small, med-small, med-small, med-small) THEN Class 2
R3: IF (large, large, large, large) THEN Class 2
R4: IF (med-small, med-small, medium, medium) THEN Class 3
R5: IF (med-large, med-large, large, med-large) THEN Class 2
R6: IF (large, med-small, med-large, medium) THEN Class 2
R7: IF (small, small, small, small) THEN Class 3
R8: IF (med-small, med-large, medium, medium) THEN Class 3
R9: IF (large, med-large, med-large, medium) THEN Class 2
RIO: IF (med-large, small, medium, med-small) THEN Class 1
Rl 1: IF (large, med-large, med-large, med-large) THEN Class 2
R12: IF (large, med-small, medium, med-small) THEN Class 1
R13: IF (medium, med-large, med-large, medium) THEN Class 2
R14: IF (large, med-small, med-large, med-small) THEN Class 2
R15: IF (medium, med-small, med-large, medium) THEN Class 1
R16: IF (med-large, large, med-large, med-large) THEN Class 3
R17: IF (medium, med-small, medium, medium) THEN Class 2
R18: IF (med-large, large, large, large) THEN Class 3
R19: IF (med-large, med-large, med-large, medium) THEN Class 2
Для данной задачи созданная программная реализация в соче-
тании с интерактивным подходом позволяет успешно улучшать па-
раметры классификации, что еще раз свидетельствует в ее пользу.
Набор данных российских
аудиторско-консультационных фирм
Данный набор является примером неполной инфор-
мации, поступающей на вход классификатора. Выборка состоит
169
Нечёткие модели и методы в интеллектуальных системах
из 75 образцов, которые относятся к 3 классам (классы фирм) и
характеризуются 4 параметрами.
Лучший результат системы NEFClass — 10 ошибок при 26
правилах, 7, 4, 7 и 2 разбивающих множествах для переменных
xh х2, х3 и х4 соответственно. Эксперимент данной работы, как и
для предыдущего набора, состоял в уменьшении базы правил и
количества значений лингвистических переменных.
В результате в модели NEFClass-M база правил была сокра-
щена до 22, а количество значений (термов) лингвистических пе-
ременных — до 4, 4, 5 и 2 соответственно. Ошибка при этом не-
значительно увеличилась и составила 13 из 75.
Следует отметить, что в целом, как набор 3, так и набор 4
весьма плохо поддаются классификации — новое правило созда-
ется для каждого второго-третьего образца обучающей выборки,
что весьма близко к вырожденному случаю создания отдельного
правила для каждого образца. Это свидетельствует о не совсем
удачном отборе входных параметров для классификации, кото-
рые в недостаточной мере коррелируют с показателем класса.
Важной особенностью нечеткой классификации является соз-
дание хорошо интерпретируемых и, как правило, несложных
правил для классификации данных, что исключительно важно,
когда возникает необходимость в интерпретации законов клас-
сифицирования для данной конкретной задачи человеком. Сис-
тема NEFCLASS, будучи одной из таких систем, полностью об-
ладает этим свойством. Тем не менее, нечеткий классификатор
ни в коей мере нельзя рассматривать в качестве замены, а только
как дополнение к другим методам — статистическим, нейронным
сетям и т.д. Дело в том, что зачастую за легкость итерпретации
классификатора и простоту алгоритма обучения наряду с его вы-
числительной эффективностью приходится платить результатами
классификации, которые могут быть не столь хороши, как в
иных методах.
Также следует констатировать положительное влияние моди-
фикаций, предпринятых в модели NEFClass-M, на качество ра-
боты системы. Рандомизация наряду с тщательно подобранной
константой скорости обучения позволили получить результаты,
превосходящие результаты базовой модели. В целом, система
NEFCLASS — весьма ценный и практичный инструмент анали-
тика, обладающий рядом несомненных достоинств и гораздо
меньшим числом незначительных недостатков, широкое приме-
нение которого может быть без сомнения рекомендовано.
170
Глава 4. Нечеткие нейронные сети в задачах классификации
4.4. Распознавание объектов электрооптических
изображений. Постановка и анализ задачи
4.4.1. Общая характеристика работы системы,
исторические сведения
Сегодня дистанционное зондирование включает раз-
нообразные методы получения изображений во всех диапазонах
электромагнитного спектра — от ультрафиолетового до инфра-
красного диапазонов. При осмотре изображений метеорологиче-
ских и геостационарных спутников, которые охватывают почти
целое полушарие, или детальных аэро изображений участка пло-
щадью в несколько сотен квадратных километров можно сделать
вывод, что дистанционное зондирование — это основной метод
нахождения качественной, необходимой информации о поверх-
ности и состоянии Земли, а также об объектах исследований
изображений.
Дистанционный метод зондирования, как правило, является
звеном измерений, т.е. с их помощью измеряются не параметры
объектов, а некоторые величины связанные с ними. Например,
нам необходимо оценить состояние сельскохозяйственных посе-
вов. Но аппаратура спутника реагирует только на интенсивность
светового потока от этих объектов на некоторых участках опти-
ческого диапазона. Чтоб «расшифровать» такие данные необхо-
димо провести предварительные исследования, которые включа-
ют в себя разнообразные эксперименты по изучению состояния
посевов контактными методами; по изучению отражающей спо-
собности в электромагнитном спектре (воды, земли, растений),
при разных расположениях спутника, при разной яркости света и
параметрах измерительного прибора. Далее необходимо опреде-
лить, какой вид имеют те или иные объекты на изображении, и
только после этого определяют состояние поверхности (посе-
вов, воды).
Методы изучения Земли с помощью дистанционного зонди-
рования не случайно относят к высоким технологиям. Это связа-
но не только с использованием современной техники, сложных
опто-электронных приспособлений, мощных компьютеров, но и
с новым подходом к получению интерпретации результатов из-
мерений. Хотя исследования являются достаточно громоздкими
при небольшом угле осмотра земной поверхности, они дают воз-
можность комбинировать (склеивать) изображения и получать
171
Нечёткие модели и методы интеллектуальных системах
качественные широкомасштабные изображения для больших
площадей и даже для всего земного шара. Ширина осмотра ска-
нирования поверхности является характерной чертой спутнико-
вых методов исследования Земли, они позволяют получить каче-
ственные снимки за сравнительно короткий интервал времени.
Информация об объектах исследования поступает со спутни-
ка, как правило, в цифровом виде, а системы дистанционного
зондирования состоят из: нескольких сенсоров, чувствительных к
поступающим световым или звуковым волнам от объекта; ком-
пьютера, который постоянно считывает данные с сенсора и запи-
сывает их на жёсткий диск. Такой сенсор обычно вмонтирован в
движущийся объект, таким образом, чтоб при вращении видеть
необходимую территорию. Как пример, может быть приведена
система с цифровой камерой для наблюдения за морскими вол-
нами. С помощью такой системы можно получить следующие
виды данных: о глубине и морфологии океана, целесообразности
использования земель и типе растительного мира. Эти данные
являются бесценными при наблюдении за такими процессами
как эрозия гор, природные изменения почвы, застройка городов
и изменение типа зелёного покрова Земли.
Дистанционное зондирование даёт возможность проводить
оперативную съёмку, а также накапливать обширный архив аэ-
рофотоснимков. На сегодняшний день практически вся поверх-
ность земной суши (и значительная часть водной поверхности)
зафиксирована космической съёмкой при разных условиях на-
блюдения (время года, время суток и т. д.).
Прогресс развития космической индустрии нуждается в эко-
номически эффективной политике для расширения использова-
ния спутников в конкретных хозяйственных, экологических и
коммерческих задачах, для изучения их в академических заведе-
ниях.
4.4.2. Концепция мультиспектральных
электрооптических систем.
Основные определения
Концепция мультиспектральной системы представле-
на на рис. 4.2. Система снимает изображение поверхности Земли
с помощью сенсора с двухмерной детекторной решёткой. В ре-
зультате данные представляют собой практически непрерывный
172
Глава 4. Нечеткие нейронные сети в задачах классификации
спектр для каждого элемента изображения (пикселя). Схематиче-
ски составляющие системы можно представить в виде куба: 3D
трёхмерного набора данных — изображения, который характери-
зуются тремя признаками, х и у координатами и z длиной
волны (спектром).
Рис. 4.2. Составляющие системы дистанционного зондирования
в виде 3D куба
Спектральная кривая отображает зависимость между длиной
волны и отражающей способностью объекта наблюдения. По
форме спектральной кривой можно различать объекты. Напри-
мер, растительность имеет высокую отражающую способность в
ближнем инфракрасном диапазоне и низкую в среднем, по срав-
нению с почвой. Пример приведён на рис. 4.3.
С помощью бортовых компьютеров получены изображения
передаются к наземным станциям для последующей обработки.
Алгоритм обработки изображения включает в себя калибровку,
картографирование исправлений геометрического искривления и
классификацию поверхностей. В некоторых случаях используется
алгоритм для обработки данных в реальном времени.
173
Нечёткие модели и методы в интеллектуальных системах
длина волны (пт)
Рис. 4.3. Распознавание объектов по форме спектральной кривой
4.4.3. Виды сенсоров. Мультиспектральные
и гиперспектральные системы
Мультиспектральная система — это такая система, ко-
торая имеет на борту спутника или самолёта сенсор, который
снимает изображения в определённом спектральном диапазоне и
насчитывает от 2 до 15 спектральных частот. Частотная полоса —
определяется как часть спектра (цветов) с определённой шири-
ной, например в 10 или 50 нм. На рис. 4.4 приведён пример
спектрального диапазона мультиспектрального сенсора.
Мультиспектральный набор данных характеризируется 5—10
полосками с относительно большой шириной спектра 70—400 нм.
Обычно, в мультиспектральных системах частотные полосы спек-
тра изображений не находятся рядом одна с другой, поэтому не
являются смежными. Они могут быть широкими или узкими, а
при значительном количестве — очень узкими (около 10 нм). Сов-
174
Глава 4. Нечеткие нейронные сети в задачах классификации
Рис. 4.4. Частотные полосы мультиспекгрального сенсора
ременные мультиспектральные изображения имеют более высо-
кое спектральное расширение. Так, например, у сенсора Aster
спектральное расширение для ближнего диапазона составляет от
0,07 до 0, 17 мкм. Чем уже спектральный диапазон, к которому
чувствителен сенсор, тем уже спектральное расширение.
Гиперспектральные системы по принципу работы такие же,
как и мультиспектралные, но отличаются количеством спек-
тральных частот. Они насчитывают десятки сотен узких смежных
частотных полос. Вообще, такие системы имеют от 100 до 200
частот на относительно маленькой ширине спектра (5—10 нм).
На рис. 4.5 приведён пример спектрального диапазона гипер-
спектрального сенсора.
Спектральные днапатоны
Риг 4.5. Частотные полосы гиперспектрального сенсора
175
Нечёткие модели и методы в интеллектуальных системах
Спектральные кривые изображения, обычно, начинаются с
400 нм от конца синего видимого спектра. Такие системы изме-
ряют диапазон до 1100 и даже 2500 нм.
4.4.4. Принципы формирования изображений
системы
В мультиспектральной и гиперспектральной системе,
электромагнитное излучение разбивается с помощью призмы на
множество узких совместимых полос. Энергия в каждой полосе
измеряется отдельным детектором. На рис. 4.6 изображена прин-
ципиальная схема построения изображения в сенсоре — спек-
трометре.
Рис. 4.6. Принципиальная схема построения изображения в сенсоре —
спектрометре
С помощью сканирующего зеркала, призмы и набора оптиче-
ских линз изображение находится до ПСС или детекторной мат-
рицы, из которой изображение поступает в компьютер, записыва-
ется на жёсткий диск и передаётся для последующей обработки.
176
Глава 4. Нечеткие нейронные сети в задачах классификации
4.5. ПРИМЕНЕНИЕ СИСТЕМЫ NEFCLASS
В ЗАДАЧЕ РАСПОЗНАВАНИЯ ОБЪЕКТОВ
ЭЛЕКТРООПТИЧЕСКИХ ИЗОБРАЖЕНИЙ
С помощью мультиспектральной электрооптической
системы, работающей в трех диапазонах — красном, зеленом и
синем были получены снимки прибрежной полосы океана и тре-
бовалось распознать объекты в виде геометрических фигур на
водной поверхности и на песке. Для этих целей учитывая слож-
ность задачи, а также большой уровень помех предложено ис-
пользовать нечеткие нейронные сети, в частности NEFClass. С
целью организации обучения нечеткой нейросети (ННС) NEF-
Class был разработан ряд алгоритмов обучения — градиентный,
сопряженных градиентов и генетический и проведены их иссле-
дования их эффективности и сравнение с базовым алгоритмом
обучения системы NEFClass, предложенным Д.Науком и Р.Крузе
и описанным в разделе 4.1 [41] .
4.5.1. Градиентный алгоритм обучения
в системе NEFClass
Для первого этапа данного алгоритма — обучения ба-
зы правил мы используем первый этап базового алгоритма
NEFClass. Второй этап использует градиентный алгоритм обуче-
ния нейронной сети прямого действия, который мы опишем
дальше.
Пусть критерий обучения нечеткой нейросети, которая имеет
3 слоя (один скрытый слой), такой:
м
e(w) = £(z, - NET'(w))2 min, (4.12)
где /, — желаемое значение /-го выхода нейросети;
NET,(w) — фактическое значение /-го выхода нейросети, для
весовой матрицы W = [w1 И'1’]. W = W(x,R)= р,(х), W° = W(R,C).
То есть, критерий e(w) является средним квадратом ошибки
аппроксимации.
Пусть функции активации для нейронов скрытого слоя (ней-
ронов правил):
177
Нечёткие модели и методы в интеллектувльных системах
= (4.13)
/=1
где Pji(x) — функция принадлежности, которая имеет вид:
<х-дл>2
^(х) = е , (4.14)
и функция активации нейронов выходного слоя (взвешенная
сумма):
^W(R,CyOR
KeU2
или функция максимума:
Ос =тахИ/(/?,С) OR. (4.16)
Рассмотрим градиентный алгоритм обучения нечеткого пер-
цептрона.
1. Пусть w(n) — текущее значение матрицы весов. Алгоритм
имеет такой вид:
И/(и + /) = 1F(W) - y„+,Vwe(^(«)) , (4.17)
где уп — размер шага на п -й итерации;
VH. e(lF(n)) — градиент (направление), который уменьшает
критерий (4.12).
2. На каждой итерации сначала мы обучаем (корректируем)
входные веса W, которые зависят от параметров а та b (см. вы-
ражение 4.14):
а/и + /) = о , (4.18)
6.(и + /) = ^(и)-/я+/^1 , (4.19)
где — размер шага для параметра Ь.
178
Глава 4. Нечеткие нейронные сети в задачах классификации
= -2Х((/* - NETk(w))-W(R,Ck)) 0R (Х “У* , (4.20)
даЛ bji
((г* - NETk(w)) И/(Л,Ck))0R- (X~ a3Ji)2 . (4.21)
dbj, *.z bJt
3. Находим (обучаем) выходные веса:
ае^П) = 4* - NETk(й/°)) OR , (4.22)
dW(R,Ck) u ” R
Wk(n + /) = W“(n)- y"„tl de^°) . (4.23)
r ^‘dW(RCk)
4. и = n + 1 и переходим на следующую итерацию.
Градиентный метод является первым предложенным алгорит-
мом обучения, он простой в реализации, но имеет такие недос-
татки:
а) медленно сходится;
б) находит только локальный экстремум.
4.5.2. Метод сопряженных градиентов
для системы NEFClass
Алгоритм сопряженных градиентов, как и более общий алго-
ритм сопряженных направлений, получил применение в области
оптимизации благодаря широкому классу проблем, для которых
он обеспечивает сходимость к оптимальному решению за конеч-
ное число шагов [45].
Сопряженные направления. Название происходит от использо-
вания сопряженных векторов. В векторном пространстве размер-
ности А множество векторов {Р;,Р,,..., Ро} образует множество со-
пряженных направлений относительно матрицы А, если
RAPj =0 для j * I , (4.24)
где А — положительно определенная матрица размером N х N .
Векторы, которые удовлетворяют (4.24), называют /-сопря-
женными.
179
Нечёткие модели и методы в интеллектуальных системах
В ^-мерном пространстве есть ровно N - I независимых век-
торов, которые образуют Л-сопряженную пару с вектором р,.
Таким образом, нам будет нужно только конечное число на-
правлений, чтобы найти оптимальное решение.
Алгоритм сопряженных направлений систематически конст-
руирует множество Л-сопряженных векторов. Через максимум N
шагов алгоритм найдет оптимальное направление и сходимость
будет обеспечена.
В рассматриваемой задаче обучения нейронной сети, мы не
имеем явного выражения для матрицы Л, хотя градиент ошибки
VE может выполнять эту роль.
Дадим краткое описание алгоритма сопряженных градиентов
[45].
0. Предположим, что К = /. Инициализировать весовой век-
тор W и вычислить градиент G = grad E(W). Положим вектор
G
начального направления р „ = - т,—„.
к н
1. Найти скаляр а’, который минимизирует Е(рК + ар), для
чего можно использовать метод Фибоначчи или «золотого сече-
ния»:
W(K + /) = W(k) + ap(K) . (4.25)
2. Если е(и/(а' + /)) < Еприп, где £„/ла1 — допустимая точность
достижения минимума, то СТОП. Иначе — вычислить новое на-
правление:
G(k + /) = gradE(w(k + /)). (4.26)
3. Если modK = 0, то новый вектор направления:
иначе р :
180
Глааа 4. Нечеткие нейронные сети в задачах классификации
и вычислить новый вектор направления
- G(k + 1) +/Зр(к)
м ||-с(л + /)+мМГ
(4 29)
4. Заменить р(к) на р{к + 1) и G(k) на G(k +1). Переходим на
шаг 1 следующей итерации.
В данном алгоритме, G(k) рассчитывается для двух парамет-
ров (а и b) последовательно и отдельно, как приведено в гради-
ентном алгоритме. Скорость обучения для этих двух параметров
настраивается также отдельно.
4.5.3. Генетический метод обучения
для системы NEFClass
Этот алгоритм является алгоритмом глобальной опти-
мизации. В нем используются следующие механизмы [45]:
а) скрещивание родительских пар, генерация потомков;
б) мутация (действие случайных влияний);
в) естественный отбор лучших (селекция).
Цель обучения — минимизация среднеквадратической ошибки.
м
E<w>=if I ('* -NET« . <4-30)
где M — количество классов; 4 — желаемый класс; NET^W) —
результат классификации;
%], W. = || wJ ||, Wo = || wu° ||
— веса, причем w,’ это терм.
Любая особь представляется соответствующим вектором весов
И<
Задается начальная популяция из N особей [W/O),.. .W/O).
IVк (0)].
Вычисляем индекс пригодности (FI) и оцениваем качество
прогнозирования:
FlfWJ = С- E(Wt )-> max, (4.31)
где С — константа.
181
Нечёткие модели и методы в интеллектуальных системах
Дальше происходит скрещивание родительских пар. При вы-
боре родителей используется вероятностный механизм. Обозна-
чим Р, — вероятность выбора z-го родителя:
(4.32)
Потом осуществляется скрещивание выбранных пар.
Можно применять разные механизмы скрещивания. Напри-
мер, для первого потомка берутся четные компоненты из вектора
первого родителя, а нечетные компоненты из вектора второго
родителя, а для второго наоборот:
W,(0) Ф Wk(0) = W/l) + Wk(l) , (4.33)
О) =
wIJ(0), если j = 2m;
wkj(0), если j = 2m- 1,
4/1) =
wkj(0), если j = 2m;
wtJ(0), если j = 2m- 1,
(4.34)
где W, = , m = R/2.
Берется -у родительских пар и генерируются N потомков.
После того как сгенерированы потомки, на популяцию дейст-
вует мутация:
wij(n) = wij(n) + i(n),
(435)
где a = const е [-!;+!];
$(ri) = ae~an,
где a — показатель угасания мутации; a — выбирается случайно
из интервала [-1, 1].
Дальше, после действия мутации происходит селекция из по-
пуляции, которая позволяет выбрать наиболее «приспособлен-
ные» особи. Можно использовать разные механизмы селекции.
182
Глава 4. Нечеткие нейронные сети в задачах классификации
1. Полная замена старой популяции на новую.
2. Выбор N лучших из всех существующих особей +
+ = 2N по критерию максимума, max(f7).
После выполнения скрещивания, мутации и селекции теку-
щая итерация заканчивается. Итерации повторяются до тех пор,
пока не будет выполняться один из критериев останова.
4.5.4. Эксперименты по распознаванию объектов
на реальных данных
Для выбора и обработки данных электрооптических
изображений используется система ENVI и возможность системы
картографировать, то есть совмещать изображения по контроль-
ным точкам, которые получены из разных спектральных камер
[9]. Это позволяет получить мультиспектральные изображения.
На рис. 4.8 приведены данные по картографированию.
Рис. 4.8. Исходные данные
183
Нечёткие модели и методы в интеллектуальных системах
После выбора 15 контрольных точек на изображениях из раз-
ных спектров (эта функция не автоматизирована) изображения
совмещаются и мы получаем так называемый мультиспектраль-
ный куб. Результат приведен на рис. 4.9.
Рис. 4.9. Мультиспектральные изображения
Было определено девять типов разных поверхностей, которые
необходимо классифицировать.
Для определения характеристик, использовались так назы-
ваемые ROI (Region of Interest). На изображении определялась
однородная область, например, песок, вода, пена, цель красного
цвета, цель белого цвета и так далее. Результат такого выделения
можно наблюдать на рис. 4.10.
Дальше, используя систему обработки, получают среднее зна-
чение выбранного региона и дисперсию. Данные, полученные
таким образом, были сведены в таблицу данных.
184
Глава 4. Нечеткие нейронные сети в задачах классификации
Рис. 4.10. Изображение из ROI
Эти данные характеризуют девять классов областей поверх-
ности [41]:
— белая цель;
— красная цель;
— зеленая цель;
— синяя цель;
— желтая цель;
— пена;
— вода;
— сухой песок;
— мокрый песок.
Для классификации объектов используется ННС NEFClass.
Эти виды поверхностей отвечают девяти выходным узлам в сис-
теме NEFClass.
Общее количество признаков, которые используются для
классификации видов поверхностей составляет четыре, а именно:
— яркость в красном спектре (КС);
185
Нечёткие модели и методы в интеллектуальных системах
— яркость в голубом спектре (ГС);
— яркость в зеленом спектре (ЗС);
— яркость в инфракрасном спектре (ИС).
Общее количество данных составляет 99, по 11 на каждый
класс.
Приведем основные статистические характеристики для на-
бора данных полученных с помощью мультиспектральной систе-
мы «Mantis» (табл. 4.1 и табл. 4.2).
ТАБЛИЦА 4.1.
Статистические характеристики для данных системы «Mantis»
Признаки Минимум Макси- мум Среднее Стандартное отклонение Корреляция между признаками и классом
Яркость в КС 28.81 255.00 165.40 76.14 -0.46
Яркость в ГС 72.93 255.00 165.43 68.62 -0.32
Яркость в ЗС 44.34 254.89 121.57 57.64 -0.52
Яркость в ИС 17.03 255.00 140.84 81.58 -0.49
ТАБЛИЦА 4.2.
Корреляция между признаками
Яркость в КС Яркость в БС Яркость в ЗС Яркость в ИС
Яркость в КС Яркость в ГС Яркость в ЗС Яркость в ИС 1 0,7 1 0,58 0,77 1 0,95 0,7 0,59 1
Для исследования эффективности различных алгоритмов обу-
чения системы NEFClass в задаче распознавания электрооптиче-
ских изображений была разработана программа NEFClass BGCGG
(Basic Gradient Conjugate Gradient Genetic).
Далее работаем с программой моделирования NEFClass—
BGCGG. Согласно основному принципу исследования моделей
эксперименты проводились, изменяя последовательно только
один параметр. Из имеющихся 99 образцов загружаем 54 в ка-
честве обучающей выборки. Другие 45 образцов будут использо-
ваны для тестирования.
Устанавливаем значение основных параметров алгоритма мо-
делирования в исходное положение (см. табл. 4.3):
186
Глааа 4. Нечеткие нейронные сети в задачах классификации
ТАБЛИЦА 4.3.
Значение параметров для работы программы
Параметр Значение
Алгоритм генерации правил Алгоритм обучения Количество генерирующих правил Функция агрегации Обучение взвешенных коэффициентов между слоем правил и выходным слоем Количество термов для каждого признака Ограничение пересечения нечетких множеств Скорость обучения для взвешенных коэффици- ентов между признаками и правилами Скорость обучения для взвешенных коэффици- ентов между правилами и выходным слоем Максимальное количество эпох лучший для класса классический максимальное взвешенная сумма свободное 5 для всех 1 о, = 0,1 Оь = 0,1 <тс = 0,1 а = 0,1 50
Во время процесса обучение было сгенерировано 15 правил,
приведенных в табл. 4.4
База правил нечеткого классификатора.
ТАБЛИЦА 4 4
№ правила № ФП для признака 1 № ФП для признака 2 Ns ФП для признака 3 Ns ФП для признака 4 Ns Класс
1 4 4 4 4 0
2 4 0 1 4 1
3 4 0 0 4 1
4 4 1 0 4 1
5 2 3 1 1 2
6 1 0 1 0 3
7 4 4 1 4 4
8 3 4 3 3 5
9 3 3 2 3 5
10 4 4 3 3 5
11 0 0 0 0 6
12 3 2 1 2 7
13 1 0 0 1 8
14 1 1 0 1 8
15 1 0 0 0 8
187
Нечёткие модели и методы в интеллектуальных системах
Исследуем зависимость качества обучения от количества пра-
вил, которые генерируются на первом этапе. В качестве проверки
будем проводить тестирование на проверочной выборке. Для это-
го зададим количество правил, начиная от 9 до 14. Результат
приведем в табл. 4.5.
ТАБЛИЦА 4.5.
Зависимость качества обучения от количества правил
Количество правил СКО ОК %
9 13.071009 24
10 9.545608 15
11 9.910701 15
12 9.705482 15
13 4.769655 4
14 4.739224 4
15 4.751657 4
Результат закономерен, чем больше правил, тем лучший ре-
зультат тестовой классификации, то есть в правилах сохраняется
информация о каждом классе.
Исследуем влияние количества термов в признаках на качест-
во обучения. Сравнительная таблица приведена ниже (см.
табл. 4.6)
ТАБЛИЦА 4.6.
Зависимость качества обучения от количества термов
Количество термов СКО ОК %
4 5.928639 4
5 4.626252 4
6 4.957257 4
7 5.228448 4
8 5.633563 4
9 6.797175 4
10 7.897521 7
Очень интересный результат мы получили во время серии
опытов. Из табл. 4.6 видно, что существует оптимальное количе-
ство термов, которые могут быть использованы для описания на-
бора данных во время обучения. При увеличении количества
188
Глава 4. Нечеткие нейронные сети в задачах классификации
термов растет количество ошибочно классифицированных образ-
цов, то есть, при увеличении сложности модели увеличивается
ошибка. Такая же ситуация наблюдается и в методе группового
учета аргументов.
Проведем обучение системы классическим алгоритмом с оп-
тимальным количеством термов в признаках. Результаты функ-
ции принадлежности для каждого признака приведены на рис. 4.11.
Рис. 4.11. Результат обучения классическим алгоритмом
Итоговая сумма квадратов ошибок составила 2,852081, коли-
чество ошибочных классификаций равно нулю на обучающей
выборке, на тестовой, как мы уже видели, доля ошибочных клас-
сификаций составила 4%, СКО равняется 4,626252, что является
хорошим результатом.
Проведем эксперименты для градиентного алгоритма. Полу-
ченные результаты приведены на рис. 4.12 (настроенные ФП не-
четких множеств для каждого из четырех признаков).
Ошибка в конце обучения составила 2.042015, что немножко
лучше классического метода. При тестировании СКО составила
3.786005, а доля ошибочной классификации составила 4%.
189
Нечёткие модели и методы в интеллектуальных системах
Рис. 4.12. Результаты обучения градиентным методом
Включим автоматическую настройку скорости адаптации па-
раметров ФП, то есть, воспользуемся алгоритмом «золотого се-
чения». Результаты приведем ниже (рис. 4.13).
Рис. 4.13. Результат работы градиентного алгоритма в тандеме
с «золотым сечением»
190
Глава 4. Нечеткие нейронные сети в задачах классификации
Проведем такие же эксперименты с алгоритмом сопряженных
градиентов. Результаты приведены на рис. 4.14 [41].
Рис. 4.14. Результат обучения методом сопряженного градиента
Применим метод золотого сечения. Полученные результаты
наблюдаем на рис. 4.15.
Рис. 4.15. Результат обучения методом сопряженного градиента
и «золотого сечения»
191
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 4.7
Сравнительная таблица для разных алгоритмов обучения весов связей
Алгоритм обучения взвешенных коэффициентов Обучение Тестирование
СКО ОК % СКО ОК %
Классический 6,650668 0 7,285827 4
Градиентный 5,9893 0 6,829068 4
Сопряженного градиента 1,132871 0 3,314763 4
Генетический с треугольной ФП 11,110936 0 13,677424 4
Генетический с гауссовской ФП 3,204446 0 4,568338 4
И в самом конце, проведем эксперимент с генетическим ал-
горитмом с разными ФП — треугольной и гауссовской.
Результаты обучения разными алгоритмами приведены на
сравнительном графике (рис. 4.16) и в табл. 4.7. Кстати, для обу-
чающей выборки для всех алгоритмов были получены отличные
результаты по критерию процент ошибочной классификации.
Рис. 4.16. Сравнительный график скорости сходимости
к оптимальной классификации различных алгоритмов обучения
192
Глава 4. Нечеткие нейронные сети в задачах классификации
Для всех алгоритмов этот показатель равнялся нулю. Однако,
во время тестирования на проверочной выборке результаты были
хуже: как минимум два образца ошибочно классифицировались.
Также росла сумма квадратов ошибок для всех, без исключения,
алгоритмов обучения. Для удобства сравнение количества итера-
ций было ограничено до 50.
Как видим, результаты вполне удовлетворительны, уровень
правильной классификации на проверочной части выборки со-
ставляет 96%. Эти результаты можно было бы улучшить, сфор-
мировав более представительную выборку.
На трафиках (рис. 4.16) хорошо видно, что наилучшим мето-
дом по скорости сходимости является метод сопряженных гради-
ентов. Дальше идет генетический с гауссовской функцией при-
надлежности. Менее эффективный — классический метод. И в
самом конце наименее эффективный — генетический метод с
треугольной функцией принадлежности.
Однако, критерий, по которому построен график, неодно-
значно отображает качество классификации. Важным критерием
оценки методов является минимальное количество ошибочно
классифицированных образцов. Из табл. 4.6 видно, что все алго-
ритмы дали одни и те же результаты относительно данного кри-
терия. Следовательно, мы удостоверились, что все алгоритмы ра-
ботают адекватно и дают в итоге почти одинаковые результаты.
ВЫВОДЫ К РАЗДЕЛУ 4
1. В главе описана ННС для классификации
NEFClass. Проанализированные её достоинства и недостатки.
Предложена модифицированная система NEFClass-M, которая
отличается рандомизацией исходной выборки, настройкой пара-
метра — скорость обучения и использованием Гауссовских ФП
вместо треугольных, что позволило реализовать градиентный ал-
горитм обучения.
2. Проведенные сравнительные экспериментальные исследо-
вания ННС NEFClass и NEFClass-M продемонстрировали пре-
имущества последней по качеству классификации (% правильной
классификации).
3. Проведены исследования ННС NEFClass в задаче класси-
фикации объектов электрооптических изображений, которые по-
зволили сделать следующие выводы:
193
Нечёткие модели и методы в интеллектуальных системах
— На тестовых данных было исследовано влияние различных
параметров на систему. В результате установлено, что качество
обучения системы NEFClass зависит от скорости обучения. Мы
увеличили параметры скорости обучения для весовых коэффици-
ентов, которые лежат между признаками и правилами, и значи-
тельно ближе приблизились к минимальной точке функции
ошибки. Но во время эксперимента было замечено, что задавать
большую скорость не целесообразно, так как возникает явление
«осцилляции».
— Наилучший алгоритм для генерации правил — «Лучшие
для класса». Но, к сожалению это не уменьшает количество не-
правильно классифицированных образцов. Результаты моделиро-
вания показывают, что возможность установления взвешенных
коэффициентов для правил слабо влияет на результат.
— Проведя эксперименты на реальных данных, мы удостове-
рились в адекватности применения нейронечеткого подхода к
классификации объектов на электрооптических изображениях.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ
К ГЛАВЕ 4
1. Приведите структуру ННС для классификации
NEFClass.
2. Запишите основные алгоритмы генерации базы правил в
ННС NEFClass. В чем их отличия.
3. Запишите алгоритм обучения ФП нечетких множеств в
ННС NEFClass.
4. Укажите основные достоинства и недостатки базовой ННС
для классификации NEFClass.
5. Укажите отличия модифицированной системы NEFClass от
базовой.
6. Укажите особенности применения ННС NEFClass в зада-
чах классификации объектов в экономике.
7. Укажите особенности применения ННС NEFClass в задаче
распознавания объектов электрооптических изображений.
194
ГЛАВА
Нечеткие нейронные сети
и системы с нечеткой логикой
в задачах кластерного анализа
ВВЕДЕНИЕ
Термин кластерный анализ (впервые ввел Tryon, 1939)
в действительности включает в себя набор различных алгоритмов
классификации без учителя [26]. Общий вопрос, задаваемый ис-
следователями во многих областях, состоит в том, как организо-
вать наблюдаемые данные в наглядные структуры, т.е. развернуть
таксономию. Например, биологи ставят цель разбить животных
на различные виды, чтобы содержательно описать различия меж-
ду ними. В соответствии с современной системой, принятой в
биологии, человек принадлежит к приматам, млекопитающим,
амниотам, позвоночным и животным. Заметим, что в этой клас-
сификации, чем выше уровень агрегации, тем меньше сходства
между членами в соответствующем классе. Человек имеет больше
сходства с другими приматами (т.е. с обезьянами), чем с “отда-
ленными” членами семейства млекопитающих (например, соба-
ками) и т. д.
Области применения. Техника кластеризации применяется в
самых разнообразных областях. Хартиган (Hartigan, 1975) дал
прекрасный обзор многих опубликованных исследований, содер-
жащих результаты, полученные методами кластерного анализа.
Например, в области медицины кластеризация заболеваний, ле-
чения заболеваний или симптомов заболеваний приводит к ши-
роко используемым таксономиям. В области психиатрии пра-
вильная диагностика кластеров симптомов, таких как паранойя,
шизофрения и т. д., является решающей для успешной терапии.
В археологии с помощью кластерного анализа исследователи пы-
таются установить таксономии каменных орудий, похоронных
объектов и т. д. Известны широкие применения кластерного ана-
195
Нечёткие модели и методы в интеллектуальных системах
лиза в маркетинговых исследованиях. В обшем, всякий раз, когда
необходимо классифицировать “горы” информации на пригод-
ные для дальнейшей обработки группы, кластерный анализ ока-
зывается весьма полезным и эффективным. В последние годы
кластерный анализ широко используется в интеллектуальном
анализе данных и Data Mining, как один из важнейших методов
[25].
Целью данной главы является рассмотрение методов нечетко-
го кластерного анализа, а именно нечеткого метода Л'-средних,
метода Густавссона—Кесселя, а также методов определения на-
чального положения центров кластеров — пикового и разностно-
го группирования.
Приводятся многочисленные результаты экспериментальных
исследований методов нечеткого кластер-анализа на тестовых
примерах и в практических задачах автоматической классифика-
ции в экономике.
5.1. КЛАСТЕР-АНАЛИЗ. ПОСТАНОВКА ЗАДАЧИ.
КРИТЕРИИ КАЧЕСТВА
И МЕТРИКИ КЛАСТЕР-АНАЛИЗА
Пусть задано множество наблюдений
Х = {Х1,Х2,...,Х„},
где
X, = (xj, j = 1JV .
Требуется разбить выборку к на непересекающиеся подмно-
жества — кластеры S},...,SK , так, чтобы обеспечить минимум
(экстремум) некоторого критерия (функционала качества), то
есть:
найти такие S = (5'|,5'2,...,5Л), что F(S) -> mjn(max).
Возможны различные виды критериев (функционалов) раз-
биения. Заметим, что эта задача тесно связана с определением
некоторой метрики в пространстве признаков.
Рассмотрим наиболее широко используемые функционалы
качества разбиения [45]:
196
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
1. Коэффициент разбиения F, который определяется следую-
щим образом:
(5.1)
/Г л w2
п
где Wy е [0;1]— некоторая степень принадлежности /-го объекта j-
му кластеру. Диапазон изменения F е — ;1
к
где п — число объ-
екгов, к — число кластеров.
2. Индекс четкости:
NFI =К? 1 , NFI е [0;1],
К — 1
(5.2)
где К — число классов (кластеров); F— коэффициент разбиения.
3. Энтропия разбиения:
Я = £f Яе(0;1пЛГ).
/-1 /-1 п
(5.3)
4. Нормализованная энтропия разбиения:
и In А-
п-К
Я1=-^, Я,е|0;
1- — <
п
где n — число точек.
5. Модифицированная энтропия:
п
п-К
6. Второй функционал Рубенса:
1 1 п
7^2 = — — 22 max Иу + min max Wj;
2 иЙ j J J
(5.4)
(5.5)
(5-6)
ij И2е
7. Третий функционал Рубенса (второй индекс четкости):
197
Нечёткие модели и методы в интеллектуальных системах
NF2I = Kf2 \ NF2I е (0;1). (5.7)
К — 1
Поскольку исходная информация задается в виде матрицы X,
то возникает проблема выбора метрики. Выбор метрики — наи-
более важный фактор, влияющий на результаты кластер-анализа.
В зависимости от типа признаков используются различные меры
близости (метрики).
Пусть имеются образцы X, И Хк в Л-мерном пространстве
признаков.
Основные метрики, используемые при кластеризации, приводят-
ся в таблице 5.1.
ТАБЛИЦА 5.1.
№ Наименование метрики Тип признаков Формула для оценки меры близости (метрики)
1 Эвклидово расстояние Количественные —l£J 1 * у и
2 Мера сходства Хэмминга Номинальные (качественные) Н nik
где nik — число совпадающих приз- наков у образцов X, и Хк
3 Мера сходства Роджерса- Танимото Номинальные шкалы +п* - «<*) гдеЛ,к — число совпадающих еди-
ничных признаков у образцов X, и Хк;
П-, И Пк — общее число единичных признаков у образцов А) и Хк соот- ветственно
4 Манхэттен- ская метрика Количественные 41’ = Е|\ -
198
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Окончание табл. 5.1.
Наименование метрики Тип признаков Формула для оценки меры близости (метрики)
Расстояние Махалонобиса Расстояние Журавлева Количественные Смешанные W — ковариационная матрица вы- борки ^ = (Х„Х2, N dik = 7-1 где _ fl, если - xj < £ ilc ~ 0, иначе
Существует большое число алгоритмов кластеризации, кото-
рые используют различные метрики и критерии разбиения. При
этом число классов (кластеров) либо задается априори, либо оп-
ределяется в процессе работы самого алгоритма.
5.2. ННС С САМООРГАНИЗАЦИЕЙ.
НЕЧЕТКИЙ МЕТОД К-СРЕДНИХ
5.2.1. ННС с самоорганизацией
Рассмотрим нейронную сеть с самоорганизацией, где
обучение проводится без учителя.
Алгоритм самоорганизации относит веккгор х к соответст-
вующиму кластеру данных, которые предъявляются центром С(,
используя соревновательное обучение.
Базовая форма алгоритма самоорганизации позволяет точно
найти положение центров Ct соответствующих групп данных
(кластеров), на которые разбивается выходное многомерное про-
странство. Эти центры далее могут использоваться в гибридном
алгоритме обучения ННС в качестве начальных значений, что
значительно ускоряет процесс обучения и гарантирует сходи-
мость к глобальному минимуму.
199
Нечёткие модели и методы в интеллектуальных системах
5.2.2. Алгоритм нечёткой самоорганизации
К-средних
Допустим, что в сети существует К нечетких нейронов
с центрами в точках с, (/= 1, 2, К). Начальные значения этих
центров могут быть выбраны случайным образом из областей до-
пустимых значений соответствующих компонентов векторов х7
(J = 1, 2, р), использованных для обучения. Пусть функция
фаззификации задана в форме обобщенной функции Гаусса, вы-
раженной формулой (3.42).
Подаваемый на вход сети вектор х будет принадлежать к
различным группам, представляемым центрами с,, со степенью
, причем 0 < < 1, а суммарная степень принадлежности ко
всем группам, очевидно, равна 1. Поэтому
х
Е^=1 (5.8)
/=1
для j = 1, 2, .... р. Функцию погрешности, соответствующую та-
кому представлению, можно определить как сумму частных по-
грешностей принадлежности к центрам с, с учетом степени при-
надлежности md. Следовательно,
*=££<#.-*> Г <з-9>
Ы 7=1
где т — это весовой коэффициент, который принимает значения
из интервала (1,°о). Цель обучения с самоорганизацией состоит в
таком подборе центров с,, чтобы для заданного множества обу-
чающих векторов — обеспечить достижение минимума функ-
ции (5.9) при одновременном соблюдении условий ограничения
(5.8). Таким образом возникает задача минимизации нелинейной
функции (5.9) с р ограничениями типа (5.8). Решение этой зада-
чи можно свести к минимизации функции Лагранжа, определен-
ной в виде [45].
200
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
К N 1 р ( К >
-х, +1Л
i=l ,-1 7-1 \»=1 J
(5.10)
где Xj(j= 1,2, ..., р) — это множители Лагранжа. В 174] доказано,
что решение задачи (5.10) можно представить в виде
£ “”xj
С,^р-------- , (5.11)
(5.12)
где — это эвклидово расстояние между центром с,, и векто-
ром , dy = ||с, - ху||. Поскольку точные значения центров с,, в
начале процесса не известны, алгоритм обучения должен быть
итерационным. Он может быть сформулирован в следующем ви-
де:
1. Выполнить случайную инициализацию коэффициентов иу,
выбирая их значения из интервала [0, 1] таким образом, чтобы
соблюдалось условие (5.8).
2. Определить К центров с,, в соответствии с (5.11).
3. Рассчитать значение функции погрешности согласно выра-
жению (5.9). Если ее значение окажется ниже установленного
порога либо если уменьшение этой погрешности относительно
предыдущей итерации пренебрежимо мало, то завершить вычис-
ления. Последние значения центров составляют искомое реше-
ние. В противном случае перейти к п. 4.
4. Рассчитать новые значения us по формуле (5.12) и перейти
к п. 2.
Такую процедуру нечеткой самоорганизации будем называть
алгоритмом C-means (К средних).
Многократное повторение итерационной процедуры ведет к
достижению минимума функции Е, который необязательно будет
201
Нечёткие модели и методы в интеллектуальных системах
глобальным минимумом. Качество находимых центров, оцени-
ваемое значением функции погрешности Е, существенным обра-
зом зависит от предварительного подбора как значений иу, так и
центров с,. Наилучшим может быть признано такое размещение
центров, при котором они располагаются в областях, содержащих
наибольшее количество предъявленных векторов ху. При таком
подборе центров они будут представлять векторы данных ху с
наименьшей суммарной погрешностью.
Поэтому начало итерационной процедуры расчета оптималь-
ных значений центров должно предваряться процедурой их ини-
циализации. К наиболее известным алгоритмам инициализации
относятся алгоритмы пикового группирования и разностного
группирования данных.
5.3. ОПРЕДЕЛЕНИЕ НАЧАЛЬНОГО РАЗМЕЩЕНИЯ
ЦЕНТРОВ КЛАСТЕРОВ. МЕТОДЫ ПИКОВОГО
И РАЗНОСТНОГО ГРУППИРОВАНИЯ
5.3.1. Алгоритм пикового группирования
Алгоритм пикового группирования был предложен
Егером и Филёвым [74].
При использовании N входных векторов строится сетка, ко-
торая равномерно покрывает пространство этих векторов. Узлы
этой сетки рассматриваются как потенциальные вектора 9, для
каждого из которых рассчитывается пиковая функция:
р
т(9) = £ехр
/=1
I’
(5.13)
где о — это некоторая константа, которая подбирается отдельно
для каждой конкретной задачи.
Величина т(9) рассматривается как оценка высоты пиковой
функции. Она пропорциональна количеству векторов ху, кото-
рые попадают в окрестность потенциального центра 9. Большое
значение т(9) свидетельствует о том, что центр 9 размещается в
202
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
области, в которой сосредоточено наибольшее количество векто-
ров {xj.
Коэффициент о влияет на конечные пропорции между т(9)
и 9 незначительно.
После расчета значений т(9) для всех потенциальных цен-
тров отбирается первый центр с,, который имеет наибольшее
значение т(9). Для выбора следующих центров необходимо ис-
ключить с, и узлы, которые размещены в непосредственной бли-
зости к с,.
Это можно сделать путём переопределения пиковой функции
за счет отделения от нее функции Гаусса с центром в точке с,.
Обозначив эту новую функцию через тпп,{9), получаем:
w„ew(S) = т(9)-т(с1)ехр
2ст2
(5.14)
Отметим что эта функция имеет нуль в точке с,.
Потом эта же процедура повторяется со следующим центром
с2 ит. и.
Процесс нахождения следующих центров с2, с3... реализуется
последовательно на модифицированных значениях т„ек(9), ко-
торые получаются при исключении ближайших соседей центра,
который был найден на предыдущем этапе. Он заканчивается в
момент локализации всех центров.
Метод пикового группирования эффективный при не очень
большой размерности вектора X. Иначе количество потенциаль-
ных центров возрастает лавинообразно.
5.3.2. Алгоритм разностного группирования
Алгоритм разностного группирования — это модифи-
кация предыдущего алгоритма, в котором векторы рассматри-
ваются как потенциальные центры 9. Пиковая функция D(x,) в
этом случае задается в виде:
203
Нечёткие модели и методы в интеллектуальных системах
D(x,) = £ехр
7=1
где значение коэффициента ru определяет сферу соседства. На
значение £)(х,) значительным образом влияют только х;, кото-
рые находятся в границах этой сферы.
При большой плотности точек около х, значение функции
D(x,) большое. После расчета значений пиковой функции для
каждой точки х,, отбирается вектор х, для которого мера плот-
ности £>(х) окажется наибольшей. Именно эта точка становится
первым центром с,.
Выбор следующего центра сг возможен после исключения
предыдущего центра и всех точек, которые лежат в его окрест-
ности.
Так же как и в предыдущем случае пиковая функция переоп-
ределяется так
DntM = D(xt) - D(Ci) exp
При новом определении функции D коэффициенты гь обо-
значают новые значения константы, которая задает сферу сосед-
ства следующего центра. Обычно придерживаются условия
rb^ra.
После модификации значения пиковой функции происходит
поиск новой точки х, для которой Z>ne„(x) -> max. Она становит-
ся новым центром.
Процесс нахождения следующего центра возобновляется по-
сле исключения всех компонент, которые отвечают уже отобран-
ным точкам. Инициализация заканчивается в момент фиксации
всех центров, которые предусмотрены начальными условиями.
204
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
5.4. АЛГОРИТМ НЕЧЕТКОГО КЛАСТЕР-АНАЛИЗА
ГУСТАВСОНА-КЕССЕЛЯ
В классическом алгоритме «-средних (c-means) эле-
менты выбираются с помощью обычного евклидового расстояния
между вектором х и центром кластера с:
d(x, с) = ||х - с|| = J(x - с)т (х - с).
При таком задании расстояния между двумя векторами мно-
жество точек, равноудаленных от центра, принимает вид сферы с
одинаковым масштабом по всем осям. Но если данные образуют
группы, форма которых отличается от сферической, или если
шкалы отдельных координат вектора сильно отличаются, в этом
случае такая метрика становится неадекватной. В этом случае
качество кластеризации можно значительно повысить за счет
улучшеной версии алгорима самоорганизации, который называ-
ется алгоритмом Густавсона-Кесселя [45; 74).
Основные изменения относительно базового алгоритма к-
средних состоят во введении в формулу расчета метрики масшта-
бирующей матрицы А. При таком масштабировании расстояние
между центром с и векторами х определяется формулой:
d(x,с) = ||х - с|| = д/(х - с)т А(х - с) .
В качестве масштабирующей обычно используется положи-
тельноопределенная матрица, то есть матрица, у которой все соб-
ственные числа действительные и положительные.
Аналогично базовому алгоритму «-средних цель обучения с
использованием алгоритма Густавсона-Кесселя состоит в таком
размещении центров, при котором минимизируется критерий:
£ = ZS^2(^,c,.). (5.15)
Описание алгоритма Густавсона-Кесселя:
1. Провести начальное размещение центров в пространстве дан-
ных. Создать элементарную форму масштабирующей матрицы А.
2. Сформировать матрицу коефициентов принадлежностей
всех векторов х к центрам с по формуле:
(5.16)
205
Нечёткие модели и методы в интеллектуальных системах
3. Рассчитать новое размещение центров в соответствии с
формулой:
----- (517)
IX
у-1
4. Сгенерировать для каждого вектора матрицу ковариаций:
$,=Х“^-с,)<ху-сУ • (5.18)
5. Рассчитать новую масштабную матрицу для каждого /-го
центра по формуле:
А, = Vdet(5,) V1. (5.19)
6. Если последние изменения положений центров и матрицы
ковариации достаточно малые по отношению к предыдущим
значениям и не превышают заданной величины, то о завершить
итерационный процесс.
5.5. ПРИМЕНЕНИЕ НЕЧЕТКИХ МЕТОДОВ
К-СРЕДНИХ И ГУСТАВСОНА-КЕССЕЛЯ
В ЗАДАЧАХ АВТОМАТИЧЕСКОЙ
КЛАССИФИКАЦИИ
Рассмотрим применение нечетких методов кластерно-
го анализа А’-средних и Густавсона-Кесселя в тестовых и практи-
ческих задачах автоматической классификации.
Входные данные: выборка точек, число кластеров.
Выходные данные: матрица принадлежности U, центры кла-
стеров.
Пример 5.1. Исходная выборка точек приводится на рис. 5.1.
Центры кластеров находим с помощью методов:
а) пиковое группирование;
б) разностное группирование.
Далее, для нахождения кластеров используем метод Густавсо-
на-Кесселя.
Размещение кластеров для данного примера приводится на
рис. 5.1
206
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
2. Для случая двух кластеров при прежней выборке данных
результаты кластеризации приводятся ниже (см. рис. 5.2)
Рис. 5.2.
207
Нечёткие модели и методы в интеллектуальных системах
Пример 5.2.
Пусть исходное множество точек задается на рис. 5.3.
Рассмотрим сначала случай для двух кластеров. Соответст-
вующие результаты представлены на рис. 5.3.
208
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Пример 5.3. Кластеризация регионов Украины по данным Гос-
комстата за январь—март 2005 года.
Исходные данные приводятся в таблице 5.2.
ТАБЛИЦА 5.2.
Темпы роста промышленного производства Темпы роста сельского хозяйства Темпы роста стро- ительства Темпы роста розничной торговли
Автономная Респуб-
лика Крим 118,6 110,5 81.2 127,5
Винницкая 108,5 101,9 100,1 116,8
Волынская 117,2 105,7 83.1 117,9
Днепропетровская 112,3 117,1 126,9 115,4
Донецкая 94 4 113,3 115,9 120,2
Житомирская 114,8 109,5 86.7 113,6
Закарпатская 113,2 98 9 72 9 118,0
Запорожская 112,8 114,1 106,2 132,2
209
Нечёткие модели и методы в интеллектуальных системах
Окончание табл 5.2.
Темпы роста промышленного производства Темпы роста сельского хозяйства Темпы роста стро- ительства Темпы роста розничной торговли
И вано-Франковская 106,2 96.4 91.5 120,7
Киевская 115,9 110,4 106,8 104,5
Кировоградская 115,1 82.3 118,9 120,3
Луганская 100,0 98.2 111,5 142,9
Львовская 101,3 100,1 102,7 114,4
Николаевская 110,9 101,6 106,5 120,1
Одесская 103,9 102,9 153,6 116,1
Полтавская 101,4 103,4 115,5 106,5
Ровенская 116,2 102,3 102,6 118,2
Сумская 117,4 100,7 90.5 115,1
Тернопольская 85.3 98 1 93.8 120,3
Харьковская 113,4 101,3 82.1 122,6
Херсонская 138,0 118,3 157,7 115,1
Хмельницкая 133,2 94.5 78.3 112,6
Черкасская 112,4 112,5 94.5 110,5
Черновецкая 94 98.4 114,8 115,2
Черниговская 109,6 103,3 115,7 108,6
г. Киев 117,2 100 310 119,7
г. Севастополь 107,3 100 107,7 128,7
ТАБЛИЦА 5.3.
Результаты кластеризации.
Автономная Республика Крим 0.980 0.018 0.001 0.000
Винницкая 0.000 0.996 0.002 0.001
Волынская 0000 0.318 0.678 0.004
Днепропетровская 0.000 0.009 0.001 0.990
Донецкая 0.000 0.037 0.942 0.020
Житомирская 0.000 0.050 0.946 0.003
Закарпатская 0.576 0.419 0.003 0.002
Запорожская 0.988 0.010 0.000 0.001
И вано-Франковская 0.795 0.199 0003 0.003
Киевская 0.000 0.142 0.812 0.046
Кировоградская 0.000 0.005 0.005 0.990
Луганская 0.000 0.991 0.007 0.002
Львовская 0 000 0.991 0.001 0.008
Николаевская 0 000 0.986 0.013 0.001
Одесская 0000 0.814 0 108 0.078
Полтавская 0.000 0.985 0.002 0.012
Ровенская 0.000 0.988 0.009 0.003
Сумская 0.000 0.937 0.057 0.006
210
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Окончание табл. 5.3.
Тернопольская 0.000 0.992 0.001 0.007
Харьковская 0.000 0.916 0.082 0.002
Херсонская 0 000 0 016 0.000 0.984
Хмельницкая 0.000 0 065 0.929 0.006
Черкасская 0.000 0.019 0 976 0.005
Черновецкая 0.000 0.617 0 002 0.381
Черниговская 0.000 0 975 ООН 0.014
г. Киев 0 000 0 103 0 002 0.895
г. Севастополь 0.000 0.993 0.006 0.001
Центры кластеров:
Первый 113,38 107,19 90,46 126,35
Второй 105,90 100,98 104,07 119,21
Третий 114,49 107,71 94,33 113,18
Четвертый 119,57 104,36 124,62 117,42
Из расположения центров кластеров можно сделать следую-
щие выводы:
1. В первом и третьем кластере находятся области с высокими
темпами роста производства и сельского хозяйства и низкими
темпами роста строительства. Различие между кластерами в тем-
пах роста розничной торговли (для АР Крыма, Закарпатской, За-
порожской и Ивано-Франковской областей (первый кластер) они
высокие, для Волынской, Донецкой, Житомирской, Киевской,
Хмельницкой, Черкасской (третий кластер) — ниже).
2. Во втором кластере находятся области с низкими темпами
роста (Винницкая, Луганская, Львовская, Николаевская, Одес-
ская, Полтавская, Ровенская, Сумская, Тернопольская, Харьков-
ская, Черновицкая, Черниговская, г. Севастополь).
3. Днепропетровская, Кировоградская, Херсонская области и
г. Киев находятся в четвертом кластере (высокие темпы роста).
Значение минимизируемого критерия ошибки: Е=4287.
Расстояние между центрами кластеров:
первый — второй 18,18588
второй — третий 15,82117
третий — четвертый 31,18478
первый — третий 13,78145
второй — четвертый 24,97599
первый — четвертый 35,95797
211
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА
212
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Как видим, наименьшее расстояние между первым и третим
кластерами: собственно различия только в значениях четвертого
параметра. Наибольшее — между первым и четвертым и между
третим и четвертым кластерами.
Пример 5.4. Кластеризация стран СНГ по данным Госкомста-
та за 2004 год.
Исходные данные приводятся в таблице 5.4.
Результаты кластеризации на К= 2 класса приводятся в сле-
дующей таблице.
ТАБЛИЦА 5 5
Азербайджан 1.000 0.000
Белорусь 0.001 0.999
Армения 0.108 0.892
Грузия 1.000 0.000
Казахстан 0.978 0.022
Кыргызстан 0.003 0.997
Молдова 0.100 0.900
Российская Федерация 0.008 0.992
Таджикистан 0.038 0.962
Украина 1.000 0.000
Центры кластеров:
109,97 107,68 104,9 126,88 113,44 107,15 112,63
108,85 108,65 108,21 109,96 117,30 110,09 113,81
Расстояние между центрами кластеров: 17,99.
Значение минимизируемого критерия: 908,06.
В первом кластере находятся страны с высокими темпами
роста ВВП -10%, высокими темпами роста инвестиций в основ-
ной капитал, высокими темпами роста производства промыш-
ленной продукции и вместе с тем с более низкими индексами
потребительских цен.
213
Нечёткие модели и методы в интеллектуальных системах
Пример 5.5. Классификация стран ООН
ТАБЛИЦА 5.6.
Данные Millennium Indicators ООН.
Процент населения за чертой бедности Процент де- тей до 5 лет с недостаточ- ным весом Г рамот- ность Гендерное равенство. Процент женщин среди работников несельско- хозяйственной сферы
Афганистан 70 48 50 17,8
Албания 25,4 14,3 99,4 40,3
Алжир 12,2 6 89,9 15,5
Ангола 70 30,5 71,4 26,4
Аргентина 15 5,4 98,6 47,6
Армения 53,7 2,6 99,8 47
Азербайджан 49,6 6,8 99,9 48,5
Бахрейн 15 8,7 97 13,4
Бангладеш 49,8 47,7 49,7 24,2
Белиз 40 6,2 84,2 44,4
Беларусь 41,9 2 99,8 55,9
Бутан 70 18,7 80 12
Бенин 33 22,9 55,5 46
Боливия 62,7 7,5 97,3 36,5
Босния Герцеговина 19,5 4,1 99,6 35,8
Ботсвана 70 12,5 89,1 47
Бразилия 17,4 5,7 96,3 46,7
Болгария 12,8 2 99,7 52,2
Бурунди 70 45,1 72,3 13,3
Буркина Фасо 45,3 34,3 19,4 15,2
Камбоджа 36,1 45,2 80,3 52,6
Камерун 40,2 21 81,1 20,7
Капо Верде 40 13,5 89,1 39,1
Центрально Афри-
канская Республика 70 24,3 58,5 30,4
Чад 64 28,1 37,3 5,5
Чили 17 0,7 99 37,3
Китай 4,6 10 98,9 39,5
Колумбия 64 6,7 97,2 48,8
Конго 50 13,9 97,8 26,1
Коста Рика 22 5,1 98,4 39,5
Кот д'Ивуар 59 21,2 59,8 20,2
Хорватия 20 0,6 99,6 46,3
Куба 60 4,1 99,8 37,7
Чехия 10 1 99,8 45,8
Демократическая
республика Конго 70 31,1 68,7 25,9
Джибути 45,1 18,2 73,2 25
Доминиканская
республика 28,6 5,3 94 34,9
214
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Продолжение табл. 5.6.
Процент населения за чертой бедности Процент детей до 5 лет с недостаточ- ным весом Грамот- ность Гендерное равенство Процент женщин среди работников несельско- хозяйственной сферы
Эквадор 35 11,6 96,4 41,1
Египет 16,7 8,6 73,2 21,6
Сальвадор 48,3 10,3 88,9 31,1
Экваториальная Гви- 50 18,6 92,7 10,5
нея
Эритрея 53 39,6 60,9 35
Эстония 8,9 1 99,8 51,5
Эфиопия 44,2 47,2 57,4 39,9
Фиджи 40 7,9 99,3 35,9
Габон 40 11,9 59 37,7
Гамбия 64 17 42,2 20,9
Г рузия 11,1 3,1 99,8 45,2
Гана 50 24,9 81,8 56,5
Гватемала 56,2 22,7 80,1 38,7
Гвинея 40 23,2 50 30,3
Гвинея-Биссау 48,7 25 44,1 10,8
Гайана 35 13,6 80 37,4
Гаити 45 17,3 66,2 39,5
Г ондурас 53 16,6 88,9 50,5
Венгрия 17,3 3 99,5 47,1
Индия 28,6 47 64,3 17,5
Индонезия 27,1 26,1 98 30,8
Иран 30 10,9 86,3 17,2
Ирак 35 15,9 41 11.9
Ямайка 18,7 3,6 94,5 48
Иордания 11,7 4,4 99,4 24,9
Казахстан 34,6 4,2 99,8 48,7
Лаос 38,6 40 78,5 42,1
Кения 52 20,2 95,8 38,5
КНДР 60 20,8 99,8 40,7
Кувейт 20 9,8 93,1 24,1
Киргизстан 64,1 11 99,7 44,1
Ливан 20 3 92,1 25,9
Лесото 50 17,9 87,2 24,7
Либерия 60 26,4 70,8 23,6
Ливия 30 4,7 97 15
Мадагаскар 71,3 33,1 70,1 24,2
Малави 65,3 21,9 63,2 12,5
Малайзия 40 12,4 97,2 38
Мальдивы 70 30,4 99,2 36,1
Мали 63,8 33,2 24,2 35,9
Мавритания 46,3 31,8 49,6 37
Мексика 30 1 7'5 96,6 37,4
215
Нечёткие модели и методы в интеллектуальных системах
Окончание табл. 5.6.
Процент населения за чертой бедности Процент детей до 5 лет с недостаточ- ным весом Грамот- ность Гендерное равенство. Процент женщин среди работников несельско- хозяйственной сферы
Мозамбик 69,4 23,7 62,8 11,4
Монголия 36,3 12,7 97,7 49,4
Марокко 19 8,9 69,5 26,2
Непал 42 48,3 70,1 11,8
Никарагуа 47,9 9,6 86,2 41,1
Нигер 63 39,6 25,6 8,6
Нигерия 34,1 28,7 88,6 34
Пакистан 32,6 38 53,9 8,7
Панама 37,3 6,8 96,1 44
Папуа Новая Гвинея 37,5 7 68,6 35,4
Парагвай 21,8 4,6 96,3 42
Перу 49 7,1 96,6 37,2
Филиппины 36,8 30,6 95,1 41,1
Польша 23,8 3 99,8 47,7
Молдова 23,3 3,2 98,7 54,6
Румыния 21,5 5,7 97,8 45,3
Российская Федерация 30,9 3 99,8 50,1
Руанда 51,2 27,2 76,5 14,6
Сенегал 33,4 22,7 51,5 25,7
Шри Ланка 25 29,4 97 43,2
Сербия и Черногория 30 1,9 99,8 44,9
Свазиленд 40 10,3 88,1 31,3
Таиланд 13,1 18,6 98 46,9
Тринидад и Тобаго 21 5 99,8 41,3
Турция 25 8,3 95,5 20,6
Туркменистан 30 12 99,8 20
Тунис 7,6 4 94,3 25,3
Уганда 44 22,8 80,2 35,6
Украина 31,7 3 99,9 53,6
Объединенные 20 14,4 91,4 14,4
Арабские Эмираты
Танзания 35,7 29,4 91,6 28,5
США 5 1,4 99,1 48,8
Узбекистан 27,5 7,9 99,7 41,5
Вьетнам 50,9 33,1 94,1 51,8
Йемен 41,8 45,6 67,9 6,1
Замбия 72,9 28,1 81,2 29,4
Зимбабве 34,9 13 97,6 21,8
216
Глава 5 Нечеткие нейронные сети и системы с нечеткой логикой...
Центры кластеров
28,25 5,96 97,86 43,77
29,85 12,51 82,14 23,67
59,72 26,00 65,40 24,48
40 39 34,25 74,51 31,35
Матрица коэффициентов принадлежностей
Афганистан 0.055 0.162 0.495 0.288
Албания 0.599 0.114 0.073 0.214
Алжир 0.174 0.733 0.031 0.062
Ангола 0.045 0.102 0.789 0.064
Аргентина 0 939 0.024 0016 0.021
Армения 0 731 0.067 0 116 0 087
Азербайджан 0.757 0.058 0.103 0.082
Бахрейн 0 204 0.687 0 030 0 080
Бангладеш 0 031 0.071 0 187 0 712
Белиз 0251 0.252 0.266 0.231
Беларусь 0.761 0.056 0.087 0.096
Бутан 0.241 0.156 0.479 0.124
Бенин 0.057 0.282 0.371 0.290
Боливия 0.645 0.087 0.191 0.077
Босния Герцеговина 0.764 0.157 0.029 0.050
Ботсвана 0 530 0.130 0 215 0 124
Бразилия 0 920 0.033 0 020 0.027
Болгария 0.914 0.033 0.025 0.028
Бурунди 0 178 0.171 0 445 0 206
Буркина Фасо 0.020 0.249 0 495 0 236
Камбоджа 0 120 0.050 0.163 0.667
Камерун 0.115 0.522 0.095 0.268
Капо Верде 0.428 0.197 0.160 0.215
Центрально Африканская Республика 0.048 0.287 0.471 0.194
Чад 0.021 0.117 0.681 0.180
Чили 0.758 0.158 0.034 0.049
Китай 0 800 0.091 0 040 0 070
Колумбия 0.703 0.075 0 136 0.086
Конго 0 435 0.275 0.157 0.133
Коста Рика 0 930 0.039 0012 0.019
Кот д'Ивуар 0013 0.091 0 819 0.077
Хорватия 0.928 0.032 0.018 0.022
Куба 0.631 0.092 0.183 0.093
Чехия 0.919 0.040 0.018 0.022
Демократическая республика Конго 0.038 0.108 0.784 0.069
217
Нечёткие модели и методы в интеллектуальных системах
Продолжение табл.
Джибути 0.036 0.604 0.203 0.158
Доминиканская республика 0.642 0.234 0.049 0.074
Эквадор 0.839 0.053 0.038 0.070
Египет 0.065 0.791 0.068 0.076
Сальвадор 0.389 0.243 0.219 0.148
Экваториальная Гвинея 0.347 0.331 0.140 0.182
Эритрея 0.035 0.076 0.246 0.642
Эстония 0.909 0.037 0.026 0.028
Эфиопия 0.048 0.060 0.174 0.718
Фиджи 0.716 0.130 0.067 0.087
Габон 0.038 0.428 0.351 0.183
Гамбия 0.035 0.200 0.509 0.256
Грузия 0.934 0.032 0.015 0.020
Гана 0.180 0.107 0.264 0.448
Гватемала 0.100 0.143 0.577 0.181
Гвинея 0.020 0.401 0.397 0.182
Гвинея-Биссау 0.021 0.193 0.572 0.214
Гайана 0.126 0.435 0.206 0.233
Гаити 0.040 0.353 0.366 0.241
Гондурас 0.368 0.122 0.275 0.235
Венгрия 0.961 0.017 0.010 0.013
Индия 0.087 0.070 0.098 0.745
Индонезия 0.220 0.099 0.077 0.604
Иран 0.106 0.785 0.035 0.074
Ирак 0.034 0.306 0.464 0.196
Ямайка 0.815 0.077 0.051 0.057
Иордания 0.322 0.588 0.029 0.061
Казахстан 0.920 0.024 0.025 0.031
Лаос 0.057 0.029 0.086 0.828
Кения 0.375 0.131 0.318 0.177
КНДР 0.293 0.128 0.451 0.127
Кувейт 0.232 0.689 0.023 0.055
Кыргызстан 0.609 0.093 0.213 0.085
Ливан 0.240 0.656 0.040 0.063
Лесото 0.276 0.360 0.204 0.160
Либерия 0.013 0.056 0.893 0.038
Ливия 0.302 0.489 0.069 0.141
Мадагаскар 0.051 0.111 0.764 0.074
Малави 0.044 0.120 0.715 0.120
Малайзия 0.725 0.100 0.069 0.106
Мальдивы 0.203 0.133 0.557 0.108
Мали 0.027 0.438 0.231 0.304
Мавритания 0.028 0.206 0.350 0.415
Мексика 0.900 0.054 0.017 0.029
Мозамбик 0.050 0.117 0.721 0.112
218
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
Окончание табл
Монголия 0 648 0 068 0.107 0 177
Марокко 0.055 0.757 0.101 0.086
Непал 0 108 0 079 0.110 0 703
Никарагуа 0.299 0.206 0.290 0.204
Нигер 0.020 0.170 0.533 0.276
Нигерия 0.096 0.040 0.052 0.813
Пакистан 0.065 0 172 0.163 0 600
Панама 0.930 0 023 0.021 0.025
Папуа Новая Гвинея 0.066 0.411 0.334 0.189
Парагвай 0.930 0 036 0.014 0 020
Перу 0.748 0.081 0.100 0.070
Филиппины 0.119 0.045 0.096 0.740
Польша 0.966 0.013 0.009 0.012
Молдова 0.873 0 038 0.041 0.048
Румыния 0.979 0 009 0.005 0 007
Российская Федерация 0.924 0.023 0.024 0.029
Руанда 0.138 0315 0.240 0 308
Сенегал 0.027 0.466 0.322 0.185
Шри Ланка 0.186 0.058 0.099 0.657
Сербия и Черногория 0.921 0.031 0.021 0.027
Свазиленд 0.293 0.433 0.125 0.150
Тайланд 0.550 0 094 0.106 0 250
Тринидад и Тобаго 0.931 0.035 0.013 0.021
Турция 0.133 0 806 0.018 0.043
Туркменистан 0.197 0.656 0.037 0.110
Тунис 0.369 0.537 0.035 0.059
Уганда 0.089 0.145 0.241 0.525
Украина 0.867 0.036 0.044 0.053
Объединенные Арабские Эмираты 0.255 0 584 0.039 0.122
Танзания 0.151 0 072 0.070 0.706
США 0.905 0 043 0.025 0 027
Узбекистан 0.889 0.046 0.023 0.042
Вьетнам 0.190 0.077 0.308 0.426
Йемен 0.117 0.106 0.118 0.659
Замбия 0.147 0 125 0.659 0 069
Зимбабве 0.249 0 585 0.046 0 120
Как видно в первом кластере находятся страны с достаточно
высокими показателями (по сравнению с другими странами вы-
борки). Это страны СНГ, Восточной Европы, Балкан, Латинской
Америки.
Во втором кластере находятся страны, показатели которых
ниже, это страны Северной Африки и Ближнего Востока. В этом
кластере самый низкий показатель уровня гендерного равенства.
219
Нечёткие модели и методы в интеллектуальных системах
В третьем кластере находятся самые бедные страны с самым
низким уровнем грамотности, а так же с низким уровнем ген-
дерного равенства. В основном Африканские страны.
В четвертом кластере находятся бедные страны с самыми не-
благоприятными условиями для роста детей.
ВЫВОДЫ К ГЛАВЕ 5
Кластерный анализ включает в себя набор различных
алгоритмов классификации. В общем, всякий раз, когда необхо-
димо классифицировать “горы” информации на пригодные для
дальнейшей обработки группы, кластерный анализ оказывается
весьма полезным и эффективным. Кластерный анализ необходим
для классификации информации, с его помощью можно опреде-
ленным образом структурировать переменные и узнать, какие
переменные объединяются в первую очередь, а какие следует
рассматривать отдельно.
Большое достоинство кластерного анализа в том, что он по-
зволяет производить разбиение объектов не по одному парамет-
ру, а по целому набору признаков. Кроме того, кластерный ана-
лиз в отличие от большинства математико-статистических мето-
дов не накладывает никаких ограничений на вид рассматривае-
мых объектов, и позволяет рассматривать множество исходных
данных практически произвольной природы. Это имеет большое
значение, например, для прогнозирования конъюнктуры, когда
показатели имеют разнообразный вид, затрудняющий примене-
ние традиционных эконометрических подходов.
Как и любой другой метод, кластерный анализ имеет опреде-
ленные недостатки и ограничения: В частности, состав и количе-
ство кластеров зависит от выбираемых критериев разбиения. При
сведении исходного массива данных к более компактному виду
могут возникать определенные искажения, а также могут терять-
ся индивидуальные черты отдельных объектов за счет замены их
характеристиками обобщенных значений параметров кластера.
При проведении классификации объектов игнорируется очень
часто возможность отсутствия в рассматриваемой совокупности
каких-либо значений кластеров.
Основным недостатком рассмотренных методов нечеткой
кластеризации /^-средних и Густавсона-Кесселя является то, что
они могут быть использованы только в случае, когда известно
220
Глава 5. Нечеткие нейронные сети и системы с нечеткой логикой...
число кластеров К. Но обычно число кластеров неизвестно, а ви-
зуальные наблюдения в многомерном случае просто не приведут
к успеху.
Как видно из результатов, метод Густавсона-Кесселя позволя-
ет находить кластеры в виде разнонаправленных эллипсов. Ино-
гда выбор метода предварительного расположения центров кла-
стеров, а следовательно и месторасположение предварительных
центров влияет на результаты кластеризации и позволяет их су-
щественно улучшить.
ГЛАВА С)
Системы с нечёткой логикой
и нечёткие множества
в финансовом анализе
ВВЕДЕНИЕ
Данная глава посвящена применению нечетких мно-
жеств и систем с нечеткой логикой в финансовом анализе. Как
правило, финансовый анализ проводится в условиях неполноты
и неопределенности исходной информации, наличия множества
качественных переменных и факторов. Поэтому применение для
этих целей аппарата нечетких множеств и систем нечеткой логи-
ки является весьма перспективным.
Большой вклад в развитие и применение нечетких множеств
в финансовом анализе внес профессор, д.э н. Недосекин А.О.
[69-72].
В главе 6 рассматривается задача оценки риска банкротства
корпорации, описаны статистический метод дискриминантного
анализа (Альтмана), методы оценки риска с использованием ап-
парата нечетких множеств, а также нечетких нейросетей с раз-
личными алгоритмами вывода. Проведен сравнительный анализ
эффективности этих подходов на примере оценки риска бан-
кротства для предприятий Украины.
Далее в разделах 6 4-6.6 рассмотрена важная задача анализа
и оптимизации инвестиционного портфеля. Описана четкая за-
дача оптимизации портфеля Марковица и приводится её реше-
ние.
Сформулирована нечеткая задача портфельной оптимизации,
построена её модель и приведен метод её решения на основе ап-
парата нечетких множеств. Выполнен сравнительный анализ ре-
шения задач портфельной оптимизации по модели Марковица и
нечетко-множественной модели. Проведены экспериментальные
исследования нечетко-множественной модели с разными ФП.
222
Глаза 6. Системы с нечёткой логикой и нечёткие множества...
6.1. КЛАССИЧЕСКИЕ МЕТОДЫ ПРОГНОЗИРОВА-
НИЯ БАНКРОТСТВА
6.1.1. Общая характеристика понятия «риск бан-
кротства».
В условиях перехода экономики Украины к рыноч-
ным отношениям, существенного расширения прав предприятия
в отрасли финансово-экономической деятельности, значительно
растет роль своевременного и качественного анализа финансово-
го состояния предприятий, оценки использования их имущества
и капитала, ликвидности, платежеспособности, финансовой
стойкости и прибыльности, а также поиска на этой основе спо-
собов повышения и укрепления финансовой стабильности пред-
приятия.
Особенное значение приобретает своевременная и объектив-
ная оценка финансового состояния предприятий разнообразных
форм собственности, поскольку ни один владелец не должен
пренебрегать потенциальными возможностями увеличения при-
были (дохода) фирмы, которые можно обнаружить, только свое-
временно и объективно проанализировав финансовое состояние
предприятий.
Одним из важнейших этапов при анализе финансового со-
стояния предприятия есть анализ риска банкротства.
Понятие банкротства органично присущее современным ры-
ночным отношениям. Оно характеризует несостоятельность
предприятия (организации) удовлетворить требования кредито-
ров относительно оплаты товаров, работ, услуг, а также обеспе-
чить обязательные платежи в бюджет и внебюджетные фонды.
Закон Украины «О возобновлении платежеспособности должни-
ка или признания его банкротом» под банкротством понимает
признанную хозяйственным судом несостоятельность должни-
ка возобновить свою платежеспособность и удовлетворить при-
знанные судом требования кредиторов, не иначе как через при-
менение ликвидационной процедуры [1J.
На практике можно отметить наличие разных понятий и оп-
ределений банкротства, которыми оперируют специалисты. Так,
юрист будет ссылаться на Закон о банкротстве, в соответствии с
которым факт банкротства должен быть признан арбитражным
223
Нечёткие модели и методы в интеллектуальных системах
судом с соблюдением всех установленных правил и процедур;
банковский служащий отметит момент прекращения платежей и
занесения расчетных документов фирмы в соответствующую кар-
тотеку банка; экономист попробует рассмотреть банкротство как
процесс, в котором юрист и банкир зафиксировали лишь отдель-
ные признаки или факты
С позиции финансового менеджмента банкротство характе-
ризует реализацию катастрофических рисков предприятия в про-
цессе его финансовой деятельности, в результате которой оно
неспособно удовлетворить в установленные сроки, выдвинутые
со стороны кредиторов требования и выполнить обязательства
перед бюджетом. В экономической литературе банкротство часто
характеризуется как долговая несостоятельность, отказ предпри-
нимателя платить за своими долговыми обязательствами из-за
отсутствия средств. Экономисты рассматривают банкротство в
качестве инструмента выведения субъектов предпринимательской
деятельности из кризисной финансово хозяйственной ситуации,
поскольку в основе самой процедуры банкротства заключаются
конкретные юридические и экономические действия
Предпосылки банкротства следует рассматривать как цело-
стное взаимодействие факторов. Одни из них могут быть внеш-
ними относительно предприятия и практически не поддаются
влиятельные или же очень слабые. Другие - внутреннего харак-
тера и непосредственно зависят от организации работы на самом
предприятии. Банкротство наиболее часто является результатом
обшего и одновременного влияния всех факторов. Анализ зару-
бежной практики свидетельствует, что в странах с развитой ры-
ночной экономикой и постоянной политической системой, как
правило, 1/3 банкротства вызванна внешними причинами и 2/3 -
внутренними причинами.
В течение многих лет классические статистические методы
широко использовались для прогнозирования рисков банкротст-
ва. Эти модели также имеют название одномерных (‘single-
period’) методов классификации или статистических моделей.
Они включают процедуру классификации, которая относит ту
или другую компанию к группе потенциальных банкротов или к
группе компаний с благоприятным финансовым положением с
определенной мерой точности. Применяя эти модели, могут воз-
никать два типа ошибок. Ошибка первого типа возникает тогда,
когда фирма-банкрот классифицировалась как фирма с благо-
224
Глава 6. Системы с нечёткой логикой и нечёткие множества...
приятным финансовым положением. Ошибка второго типа воз-
никает тогда, когда предприятие с нормальным финансовым со-
стоянием классифицируется как потенциальный банкрот. Обе
ошибки могут привести к серьезным последствиям и убыткам.
Например, если кредитное учреждение откажет компаниям со
«здоровой» финансовой ситуацией в предоставлении кредита в
связи с допущением ошибки 2-го типа, то это может привести к
потерям будущей прибыли этой компанией. Такую ошибку часто
называют «коммерческим риском». И наоборот, если кредитное
учреждение примет решение о предоставлении кредита компа-
нии, которая является потенциальным банкротом (ошибка 1-го
типа), то это может привести к потерям процентов по кредиту,
значительной части ссудных средств, альтернативной стоимости,
и др. Поэтому такую ошибку называют «кредитным риском».
Многофакторный дискриминантний анализ является самым
распространенным и самым известным из классических методов
прогнозирования банкротства. К другим классическим методам
относятся одномерный анализ, модели индекса риска, logit/probit
анализ и вероятностные модели.
6.1.2. Многомерный дискриминантний анализ
(MDA, Multivariate Discriminant Analysis)
В 1968 году американский экономист Е.Альтман пре-
дставил статистический многомерный метод анализа прогнозиро-
вания банкротства, который получил название ‘Z — счет Альт-
мана’.
Подход Альтмана следующий:
1. Для применение данной модели на основе предыдущего
анализа формируется набор отдельных финансовых показателей
предприятия, которые имеют наибольшее влияние на возмож-
ность банкротства, для конкретной страны и определенного про-
межутка времени. В и-мерном пространстве, сформированном
отобранными показателями, проводится гиперплоскость, которая
наилучшим образом отделяет успешные предприятия от пред-
приятий-банкротов, на основе данных исследований статистики.
Уравнение гиперплоскости имеет следующий вид:
225
Нечёткие модели и методы в интеллектуальных системах
, (6.1.1)
(О
где К, — функции показателей бухгалтерского учета, а, — полу-
ченные в результате анализа веса.
2. Делая параллельный перенос плоскости, можно наблюдать,
как перераспределяется количество успешных и неуспешных
предприятий, которые попали в ту или другую подобласть, разде-
ленные данной гиперплоскостью. Соответственно можно устано-
вить пороговые значения и Z,; когда Z < Z,, риск банкротст-
ва предприятия большой, когда Z>Z, — риск банкротства ма-
ленький. а при Z, < Z < Z2 финансовое состояние предприятия
неопределенно.
Данный подход Альтман применил для экономики США. На
основании исследований финансового состояния и результатов
хозяйственной деятельности 66 компаний (33 успешных компа-
нии и 33 банкротов), рассчитав 22 финансовых коэффициента и
воспользовавшись лишь пятью наиболее весомыми (табл. 1), он
получил широко известную формулу:
Z = \.2Kx+\AK1+'i.?>Ki+Q.6Ki+\.QKs , (6.1.2)
где К, — характеризует структуру капитала и определяется как
отношение собственного оборотного капитала к обшей стоимо-
сти активов субъекта ведения хозяйства;
К, — отображает уровень чистой прибыльности производст-
ва (деятельности); рассчитывается делением объема реинвести-
руемой прибыли (суммы резерва, фондов социального назначе-
ния и целевого финансирования, нераспределенной прибыли) на
общую стоимость активов фирмы;
К3 — определяет структуру капитала фирмы; вычисляется
как отношение собственного капитала (по рыночной стоимости)
к ссудному капиталу (суммы коротко- и долгосрочных пассивов);
Kt — отображает доходность субъекта ведения хозяйства и
рассчитывается как соотношение чистой выручки от реализации
продукции и общей стоимости активов предприятия (организа-
ции);
226
Глава 6. Системы с нечёткой логикой и нечёткие множества...
^5 — характеризует прибыльность основного и оборотного
капитала: определяется делением суммы балансовой прибыли на
общую стоимость активов; с определенной частью условности его
можно назвать показателем рентабельности производства.
ТАБЛИЦА 6.1.
Средние значения и F-статистика по группам для Z-модели Альтмана
Финансо- вый коэф- фициент Среднее значе- ния по группе компаний, какие заявили о бан- кротстве Среднее значе- ния по группе компаний, кото- рые не обанкро- тились F- стати- стика
К1 -6,1 % 41 % 32,60
К2 -62,6% 35,5% 58,86
КЗ -31,8% 15,4% 26,56
К4 40,1% 247,7% 33,26
К5 1,5 раза 1,9 раз 2,84
Коэффициенты модели были рассчитаны компьютерным ал-
горитмом, а не аналитиком. В зависимости от значения Z про-
гнозируется вероятность банкротства: до 1,8 — очень высокая, от
1,8 до 2,7 — высокая, от 2,8 до 3 — возможно, выше 3 — очень
низкая.
В результате проведения дискриминантного анализа по группе
предприятий, которые заявили о своем банкротстве, по финансо-
вым показателям, взятым за год до дефолта, был верно смодели-
рован этот факт в 31 случае с 33 (94,5%), и в 2 — сделана ошибка
(6%). По второй группе предприятий, которые не обанкротились,
модель ошибочно спрогнозировала банкротство только в 1 случае
(3%), а в оставшихся 32 (97%) была допущена очень низкая ве-
роятность банкротства, что и подтвердилось фактически.
ТАБЛИЦА 6.2.
Результаты прогноза по модели Альтмана за год до банкротства
Группа Количество компаний Прогноз: приналеж- ность к 1 группе Прогноз: приналеж- ность к 2 группе
227
Нечёткие модели и методы в интеллектуальных системах
Группа 1 (обанкротившие^ компании) 33 31 (94,0%) 2 (6,0%)
Группа 2 (компании, кото- рые не обанкро- тились) 33 1 (3,0%) 32 (97,0%)
Аналогичные расчеты были проведены на основе финансо-
вых показателей за два года до банкротства. Как видно из табли-
цы 6.2, результаты оказались размытыми, особенно по группе
предприятий, которые заявили о своем дефолте, тогда как по
группе 2 достоверность расчетов осталась приблизительно на том
же уровне. Общая точность классификации по модели Альтмана
составляет 95% за год и 82% за два года до банкротства.
ТАБЛИЦА 6.3.
Результаты прогноза по модели Альтмана (за два года до банкротства)
Группа Количество компаний Прогноз: при- належность к 1 группе Прогноз: при- належность к 2 группе
Группа 1 (обанкротив- шиеся компа- нии) 33 23 (72,0%) 9 (28,0%)
Группа 2 (компании, которые не обанкроти- лись) 33 2 (6,0%) 31 (94,0%)
Учитывая то, что вышеприведенный z-счет пригодный лишь
для больших предприятий, акции которых котируются на бирже,
в 1985 году Е. Альтман предложил новую модель, которая позво-
ляет исправить данный недостаток. Ниже приведена формула для
определения вероятности прогнозирования банкротства для
предприятий, акции которых не представлены на бирже:
Z = 0.717/C, +0.847/С2 + 3.107К3 +0.42К4 +0.998/Q , (и)
228
Глава 6. Системы с нечёткой логикой и нечёткие множества...
где ^4 — балансовая стоимость собственного капитала по отно-
шению к одолженному капиталу. При Z <1.23 риск банкротства
очень большой. Подход Альтмана был многократно использован
самим Альтманом и его последователями во многих странах (Ве-
ликобритания, Франция, Бразилия, Китай и др.). Так, например,
Тоффлер и Тишоу, для Великобритании плучили следующую за-
висимость:
Z = 0.53tf, +0.13К2 +0.18К3 +0.16К4, (6.i.4)
где — прибыль от реализации/краткосрочные обязательства;
К2 — краткосрочные обязательства/сумма активов;
— объем продаж/сумма активов;
При Z < 0.3 вероятность банкротства низкая.
Таким образом, несколько финансовых характеристик ком-
пании комбинируются в один многомерный дискриминантний
счет, который принимает значение от -«5 до +°о и показывает
финансовое состояние компании.
Примером применения модели Альтмана являются результа-
ты исследований самим автором модели 86 компаний банкротов
в период 1969—1975 г.г., НО компаний банкротов в период 1976
— 1995 г.г. и 120 компаний банкротов в период 1997—1999 годы.
Используя пороговое значение 2,675, точность применения мето-
да была в диапазоне от 82% до 96%. При повторном тесте моде-
ли, который базировался на одном финансовом периоде к бан-
кроту, точность была в пределах 80—90%. Результаты исследова-
ния приведены в таблице 6.4:
ТАБЛИЦА 6.4
Точность классификации модели Альтмана
Кол-во лет до банкротства 1969-1975 1976-1995 1997-1999
1 82% (75%) 85% (78%) 94% (84%)
2 68% 75% 74%
Пороговое значение 2,67 (в скобках точность класси- фикации для порогового значения 1,81)
229
Нечёткие модели и методы в интеллектуальных системах
Преимуществом модели MDA является то, что она принима-
ет во внимание весь набор совокупности характеристик, общих
для компаний, а также взаимодействие между этими характери-
стиками. Также преимуществом этого метода является то, что он
трансформирует значение индивидуальных переменных в один
дискриминантний z-счет.
Точность классификации модели MDA, как правило, оцени-
вается на основе ошибок 1-го и 2-го типа. Также часто использу-
ется процент правильной классификации или невзвешенная
сумма двух типов ошибок. Кроме измерения ошибки, которая
нуждается в знании пороговой точки, для оценки точности моде-
ли MDA используются кривая ROC (Receiver Operating Curve) и
“trade-off” функция. Они дают понятное графическое представ-
ление модели Альтмана и не нуждаются в знании пороговой точ-
ки. Чем большая площадь под кривой, тем более точное прогно-
зирование. Также можно использовать коэффициент Джини
(Gini). Он показывает разницу между “trade-off” функцией моде-
ли и “trade-off” функцией недискриминантной модели. Чем
больше коэффициент Джини, тем большая разница между ус-
пешными фирмами и банкротами.
Применение модели MDA начинается с нескольких предпо-
ложений. Первое предположение заключается в том, что входные
данные дихотомические, то есть группы являются непересекаю-
шимися. Также MDA базируется на следующих ограничениях:
— независимые переменные, включенные в модель, нор-
мально распределены;
— матрицы дисперсий и ковариаций группы успешных ком-
паний и банкротов равны;
— стоимость неправильной классификации и априорная ве-
роятность неудачи определены.
На практике данные очень редко удовлетворяют всем трем
выше названным предположениям, потому часто применение
MDA происходит неадекватным образом и правильность резуль-
татов, полученных после его применения, стоит под вопросом.
Также на практике нарушается первое предположение отно-
сительно нормально распределенных переменных. Для приведе-
ния переменных к нормальному распределению ученые часто
проводят нормализацию, но она может привести к изменению
зависимости между переменными.
230
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Второе предположение относительно равенства матриц дис-
персий тоже должно быть проверено до применения модели
MDA. Если это предположение не будет выполнено, то результа-
ты классификации будут недостаточно корректными. В случае
неравенства матриц дисперсии необходимо использовать квадра-
тичный MDA. Однако на практике исследователи избегают его
применения, потому что модель является очень сложной и лучше
линейной модели только в случае большого количества входных
данных, маленького количества независимых переменных и
большой разницы между матрицами дисперсий. Таким образом,
исследователи пытаются преобразовать данные так, чтобы дис-
персионные матрицы не очень отличались и затем применяют
линейный MDA.
Невыполнение третьего предположения также влияет на точ-
ность применения MDA. Оптимальная пороговая точка должна
быть результатом минимизации функции «общих потерь», кото-
рая состоит из цены ошибок неправильной классификации. Од-
нако, на практике, цена ошибок определяется субъективно и за-
висит от лица, которое принимает решение. Многие исследова-
тели применяют MDA, пытаясь минимизировать общую стои-
мость ошибки, а не функцию общих расходов. Также они не
учитывают веса каждой из ошибок и допускают, что цены непра-
вильной классификации для обоих классов равны. Но на практи-
ке ошибка 1-го рода (цена неправильной классификации компа-
нии-банкрота) часто намного более высока, чем цена ошибки
2-го рода (неправильная классификация успешной компании).
Одним из возможных решений определения оптимальной поро-
говой точки есть определение результатов классификации
(ошибки 1-го и 2-го рода) для разных значений порога.
Несмотря на то, что MDA является одной из самых распро-
страненных методик прогнозирования банкротства, он имеет су-
щественные недостатки, связанные с невыполнением основных
предположений. Во-первых, MDA требует, чтобы правило клас-
сификации было линейно и, определив общий индекс Z и срав-
нив его с пороговой точкой, получим характеристику финансово-
го состояния компании. Но линейность противоречит фактам,
что некоторые переменные имеют нелинейную зависимость.
Иногда переменные показывают плохое финансовое состояние в
случае, как маленьких, так и больших своих значений. Во-
вторых, необходимо принимать во внимание, что индекс Z является
231
Нечёткие модели и методы в интеллектуальных системах
лишь порядковым измерением финансового состояния предпри-
ятия. MDA не прогнозирует вероятность банкротства, а лишь
реализует классификацию финансового состояния предприятия.
6.2. КОМПЛЕКСНАЯ ОЦЕНКА РИСКА БАНКРОТСТ-
ВА КОРПОРАЦИИ НА ОСНОВЕ АППАРАТА НЕ-
ЧЁТКИХ МНОЖЕСТВ
Введение
Выше был рассмотрен классический метод дискрими-
нантного анализа риска банкротства (метод Альтмана) Этот ме-
тод, несмотря на широкое применение в различных странах,
имеет ряд серьезных недостатков.
В частности, на практике редко выполняются допущения о
нормальном распределении переменных, которые включены в
модель, о равенстве дисперсий и ковариаций групп успешных
предприятий и предприятий-банкротов, и равенстве цены оши-
бок первого и второго рода. Кроме того, предполагается, что
группы успешных предприятий и предприятий-банкротов явля-
ются непересекаюшимися.
Еше одним существенным недостатком этого метода являет-
ся то, что он рассматривает показатель в статике в текущий мо-
мент времени и не учитывает динамики его изменения во време-
ни. Таким образом, решается задача классификации, а не про-
гнозирования.
В целом применение модели Альтмана для условий хозяйст-
вования на Украине наталкивается на серьезные трудности. Осо-
бенности украинской экономики не позволяют механически пе-
реносить эту модель. Коэффициенты модели Альтмана рассчиты-
вались ним по результатам деятельности большого числа амери-
канских компаний. Отличия в экономиках США и Украины на-
столько велики, что модели прогнозировании банкротства отече-
ственных предприятий должны базироваться на другом множест-
ве показателей. Кроме того, коэффициенты в модели Альтмана
должны зависеть от отраслевой принадлежности.
232
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Эти обстоятельства определяют целесообразность разработки
новых подходов и моделей оценки риска банкротства, учиты-
вающих неопределенный характер и неточности в оценке исход-
ных показателей и факторов, используемых для комплексного
анализа риска банкротства.
Весьма эффективным методом решения данной проблемы
является нечетко-множественный метод оценки риска банкрот-
ства, разработанный проф. А.О.Недосекиным.
Как известно, банкротство корпорации может наступать в
результате целого ряда взаимосвязанных между собой причин.
Все эти причины можно сгруппировать в пять больших классов
[69, 70-72]:
— причины из внешнего окружения корпорации, куда отно-
сим политические, внешнеэкономические, технологические и
социальные причины. Все перечисленное подлежит специально-
му PETS-анализу (Р — political, Е — economical, Т —
technological, S — social);
— рыночные причины — к ним относятся: слабая позиция
корпорации на рынке сбыта продукции, высокий уровень конку-
ренции, неустойчивость и узость занятой рыночной ниши и дру-
гие;
— внутриэкономические причины, в число которых входят
затратность, ресурсоемкость, не экологичность производства; мо-
рально устаревшие технологии, изношенность основных фондов,
неоптимизированное налогообложение, низкая производитель-
ность труда и другие;
— финансовые причины — неудовлетворительный уровень
дебиторской (кредиторской) задолженности и низкое качество ее
обслуживания, дефицит оборотных средств, неудовлетворитель-
ный уровень ликвидности, недостаточная автономия — и другие
причины, приводящие к нарастанию убытков, штрафных санк-
ций и других отрицательных финансовых результатов;
— управленческие причины, в число которых входят низкий
уровень управленческой культуры топ-менеджмента и финанси-
стов корпорации, отсутствие эффективного управленческого
учета финансовых операций, ненадлежащее управление финан-
сами, неэффективная рекламная и маркетинговая деятельность
соответствующих служб и другие причины, в итоге получающие свое
негативное отображение на уровне всех сфер бизнес-активности
корпорации.
233
Нечёткие модели и методы в интеллектуальных системах
Связь между группами причин очевидна. Сильный конку-
рент может действовать против тебя как экономическими, так и
политическими методами. Фигурально выражаясь, он может пой-
ти на ценовой демпинг, а может натравить на тебя налоговую
полицию. В первом случае вполне вероятен резкий спад продаж,
во втором — штрафные санкции; но в обоих случаях это обора-
чивается убытками и дефицитом оборотных средств. Так что фи-
нансы предприятия представляют собой как бы зеркало происхо-
дящего в корпорации и вокруг нее.
В то же время оценивать риск банкротства корпорации толь-
ко по состоянию ее финансов — недальновидно. Когда проблемы
корпорации начинают отображаться на уровне денег, часто быва-
ет уже поздно что-либо исправлять, и банкротство неизбежно.
Просто финансы традиционно являются самыми наблюдаемыми
артефактами корпорации, потому что имеют стандартное количе-
ственное выражение в учетных записях и отчетных формах. Все
прочие аспекты деятельности корпорации (если, конечно, речь
не идет об измерении материальных потоков в натуральном вы-
ражении) количественному измерению могут не подлежать вовсе.
И тогда приходится при оценивании этих слабо измеримых фак-
торов прибегать к искусственным приемам. Характерным приме-
ром служит подход Аргенти, где каждому фактору банкротства
корпорации сопоставляется количественная балльная шкала. Ре-
зультат оценки риска банкротства — состояние так называемого
A-счета; чем больше счет, тем выше риск.
Поэтому в работах [68-70] предлагается строить показатель
риска банкротства корпорации на основе агрегирования данных
со всех уровней иерархии факторов, на основе качественных
данных об уровнях факторов и их отношениях порядка на одном
уровне иерархии.
6.2.1. Модель риска банкротства корпорации
Пусть построена математическая модель риска бан-
кротства корпорации, далее именуемая BRM-моделью (BRM —
Bankruptcy Risk Model) [69, 70] следующего вида:
BRM = <G, L, Ф>, (6.2.1)
где G — древовидная иерархия факторов банкротства, L — набор
качественных оценок уровней каждого фактора в иерархии G, Ф
234
Глава 6. Системы с нечёткой логикой и нечёткие множества...
— система отношений предпочтения одних факторов другим для
одного уровня иерархии факторов. При этом:
L = {Очень Низкий уровень (ОН), Низкий уровень (Н),
Средний уровень (С), Высокий уровень (В), Очень Высокий уро-
вень (ОВ)},
0 = (F1(<p)FJ<pe (>,«)}, (6.2.2)
где >---отношение строгого предпочтения, « — отношение
безразличия.
В свою очередь, древовидная иерархия G может быть описа-
на ориентированным графом без циклов, петель, горизонтальных
ребер в пределах одного уровня ранжирования, содержащим одну
корневую вершину:
G =<{/•}. }>. ВД
где{^:} — множество вершин факторов, — множество луг,
Fo — корневая вершина, отвечающая риск-фактору корпорации в
целом. При этом в древовидном графе дуги расположены так:
началу дуги соответствует вершина нижнего уровня иерархии
(ранга), а концу дуги — вершина ранга, на единицу большего
(рис. 6.1).
Простейший пример, соответствующий иерархии факторов
имеет вид рис. 6.1.
Fo — корпорация в целом;
F] — внутренняя экономика;
F2 — финансы;
Fx j — уровень производительности труда;
Fx2 — уровень изношенности внеоборотных активов;
F2л — уровень финансовой автономии;
F22 — уровень ликвидности;
FZ3 — уровень прибыльности и рентабельности
Связь вершин в графе отображается нумерацией вершин, в
соответствии с занимаемым вершиной уровнем иерархии.
235
Нечёткие модели и методы в интеллектуальных системах
Рис. 6.1. Древовидная иерархия F
Конечно данный пример можно сколько угодно расширять,
добавляя к графу F новые узлы и дуги. Необходимо еще нало-
жить на эту иерархию систему отношений предпочтений Ф (рис. 6.2):
Рис. 6.2. Иерархия F с наложенной на нее системой Ф
Ф ~ {Л * Л .2»Лг.2 ^21 ~ ^2. 3 }
6.2.2. Метод оценки риска банкротства
Рассмотрим метод оценки риска банкротства с ис-
пользованием аппарата нечетких множеств [69].
Чтобы произвести оценку риска банкротства количественно
и качественно, необходимо произвести агрегирование данных,
собранных в рамках древовидной иерархии; при этом агрегиро-
вание совершается по направлению дуг графа иерархии.
236
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Для агрегирования применяется так называемый OWA-
оператор Ягера, причем весами в свертке выступают коэффици-
енты Фишберна (OWA — Ordered Weighted Averaging — усредне-
ние с упорядоченными весами) [69, 71J.
Учитывая качественный характер ряда факторов риска бан-
кротства сформируем лингвистическую переменную «Уровень
фактора» с терм-множеством значений L вида (6.2). Тогда в ка-
честве семейства функций принадлежности может выступать
стандартный пятиуровневый 01-классификатор, где функции
принадлежности — трапециевидные треугольные числа (рис. 6.3):
1,_0 < х < 0.15
ОН: д/х) = < 10(0.25-х),_ 0.15 < х < 0.25 ,
(6.2.5)
0,_0.25<х<1
0, 0 < х < 0.15 10(х-0.25),_0.15 < х < 0.25
Н: р2(х) = - 1,_0.25 <х < 0.35 , (6:2.6)
10(0.45-х),_0.35 <х < 0.45
0,_0.45<х<1
0, О < х < 0.35
10(х-0.35), _ 0.35 <х < 0.45
С: д3(х) = <1,_ 0.45 < х < 0.55
(6.2.7)
10(0.65-х), _0.55<х<0.65
0, 0.65 <х<1
—
237
Нечёткие модели и методы в интеллектуальных системах
0, 0 < х < 0.55 10(х- 0.55),_ 0.55 <х < 0.65
В: P4W = ' 1, _ 0.65 < х < 0.75 10(0.85-х),_0.75 < х < 0.85 0, 0.85 <х<1 к —
0,_0<х<0.75
(6.2.8)
ОВ: р5 (х) = (10(х - 0.75),_ 0.75 < х < 0.85 .
(6.2.9)
1,_0.85 < х < 1
Везде в (6.2.5)—(6.2.9) — это 01 - носитель (отрезок [0,1] ве-
щественной оси).
Рис. 6.3. Система трапециевидных функций принадлежности
на 01-носителе
Стандартный классификатор осуществляет проекцию нечет-
кого лингвистического описания на 01-носитель, при этом делает
это непротиворечивым способом, симметрично располагая узлы
классификации в точках 0.1. 0.3, 0.5, 0.7, 0.9. В этих узлах значе-
ние соответствующей функции принадлежности равно единице, а
всех остальных функций — нулю. Неуверенность эксперта в
238
Глава 6. Системы с нечёткой логикой и нечёткие множества...
классификации убывает (возрастает) линейно удалением от узла
(с приближением к узлу, соответственно); при этом сумма функ-
ций принадлежности во всех точках носителя равна единице.
Таким образом мы переходим от качественного описания
уровня фактора к стандартному количественному виду соответст-
вующей функции принадлежности (трапециевидное число). Та-
кое представление в модели представляется нам наиболее целе-
сообразным. Аналогичный классификатор, конечно, можно было
бы построить и на гладких функциях принадлежности колоколо-
образного вида. Далее необходимо определить веса факторов.
Теперь рассмотрим порядок построения схемы весов Фиш-
берна. Как хорошо известно, системе убывающего предпочтения
N альтернатив наилучшим образом отвечает система снижаю-
щихся по правилу арифметической прогрессии весов:
Pi =
2(7V-z + l) .
(N + 1)N ,l
= 1..7V
(6.2.10)
а системе безразличных друг другу N альтернатив — набор рав-
ных весов:
p.=N~',i = l..N. (6.2.11)
Из (6.2.10) видно, что веса Фишберна — это рациональные
дроби, в знаменателе которых стоит сумма арифметической про-
грессии N членов первых членов натурального ряда с шагом 1, а
в числителе — убывающие на I элементы натурального ряда, от
N до 1 (например, 3/6, 2/6, 1/6, в сумме единица). То есть пред-
почтение по Фишберну выражается в убывании на единицу чис-
лителя рациональной дроби весового коэффициента более слабой
альтернативы.
Чтобы определить набор весов Фишберна для смешанной
системы предпочтений, когда, наряду с предпочтениями, в сис-
тему входят отношения безразличия, необходимо определять
числители г, рациональных дробей по рекурсивной схеме:
Г,_} = ’ г, +1, F/.i >- F, . (6.2.12)
|rw =l,i = ^.2
Тогда сумма полученных числителей и есть общий знамена-
тель дробей Фишберна:
239
Нечёткие модели и методы в интеллектуальных системах
К = Хг,. (6.2.13)
1=1
А весовой коэффициент /-го фактора определяется из:
р,=г,1К. (6.2.14)
Можно легко убедиться, что от соотношений (6.2 10)—(6.14)
можно легко перейти к частным случаям (6.2.10) и (6.2.11).
Действительно, если в систему входят только отношения
предпочтения, то выполняется:
rN =1, =<+1, /С = 1+ 2+ ... +TV = 7V(7V +1)/2 (6.2.15)
что одновременно соответствует (6.6) и (6.8). В другом случае,
если в систему входят только отношения безразличия, то
^=1,^=^, /C = l + l + ... + l = 7V, (62.16)
что одновременно соответствует (6.2.7) и (6.2.10).
Таким образом, предложенная в (69, 70] система весов
Фишберна для смешанных систем предпочтений является непро-
тиворечивой и обобщает частные случаи известных систем (6.2.6)
и (6.2.7). Для иллюстрации в таблицу 6.5 сведены дроби Фиш-
берна для всех смешанных систем отношений предпочтения при
N=2...4.
ТАБЛИЦА 6.5.
Система весов Фишбернв (N=2..4)
N Ф Px Pi Pi P,
2 1/2 1/2 — —
F, >F2 2/3 1/3 — —
3 F, - F2 = F3 1/3 1/3 1/3 —
f^f2^f2 2/4 1/4 '/< —
F, « F2 > F3 2/5 2/5 1/5 —
Ft >F2>F. 3/6 2/6 1/6 —
4 F4 1/4 1/4 % 1/4
f^f2^f^f4 2/5 1/5 1/5 1/5
F^F2>F^Fa 2/6 2/6 1/6 1/6
Fx^F2k f} >= f4 2/7 2/7 2/7 1/7
f^f2>f^fa 3/7 2/7 1/7 1/7
240
Глааа 6. Системы с нечёткой логикой и нечёткие множества...
р > F, « р >- F4 3/8 2/8 2/8 1/8
F} * F2 >- F, >- F4 3/9 3/9 2/9 1/9
Fx>F2>F3>F4 4/10 3/10 2/10 1/10
Всего вариантов системы предпочтений 2'' 1 для каждого
числа N сопоставляемых альтернатив.
И наконец, когда по каждому показателю (F, r..F.N) на вы-
бранном подуровне (*) иерархии G известны лингвистические
оценки L = (L. V..L. N) , а также определена система весов Фиш-
берна Р = (р. v..p* на основе системы предпочтений Ф, тогда
показатель подуровня F» характеризуется своей лингвистической
оценкой, определяемой функцией принадлежности на 01-
носителе x: N м,^ (x) = уи. , x P' , (6.2.17) (6.5),если _ L.j - 'очень _низкий " (6.6), если _L.j =" низкий "
где (Л) = ' (6.7), если _ L.j =" средний " _ (6.2 18) (6.8), если _Ltj ="высокий " (6.9),е сли _L.j -'очень _высокий "
Соотношение (6.2.17) — это OWA-оператор Ягера, причём,
поскольку функции принадлежности (6.2.18) имеют трапецие-
видную форму, то и линейная (6 2.17) является трапециевидным
нечётким числом (что легко доказывается при использовании
сегментного правила вычислений). И можно свести операции с
функциями принадлежности к операциям с их вершинами. Если
обозначить трапециевидное число (6.2.18) как (a,,a2,a3,a4), где
ai соответствуют абсциссам вершин трапеции, то выполняется:
241
Нечёткие модели и методы в интеллектуальных системах
N N N N N
У, Р, X («.1 > aa • «,з > «.4 ) = (У Р, х atl, У р, ха,2, У р, xal3, £ р, хл14 )
i=i !=1 i=i 1=1 /=|
(6.2.19)
Полученную функцию вида (6.2.17) необходимо лингвистиче-
ски распознать, чтобы выработать суждение о качественном
уровне показателя F,. Для этого необходимо соотнести получен-
ную функцию р. (х) и функции (х) вида (6.2.5)—(6.2.9).
Если
(Vx е [0,1] sup_ min(p. (х), р, (х)) = 0, (6.2.20)
то уровень показателя Е однозначно не распознается как уро-
вень, которому отвечает z-ая «эталонная» функция принадлежно-
сти. Стопроцентное распознавание наступает, если выполняется
(Vx е [0,1] _ min(/r. (х), р, (х)) = р, (х). (6.2.21)
Во всех промежуточных случаях необходимо задаться мерой
распознавания уровня. Такой мерой может быть разновидность
нормы Хемминга Пусть даны два трапециевидных числа
(а!,а2,а3,а4) и (6,,62,63,64) на 01-носителе. Тогда степень
сходства v двух таких чисел может быть определена как
0<и = 1-тах{|а,-b, |,| а2 - Ь2 |,|а3-63 |,| а4 -&4 |] <1 (6.2.22)
Мы провели агрегирование показателей низового уровня ие-
рархии G и распознавание агрегированного фактора по шкале L.
Пройдя последовательно снизу вверх по всем уровням иерархии
G и применяя соотношения (6.2.17—6.2.22), мы в итоге получаем
функцию принадлежности фактора Fo и лингвистическую ин-
терпретацию уровня этого фактора, сопровожденную степенью
сходства вида (6.2.22).
Сам же риск банкротства и его лингвистическая оценка на-
прямую вытекает из предыдущего изложения. Если сопоставить
лингвистические переменные «Уровень фактора Fo » и «Степень
риска банкротства предприятия», то можно установить взаимно
однозначное соответствие вида табл. 6.6 [69-71]:
242
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6.6
Соответствие лингвистических переменных
№ терм- множества Уровень фактора Fo Степень риска банкротства предприятия
1 ОН Запредельная (очень высо- кая)
2 Н Опасная (высокая)
3 С Пограничная (средняя)
4 В Приемлемая (низкая)
5 СВ Незначительная (очень низкая)
При этом лингвистическая переменная «Степень риска бан-
кротства предприятия» также может быть описана стандартным
пятиуровневым 01-классификатором вида рис. 6.3, как и лин-
гвистическая переменная «Уровень фактора».
Итак, изложение метода опенки риска банкротства предпри-
ятия завершено. Рассмотрим пример.
Пример 6.1.
Пусть предприятие оценивается на риск банкротст-
ва по двум блокам факторов: F1 «Финансы» и F2 «Управление»,
исходные данные по которым приведены в таблице 6.7:
ТАБЛИЦА 6.7.
Факторы и их уровни («*» — предстоит определить)
Шифр фактора Наименование фактора Уровень фактора
FB Состояние предприятия *
Уровень финансов предприятия *
Л, Уровень ликвидности ♦
Л.. Уровень мгновенной ликвидности Очень низкий
243
Нечёткие модели и методы в интеллектуальных системах
Л.2 Уровень обеспеченно сти собственными средствами Средний
Л.з Уровень промежуточ- ной ликвидности Низкий
Уровень финансовой автономии Высокий
Лз Уровень рентабельно- сти Средний
^4 Уровень оборачиваемо- сти активов Средний
С Уровень управления предприятием *
Г2) Уровень топ- менеджмента Средний
^2 2 Уровень финансового менеджмента Высокий
^2 3 Уровень подразделений маркетинга и рекламы Низкий
^2 4 Уровень развития дист- рибьюторской сети и филиалов Высокий
При этом существует следующая система отношения пред-
почтений факторов: Л.1 Л.2 “ Л.з х Л.4> (6 2.23)
^2 I ^22 ^2.3 ~ ^24'
Определить степень риска банкротства предприятия.
Решение. Результаты расчетов по формулам предыдущего раз-
дела работы приведены в табл. 6.8 (в скобках рядом с уровнем
фактора стоит степень сходства с эталонной функцией распреде-
ления) Видно, что, несмотря на низкий уровень ликвидности,
состояние предприятия распознается как среднее (прочие факто-
ры в оценке финансового состояния «перетягивают» финансы к
244
Глава 6. Системы с нечёткой логикой и нечёткие множества...
средней оценке). Но, так или иначе, появление в результатах
низких оценок должно склонять менеджмент предприятия к оп-
ределенным выводам (иначе зачем вообще анализ).
ТАБЛИЦА 6.8.
Результаты расчетов
Шифр фактора Наименование фактора Уровень фактора Соответствующие вер- шины классификации уровня (трапециевид- ные числа)
Л> Состояние предприятия средний (0.99) 0.36 0.45 0.56 0.66
Л Уровень финан- сов предприятия средний (0.95) 0.32 0.40 0.51 0.61
Уровень лик- видности низкий (0.98) 0.17 0.23 0.35 0.45
Уровень управ- ления предпри- ятием средний (0.94) 0.41 0.51 0.61 0.71
Соответственно, степень риска банкротства предприятия оце-
нивается как пограничная (табл. 6.4).
6.2.3. Анализ на основе только количественных
оценок
Пусть все факторы модели являются количественно
измеримыми. Это возможно даже в случае работы с качествен-
ными признаками, если, в духе Аргенти, сопоставить этим при-
знакам количественные бальные шкалы. Проведем по всем коли-
чественным носителям исходных данных модели лингвистиче-
ское распознавание и построим соответст ующие пятиуровневые
классификаторы. Тогда любой количественной оценке фактора
будет сопоставлен вектор из пяти значений соответствующих
функций принадлежности классификатора:
245
Нечёткие модели и методы в интеллектуальных системах
Z.(a) = {р., (а), р. 2 (а), 3 (а), д. 4 (а), ц. 5(а)},
где а — количественное значение фактора, подлежащего распо-
знаванию, a /д, (я) определяется по (5.16). Сумма всех компо-
нент вектора Z,(a) равна единице (непротиворечивость серой
шкалы в смысле Поспелова), при этом от трех до четырех значе-
ний вектора — нули (уровень принадлежит максимуму двум ка-
чественным описаниям со своими степенями принадлежности,
сумма которых равна единице).
Произведем свертку всех векторов Z. (х.) в иерархии G с ве-
сами Р по формуле:
х(д(1.Яа.Я/.э.Ям.^3)={Ха хМ/2>Ха хАз-Ха ха.«.Ха
»! f“l /! f—I /!
Тогда результирующий показатель состояния корпорации -
это тоже вектор из пяти значений функций принадлежности
Z0={/i0(}, сумма которых равна единице. Можно определить
скалярный вектор, характеризующий состояние предприятия, по
правилу:
5
A_N = £(O.2z-O.l)xpo/, (6.2.24)
i=i
где (0.2i-0,1)=(0.1,0.3,0.5,0.7,0.9) — узловые точки стандартного
пятиуровневого нечёткого классификатора. Теперь следует распо-
знать значение A_N на основе стандартного пятиуровневого
классификатора и получить лингвистическую оценку состояния
корпорации и сопряжённую с ней оценку уровня риска банкрот-
ства.
Изложение метода закончено. Рассмотрим простейший рас-
чётный пример.
Расчетный пример 6.2
Рассмотрим состояние корпорации только с точки зрения
финансов. Выделим 6 факторов Ft-F6 и текущие оценки этих
факторов аг..а6 распознаем по лингвистической шкале. Резуль-
тат распознавания сведем в таблицу 6.9.
246
Глава 6. Системы с нечёткой логикой и нечёткие множестве...
ТАБЛИЦА 6.9.
Результаты распознавания количественных входных данных
Фактор F Функции принадлежности
Рз(йз) /^4(^4) ^5(^5)
0 0 0 0.81 0.19
0 0 1 0 0
Рз 0 1 0 0 0
0 0 1 0 0
0 0 0 0 1
Л 0 0 0 1 0
Все факторы для комплексного состояния корпорации при-
знаются равнозначными, т.е. веса показателей в свертке равны
0.166. Определить количественно и качественно комплексное со-
стояние предприятия и риск банкротства.
Решение.
Однократная свертка (6.2.23) дает нам вектор Zo={0, 0.167,
0.333, 0.302, 0.198}. Видно, что результат группируется вокруг
средних и высоких значений фактора. Из (6.2.24) получаем A_N
= 0.606, что дает нам распознавание:
• средний уровень Fo — 0.43, высокий уровень Fo — 0.57,
• риск банкротства — промежуточный между лингвистиче-
скими оценками «Приемлемый и пограничный». Наибольший
вклад в риск вносит показатель Ез (он требует повышения).
6.3. Применение нечетких нейронных сетей для
анализа риска банкротства
Для анализа риска банкротства были также примене-
ны нечеткие нейронные сети Цукамото, Мамдани и ANFIS Они
использовались в качестве классификаторов. В качестве входных
247
Нечёткие модели и методы в интеллектуальных системах
данных выступали разные наборы финансовых показателей
предприятий, описанные ниже. Таким образом, количество
входных нейронов равняется количеству показателей в соответст-
вующем наборе. Количество выходных нейронов равняется коли-
честву классов, т.е. имеем 2 выходных нейрона.
База правил состояла из нечетких правил вида «если-то» с
гаусовскими функциями принадлежности. Выбор гауссовских
функций принадлежности был обусловлен их дифференцирован-
ностью в каждой точке, которая позволяет гарантировать сходи-
мость процесса обучения (градиентного алгоритма) Были прове-
дены эксперименты с разным количеством правил (20, 30, 40),
параметры которых настраивались в процессе обучения. Первич-
ная выборка разбивалась на учебную и проверочную. Кроме того,
для большей надежности процесс обучения осуществлялся на не-
скольких окнах данных.
6.3.1. Входные данные для анализа риска банкрот-
ства
Для анализа эффективности прогнозирования метода-
ми дискриминантного анализа, анализа на основе нечетких мно-
жеств, предложенного Недосекиным, а также нечетких нейрон-
ных сетей были взяты финансовые показатели пятидесяти шести
предприятий Украины, из которых 13 в 2006 году были признан-
ные арбитражным судом банкротами. Другие предприятия выби-
рались случайно. Финансовые показатели взяты из годовых ба-
лансов и годовых отчетов о финансовых результатах за 2003, 2004
и 2005 года. Годовые балансы и отчеты о финансовых результатах
были предоставлены Государственным комитетом статистики.
Так как информация бухгалтерских отчетов является закрытой,
данные были предоставлены без названия предприятий. Все
предприятия пронумерованы. Предприятия, которые выбирались
случайно, пронумерованы от I до 45, а признанные банкротами в
2006 году — от 101 до 115. На основе этих отчетов о балансе этих
предприятий были рассчитаны финансовые коэффициенты, ко-
торые более всего отображают финансовое состояние предпри-
ятий. Существующие коэффициенты были рассмотрены в первом
разделе данной главы (разд.6.1).
248
Глава 6. Системы с нечёткой логикой и нечёткие множества...
6.3.2. Описание экспериментов
Были проведены эксперименты по классификации
предприятий относительно риска банкротства с использованием
нечетких нейросетей с логическими выводами Мамдани, Цука-
мото и Сугено, работа которых описана в главе 3.
Проведем сначала анализ на базе следующих показателей
(Набор 1):
1. Отношение рабочего капитала к общей стоимости акти-
вов;
2 Отношение чистой прибыли к общей стоимости активов;
3 Отношение чистой выручки от реализации до общей стои-
мости активов;
4. Отношение уставного капитала к сумме задолженности;
5. Отношение дохода от реализации до общей стоимости ак-
тивов.
Обучение будем осуществлять в несколько шагов длиной в
100 эпох.
Для нечеткой нейронной сети Цукамото получаем следую-
щие результаты:
ТАБЛИЦА 6.10.
Результаты работы ННС Цукамото для Набора 1
Количество правил Обучающая выборка Проверочная выборка
20 81% 78%
30 81% 82%
40 81% 78%
ТАБЛИЦА 6.11.
Результаты обучения нечеткой нейронной сети Мамдани:
Количество правил Обучающая выборка Проверочная выборка
20 88% 83%
30 82% 80%
40 86% 82%
249
Нечёткие модели и методы в интеллектуальных системах
Для ННС ANFIS имеем:
ТАБЛИЦА 6 12
Результаты работы ННС ANFIS для Набора 1
Количество правил Обучающая выборка Проверочная выборка
20 86% 82%
30 85% 84%
40 82% 81%
В результате, для Набора 1 получаем следующие результаты
(см. рис. 6.4):
Рис. 6.4. Результаты классификации для Набора 1
Попробуем изменить набор показателей (Набор 2):
1. Отношение чистого оборотного капитала к общей стоимо-
сти активов;
2. Отношение прибыли к собственному капиталу;
3. Коэффициент оборотных активов;
4. Норма прибыли.
Для нечеткой нейронной сети Цукамото получаем следую-
щие результаты:
250
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6 13
Результаты работы ННС Цукамото для Набора 2
Количество правил Обучающая выборка Проверочная выборка
20 87% 85%
30 88% 87%
40 87% 86%
Результаты обучения нечеткой нейронной сети Мамдани:
ТАБЛИЦА 6.14
Результаты работы ННС Мамдани для Набора 2
Количество правил Обучающая выборка Проверочная выборка
20 88% 85%
30 90% 89%
40 91% 89%
Для ННС ANFIS имеем:
Количество правил Обучающая выборка Проверочная выборка-
20 86% 82%
30 88% 84%
40 89% 81%
В результате для Набора 2 имеем следующие итоговые резуль-
таты (см. рис. 6.5):
251
Нечёткие модели и методы в интеллектуальных системах
Рис. 6.5. Результаты классификации для Набора 2
Используем также следующий набор показателей:
коэффициент автономии (отношение собственного капитала
к валюте баланса);
коэффициент обеспечения оборотных активов собственными
средствами (отношение чистой прибыли (убытка) к налогообло-
жению к оборотным активам);
коэффициент промежуточной ликвидности (отношение сум-
мы денежных средств и дебиторской задолженности к кратко-
срочным пассивам);
коэффициент абсолютной ликвидности (отношение суммы
денежных средств к краткосрочным пассивам);
обращение всех активов за год (отношение выручки от реа-
лизации до средней выручки за период стоимости активов);
рентабельность всего капитала (отношение чистой прибыли
к среднему за период стоимости активов).
Для нечеткой нейронной сети Цукамото получаем следую-
щие результаты:
252
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6 15
Результаты работы ННС Цукамото для Набора 3
Количество правил Обучающая выборка Проверочная выборка
20 89% 81%
30 88% 87%
40 89% 83%
Результаты обучения нечеткой нейронной сети Мамдани:
ТАБЛИЦА 6 16
Результаты работы ННС Мамдани для Набора 3
Количество правил Обучающая выборка Проверочная выборка
20 91% 89%
30 92% 88%
40 90% 89%
Для ННС ANFIS имеем:
ТАБЛИЦА 6.17.
Результаты работы ННС ANFIS для Набора 3
Количество правил Обучающая выборка Проверочная выборка
20 86% 86%
30 87% 88%
40 89% 88%
В результате для Набора 3 итоговые результаты классифика-
ции всеми ННС приведены на рис. 6.6.
253
Нечёткие модели и методы в интеллектуальных системах
Q Обучающая выборка
Проверочная выборка
Рис 6.6. Результаты классификации для Набора 3
Как видим, нечеткие нейронные сети недостаточно хорошо
обучаются. Это может быть связано с неточностью, некорректно-
стью входной информации, т.е. ненадежностью полученных дан-
ных о предприятиях-банкротах. Например, некоторые предпри-
ятия, которые по их экономическим показателям должны были
быть признаны банкротами, представлены как «не-банкроты».
Для анализа и исправления таких расхождений целесообразно
применить методы нечеткого кластерного анализа, например, ал-
горитм Густафссона-Кесселя, описанный в главе 5.
Осуществим кластеризацию для нескольких наборов данных
отдельно за каждый год. Получим следующие результаты, относя
предприятие к кластеру банкротов в случае, когда его вероят-
ность принадлежности этому кластеру больше 0,75.
254
Глава 6. Системы с нечёткой логикой и нечёткие множества..
Набор 1,2003
Банкроты
45%
Не-банкроты
Банкроты
Не-
Банкроты
55%
Рис. 6.7. Результаты кластеризации для Набора 1 за 2003 г.
Набор 1. 2004
Банкроты
64%
и Не-банкроты
Банкроты
Не-
банкроты
36%
Рис. 6.8. Результаты кластеризации для Набора 1 за 2004 г.
255
Нечёткие модели и методы в интеллектуальных системах
Рис. 6.9. Результаты кластеризации для Набора 1 за 2005 г.
Набор 3. 2004
Не-
ба нкроты
36%
□ Не-банкроты
Банкроты
Банкроты
Рис. 6.10. Результаты кластеризации для Набора 3 за 2004 г.
256
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Набор 3, 2005
Не-
банкроты
55%
□ Не-банкроты
Банкроты
Банкроты
45%
Рис. 6.11. Результаты кластеризации для Набора 3 за 2005 г.
Предположим, что предприятия, которые несколько раз по-
пали в кластер банкротов при кластеризации по разным наборам
данных, являются потенциальными банкротами (согласно фи-
нансовой отчетности) и дальше будем это учитывать при класси-
фикации. На следующей диаграмме отобразим изменение струк-
туры нашей выборки.
257
Нечёткие модели и методы в интеллектуальных системах
После кластеризации
Не-банкооты
Банкроты
Не-
банкроты
55%
Рис. 6.12. Изменение в структуре выборки после кластеризации
ТАБЛИЦА 6.18.
Изменение в структуре выборки после кластеризации
Не-банкроты Банкроты
До кластеризации 43 13
После кластеризации 31 25
Попробуем снова возвратиться к задаче классификации. Рас-
смотрим показатели из Набора 1.
Для нечеткой нейронной сети Цукамото получаем следую-
щие результаты:
ТАБЛИЦА 6.19.
Результаты работы ННС Цукамото для Набора 1 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 89% 88%
30 88% 88%
40 90% 89%
Результаты обучения нечеткой нейронной сети Мамдани:
258
J
Глввв 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6.20.
Результаты работы ННС Мамдани для Набора 1 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 92% 89%
30 93% 88%
40 93% 90%
Для ННС ANFIS имеем:
ТАБЛИЦА 6.21.
Результаты работы ННС ANFIS для Набора 1 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 89% 85%
30 90% 86%
40 91% 86%
В результате, для Набора 1 после кластеризации имеем сле-
дующие итоговые результаты (см. рис. 6.13):
□ Обучающая выборка
Проверочнвя выборке
Рис. 6.13. Результаты классификации для Набора 1
после кластеризации
Рассмотрим теперь показатели из Набора 2. Для нечеткой
нейронной сети Цукамото получаем следующие результаты:
259
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 6 2 2.
Результаты работы ННС Цукамото для Набора 2 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 89% 85%
30 89% 87%
40 90% 86%
Результаты обучения нечеткой нейронной сети Мамдани:
ТАБЛИЦА 6 23.
Результаты работы ННС Мамдани для Набора 2 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 93% 90%
30 92% 89%
40 94% 91%
Для ННС ANFIS имеем:
ТАБЛИЦА 6 2 4
Результаты работы ННС ANFIS для Набора 2 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 90% 82%
30 89% 84%
40 90% 88%
В результате для Набора 2 после кластеризации имеем сле-
дующие итоговые результаты:
260
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Рис. 6.14. Результаты классификации для Набора 2 после кластеризации
Исследуем показатели из Набора 3 после кластеризации.
Для нечеткой нейронной сети Цукамото получаем следую-
щие результаты:
ТАБЛИЦА 6 24
Результаты работы ННС Цукамото для Набора 3 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 91% 89%
30 92% 90%
40 92% 92%
Результаты обучения нечеткой нейронной сети Мамдани:
ТАБЛИЦА 6 25
Результаты работы ННС Мамдани для Набора 3 после кластеризации
Количество правил Обучающая выборка Проверочная выборка
20 92% 89%
30 96% 95%
40 98% 95%
Для ННС ANFIS имеем:
261
Нечёткие модели и методы в интеллектуальных системах
ТАБЛИЦА 6.26
Результаты работы ННС ANFIS для Набора 3 после кластеризации
количество правил Обучающая выборка Проверочная выборка
20 90% 89%
30 94% 90%
40 97% 95%
В результате, для Набора 3 после кластеризации имеем:
Обучающая выборка
Проверочная выборке
Рис. 6.15. Результаты классификации для Набора 3 после кластеризации
6.3.3. Сравнительный анализ различных методов
оценки риска банкротства
Для анализа различных методов оценки риска банкротства
был разработан программный комплекс, в котором реализованы
классический метод дискриминантного анализа Альтмана, мат-
ричный метод Недосекина на основе нечетких множеств и метод
оценки риска банкротства с применением нечетких нейронных
сетей с различными алгоритмами нечеткого вывода
262
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Используя разработанный программный комплекс, было
проведено прогнозирование банкротства для пятидесяти шести
предприятий Украины, 13 из которых в 2006 году арбитражным
судом были признаны банкротами. Финансовое состояние ос-
тальных предприятий было неопределенно вследствие специфики
процедуры предоставления Государственным комитетом стати-
стики финансовой отчетности. Для его определения был прове-
ден анализ предприятий на основе методических рекомендаций
для выявления признаков неплатежеспособности и проведена
кластеризация методом Густавссона-Кесселя. Проанализировав
результаты обоих методов, к классу предприятий банкротов было
дополнительно отнесено еще 12 предприятий и 6 предприятий
были определены как такие, что имеют большой риск банкротст-
ва. Таким образом, выборка составила 56 предприятий, из кото-
рых 25 отнесенные банкротам, 6 предприятиям с большим рис-
ком банкротства и 25 предприятия с удовлетворительным финан-
совым состоянием.
Входными данными для расчета были финансовые коэффи-
циенты, которые вычислялись на основе данных из бухгалтер-
ских отчетов (баланса и отчета о финансовых результатах) за
2003, 2004 и 2005 годы. Прогнозирование проводилось с помо-
щью моделей Альтмана, Спрингейта, Давыдовой-Беликова и
матричного метода Недосекина. Таким образом, анализ прово-
дился на основе только количественных показателей.
На рис. 6.16 приводятся сравнительные данные - процент
ошибочной класификации банкротства проедприятий для стати-
стических методов Альтмана и Давыдовой-Беликова, матричного
нечетко-множественного метода Недосекина и нечетких нейросе-
тей Мамдани, Цукамото и ANFIS (Сугено) для трех наборов
финансовых показателей.
263
Нечёткие модели и методы в интеллектуальных системах
Набор 1
Набор 2
Набор 3
а) число правил 20
264
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Набор 1
Набор 2
Набор 3
б) число правил 30
Рис. 6.16
265
Нечёткие модели и методы а интеллектуальных системах
Основные результаты прогнозирования и сравнительный анализ
рассмотренных методов
1. Методом, который спрогнозировал банкротство с макси-
мальной точностью, оказался матричный метод Недосекина.
Точность прогнозирования составила 80% за 2 года до банкрот-
ства и 87% за год до дефолта. Такой результат вполне закономе-
рен, так как матричный метод, который базируется на использо-
вании теории нечетких множеств, лучше прогнозирует при усло-
виях неопределенности, неоднородности данных, а также учиты-
вает субъективные оценки экспертов. Но, несмотря на наилуч-
ший результат, матричный метод имеет довольно большую
ошибку прогнозирования (20% за 2 года и 13% за год до дефол-
та). Это обусловлено входными данными. Мы не имеем 100%
уверенности в правильном разбиении всей выборки на банкроты
и успешные предприятия. Ведь проверочная выборка может
иметь определенные неточности, которые влияют на величину
ошибок.
2. Среди статистических моделей наилучший прогноз, а точ-
нее классификацию, дает модель, разработанная русскими уче-
ными Давыдовой и Беликовым. Точность прогнозирования со-
ставила 73,5% за три года до банкротства, 85% и 78% за два и за
год до дефолта соответственно. Результат обусловлен адаптиро-
ванностью данной модели к условиям переходной экономики, в
отличие от модели Альтмана и Спрингейта, которые строились
на базе американских компаний.
3. Все статистические модели показали довольно большую
ошибку прогнозирования, которая колеблется в пределах 22-41%.
Это ставит под вопрос целесообразность использования данных
моделей для анализа финансового состояния украинских пред-
приятий. Основными причинами такой погрешности есть не-
адаптированность моделей к условиям украинской экономики,
предположение относительно однородности, независимости и
стационарности данных, которые в нашем случае не выполняют-
ся вследствие неоднородной выборки предприятий, а также того,
что статистические модели лишь анализируют текущее финансо-
вое состояние предприятий и не учитывают динамики изменения
показателей во времени.
Итак, для прогнозирования банкротства украинских пред-
приятий более целесообразно использование матричного метода
Недосекина. Для повышения точности прогнозирования необхо-
266
Глава 6. Системы с нечёткой логикой и нечёткие множества...
димо проводить его на основе не только количественных, но и
качественных характеристик, что возможно в пределах одного
конкретного предприятия, а также с помощью экспертов провес-
ти анализ всех показателей предприятия, которое анализируется,
и определить классификацию этих показателей (разбивка на не-
четкие подмножества) для конкретного предприятия, учитывая
его специфику и специфику отрасли, к которой оно относится.
Для более всесторонней оценки можно применять объединение
статистических методов с матричным методом.
4. Дальше с помощью разработанного программного пакета
был проведен анализ финансового состояния пятидесяти шести
предприятий Украины, 13 из которых в 2006 году арбитражным
судом были признаны банкротами. На такой выборке классифи-
кация с помощью нечетких нейронных сетей Цукамото, Мамда-
ни и ANFIS на разных наборах данных не принесла желаемых
результатов. Точность классификации составляла в среднем 80-
85% на обучающих и тестовых выборках. Такие результаты были
обусловлены, прежде всего тем, что среди предприятий оказались
потенциальные банкроты, о состоянии которых свидетельствова-
ли их финансовые показатели, но судом они банкротами по той
или другой причины признанные не были. Поэтому был приме-
нен алгоритм нечеткой самоорганизации Густафсона-Кесселя,
который помог выявить такие предприятия. В результате этого
была получена новая выборка уже с 25 банкротами и 31 другими
предприятиями. Результаты классификации с помощью выше-
упомянутых нечетких нейронных сетей на этой выборке значи-
тельно улучшились. Средняя точность выросла до 90-93% на
обучающих и тестовых выборках.
Наилучших результатов удалось достичь с помощью нечет-
кой нейронной сети Мамдани, точность классификации на кото-
рой при 40 нечетких правилах составила 97% на учебной и 95%
на тестовой выборках. При этом использовались следующие по-
казатели: коэффициент автономии, коэффициент обеспечения
оборотных активов собственными средствами, коэффициент
промежуточной ликвидности, коэффициент абсолютной ликвид-
ности, обращение всех активов за год, рентабельность всего ка-
питала. На втором месте находятся результаты прогноза банкрот-
ства, полученные с использованием ННС Цукамото, и наконец,
на третьем месте результаты, полученные матричным методом
Недосекина.
267
кие модели и методы в интеллектуальных системах
Что же касается статистических методов дискриминантного
анализа, то они оказываются существенно хуже в сравнении с
нечеткими методами.
6.4. АНАЛИЗ ИНВЕСТИЦИОННОГО ПОРТФЕЛЯ
Управление финансовыми активами преследует цель
достижения определенного экономического эффекта в будущее
время. Однако будущее неясно, и управление протекает в усло-
виях неопределенности относительно будущего состояния как
самих финансовых активов, так и их экономического окружения.
Неопределенность порождает риск неэффективного управления -
такого, что намеченные цели управления не достигаются. Поэто-
му задача минимизации риска неэффективного управления фи-
нансами замыкается на задачу всемерной борьбы с неопределён-
ностью [72, 73].
Исторически первым и наиболее распространённым спосо-
бом учета неопределенности является использование вероятно-
стей. Считается, что началом современной теории инвестиций
стала вышедшая в 1952 г. статья Г.Марковица «Выбор портфеля»,
в которой впервые была предложена математическая модель
формирования оптимального портфеля ценных бумаг и методы
построения таких портфелей при определенных условиях на ос-
нове теоретико-вероятностной формализации понятия доходно-
сти и риска.
Таким образом, в свете явной недостаточности имеющихся
научных методов для управления финансовыми активами, потре-
бовалась разработка принципиально новой теории управления
финансовыми системами, функционирующими в условиях суще-
ственной неопределенности. Большое содействие этой теории
оказывает теория нечетких множеств, заложенная около полувека
назад в фундаментальных работах Лотфи Заде.
В случае применения нечетких чисел к прогнозу параметров
от Л ПР требуется не формировать точечные вероятности оценки,
а задавать расчетный коридор значений прогнозируемых пара-
метров Тогда ожидаемый эффект оценивается экспертом так же,
268
Глава 6. Системы с нечёткой логикой и нечёткие множества...
как нечеткое число со своим расчетным разбросом (степенью не-
четкости).
Целью настоящего раздела является исследование и анализ
качественно нового подхода к управлению фондовым портфелем,
основанного на применении теории нечетких множеств, а также
разработка реализующих данный подход алгоритмов и сравнение
результатов их применения с результатами, полученными при
использовании классических вероятностных методов.
Для достижения поставленной цели были выполнены сле-
дующие задачи:
проведен анализ модели Марковица, как наиболее распро-
страненного на данный момент метода портфельного менедж-
мента, и выявлены её слабые стороны;
построена модель управления доходностью фондового порт-
феля, основанная на нечетко-множественном подходе;
проведен сравнительный анализ структуры портфелей, полу-
ченной в результате применения разных подходов.
6. 4. 1. Постановка задачи оптимизации инвестици-
онного портфеля
Рассматривается фондовый портфель из N компонент
и его ожидаемое поведение (прогнозный перфоманс) на интерва-
ле времени [О,?7]. Каждая из компонент портфеля i = l,...,N ха-
рактеризуется своей финансовой доходностью ri (оцененной в
точке Т как относительное приращение цены актива за период).
Держатель фондового портфеля - частный вкладчик, инве-
стиционная компания, взаимный фонд - управляет своими инве-
стициями, руководствуясь определенными соображениями. С од-
ной стороны, инвестор старается максимизировать свою доход-
ность. С другой стороны, он фиксирует предельно допустимый
риск неэффективности своих инвестиций. Примем капитал инве-
стора равным I. Задача оптимизации фондового портфеля за-
ключается в нахождении вектора долевого ценового распределе-
ния бумаг в портфеле: x = i = l,N, максимизирующего до-
269
Нечёткие модели и методы в интеллектуальных системах
ход инвестора при заданном уровне риска (очевидно, что
Л’
Ел/ = 1)-
/-1
Поставленную задачу можно условно разделить на два этапа:
1. Разработка и реализация алгоритмов методов оптимизации
фондового портфеля:
а) для модели Марковица (вероятностный подход);
б) для нечеткой модели на основе теории возможностей (не-
четко-множественный подход).
2. Проведение сравнительного анализа методов и выявление
их достоинств и недостатков для решения поставленной задачи.
6. 4. 2. Чёткая задача оптимизации портфеля
(задача Марковица) и её решение
Теоретические построения Марковица построены на
ряде предположений, часть из которых относится к условиям
принятия инвестиционных решений — к свойствам фондового
рынка, другая часть — к поведению инвестора.
Важнейшими из предположений первой группы являются
следующие:
1. Рынок состоит из конечного числа бесконечно делимых
ликвидных активов, доходности которых для заданного периода
считаются случайными величинами, т.е. все активы — рисковые).
2. Существуют открытые и достоверные исторические дан-
ные о доходности активов, позволяющие инвестору, получить
оценку ожидаемых (средних) значений доходностей и их попар-
ных ковариаций.
3. Инвестор при совершении операций с фондовыми акти-
вами свободен от транзакционных издержек и налогов.
4. Инвестор может формировать любые допустимые (для
данной модели) портфели, доходности которых являются также
случайными величинами.
Относительно поведения инвестора выдвигаются две гипоте-
зы — гипотеза не насыщаемости и гипотеза несклонности к рис-
ку. Эти гипотезы означают, что:
270
Глава 6. Системы с нечёткой логикой и нечёткие множества...
5. Инвестор всегда предпочитает более высокий уровень бла-
госостояния, то есть при одинаковых прочих условиях всегда вы-
бирает актив (портфель активов) с большей доходностью.
6. Инвестор из двух активов с одинаковой доходностью обя-
зательно предпочтет актив с меньшим риском.
Математическая модель задачи Марковица в четкой постановке
Пусть портфель содержит типов N ценных бумаг (ЦБ), каж-
дая из которых характеризуется пятью параметрами:
— начальной ценой Wj0 одной бумаги перед помещением её
в портфель;
— числом бумаг и, в портфеле;
— начальными инвестициями Si0 в данный портфельный сег-
мент, причем
S,0 = ^0-n,.; (6.25)
— среднеожидаемой доходностью бумаги rt;
— её стандартным отклонением ст,- от значения .
Делается основное допущение, что случайная величина до-
ходности бумаги имеет нормальное распределение с первым на-
чальным моментом rt и вторым центральным моментом . Это
распределение не обязательно должно быть нормальным, но из
условий винеровского случайного процесса нормальность выте-
кает автоматически.
Сам портфель характеризуется:
— суммарным объемом портфельных инвестиций S ;
— долевым ценовым распределением бумаг в портфеле {jcJ ,
причем для исходного портфеля выполняется
О N ____
xt= — , i = \,N; (6.26)
S' i=i
— корреляционной матрицей коэффициенты которой
характеризуют связь между доходностями i -ой и j -ой бумаг.
Если р(/ =-1, то это означает полную отрицательную корреля-
271
Нечёткие модели и методы в интеллектуальных системах
цию, если pj( = 1, имеет место положительная корреляция. Все-
гда выполняется рп = 1, так как ценная бумага положительно
коррелирует сама с собой.
Таким образом, портфель описан системой статистически
связанных случайных величин с нормальными законами распре-
деления. Тогда, согласно теории случайных величин, ожидаемая
доходность портфеля г находится по формуле:
,v
^=Ех. >
(6.27),
а стандартное отклонение портфеля & :
N
ст= EEvv^-^-^
(6.28)
Задача управления таким портфелем имеет следующее описа-
ние: определить вектор х = {х,} ( = 1, N, максимизирующий це-
левую функцию г вида (3) при заданном ограничении на уровень
риска ст, оцениваемый (6.28).
Найти такой вектор х
такой что
ст = const < <5М ,
N
х> О,
(6.29)
(6.30)
(6.31)
где <УМ — риск бумаги с максимальной среднеожидаемой доход-
ностью. Задача (6.29)—(6.31) есть не что иное, как классическая
задача квадратичной оптимизации, которая может решаться лю-
быми известными вычислительными методами.
Если задаваться различным уровнем ограничений по ст, ре-
шая задачу (6.29)—(6.31), то можно получить зависимость макси-
мальной доходности от ст вида:
г™х ^/СТ). (6.32)
Выражение (6.32), именуемое эффективной границей порт-
фельного множества, в координатах «риск-доходность» является
кусочно-параболической вогнутой функцией без разрывов. Пра-
272
Глава 6. Системы с нечёткой логикой и нечёткие множества...
вой точкой границы является точка, соответсвующая тому слу-
чаю, когда в портфеле оказывается одна бумага с максимальной
среднеожидаемой доходностью
6. 4. 3. Постановка нечёткой задачи портфельной
оптимизации
Сформулированные в предыдущем разделе проблемы
обусловливают применение нечетко-множественного подхода
[70], где:
Риск портфеля — это не его волатильность, а возможность
того, что ожидаемая доходность портфеля окажется ниже неко-
торой предустановленной плановой величины.
Корреляция активов в портфеле не рассматривается и не
учитывается.
Доходность каждого актива — это неслучайное нечеткое чис-
ло (например, треугольного вида или интервального вида). Ана-
логично, ограничение на предельно низкий уровень доходности
может быть как обычным скалярным, так и нечетким числом
произвольного вида. Таким образом, мы сводим два источника
информации (средняя доходность и волатильность актива) в один
(расчетный коридор доходности или цены) и тем самым объеди-
няем два источника неопределенности в один.
Поэтому оптимизировать портфель в такой постановке мо-
жет означать, в частном случае, требование максимизировать
ожидаемую доходность портфеля в точке времени Т при фикси-
рованном уровне риска портфеля Эффективная граница порт-
фельного множества в этом случае — вогнутая линия в коорди-
натах «риск недопустимо низкой доходности портфеля — ожи-
даемая доходность портфеля». Каждой точке эффективной гра-
ницы отвечает оптимальный портфель с четкими границами. Та-
ким образом, вся нечеткость — возможность модели «прятаться»
в показателе риска недостаточной доходности.
Рассмотрим задачу на основе изложенной модели, в предпо-
ложении самых широких допущений относительно вида её не-
четких параметров.
Пусть имеется фондовой портфель из А активов на интерва-
ле [0, /J. Прогнозный перфоманс каждой из компонент портфе-
273
Нечёткие модели и методы в интеллектуальных системах
ля i = на момент Т характеризируется своей финальной
расчетной доходностью (оцененной в точке Т как относи-
тельное приращение цены актива за период). Поскольку доход по
ЦБ случаен, его точное значение в будущем неизвестно, а веро-
ятностное описание такого сорта случайности не вполне кор-
ректно, то в качестве описания доходности уместно использовать
треугольные нечеткие числа, моделируя экспертное высказыва-
ние следующего вида: «Доходность ЦБ по завершении срока вла-
дения ожидаемо равна г и находится в расчетном диапазоне
Таким образом, для i -ой ценной бумаги имеем:
rt — ожидаемая доходность по i -ой ценной бумаги;
— нижняя граница доходности i -ой ценной бумаги;
ri2 — верхняя граница доходности i -ой ценной бумаги.
rt =(ru>/br2«) — доходность по i -ой ценной бумаге, тре-
угольное нечеткое число.
Тогда доходность по портфелю:
W _ N _ N
Г = (rmin = £ Xtru г =Y х, rt; rmax = £ X,r2i) , (6.33)
i=i i=i z=i
также является треугольным нечетким числом (как линейная
комбинация треугольных нечетких чисел), где Xj — вес z-ro ак-
тива в портфеле, причем
N
=1, 0<х <1. (6.34)
1=1
Также определимся с критическим уровнем доходности
портфеля на момент Т. Это может быть нечеткое число тре-
угольного вида r*=(z-*;r ;r2*j. В частном случае это обычный
числовой норматив г , например, 10% годовых.
274
Глава 6. Системы с нечёткой логикой и нечёткие множества...
6. 5. МЕТОД РЕШЕНИЯ НЕЧЁТКОЙ ЗАДАЧИ
ОПТИМИЗАЦИИ ПОРТФЕЛЯ
Оценка риска портфельных инвестиций
Перейдем к оценке собственно риска портфельных
инвестиций. На рис. 6.17 представлены функции принадлежно-
сти г и критериального значения г*.
О
Рис. 6.17. Функции принадлежности г и г
Точкой пересечения этих двух функций принадлежности
является точка с ординатой . Выберем произвольный уровень
принадлежности а и определим соответствующие интервалы
Pi.*,] и Pi >г2]- При a > а,, i\ > r2, интервалы не пересекают-
ся, и уверенность в том, что портфель эффективен, стопроцент-
ная, поэтому степень риска неэффективности равна нулю. Уро-
вень ОС] уместно назвать верхней границей зоны риска. При
0<а<а] интервалы пересекаются. На рис. 6.6 показана за-
штрихованная зона неэффективного распределения активов в
портфеле, ограниченная прямыми г* - г*, г* = г* , г = , г = г2
и биссектрисой координатного угла г — г .
275
Нечёткие модели и методы в интеллектуальных системах
Рис. 6.18. Фазовое пространство (г,г )
Взаимные соотношения параметров гх 2 и гхг дают следую-
щий расчет для площади заштрихованной плоской фигуры [70, 71]:
0, при > г2
2 1 • "Г" т2 > 'i * гг > г[
(гх ~^) + <г2 ri).(^_^) при г<г^ Гг>г’
• • (у —г)2 • •
(g ~r, —2 2‘ . ирм G<'i г2<г2
(»'j -<)(г2-г,), при г2>г’
(6. 35)
Поскольку все реализации (г,г*) при заданном уровне при-
надлежности а равновозможны, то степень риска неэффектив-
ности ф(а) есть геометрическая вероятность события попадания
точки (г, г) в зону неэффективного распределения капитала:
ф(«) =
(6.36)
где Sa - оценивается по формуле (6.35).
Тогда итоговое значение степени риска неэффективности
портфеля:
276
Глава 6. Системы с нечёткой логикой и нечёткие множества...
(6.37)
о
В важном частном случае (см. рис. 6.7), когда критерий эф-
фективности определен четко уровнем г , то предельный пере-
ход при r2 —>Ai —дает [70]:
О, при г* < t\
ф(«) ='
------—, при rx<r* <r2; а е [0;11.
(''г"'!)
1, при г* > г2
Для того чтобы собрать все необходимые исходные данные
для оценки риска, нам потребуется два значения обратной функ-
ции Первое значение есть г* (по определению верхней
границы зоны риска а,), второе значение обозначим г*. Анало-
гичным образом обозначим rnun и — два значения обратной
Рис. 6.19. Пример четкого критерия эффективности
277
Нечёткие модели и методы в интеллектуальных системах
Также введем обозначение г — наиболее ожидаемое значе-
ние г. Тогда выражение для степени риска портфеля /3, с уче-
том (6.37) и длинной цепи преобразований, имеет вид:
О, при г' < rmm
R 1 + ——1п(1-а,)|, при rmin <r <г
0 = И J , (6.38)
1 - (1 - /?)[ 1 + ——^-1п(1 - а,) при г < г* < гтах
Л » При Г' * Гтах
где
(6.39)
1,
О, при
пРи
’ < Гтах
при г’ < г
при г* = г
при г<г‘ < гтах
при г' > гтах
(6.40)
Таким образом, степень риска /3 принимает значения от 0
до 1. Каждый инвестор, исходя из своих инвестиционных пред-
почтений, может классифицировать значения /3, выделив для
себя отрезок неприемлемых значений риска. Возможна также
более подробная градация степеней риска. Например, если вве-
сти лингвистическую переменную «Степень риска» со своим
терм-множеством значений {Незначительная, Низкая, Средняя,
Относительно высокая, Неприемлемая), то каждый инвестор мо-
жет произвести самостоятельное описание соответствующих не-
четких подмножеств, задав пять функций принадлежности р {/3) .
278
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Модель управления доходностью портфеля
Для того, чтобы определить структуру портфеля, который
обеспечит максимальную доходность при заданном уровне риска,
требуется решить следующую задачу:
{xopJ = М I r~>max’ /3 = const, (6.41)
где г и (3 определяются из формул (6.38)—(6.40), компоненты
вектора х удовлетворяют (6.34).
Нетрудно заметить, что (6.40) можно записать в следующем
виде:
0, при г'<rmn
*
4----*4 при гтш<г'<7
г~г™
«1 =1
г —г ~ .
, при г <r <rmax
Гпих -Г
0, при г > rmax
Вспомнив также, что доходность портфеля:
(6.42)
где (rH,/;,r2j) — доходность z-ой ценной бумаги получаем сле-
дующую задачу оптимизации (6.43)-(6.45):
N
7 = ^х,?; -> шах, (6.43)
i=i
(3 = const, (6.44)
N ____
£х, =1 х,. >0 i = l,N. (6.45)
i=i
При варьировании уровня риска /3 возможны 3 случая. Рас-
смотрим подробно каждый из них.
1. /3 = 0.
279
Нечёткие модели и методы в интеллектуальных системах
N
Из (6.38) видно, что этот случай возможен когда г* < .
1=1
Получаем следующую задачу линейного программирования
(6.46)—(6.48):
N
г = £xfi -> max, (6.46)
/=1
н
(6.47)
f=l
Ь' ___
£х,=1 х, >0 i = ],N. (6.48)
i=i
Найденный в результате решения задачи (6.46)—(6.48) вектор
х = {х,} i = 1,N и есть искомая структура оптимального для
данного уровня риска портфеля.
2. (3 = 1.
Из (6.38) следует, что этот случай возможен когда
N
1=1
Получаем следующую задачу линейного программирования:
.V
г = ^х^ —> max, (6.49)
/=1
(6.50)
1=1
.V ____
=1 х, > 0 i = l,N. (6.51)
1=1
Найденный в результате решения задачи (6.49)—(6.51) вектор
х = {х,} i = ],N и есть искомая структура оптимального для
данного уровня риска портфеля.
280
Глаза 6. Системы с нечёткой логикой и нечёткие множества...
3 О<0<1.
Из (15) видно, что этот случай возможен когда
Д' V N N
- г < либ°’когда -r < •
1=1 1=1 1=1 1=1
N V
а) Пусть Ел-г<> -г* < . Тогда используя (6.38)—(6 40)
1=1 /=1
задача (6.43)—(6.45) сводится к следующей задаче нелинейного
программирования:
N
7 = —> max >
i=i
(6.52)
,(6.53)
N
E*zn -r''
1=1
.V
>r‘.
1=1
N ____
xf = 1 xt > 0 i = I, N
i=\
(6.54)
(6.55)
(6.56)
N N
б) Пусть < r* < ^х(г;2 . Тогда задача (6.43)—(6.45)
i=i i=i
сводится к следующей задаче нелинейного программирования:
281
Нечёткие модели и методы в интеллектуальных системах
N
ХХ^2>Г'’ <659)
1=1
/V
(6.60)
1=1
N ___
£х,=1 х,. >0 i = l,N. (6.61)
i=i
Для решения задач (6.52)—(6.56) и (6.57)—(6.61) в работах
[43, 44] применен A-алгоритм минимизации недифференцируе-
мых функций. Пусть обе задачи: (6.52)-(6.56) и (6.57)—(6.61) раз-
решимы. Тогда структуре искомого оптимального портфеля будет
отвечать вектор х = {х,}, i = l,N — решение той из задач
(6.52)—(6.56), (6.57)—(6.61), значение целевой функции которой
будет больше.
6. 6. СРАВНИТЕЛЬНЫЙ АНАЛИЗ РЕЗУЛЬТАТОВ
РЕШЕНИЯ ЧЁТКОЙ И НЕЧЁТКОЙ ЗАДАЧ
ОПТИМИЗАЦИИ ИНВЕСТИЦИОННОГО
ПОРТФЕЛЯ
Рассмотрим применение вышеописанного нечетко-мно-
жественного подхода в задаче оптимизации портфеля акций фон-
дового рынка Московской межбанковской валютной биржи
(ММВБ).
Описание результатов экспериментальных исследований
Пусть фондовый портфель состоит из 5-ти компонент, акций
российских компаний ЛУКОЙЛ, РАО ЕЭС, МосЭнерго, Татнфт.
ЮКОС. По данным Московской межбанковской валютной бир-
жи (ММВБ) доходности акций данных компаний за период 19-
23 мая 2006 года составляли соответственно:
282
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6.27
Ценные бумаги
1 2 3 4 5
1 0,109 -0,31 0,422 0,457 -0,394
2 0,214 0,052 -0,237 -0,15 -0,093
3 0,165 0,076 0,442 0,136 -0,497
4 0,256 -0,05 -0,33 0,288 0,399
5 0,09 -0,297 -0,246 0,032 0,333
6 -0,473 -0,167 0,306 0,141 0,254
7 -0,013 -0,46 0,154 0,022 -0,107
8 0,104 -0,11 0,457 0,092 0,26
9 -0,443 -0,188 -0,354 -0,19 0,266
10 0,01 -0,235 0,176 0,76 -0,24
Как видно, доходности чрезвычайно малы. Это обусловлено
тем, что данные по курсам акций брались за очень короткий пе-
риод, в течение которого изменения в цене были незначитель-
ными.
Портфель, обеспечивающий максимальную доходность при
заданном пользователем уровне риска 0,05, включает в себя ак-
ции только двух компаний: МосЭнерго (48,5%) и Татнф (51,5%).
Задаваясь различным уровнем ограничений (риск портфеля),
получаем эффективную границу портфельного множества - зави-
симость максимальной доходности от риска вида ппах= гтах(б).
Программа позволяет построить эффективную границу по точ-
кам, выбранным пользователем, или же по 10-ти автоматически
сгенерированным точкам.
283
Нечёткие модели и методы в интеллектуальных системах
а) автоматически
Рис. 6.20
б) по 4-м заданным пользователем точкам
Рис. 6.21
284
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Корреляция активов и принцип диверсификации позволяют
инвестору получить доход, задавая уровень риска ниже волатиль-
ности наименее рискового актива. Эта ситуация наблюдается в
первых двух из приведенных выше портфелей.
При уровне риска, превышающим волатильность наиболее
рискового актива, в портфеле оказываются одна бумага с максималь-
ной средне ожидаемой доходностью. В рассматриваемом портфеле, это
акции компании МосЭнерго. Соответствующая этому случаю точка яв-
ляется правой точкой эффективной границы портфельного множества.
Анализ и сравнение результатов, полученных при применении мо-
делей Марковица и нечетко-множественного метода
Для сравнительного анализа исследуемых методов оптимиза-
ции фондового портфеля были использованы реальные данные
по курсу акций компании РАО «ЕЭС России» (EERS2) и ОАО Газ-
пром (GASP), взятые за период с февраля 2000 года по май 2006 года.
Данные получены из архивов Московской фондовой биржи (МФБ).
Доходность акций компаний РАО «ЕЭС» и Газпром за ука-
занный период:
__________________________________ТАБЛ ИЦА 6 2 8
1 EERS2 2 GASP
-8,40479754 6,47487205
-14,8852025 13,69050481
21,33097436 46,4871688
-9,13538992 8,76644886
10,14596678 39,37311526
2,074775007 -23,8466504
5,445945879 19,128848
-2,98057593 29,81867364
14,40914705 22,27473498
4,12083224 0,02543522
2,3463079 0
1,41692617 -19,8581445
1,37627361 -7,35357621
285
Нечёткие модели и методы в интеллектуальных системах
В модели Марковица ожидаемая доходность акции рассчиты-
вается как математическое ожидание т=М{г] на основе указан-
ной выше выборки доходностей. В качестве меры риска актива
рассматривается дисперсия величины ожидаемой доходности
б2=М[(т-г)2] т.е. уровень изменчивости ожидаемых доходов.
Рассмотрим теперь нечетко-множественную модель. Исходя
из ситуации на фондовом рынке, делаются следующие выводы:
— доходность акций EERS2 лежит в расчетном коридоре
[-1.0: 3.9], наиболее ожидаемое значение доходности 2,1%;
— доходность акций GASP лежит в расчетном коридоре [-4.1:
5.7], наиболее ожидаемое значение доходности 4,8%;
Пусть критическая доходность портфеля составляет 3,5% т.е.
портфельные инвестиции, приносящие доход ниже 3%, считают-
ся неэффективными.
Нечетко-множественный метод дал нам следующие результаты:
ТАБЛИЦА 6.29
ERS2 GASP Доходность портфеля Нижняя граница Верхняя граница Уровень риска
0 1 4,8 -4,1 5,7 0,5203
0,1 0,9 4,53 -3,59 5,52 0,5449
0,2 0,8 4,26 -3,08 5,34 0,5767
0,3 0,7 3,99 -2,74 5,16 0,6207
0,4 0,6 3,72 -2,06 4,98 0,6878
0,5 0,5 3,45 -1,55 4,9 0,8212
0,6 0,4 3,18 -1,04 4,62 0,8871
0,7 0,3 2,91 -0,53 4,44 0,9239
0,8 0,2 2,64 -0,02 4,26 0,949
0,9 0,1 2,37 0,48 4,08 0,9688
1 0 2,1 0,99 3,9 0,9833
Результаты, полученные с помощью модели Марковица для
аналогичных уровней риска таковы (см. табл. 6.30):
286
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ТАБЛИЦА 6.30
ERS2 GASP Доходность портфеля Уровень риска
0,47 0,53 6,49 0,52
0,44 0,56 6,75 0,54
0,38 I 0,62 7,22 0,577
0,31 0,69 7,77 0,62
0,209 0,791 8,647 0,688
0,004 0,91 10,35 0,821
0,0001 0,996 10,38 0,887
0 0,9999 | 10,383 0,92
Ожидаемая доходность оптимальных портфелей, полученных
с помощью модели Марковица, выше, чем доходность оптималь-
ных портфелей, полученных с помощью нечетко-множественного
метода. Это объясняется тем, что в модели Марковица расчет
ожидаемой доходности акций основывается на показателях за
прошедшие периоды и почти не учитывается ситуация на фондо-
вом рынке на момент принятия решения инвестором. Поскольку
доходность акций EERS2 и GASP до июля 2006 года была намно-
го выше нынешней, модель Марковица дает неоправданно высо-
кую оценку.
Если рассматривать данные по доходностям акций указанных
компаний начиная с июля 2003 года, опустив показатели 2000-
2002 гг., на основании подхода Марковица получим следующие
результаты:
ERS2 GASP Доходность портфеля Уровень риска
0,5 0,49 5.01 0,5
0,38 0,62 5.31 0,6
0,26 0,74 5.6 0,7
0,02 0,98 6.23 0,9
287
Нечёткие модели и методы в интеллектуальных системах
Наблюдается парадокс: с уменьшением объёма выборки ис-
ходных данных показатели ожидаемой доходности портфеля ста-
ли больше соответствовать реальным данным. Оптимальная
структура портфеля при этом практически не изменилась.
В нечетко-множественном методе, доходность каждого актива
— это детерминированное нечеткое число. Её ожидаемое значе-
ние рассчитывается уже не из статистических данных, а исходя
из состояния рынка в момент принятия инвестором решения
Таким образом, в рассматриваемом случае, ожидаемая доход-
ность портфеля не слишком высока.
Структура оптимального портфеля, полученная в результате
применения методов, для одних и тех же уровней риска тоже
различна. Для того, чтобы выяснить причину этого, рассмотрим
следующие зависимости.
Зависимости ожидаемой доходности от степени риска порт-
феля, приведены на следующем рисунке 6.22 [43].
а) нечетко-множественным методом
288
Глава 6. Системы с нечёткой логикой и нечёткие множества...
степень риска
Зависимости ожидаемой доходности от степени риска порт-
феля, полученные указанными выше методами, практически
противоположны. Причиной такого результата является различ-
ное понимание уровня риска портфеля.
В нечетко-множественном методе под риском понимается си-
туация, когда ожидаемая доходность портфеля ниже заданного
критического уровня. Со снижением ожидаемой доходности воз-
растает риск того, что доход от портфельных инвестиций окажет-
ся меньше критического значения.
В модели Марковица риск рассматривается как степень ко-
леблемости ожидаемого дохода по портфелю, причем как в
меньшую, так и в большую сторону, что противоречит здравому
смыслу.
Различное понимание уровня риска портфеля является также
причиной различия зависимостей степени риска от доли той или
иной акции в портфеле, полученных разными методами.
Зависимость степени риска портфеля от доли акций ESP2,
полученная по модели Марковица и нечетко-множественной мо-
дели, приводятся на рис. 6.23.
а) нечетко-множественным методом;
б) с помощью модели Марковица;
289
Нечёткие модели и методы в интеллектуальных системах
Вполне ясно, что с ростом доли низкодоходной бумаги в
портфеле, даже несмотря на то, что расчетный коридор по
EERS2 более узок, нежели расчетный коридор по GASP, падает
ожидаемая доходность портфеля в целом — и, соответственно,
растет риск неэффективности портфельного выбора.
Уровень же изменчивости ожидаемых доходов для акций
EERS2 исходя из данных 2000-2006 гг. намного ниже, чем для
акций GASP. Поэтому в модели Марковица, рассматривающей
его как риск портфельных инвестиций, с увеличением доли ак-
ций EERS2 риск портфеля снижается.
Аналогичным образом объясняется различие между получен-
ными разными методами графиками зависимости степени риска
портфеля от доли акций в нем GASP.
С точки зрения нечетко-множественного подхода, чем боль-
ше доля акций GASP в портфеле, тем меньше риск того, что эф-
фективность фондовых инвестиций окажется ниже критического
уровня, составляющего в нашем случае 3.5%.
С точки зрения модели Марковица, среднеквадратическое от-
клонение от среднего значения для акций GASP довольно вели-
ко, поэтому с ростом их доли риск портфеля возрастает Это
приводит к тому, что часто доля высокодоходных активов в фон-
довом портфеле, полученном с помощью модели Марковица, не-
оправданно мала.
Согласно модели Марковица, благодаря корреляции между
активами можно получить портфель с уровнем риска меньше во-
латильности наименее рисковой бумаги. В рассматриваемом
примере, вложив 96% капитала в акции EERS2 и 4% в акции
GASP, инвестор получает портфели с ожидаемой доходностью
2.4% и степенью риска 0.19. Однако инвестиции с ожидаемой
290
Глава 6. Системы с нечёткой логикой и нечёткие множества...
доходностью 2.4% в нашей нечетко-множественной модели счи-
таются неэффективными. Если же задать критическое значение
ожидаемой доходности портфеля равным 2.4%, то риск неэффек-
тивных инвестиций, тоже, само собой, снизится.
6.7. ЭКСПЕРИМЕНТАЛЬНЫЕ ИССЛЕДОВАНИЯ НЕ-
ЧЕТКО-МНОЖЕСТВЕННОЙ МОДЕЛИ С РАЗ-
ЛИЧНЫМИ ФУНКЦИЯМИ ПРИНАДЛЕЖНОСТИ
Для сравнительного анализа исследуемых методов оп-
тимизации фондового портфеля были использованы данные по
курсу акций компаний РАО «ЕЭС России» (EERS2) и ОАО Газ-
пром (GASP), взятые за период с февраля 2000 года по май 2006
года. Данные получены из архивов Московской фондовой биржи
(МФБ) [42].
Рассмотрим нечетко-множественную модель. Исходя из си-
туации на фондовом рынке, делаются следующие выводы:
доходность акций EERS2 лежит в расчетном коридоре [-1.0;
3.9], наиболее ожидаемое значение доходности 2.1%;
доходность акций GASP лежит в расчетном коридоре [-4.1;
5.7], наиболее ожидаемое значение доходности 4.8%;
Пусть, критическая доходность портфеля задается нечетким
числом с параметрами [3 0; 3.5; 4.0]. Задание критического уров-
ня доходности портфеля в виде нечеткого числа отражает неуве-
ренность инвестора в том, какой доход через заданный период
времени будет приемлемым.
Нечетко-множественный метод дал нам следующие результа-
ты:
ТАБЛИЦА 632.
Треугольная ФП
EERS2 GASP Доход- ность портфе- ля Нижняя граница Верхняя граница Задан- ный уровень риска Риск - получ. портфеля
0.4104 0.5896 403051 -1.1645 4 95457 0.55 0 55000004
0 6323 0.3677 3 73956 0.39456 4 56952 0.6 0 60000013
0.7253 0.2147 3.25545 0.98567 4.41491 0.65 0.64999999
291
Нечёткие модели и методы а интеллектуальных системах
0.7545 0.2555 3.527643 1.26584 4.34897 0.7 0.70000007
0.7833 0.2167 3.484655 1.42589 4.29367 0.75 0.75000000
0.8345 0.1255 3.399487 1.84564 4.25784 0.8 0.79999998
0.8734 0 1266 3.334893 2.04578 4.14457 0.82 0.82000006
ТАБЛИЦА 6.33.
Гауссовская ФП
EERS2 GASP Доход- ность портфе- ля Нижняя граница Верхняя граница Задан- ный уровень риска Риск получ. портфеля
0.4213 0.5797 4.09324 -1.0667 4.97356 0.55 0.54999999
0.6398 0.3612 3.74755 0.41678 4.58745 0.6 0.60000007
0.7301 0.2699 3.59846 1.34922 4.41975 0.65 0.65000000
0.7576 0.2424 3.52903 1.29867 4.35873 0.7 0.70000003
0.7873 0.2127 3.50015 1.43972 4 30021 0.75 0.75000010
0.8389 0 1611 3.41324 1.92563 4 25564 0.8 0.80000002
0.8776 0.1224 3.34254 2.13456 4.16567 0.82 0.82000001
ТАБЛИЦА 6 34.
Колоколообразная ФП
EERS2 GASP Доход- ность порт- феля Нижняя граница Верхняя граница Задан- ный уровень риска Риск получ. порт- феля
0.4214 0 5886 4.09497 -1.0786 4 97765 0.55 0.55000000
0.6397 0.3703 3.74743 0.41273 4 58878 0.6 0.59999989
0.7235 0.2765 3.59951 1.34926 4 42433 0.65 0.65000100
0.8064 0.1936 3.52985 1.29456 4 36784 0.7 0.70000007
0.7578 0.2462 3.51432 1.43456 4 32054 0.75 0.75000002
0.8190 0.1910 3.43476 1.93345 4.26574 0.8 0.79999999
0.8807 0.1193 3.34455 2.13457 4.16567 0.82 0.82000008
292
Глава 6. Системы с нечёткой логикой и нечёткие множества...
Как видно из таблиц 6.32—6.34, структура и значения ожи-
даемой доходности для оптимальных портфелей, найденных с
применением разных функций принадлежности параметров от-
личаются весьма несущественно. Это позволяет судить, во-
первых, о корректности построенных моделей, а, во-вторых, о
том, не имеет особого значения, какую ФП для выраженных не-
четко доходностей ценных бумаг и критического уровня доход-
ности, мы выбираем. Исключением является случай, когда сумма
вкладываемого в акции капитала чрезвычайно высока и даже
очень малые порядки от неё, составляют большие деньги.
О достоверности полученных результатов можно судить лишь
по погрешности при решении соответствующей задачи оптими-
зации. Логично предположить, что чем меньше риск оптималь-
ного портфеля отличается от заданного уровня, тем точнее реше-
ние, а значит и достовернее результаты.
Рис. 6.24. Зависимость ожидаемой доходности от степени риска портфе-
ля, полученного для треугольной ФП параметров портфеля
Теперь рассмотрим случай, когда критический уровень до-
ходности портфеля задается четким числом
ТАБЛИЦА 6.35.
Треугольная ФП, четкий критический уровень доходности 3,5%
EERS2 GASP Доход- ность * портфеля Нижняя граница Верхняя граница Заданный уровень риска
0.4214 0.5886 4.12345 -1.0847 4.99988 0.55
0.6397 0.3703 3.78746 0.48756 4.74359 0.6
293
Нечёткие модели и методы в интеллектуальных системах
0.7235 0.2765 3.93478 1.19373 4.58366 0.65
0.8064 0.1936 3.65685 1.39487 4.48523 0.7
0.7578 0.2462 3.52734 1.42589 4.39645 0.75
0.8190 0.1910 3.41276 1.94567 4.30007 0.8
0.8807 0.1193 3.39846 2.12356 4.19836 0.82
Сравнив с данными таблицы 6.32, полученными для тре-
угольной функции принадлежности параметров и нечеткого кри-
тического уровня доходности [3.0; 3.5; 4.0], можно сделать за-
ключение о том, что в этом случае доходность оптимального
портфеля несколько ниже, чем при четком значении, поскольку
выгодными считаются также портфельные инвестиции, ожидае-
мая доходность которых попадает в интервал от наименьшего ле-
вого значения критической доходности до наиболее ожидаемого.
Такая же ситуация наблюдается и для функции принадлежно-
сти Гауссовского и колоколообразного вида.
Рассмотрим теперь другой пример [42].
Пусть инвестиционный портфель состоит из акций трех рос-
сийских компаний, так называемых «голубых фишек»: ОАО
«ГМК Норильский никель», ОАО «Мобильные ТелеСистемы»,
ОАО «Сургутнефтегаз».
В таблице 6.36 представлены данные по доходности акций в
период с января по май 2006 года, которые были получены с
сайта Московской межбанковской валютной биржи (ММВБ).
ГМКННик МТС Сугрнфгз
7.248776 9.683646 11.035432
8.049567 12.08452 10.094762
8.135762 11.00965 13.398224
8.893875 12.48531 17.584875
7.953982 11.19587 13.530822
7.945093 11.72653 10.398697
8.154398 10.33497 10.535983
8.235453 12.29823 9.8359845
7.934764 9.824734 9.94573598
7.993747 12.02653 13.9976690
294
Глааа 6. Системы с нечёткой логикой и нечёткие множества...
Исходя из ситуации на фондовом рынке, делаются следую-
щие выводы:
— доходность акций ГМКННик лежит в расчетном коридоре
[7.2; 8.9], наиболее ожидаемое значение доходности 8.0%;
— доходность акций МТС лежит в расчетном коридоре [9,5;
12,5], наиболее ожидаемое значение доходности 11.0%;
— доходность акций Сургутнефтегаз лежит в расчетном кори-
доре [9.6; 17,6], наиболее ожидаемое значение доходности 12.0%.
Пусть, критическая доходность портфеля составляет [10.0;
11.0; 12.0]. То есть, портфельные инвестиции, приносящие доход
ниже 10.0% считаются вообще неэффективными.
Для Гауссовской и колоколообразной ФП параметры функ-
ций взяты таким образом, чтобы соответствующие функции по-
лезности принимали существенно отличные от нуля значения на
аналогичных интервалах, и значения наиболее ожидаемой доход-
ности (для которых р(г)=1) тоже совпадали, так как лишь в этом
случае возможно сравнение результатов, полученных при исполь-
зовании разных ФП.
Нечетко-множественный метод дал нам в данном случае сле-
дующие результаты, которые приведены на рисунках 6.25—6.27
для разных видов функций принадлежностей.
Наблюдаемая картина абсолютно аналогична предшествую-
щему примеру. То есть доходность оптимальных портфелей, по-
лученных при применении Гауссовской и колоколообразной ФП
немного выше, чем в случае треугольной ФП, что наглядно ил-
люстрируют графики.
15 -----------------------------------------
8
0.5 0.55 0.6 0.65 0.75 0.8 0.9
Уровень риска
Рис. 6.25. Зависимость ожидаемой доходности от степени риска порт-
феля, полученного для треугольной ФП параметров портфеля
295
Нечёткие модели и методы в интеллектуальных системах
Рис. 6.26. Зависимость ожидаемой доходности от степени риска портфе-
ля, полученного для Гауссовской ФП параметров портфеля
Рис. 6.27. Зависимость ожидаемой доходности от степени риска порт-
феля, полученного для колоколообразной ФП параметров портфеля
Однако, как и в предыдущем примере, различия в получен-
ных результатах достаточно малы, особенно между моделями,
использующими Гауссовскую и колоколообразную ФП. Поэтому
в большинстве случаев не играет роли, какая функция принад-
лежности параметров используется при построении нечеткой мо-
дели портфеля ценных бумаг.
296
Глава 6. Системы с нечёткой логикой и нечёткие множества...
ВЫВОДЫ К ГЛАВЕ 6
В данном разделе проводилось исследование в облас-
ти фондового менеджмента. Была рассмотрена модель Маркови-
ца, как одна из наиболее широко применяемых в данной облас-
ти, и относительно недавно возникший нечетко-множественный
подход к портфельной оптимизации. В результате проведенного
исследования была получена основанная на нечетко-множествен-
ном подходе математическая модель для нахождения структуры
оптимального инвестиционного портфеля, лишенная большинст-
ва недостатков классических вероятностных моделей
На основании теории нечетких множеств был разработан ал-
горитм оптимизации фондового портфеля. В процессе исследо-
вания и сравнительного анализа модели Марковица и нечетко-
множественного метода определения оптимальной структуры
фондового портфеля было выявлено следующее:
Структуры оптимального портфеля и показатели его ожидае-
мой доходности, получаемые с помощью модели Марковица и
нечетко-множественного метода кардинально отличаются.
С уменьшением объема выборки исходных данных по доходности
активов модель Марковица даёт более правдоподобные результаты.
Однако слишком маленькая выборка также не допустима, т.к. не мо-
жет дать полного представления о рассматриваемых параметрах.
Поскольку отклонение ожидаемой доходности в большую
сторону, также как и в меньшую, рассматривается в модели
Марковица как риск, зависимости ожидаемой доходности от
уровня риска портфеля, полученные с помощью упомянутой мо-
дели Марковица и нечетко-множественного метода, практически
противоположны.
По указанной выше причине также довольно часто доля вы-
сокодоходных активов в структуре портфеля, полученного с по-
мощью модели Марковица, неоправданно мала.
Таким образом, наглядно проявили себя недостатки модели
Марковица. Особенно не оправдывает себя применение модели
Марковица к фондовым рынкам таких стран, как Россия и Ук-
раина, где однородность с течением времени не сохраняется.
5. Различия в доходности оптимальных портфелей, получен-
ных при применении треугольной, Гауссовской и колокольной
ФП, в полученных результатах достаточно малы, особенно между
моделями, использующими Гауссовскую и колокольную ФП.
297
ПРИЛОЖЕНИЕ
Нечеткие множества,
нечеткие отношения
В задачах организационного управления часто случаются си-
туации, в которых исходные условия задачи нечетко определен-
ны. Такие ситуации отображают недостаточную инфомацион-
ность лица, принимающего решение (ЛПР).
Используемая информация может быть субъективной, а ее
отображение в языке людей, как правило, содержит много неоп-
ределенностей типа “много”, ’’мало”, “приблизительно”, кото-
рые не имеют аналогов в языке математики. Поэтому описание
этой информации средствами традиционной математики сильно
огрубляет математическую модель. Таким образом, для дальней-
шего применения математических методов анализа и исследова-
ния все более сложных систем, появилась потребность в созда-
нии нового математического аппарата, что дал бы возможность
формально описывать нечеткие понятия, которыми пользуется
человек, описывая свои желания, цели и представление о системе.
Таким аппаратом стала теория нечетких множеств, созданная
Л.Заде, первая фундаментальная работа которого была опублико-
вана еще в 1965 г. [124]. На протяжении последних сорока лет
это направление интенсивно развивалось, появились сотни ра-
бот, посвященью теоретическим и прикладным аспектам теории
нечетких множеств. Одним из наиболее актуальных направлений
новой теории является проблема принятия решений при нечет-
ких условиях и критериях, которая привела к появлению нового
направления в математическом программировании — нечеткого
математического программирования (НМП). В этой главе изло-
жены основные идеи, задачи и методы нечеткого математическо-
го программирования.
298
Нечеткие множества, нечеткие отношения
1.1. НЕЧЕТКИЕ МНОЖЕСТВА
И ОПЕРАЦИИ НАД НИМИ.
Основные понятия и определения.
Определение 1.1. Нечетким множеством А, которое
задано на универсальном множестве X называется совокупность
пар (х,дл(х)), где хе!,а ЦА — функция х -+ [0;1], которая
имеет название функции принадлежности множества А. Значе-
ние Мл(х) Для конкретного х называется степенью принадлеж-
ности этого элемента к нечеткому множеству А (рис. 1.1. а) [47].
Обычные множества образовывают подкласс нечетких мно-
жеств. Действительно, функцией принадлежности обычного
множества В с X является её характеристическая функция
Рг(х) (рис. 1.1. б):
, , (1,если х е В;
[0,ес/ш хеВ.
Определение 1.2. Нечеткое множество &, определенное на X,
называется пустым, если ее функция принадлежности равняется О
на всем множестве X, т.е. цв(х) = 0, Vx е X.
Определение 1.3. Универсальное множество X описывается
функцией принадлежности вида цх (х) =1, Vx е X .
Определение 1.4. Носителем нечеткого множества А с функцией
принадлежности (х) называется множество вида
supp/l = {х : дл(х) > 0,х е %].
299
Приложение
Нечеткое множество А называется нормальным, если выполня-
ется условие sup^(x)=l, в противном случае оно называется суб-
нормальным.
Пусть А и В — нечеткие множества на X, /J.A(x) и /J.B(x) —
их функции принадлежности соответственно.
Говорят, что А включает в себя В (т.е. В с А), если для лю-
бого х е X выполняется неравенство цв(х)< /ЛА(х) (рис. 1.2).
Если В с А , то supp В с supp А.
Множества А,В эквивалентные (А ~ В), если р^(х) = ^^(х),
Vx е X.
Пример 1.1. Рассмотрим нечеткие множества:
А = {х: величина х близка к 1};
В = {х: величина х очень близка к 1}.
Тогда В с А и функции принадлежности этих множеств
должны удовлетворять условие
Операции над нечеткими множествами.
Определение 1.5. Объединением нечетких множеств А и В
в X называется нечеткое множество С = A{JB с функцией принад-
лежности вида (рис. 1.3):
йс (х) = тах{^л (х> цв (х>. (9.1.1)
Определение 1.6. Сильным объединением нечетких множеств А и
В в X называется нечеткое множество С = AUB с функцией принад-
лежности
W+йв W,если м + йв(х) <1 >
\,якщо pA(x) + pB(x) > 1.
Определение 1.7. Пересечением нечетких множеств А и В в X на-
зывается нечеткое множество С = А П В с функцией принадлежно-
сти вида (рис. 1.4):
Рс(*) =
300
Нечеткие множества, нечеткие отношения
McW=M^w=min{^W; <112)
Если {А}} — конечнная или бесконечное семейство нечетких
множеств с функциями принадлежности (х,у), где у е У —
параметр семьи, то пересечение С = Q Ау является нечетким
У
множеством с функцией принадлежности вида:
)UC М = inf (х, у), х е X .
Определение 1.8. Сильным пересечением нечетких множеств А и
В в X называется нечеткое множество С = АП В с функцией при-
надлежности вида:
Цс(х)=ц (х)=у.А(х)*цв(х) , хе X. (1.1.3)
Определение 1.9. Разностью нечетких множеств А и В в X на-
зывается нечеткое множество А\В с функцией принадлежности
вида:
РлМ “ ИвМ’ если цА{х) > рЛ(х) > 0,
О, в противном случае.
(1.1.4)
Определение 1.11. Декартовым произведением Ах х Л2 х... х Ап
нечетких множеств Л, в X,,i = 1,п называется нечеткое множе-
301
Приложение
ство в декартовом произведении Xt х Х2 х ...х Хл с функцией при-
надлежности вида.
рА(х) = min^x,),^^).....дл(х„)}. (1.1.5)
Множества уровня и декомпозиции
нечетких множеств.
Определение 1.12. Множеством уровня а нечеткого
множества А на X называется множество, которое состоит из
элементов х е X таких, степень принадлежности которых к
множеству А не менее а, т.е., еслиАа — множество уровня а не-
четкого множества А , то
Аа = {х: рА(х)> а} . (1.1.6)
Справедливы такие соотношения [47]:
«Ж = Ш ;(4Ж = 4ПД» (i-i ?)
Если для операции объединения и пересечения используются
соответствующие сильные операции, то
(4jB)a=>(4UBa) ; (<p)aG(4,UBo). (1.1.8)
В некоторых случаях целесообразно пользоваться разложе-
нием нечеткого множества pi по его множествам уровня, а имен-
но представлением нечеткого множества в виде:
л = (11-9)
а-0
где д^(х) = apAJx), а объединение нечетких множеств берется
согласно определению (1.1.10) по всем а от 0 до 1.
1.2. НЕЧЕТКИЕ ОТНОШЕНИЯ.
ОПЕРАЦИИ НАД НИМИ.
Прежде чем ввести понятие нечеткого отношения,
рассмотрим обычные отношения и их свойства.
302
Нечеткие множества, нечеткие отношения
Отношением R на множестве X называется некоторое под-
множество декартового произведения X * X.
Согласно этому определению задать отношение R на множе-
стве X означает указать все пары (х,у), которые связаны отно-
шением R. Для обозначения того, что элементы х е X связаны
отношением, будем пользоваться такими двумя эквивалентными
формами записи: xRy или (х, у) е R. Если множество X, на ко-
тором задано отношение R, конечно, то отношение задается в
двух формах:
1) в матричной
R = |Ы i = l,m j = 1,я,
2) в графической
\,если (х,,х ) е Л;
г. =
[О, в противном случае.
Нечеткие отношения.
Введем понятие нечеткого отношения и рассмотрим
его свойства [47].
Определение 1.14. Нечетким отношением R на множестве X
называется нечеткое подмножество декартового произведения
X х X , которое характеризуется такой функцией принадлежно-
сти рЛ(х,у), которая ХхХ——>[0,1] . Причем рк(х,у) рас-
сматривается как субъективная мера выполнения отношения
xRy.
Носителем нечеткого отношения R на множестве X называ-
ется подмножество декартового произведения X х X, которое
определяется так:
supp R = {(х, у): рЛ(х,у) > 0, х е X,у е У].
Операции над нечеткими отношениями.
Пусть на множестве X х X задано два нечетких отно-
шения А и Вс функциями принадлежности рА(х,у),рв(х,у).
Тогда множество С = A U В является объединением нечетких от-
303
Приложение
ношений А и В на множестве X, если его функция принадлеж-
ности определяется выражением
= тах^х.уХц^х.у)}.
Аналогично множество D = А П В является пересечением не-
четких множеств А и В, если
цй(х,у) = min{^(x,y),pj(x,y)}
Можно ввести также операции сильного объединения и силь-
ного пересечения, аналогичные операциям над нечеткими мно-
жествами.
Нечеткое отношение В включает в себя нечеткое отношение
А (А с В), если для них выполняется соотношение рА(х,у)<
< рв(х, у),Ух,у е X.
Если R -нечеткое отношение с функцией принадлежности
Ря(х<У)< то отношения R, которое характеризуется функцией
принадлежности р^(х,у) = 1 - pR(x, у),Ух, у е X называется до-
полнением R на множестве X.
Обратное к R отношение на X определяется так: xR 1
у<---->yRx, при этом функции принадлежности связанные ме-
жду собой равенством _,(х,у) = ря(у,х).
Свойства нечетких отношений.
1. Рефлексивность. Нечеткое отношение называется
рефлексивным на X, если выполняется условие цЛ(х,х) =
= l,VxeX (пример рефлексивных отношений: приблизительно
равные, близкие)
2. Антирефлексивность. Нечеткое отношение R на X назы-
вается антирефлексивным, если для всех х е X, рк(х,х) = 0
(Например R— намного больше).
3. Симметричность. Нечеткое отношение R на X симмет-
ричное, если для всех xjel, pR(x,y) = pR(y,x). Отношение
R антисимметричное, если из того, что цл(х, у)>0 вытекает
= 0.
304
Нечеткие множества, нечеткие отношения
Важное значение в теории нечетких множеств имеет компо-
зиция (или произведение) нечетких отношений. В отличие от
обычных (четких) отношений композицию (произведение) не-
четких отношений можно определить разными способами
Определение 1 15. Макс иминная композиция (произведение) не-
четких отношении А и В на X характеризуется функцией при-
надлежности вида:
йЛв(МУ) = suprmn{pA(x,z),pB(z,y)} (1.2.1)
Определение 1.16. Минимаксная композиция нечетких отноше-
ний А и В на X (она обозначается АВ) определяется функцией
принадлежности вида:
рА в(х,у) = minmax{pA(x,z),pB(.z,y)}. (1.2. 2)
ZeA
Определение 1.17. Максимультипликативная композиция нечет-
ких отношений А и В на X — нечеткое отношение С = А* В с
функцией принадлежности вида:
Ва-в^Х-У) = sup{p„(x,z) pB(z,y)} (1.2. 3)
ZeX
Пример. 1.5. Пусть задано два нечетких отношения А и В на
множестве X, которое состоит из двух элементов X = {х,, хг}, где
матрицы нечетких отношений имеют следующий вид:
Zt z2
У1 У2
BA(z,y) =
х, 0.2 0.6
х2 0.5 0.8
, а Г0'5
^Uy) = z2[0-3
0.7
1
Тогда композиция (произведение) нечетких отношений опре-
деляется так:
а) максиминная R* = АВ
ч 0.3
^АВ(х'у) = 0.5
0.6
0.8
б) минимаксная /?22 = А ° В
Ра в(х,у) =
0.5
0.5
0.7
0.7 ’
305
Приложение
в) максимультипликативнаяRl = А* В
Иа.в<х>У)
0.18
0.25
0.6
0.8
Нечеткое отношение R на множестве X называется транзи-
тивным, если R- R^ R. Из этого следует, что свойство транзи-
тивности нечеткого отношения зависит от способа задания ком-
позиции нечетких отношений.
1.3. ЗАДАЧА ДОСТИЖЕНИЯ НЕЧЕТКО
ОПРЕДЕЛЕННОЙ ЦЕЛИ
(ПОДХОД БЕЛМАНА—ЗАДЕ).
Задача достижения нечетко определенной цели, сфор-
мулированная Р.Белманом—Л.Заде, базируется на предположе-
нии, что цель принятия решений и множество альтернатив рас-
сматриваются как равноправные нечеткие подмножества некото-
рого универсального множества альтернатив. Это предположение
дает возможность найти решение задачи довольно просто [47].
Пусть X — универсальное множество альтернатив, т.е. уни-
версальная совокупность возможных выборов Л ПР.
Нечеткой целью в X является нечеткое подмножество X,
которое обозначим G.
Нечеткая цель описывается функцией принадлежности pc :
х----->[0,1].
Определим теперь, что понимают под решением задачи дос-
тижения нечеткой цели. Решить эту задачу означает достичь це-
ли и удовлетворить ограничение, причем в данной постановке
надо говорить не просто о достижении цели, а о ее достижении
с той или другой степенью, с учетом степени выполнения огра-
ничений.
В подходе Белмана—Заде эти факторы учитываются так.
Пусть некоторая альтернатива х обеспечивает достижение
цели со степенью рс(х) и удовлетворяет ограничение С со сте-
пенью рс(х). Тогда считают, что степень принадлежности упо-
306
Нечеткие множества, нечеткие отношения
минутой альтернативы решения задачи равняется минимуму сре-
ди этих величин. Таким образом, нечетким решением задачи
достижения нечеткой цели есть пересечение нечетких множеств
цели и ограничений, т.е. функция принадлежности решений
рд(х) равняется:
рд(х) = min{^c(x);pc(x)}. (1.3.1)
При наличии нескольких целей и ограничений нечеткое ре-
шение описывается функцией принадлежности:
1лв(х) = min{^& (х),^^),...,^^),^^),^^),...,^^)}.
Если разные цели и ограничения различаются за степенью
весомости и заданы соответствующие коэффициенты относи-
тельной весомости целей Л,(х) и ограничений v,, то ц0(х) зада-
ется выражением:
Рд(х) = min{A1juC|(x),...,A„pC/i(x),vlpC|(x),...,vmpCn(x)}. (1.3.2)
Пример 1.6. Пусть задано универсальное множество X =
= {1,2,—,10}, на котором задана нечеткая цель G (х близкое до
5), нечеткое ограничение С, (х близкое до 4) и С2 (х близкое
до 6). Пусть их функции принадлежности заданы в табл. 1.2.
ТАБЛИЦА 1.2.
X 1 2 3 4 5 6 7 8 9 10
0 0.1 04 0.8 1.0 0.7 0.4 0.2 0.1 0
Рс, М 03 0.6 07 1 0.9 0.8 0.5 0.3 0.2 0
Pc, W 0.2 0.4 0.6 0.7 0.9 1 0.8 0.6 0.4 0.2
Тогда для решения D получим функцию принадлежности
рд(х), а решения D интерпретируется как: х должно быть близ-
ким до 5 (для табл. 9.3).
ТАБЛИЦА 1.3.
X 1 2 3 4 5 6 7 8 9 10
0 0.1 0.4 0.7 0.9 0.7 0.4 0.2 0.1 0
307
Приложение
Это решение можно интерпретировать как нечетко сформу-
лированную инструкцию. При таком представлении остается не-
определенность, какую же альтернативу следует выбрать, т.е. на-
до разрешить эту неопределенность. Существуют разные способы
разрешения этой неопределенности. Наиболее распространенный
из них, предложенный Л.Заде, состоит в выборе альтернативы,
которая имеет максимальную степень принадлежности к нечет-
кому решению, т.е. альтернатива определяется из условия:
max р„(х) = max min{pc(x),pc(x)}.
X
Такие альтернативы называют максимизирующими.
1.4. ПРИНЯТИЕ РЕШЕНИЙ ПРИ НЕЧЕТКОМ
ОТНОШЕНИИ ПРЕДПОЧТЕНИЯ
НА МНОЖЕСТВЕ АЛЬТЕРНАТИВ.
Процесс принятия решений как выбор наилучшей
(наиболее рациональной) альтернативы из некоторого универ-
сального множества альтернатив X, может происходить при раз-
ной степени информированности Л ПР.
Если информацию о реальной ситуации, на основе которой
сравниваются разные альтернативы, можно задать в форме
функций полезности, то имеем задачу НМП. Такие варианты за-
дачи рассмотрено в п. 1.3. Однако подобный способ описания
информации возможный не всегда. Универсальным является
описание информации в форме отношения предпочтения на
множестве альтернатив [47].
Рассмотрим это отношение и его свойства. Предположим, что
на основе информации, полученной от ЛПР, на множестве до-
пустимых альтернатив X введено четкое отношение нестрогого
предпочтения R. Это означает, что для любой пары альтернатив
(х, у) можно высказать одно из таких утверждений:
х не хуже у, что записывается так: х > у или (х, у) е R;
у не хуже х, т.е. у > х или (у, х) е R ;
х и у не сопоставимы между собой, т.е. (у, х) « R, (х, у) g R.
Такая информация дает возможность сузить класс рацио-
нальных выборов, включив в него лишь те альтернативы, кото-
рые не доминируются никакой альтернативой из множества X.
308
Нечеткие множества, нечеткие отношения f
Для того, чтобы определить недоминированные альтернати-
вы, введем отношение строгого предпочтения Rs, соответствую-
щее отношению нестрогого предпочтения R, а также отношение
безразличия Rj.
Будем говорить, что альтернатива х строго лучше альтернативы
у, когда одновременно, х> у, а у>х не выполняется, т.е.
(х, у) е R. (у,х) g R. Совокупность всех таких пар (х,у) и назы-
вается отношением строгого предпочтения Rs на множестве X.
Отношение строгого предпочтения Rs, согласно его опреде-
лению, записывается так:
RS = R\R‘. (1.4.1)
Если (х, у) е Rs, то будем говорить, что альтернатива х до-
минирует альтернативу у (записывается Альтернативу
х е X назовем недоминированной на множестве X с заданным
отношением Rs, если (у, х) s Rs для любой альтернативы
у е X. Другими словами, если х — недоминированная альтер-
натива, то на множестве X нет ни одной альтернативы у, ко-
торая бы доминировала х. Ведь выбор недоминированных аль-
тернатив можно считать рациональным в задаче принятия ре-
шений.
Таким образом, информация в форме отношения предпочте-
ния R дает возможность сузить класс рациональных виборов X
в подмножество недоминированных альтернатив Хнд вида:
Хи0 = {х : х е Х,(у,х) е R\ R' ,Vy e X}.
Если имеющаяся в ЛПР информация в форме отношения
предпочтения недостаточная, чтобы сделать выбор между альтер-
нативами х и у, то между этими альтернативами существует
отношение “безразличия” Rj (индифферентность). Более строго,
между альтернативами х и у есть отношения безразличия
(х, у) е Rj тогда и только тогда, когда отношение предпочтения
х > у и предпочтения у > х одновременно выполняются или
одновременно не выполняются. Из этого определения вытекает,
что Rj можно записать в виде:
309
Приложение
Rj = {X х X}\{R\J R'}\J {R6\ R~'} (1.4.2)
Нечеткое отношение предпочтения.
При моделировании реальных систем могут быть та-
кие ситуации, когда в Л ПР нет четкого представления (инфор-
мации) об отношении предпочтения между всеми или некоторы-
ми альтернативами, а можно лишь оценить степень выполнения
того или другого предпочтения между парами альтернатив в виде
числа на отрезке [0; I ]. В таком случае с помошью Л ПР (или экс-
перта) можно ввести нечеткое отношение предпочтения.
Определение 1.18. Нечетким отношением нестрогого предпочте-
ния на множестве альтернатив X будем называть любое заданное
на этом множестве нечеткое рефлексивное отношение R [47].
Итак, нечеткое отношение предпочтения R на X описываем
функцией принадлежности pR(x,y), которая имеет свойство
рефлексивности, т.е. pR(x,x) = 1 для всех хе X. Если R — не-
четкое отношение предпочтения на множестве X, то для произ-
вольной пары альтернатив (x,y)eR значение pR(x,y) следует
понимать как степень выполнения предпочтения х > у. На ос-
нове заданного на X нечеткого отношения нестрогого предпоч-
тения R можно однозначно определить три соответствующих
ему нечетких отношения: 1) безразличия Rj\ 2) эквивалентности
Re; 3) строгого предпочтения Rs, которые используются для оп-
ределения и анализа свойств множества недоминированных аль-
тернатив в задачах принятия решений [47]. По аналогии из обыч-
ными (т.е. четкими) отношениями предпочтения они определя-
ются так:
Rj = {Xх2Г]\{RUR-'}U{ЯЛ R '}; я, = я\я',
Д, = япя1
Т.е. отношение эквивалентности Re определяется так: альтерна-
тива х эквивалентна у (у ~ х), если одновременно выполняют-
ся отношение х > у и у > х. Используя раньше введенные опре-
деления операций нетрудно получить выражения для функ-
ций принадлежности этих отношений:
310
Нечеткие множества, нечеткие отношения
1) нечеткое отношение безразличия
Рк(х,у) = тах[1 - max{pft(x,y);pR(y,x)};niin{/jft(x,y);pft(y,x)}] =
= тах|тт{1-дя(х,у);1-дЛ(у,х)}; тт{дя(х,у);дЛО\х)Н; (1-4.3)
2) нечеткое отношение эквивалентности
Рк(х,у) = гпш{дЛ(х,у);дл(у,х)}; (1.4. 4)
3) нечеткое отношение строгого предпочтения
£(х,у)
Vn(x,y)-pR(y,x), если pR(x,y)>pR(y,x),
<
О, в противном случае.
(1.4.5)
Рассмотрим некоторые свойства введенных нечетких отношений.
1. Нечеткие отношения Rj, Re рефлексивны и симметричны.
Действительно, их рефлексивность вытекает из того, что ря(х,х) =
= 1, Vx е X, поскольку исходное отношение R рефлексивно.
Поэтому p«(x,x) = pJK(x,x) = 1.
Симметричность обоих отношений вытекает из их определений.
2. Нечеткое отношение строгого предпочтения Rs анти-
рефлексивное и антисимметричное.
а) р*(х,х) = 0, поскольку исходное отношение R рефлек-
сивное и для него рл(х, х) = I для всех х е X ;
б) пусть Ря(х,у)>0, т.е. рл(х,у) > дЛ(у,х) > 0. Тогда
р£(у,х) = 0, что означает антисимметричность этого отношения.
Можно показать, что когда исходное нечеткое отношение
предпочтения R на X транзитивное, то транзитивны также и
соответствующие отношения эквивалентности Re и строгого
предпочтения Rs [47] .
Нечеткое подмножество недоминированных
альтернатив.
Используем введенные выше отношение строгого
предпочтения Л, для определения подмножества недоминирован-
ных альтернатив. Согласно определению нечеткого отношения
311
Приложение
предпочтения Rs для любых альтернатив х, у е X величина
PR(x,y) является степенью, с которой альтернатива у домини-
руется альтернативой х. Поэтому при фиксированом у е X
функцию х) можно рассматривать как функцию принад-
лежности нечеткого множества альтернатив х е X, которые
строго доминируются альтернативой р%(х,у). Отсюда вытекает,
что множество всех альтернатив х, которые не доминируются аль-
тернативой у, является дополнением введенного отношения Rs.
Согласно определению дополнения получим, что это новое не-
четкое множество описывается функцией принадлежности вида:
l-l4(y,x),xe X. (1.4.6)
Если, например, psR(y, х) = 0.3, то со степенью 0.7 альтерна-
тива х не доминируется альтернативой у. Отсюда вытекает, что
для выделения в X подмножества всех альтернатив, каждая из ко-
торых не доминируется никакой альтернативой из X, надо взять
пересечение нечетких подмножеств (1.4.6) по всем уеХ. Такое
пересечение и назовем нечетким подмножеством недоминиро-
ванных альтернатив и обозначим его Хнд. Согласно определению
операции пересечения нечетких множеств получим такое выра-
жение для функции принадлежности множества недоминирован-
ных альтернатив:
rf(x) = inf[l -р£(у,х)],х е X .
у^Х
Или
p«(x) = l-supp^(y,x),xe X. (1.4.7)
Согласно (1.4.7) pR(x) — степень с которой альтернатива х
не доминируется ни одной из альтернатив множества X. Пусть
pHR(x) = a для некоторой альтернативы х0. Тогда х0 доминиру-
ется любыми другими альтернативами со степенью, которая не
превышает (1 - а).
312
Нечеткие множества, нечеткие отношения
Пользуясь определением нечеткого отношения nsK(x,y) мож-
но показать, что
supju£(y,x) = 5ир[рл(у,х)-дя(х,у)],хе X. (1.4.8)
уъХ уеХ
Выражение (1.4.7) дает возможность описать подмножество
недоминированных альтернатив функцией принадлежности вида,
где — исходное нечеткое отношение нестрогого предпочтения.
Поскольку величина р^(х) есть степень недоминированности
альтернативы х, то рациональным следует, конечно, считать вы-
бор альтернатив, которые имеют наибольшую степень принад-
лежности нечеткому множеству Хн<), т.е. таких, что
Ик<х°) = sup цр (х) = 1 - inf sup^Cr, х) - рЛ(х, у)}. (1.4.9)
хеХ уеХ
Множество всех альтернатив xHd, которые удовлетворяют ус-
ловию (1.4.9), назовем максимальными недоминированными аль-
тернативами на множестве X. Очевидно
X™ = М = sup ц"а(г),х е X}.
геХ
ТАБЛИЦА 1.6
А#(х) = *1 *2 Хэ
0.5 0.6 0.8 0.5
Как видим, наибольшую степень недоминированости имеет
альтернатива х3(д^(х) = 0.8), поэтому ее выбор следует считать
наилучшим решением.
Четко недоминированные альтернативы
и их свойства.
Рассмотрим задачи рационального выбора альтернатив,
в которых множество недоминированных альтернатив представля-
ет собой нормальное нечеткое подмножество множества X, т.е.
функция принадлежности этого подмножества имеет свойство
supp^(x) = l. (1.4.10)
хеХ
313
Приложение
В этом случае для любой альтернативы х из множества Хяй
максимальных недоминированных альтернатив выполняется ус-
ловие pR (х) = I. Это означает, что для любой альтернативы
х е Хнд и произвольной альтернативы у е X при этом выполня-
ется равенство pR(y,x) = 0, т.е. ни одна из альтернатив не доми-
нирует с ненулевой степенью данную альтернативу х.
Такие альтернативы, для которых pHR(x) = l, назовем четко
недоминированными (сокращенно ч.нд.), соответствующее мно-
жество — множеством четко недоминированных альтернатив, и
будем обозначать его Хчнд. Тогда
Хчнд = {х : х е X та р£*(х) = 1}.
Множество ч.нд. альтернатив сыграет выдающуюся роль в за-
дачах рационального выбора, поскольку его можно рассматри-
вать как четкое решение нечетко сформулированной задачи.
Рассмотрим некоторые свойства ч.нд. альтернатив. Прежде
всего рассмотрим вопрос об эквивалентности ч.нд. альтернатив.
Покажем, что ч.нд. альтернативы, если их можно сравнивать,
обязательно эквивалентные.
Как вытекает из определения Хчи'\ pHR(x), для произвольной
ч.нд. альтернативы х е Хчнд выполняется равенство:
supply,*) = 0. (1.4.11)
уех
Отсюда можно сделать вывод, что для любых х,,х2 е Хчш> вы-
полняется равенство:
^(х1,х2) = ^(х2,х,) = 0. (1.4.12).
Тогда из определение p^(x,,x2) вытекает, что рк(х{,х2) =
= рЛ(х2,х|).
Согласно определению нечеткого отношения эквивалентно-
сти р^(хих2) получим
Яя, х2) = min{p/((x1, х2), рк(х2, х,)} = pR(х,, х2)
314
Нечеткие множества, нечеткие отношения
для всех
х„х2е1“"’. (1.4.13)
Рассмотрим два типа линейности нечеткого отношения пред-
почтения (н.о.п.):
1) — линейное н.о п. Если R есть Л — линейным, т.е.
тах{дл(х1, х2),цк(х2, х,)} > Л,
То из (9.4.18): вытекает
Л. (1.4.14).
т.е. две произвольные ч.нд. альтернативы эквивалентны со сте-
пенью, не ниже Л.
2) R сильно линейное н.о.п. Если R сильно линейное,
тах{дл(х1,х2),дл(х2,х|)} = 1, a х,,х2 & Хчид,
то из определения сильной линейности и равенства (7.4.14) вы-
текает
^хх,х2) = I.
(1.4.15)
Многокритериальный выбор альтернатив
на основе нечеткого отношения предпочтения
Рассмотрим применение нечеткого отношения пред-
почтения и множества недоминированных альтернатив в пробле-
ме рационального выбора при наличии нескольких критериев.
Пусть имеем ситуацию, когда каждый из критериев j задан в
форме четких функций полезности fj-.X-t R('}. Значение fj(x)
можно трактовать как числовую оценку альтернативы х е X по
признаку (х) = 1 -—sup
2 m уеХ
m
,x e X. Альтерна-
тива x с большей оценкой fj(x) считается лучшей по критерию
(признаку) j. Таким образом, каждая из функций Х2 описыва-
ет(задает) обычное(четкое) отношение предпочтения {X,Q2} на
множестве альтернатив Х2нд с Х'нд вида:
315
Приложение
Rj = {(*,У): fj(x) > x,y eX}.
Задача состоит в том, чтобы выбрать альтернативу х0, кото-
рая имела бы наибольшие оценки по всем критериям (призна-
ками).
Дадим описание алгоритма выбора альтернатив при наличии
многих критериев оптимальности (нечетких отношений предпоч-
тения) [20].
1. Пусть на универсальном множестве альтернативы X зада-
ны отношение предпочтения R2,..., Rm (четкие или нечеткие)
с функциями принадлежности р2(х,у), а также a)j,J = \,т — ве-
совые коэффициенты соответствующих отношений.
Строим свертку отношений Rt,R2,..., Rnl в виде пересечения
т
2, = Р] Rj , с функцией принадлежности
j=i
Pft(x,y) = пйп{ц|(х,у),рДх,у),..,рт(х,у)) (1.4.20)
2. Определим множество недоминированных альтернатив Q"’’
в множестве (X, Q})
Рй (*) = 1" SUP) Е Pq, &х) - Pq, и у)
УеХ j=i
(1.4.21)
3. Введем свертку исходных отношений {Rj} в виде суммы
Qi = , где ^coj = 1,соу > 0.
7=1 7=1
Ей отвечает функция принадлежности вида:
Pq, (X,y) = ffi)^(xj).
7=1
Результирующее н.о.п. Q2 рефлексивное, поскольку все ис-
ходные н.о.п. Rj рефлексивные.
316
Нечеткие множества, нечеткие отношения
4. Используя свертку критериев в виде суммы, строим нечет-
кое отношение предпочтения Q,:
m m
RQ,(x,y) = ,YC0, =^{OJ • (1.4.22)
5. Находим нечеткое подмножество недоминированных аль-
тернатив по отношению Q,
Rq, (х) = 1 - sup] £ рОл (у, X) - рОл (х, у) .
у*х [у=1
(1.4.23)
6. Находим пересечение множеств Q"d, Qf , и обшее множе-
ство недоминированных альтернатив Qut) = Q2d с функцией
принадлежности
ряДх) = min{^(x),Pft(x)}
(1.4.24)
Рациональным считаем выбор альтернатив из множества
Хчид = {х‘ : кДх*) = 5ирряДх),х е X}. (1.4.26)
Итак, наилучшим следует считать выбор альтернатив из мно-
жества с наибольшей степенью недоминированости.
Пример 1.8. Пусть гражданин N хочет более выгодно вложить
свой приватизационный имущественный сертификат (ПИС).
При этом он рассматривает такие возможные варианты:
х, — использовать ПИС для приватизации жилья,
х2 — использовать его для приобретения акций автомобиль-
ной компании, например ЛОГОВАЗ;
х3 — вложить ПИС в акции строительной компании, которая
строит бизнес-центр в городе;
х4— продать свой ПИС.
Гражданин оценивает альтернативы по таким критериям:
Я, — ожидаемая прибыль; R2 — возможный риск, связанный с
317
Приложение
банкротством; — время, через которое можно ожидать полу-
чение прибыли.
Пусть по оценкам эксперта упомянутые критерии устанавли-
вают такие отношения преимущества на множестве альтернатив:
Л]: х, предпочтительнее х4 (записываем так: х,>х4); х2
приблизительно эквивалентное х3 (х2 » х3 ), х2 предпочтитель-
нее jq;
/?2:Х] > х2,хг » х4,х3 > x2,xt > х3;
/?3:х4 > х2,х2 > х3,х4 ~ X].
Надо найти наилучшее компромиссное решение по совокуп-
ности критериев, используя свертки Qt,Q2. При этом для Q2
взять веса критериев^ = 0.4,а>2 = 0.3,а>3 = 0.3.
Решение. 1. Построим матрицу отношения Rt. Будем счи-
тать все отношения транзитивными, т.е., еслих2 > х, , а х3 » х2,
то х3 > X] .
Воспользуемся соотношениями
1, если х, > х2
0, еслих, -<Xj.
или
х « х,;
I J *
Получим матрицу отношения Rx (табл. 1.7).
ТАБЛИЦА 1.7.
Ху \ Ху *1 *2 Хз х4
1 0 0 1
Ря, (я,,*;) = *2 1 1 1 1
х3 1 1 1 1
х4 0 0 0 1
= 0.4
318
Нечеткие множества, нечеткие отношения
2. Аналогично строим матрицу отношения R2 (табл. 1.8).
ТАБЛИЦА 1.8.
х, \ Xj Xt Xi Хз х4
Xt 1 1 1 1
=| х2 0 1 0 0
Хз 0 1 1 0
х4 1 1 1 1
(о2 = 0.3
3. Аналогично строим матрицу отношения R3 (табл. 1.9).
ТАБЛИЦА 1.9.
X,. \ Xj ^1 Xi Хз х4
Xt 1 1 1 1
р я, и,.*,) =1 Xi 0 1 1 0
Хз 0 0 1 0
х4 1 1 1 1
= 0.3
4. Строим свертку отношений Qt = 7?3 (табл. 1.10).
ТАБЛИЦА 1.10.
X, \ Xj Xi Xi Хз х4
Х1 1 0 0 1
VqSx.’Xj) = Х2 0 1 0 0
Хз 0 0 1 0
х4 0 0 0 1
319
Приложение
5. Находим подмножество недоминированных альтернатив:
(х) = 1 - sup{ua (у, х) - (X, у)};
УеХ
р$(х,) = 1 - sup{0 - 0;0 - 0;0 - 1} = 1;
я£ (х2) = 1 - sup{0 - 0;0 - 0;0 - 0} = 1;
Яд (х3) = 1 - sup{0 - 0;0 - 0;0 - 0} = 1;
Яд (х4) = 1 - sup{l - 0;0 - 0;0 - 0} = 0.
Таким образом, р£(х) = .
6. Строим н.о.п. Q2 (адитивну свертку отношений Лу), Q2 =
т=4
= ^a>jfj(x), гдер^(х4) = 1 - тах{0.4;0.0} = 0.6 <и, = 0.4, а>2 = 0.3,
7=1
<d3 = 0.3.
Его функция принадлежности приведена в таблице 1.11.
ТАБЛИЦА 1.11.
Xf \ Xj *1 Xi X3 x4
*i 1 0.5 0.5 1
Hq^X^Xj) = x2 0.4 1 0.7 0.4
x3 0.4 07 1 04
X4 0.6 06 0.6 1
7. Находим подмножество недоминированных альтернатив по
отношению Q2\
р%(х2) = 1 - sup{(0.4 - 0.5); (0.4 - 0.5); (0.6 - 1)} = 1;
я£(х2) = 1 - sup{(0.5 - 0.4);(0.7 - 0.7);(0.6 - 0.4)} = 0.8;
Я&(х3) = 1 - max{(0.5 - 0.4);(0.7 - 0.7);(0.6 - 0.4)} = 0.8;
Я^(х4) = 1 _ max{0.4;0.0} = 0.6.
Таким образом, Hq^x/) = [l;0.8;0.8;0.6].
320
Нечеткие множества, нечеткие отношения
8. Находим пересечение множеств Q"d, Q2d и вычисляем
функцию принадлежности результирующего подмножества QHd =
= СГП Qid Его Функция принадлежности равняется р^(х, ) =
*3 ^4
Мс(х,) = [1 0.8 0.8 0].
Итак, наилучшим выбором в рассмотренном случае является
альтернатива Xj — вложить ПИС в приватизацию жилья.
1.5. АРИФМЕТИЧЕСКИЕ ОПЕРАЦИИ
НАД НЕЧЕТКИМИ ЧИСЛАМИ
Пусть A i В — два НЧ на % с функциями принадлеж-
ности ЦА(а), a eSA, SAczX и 1ЛВ(Ь), b е SB а X соответст-
венно, где SA,SB — область определения (или носитель) нечет-
кого множества А или В соответственно.
Обозначим через ® одну из четырех арифметических опера-
ций (+,-,*,/). Воспользовавшись принципом обобщения, полу-
чим следующее определение: Бинарной арифметической операци-
ей над НЧ является операция, которая определяется так:
С = А®В= J ininM<U(&)} (1-5.1)
is,
знак U объединения в (1.5. 1) нужно понимать буквально.
Пусть A i В — два непрерывных НЧ, носители которых яв-
ляются отрезками числовой оси SA = [alta2], SB = [6pfe2].
Пусть также Sc = {с :с = a®b,a е SA,b е SB} — нечеткое
число, которое является результатом операции а®Ь .
В принятых обозначениях выражение (1.5.1) можно конкре-
тизировать таким образом:
с = А ® В = Umc(c) = J max тт{рА(а),цв(Ь)}.
ceSc ccSc<a.b)-.a®b=c
321
Приложение
Алгоритм выполнения операций
Опишем численный алгоритм формирования функции
принадлежности нечеткого множества С — результата операции
над нечеткими числами.
Задачу построения НМ С будем выполнять по следующей
схеме.
ШАГ 1. Определить множество Sc и дискретизировать его,
исходя из необходимой точности табличного представления гра-
фика функции /л(с).
ШАГ 2. Для каждого из полученных с е Sc решить задачу:
с = а®Ь, ае[а1}а2], fee[fepfe2], (1.5.2)
Решением задачи (1.5.2) для заданного се5с назовем мно-
жество cz S,, такое что:
(Vo е 5°)(3й е SB)(c = о® Ь),
(Vа е \ S°A)(\/b е SB)(c * a®b).
ШАГ 3. Дискретизируем множество SA, результатом дискре-
тизации будет конечный ряд значений а,, е 5°. Найти bt е SB
такое, что с = at ® btДля at,b. определить д(а(.) и д(6,).
Вычислить:
р, = min[p(o,);p(Z>,)];
pc(/) = max[pcO-l);pJ.
Для i = l приравнять /1с(0) = 0. Пусть после дискретизации
множества SA |S° = п. Тогда рс(с) = рс(п).
322
Нечеткие множества, нечеткие отношения
Утверждение 1.
При данном определении операций над НЧ справедливы
следующие свойства операций:
Коммутативность сложения и умножения
(ЧА,В)(А + В = В + А); (Х/А, В)(А * В = В * А).
Ассоциативность арифметических операций
(УЛ,Я,С)[Л®(5®С) = (Л®5)®С].
Отсутствие дистрибутивности умножения относительно сло-
жения в общем случае
-i(VA, В, D)[A x(B + D) = AxB + AxDJ.
Рассмотрим реализацию вышеизложенного алгоритма для
разных арифметических операций.
1. Сложение. Будем считать, что at <bt. Пусть а е SA, beSB,
c = a + b.
Утверждение 2.
Обозначим a, + Ь} = с+ , а2+Ь2=с+. Тогда
(Va,fe)(c>c+); (Уа,Ь)(с < с+). Будем считать c+=q; с+=с2.
Результат операции с.
Утверждение 3.
Пусть ceSr, a =max[apc-fe2], а" = min[a2,c-ft,].
Тогда отрезок =[а,а ] — решение задачи (1.5 2) при замене
операции ® на +
При этом функция принадлежности для суммы с-a+b рав-
няется цс(с) , где ^С(с) определяется соотношением:
pt(c)= max min{pA(a),pB(b)}. (1.5.3)
323
Приложение
2. Вычитание. Учитывая, что (Va,b е Rl )(а - Ь = а + (-6))
можно заменить нечеткое число — вычитаемое В на противопо-
ложное В, по следующему правилу:
B,= \J^B(-b)\b, де SB=[-b2--bt].
beSb
При этом НЧ С = А - В становится равносильным А + В..
3. Умножение. Будем считать, что а, < 6,. Иначе этого можно
добиться перестановкой операндов. Введем обозначение:
= а1 -bx\ а2 = -Ь2, а3 = а2 -Ьх\ а4-а2-Ь2.
Пусть
с+ = min а,.
Тогда (Vа е SA)(\/b е 5в)(а b > с+). Пусть с+ = maxct(. То-
гда (X/aGSA)(ybeSB)(a-b<c+).
Отсюда вытекает, что с, = с+ и с2 = с+ , и Sc = (с,,с2). Реше-
ние задачи (1.5.2) для операции умножения заключается в сле-
дующем утверждении.
Утверждение 4.
Предположим, что bt > 0 и Ь2 > 0 или Ь{ < 0 и Ь2 < 0.
Пусть
а =шах
с с
a., min —
b, Ь,
и
a =min а2,шах
с с
62 ht
Тогда SA =[а ,а ] — решение задачи (1.5.2) при операции
умножения.
324
Нечеткие множества, нечеткие отношения
Утверждение 5.
Предположим, что bt<0<b2 и Ой(ара2). Разобьем
отрезок SB на два отрезка: SB=[fep0] и 5в=[0;62]. Отсюда
следует, что SB = .
Пусть S'A — решение задачи (1.5.2) при SB = SB, SA — реше-
ние задачи при SB = S2B . Здесь принимается, что SA в обоих слу-
чаях нужно взять из начальной задачи, а именно решение SlA и
SA найдены соответственно утверждению 4. Тогда 5° =
— решение задачи (2) при замене операции ® на * .
4. Деление. Будем считать, что результат операции А/В не
определен, если 0 е SB. Если 0 g SB, то учитывая, что
(Va,beR)(a/b = a (\/b)), (1-5.4)
заменим знаменатель В на обратный В, по следующему правилу:
beSB
(1.5.5)
И дальше воспользуемся результатами, полученными для ум-
ножения. Важно подчеркнуть, что для любых НЧ A i В, функции
принадлежности которых удовлетворяют стандартным условиям,
имеет место неравенство:
Ах В' *1, где Ь = — -
a
В частности, для прямого и обратного НЧ это вытекает из
рассмотрения носителя результата их умножения.
325
Приложение
Пример 1.9.
Рассмотрим пример выполнения арифметических операций
над дискретными НЧ A i В. Пусть A i В заданы в таблицах 1.22 и
1.23.
1. С\=А + В Hc(c)= max.min{p^(a);^fi(fe)}. (1.5.6)
1 a,b:a+b=c
SCi = 19; 131.
Результаты ^tC[ (с) приведены в таблице 1.24.
2. С2 = А — В", В, = -ВSв. = [- 6;-4].
5Сг=[-1;3].
Вычисляем /лс (с) = max _ min {цА (а); (b)}, Vc е Sc и ре-
2 a,b:<i—b-c 2
зультаты заносим в таблицу 1.25.
3. С3 = АхВ- 5Сэ=[20;42].
Вычисляем рс(с)= тах.тт{рл(а);рй(6)} и результаты
3 a,b:a*b=c
заносим в таблицу 1.26.
4. С4 = А/В = А*В~1,
5 7
0,833; - = 1.75 .
6 4 J
Вычисляем jAc (с) = тах.тт{рл(а);^й(6)} и результаты
4 а,Ь.а!Ъ=с
заносим в таблицу 1.27.
где В =
6 5 41 с‘
ТАБЛИЦА 1.22
А 5 6 7
0 1 08 0.4
326
Нечеткие множества, нечеткие отношения
ТАБЛИЦА 9.23
в 4 5 6
0.2 09 03
ТАБЛИЦА 1.24
Ci 9 10 и 12 13
Рс, 0.1 0.2 0.8 0.4 0.3
ТАБЛИЦА 1.25
С -1 0 1 2 3
0.1 0.2 0.8 0.4 0.3
ТАБЛИЦА 126
С 20 24 25 28 30 35 36 42
0.1 0.2 0.1 0.2 0.8 0.4 03 О-.З
ТАБЛИЦА 1.27
С 0.83 1 1.17 1.22 1.25 1.4 1 5 1.75
0.1 0.2 0.3 0.8 0.1 0.4 0.2 0.2
AI*
Рис. 1.5.
327
Приложение
Рис. 1.6.
Приближенный метод выполнения арифметических операций
над нечеткими числами.
Рассмотрим приближенный метод выполнения арифметиче-
ских операций над НЧ, который основывается на использовании
подмножеств уровня а.
ОПРЕДЕЛЕНИЕ. Операция называется монотонной, если она
удовлетворяет следующим соотношениям:
если а, < а2 и bx<b2, то с, = а, 0^ <с2 = а2 <8>Ь2,
и с, =а, <с3 =a2®b}, Vax,a2 gSa; V6p62 e5B.
При этом предполагается, что at >0, bt > 0.
К числу монотонных операций относятся сложение (+) и ум-
ножение (*), а к не монотонным — вычитание (-) и деление (/).
Пусть заданы два непрерывных монотонных числа А и В,
функция принадлежности которых и ЦВ(Ь) приведена на
рисунке 1.5.
Для заданных значений а{,а2,...,а„ е (0;1] определим
ап,а21,...,а1к,а2к такие, что
Ди(«11) = Дл(а21)=0!1
Дл(а1*) aik
328
Нечеткие множества, нечеткие отношения
Аналогичным образом для НЧ В и значений уровней ak е [0;1]
определим:
= Ps(^2t) = aik
Обозначим:
cn =au®b", с12 =а12®612;...; cik=aik®bik.
с21 — <т21 ®b2l, с22 — a22 ®b22,..., c2k — aik ®Ь1к.
Будем выполнять монотонные операции над операндами НЧ
A i В на ветках кривых функции принадлежности одинакового
характера монотонности (монотонно возрастающая или моно-
тонно ниспадающая).
Используя свойство монотонных операций, нетрудно увидеть,
что:
Я-(сп) = max min{^(a);A/B(6)} =а,;
а.Ь:сп=а®Ь
(1.5.7)
Цс(с1к)= max min{^A(ay,vB(b)}=ak;
aji:cik =a®b
И, по аналогии:
Pc(c2i) = max min{^(a);^B(fe)} = a2;
a Jr.c2\=<i®b
ВАС2к ) = ,ma* min ШаУ’^В (fe)I = «Л ’
a.b:c2,=a®b
Пример 1.9.
Пусть заданы два НЧ А^2 , В~3 с функциями принадлеж-
ности треугольного вида (смотри рис 1.5), которые заданны в
таблицах 1.28 и 1.29.
Пользуясь соотношением (1.5.7), получаем:
a) Q = А + В « 5. Соответствующая ФП НЧ С\ приведе-
на в таблице 1.30.
329
Приложение
б) С2 = А - В . Поскольку операция не монотонная, то, как и
раньше, заменим -В на В, и перейдем к операции +. Соответ-
ствующая ФП НЧ С2 приведенная в таблице 1.31 и на рис. 1.6.
в) С3 = А * В. Выполняя операцию * над операндами а и b
на ветках ЦА(а) и ЦВ(Ь) однакового характера монотонности,
вычисляем jUCj(c), результаты приведены в таблицах 1.32 и на
рис. 1.6.
г) С4 = А1В. Заменив НЧ В на В~' и вычислив его ФП для
заданных значений at,a2,...,ak, вычисляем цс (с) согласно со-
отношению. Результаты приведены в таблице 1.33 и на рис. 1.6.
ТАБЛИЦА 1.28
X 1.0 1.25 1.5 7/4 2.0 9/4 2.5 11/4 3.0
М*) 0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
ТАБЛИЦА 1.29
X 2.0 2.25 2.5 11/4 3.0 13/4 3.5 15/4 4.0
0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
ТАБЛИЦА 1.30. С, = А + В « 5
с 3.0 3.5 4 4.5 5.0 5.5 6 6.5 7
Vc,(x) 0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
ТАБЛИЦА 1.31. С2=А~В
с -3.0 -2.5 -2 -1.5 -1.0 -0.5 0 0.5 1
Ис2(х) 0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
330
Нечеткие множества, нечеткие отношения
ТАБЛИЦА 1.32. С3=А*В
с 2,0 45/16 3.75 77.16 6.0 117/16 35/4 165/16 12.0
0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
ТАБЛИЦА 1.33. С^=А/В
С 1/4 1/3 3/7 7/13 2/3 9/11 1 11/9 1.5
ИсЛ*) 0 0.25 0.5 0.75 1 0.75 0.5 0.25 0
1.6. ЛИНГВИСТИЧЕСКИЕ ПЕРЕМЕННЫЕ
Важным шагом в разработке аппарата принятия ре-
шений в нечетких условиях явилось введение Л.Заде понятия
лингвистической переменной и описание переменных с исполь-
зованием нечетких множеств.
Определение 1.18. Лингвистическая переменная задается пя-
теркой (X,T,U,G,M), где X — имя переменной; Т — терм-
множество, каждый элемент которого (терм) представляется как
нечеткое множество на универсальном множестве U; G — син-
таксические правила, часто в виде грамматики, порождающие
название термов; М — семантические правила, которые задают
функции принадлежности нечетких термов, порожденных син-
таксическими правилами G.
Например, рассмотрим лингвистическую переменную с име-
нем х = “температура в комнате”. Тогда оставшуюся четверку
(Т, U, G, М) можно определить так:
универсальное множество — (/=[5,35];
терм-множество — Т= {“холодно”, “комфортно”, “жарко”}
с такими функциями принадлежностями (и е (/):
М“ххолодно” )= ’ 1 (w-ioY2 1 + 1 7 J
331
Приложение
Р'ккомфортн’vV , -_х6 >
. | W — 20 |
+Ы
Р'жжаркоСО
1
fw-30\
А 6 J
• синтаксические правила G, порождающее новые термы с
использованием квантификаторов “не”, “очень” и “более-
менее”;
• семантические правила М, в виде таблицы 1.
Квантификатор Функция принадлежности (u е U )
не t 1-Л (")
очень t
более-менее t
Список сокращений
МГУА — метод группового учета аргументов
НМГУА — нечеткий метод группового учета аргументов
МНК — метод наименьших квадратов
РМНК — рекуррентный МНК
НС — нейронная сеть
ННС — нечеткая нейронная сеть
ФП — функция принадлежности
СКО — средний квадрат отклонения
МАРЕ — Module average percentage error — средняя модульная относи-
тельная (процентная) ошибка
MSE — Mean squared Error — СКО
ИПЦ — индекс потребительских цен
ИОЦ — индекс оптовых цен
НВВП — номинальный внутренний валовой продукт
ОПП — объем промышленной продукции
ИРПП — индекс реальной промышленной продукции
СР — ставка рефинансирования
ДБ — денежная база
РДН — реальные доходы населения
ВК — вложенные кредиты
РТС — Российская торговая система
ОАО — открытое акционерное общество
НК — нечеткий контроллер
ННК — нечеткий нейронный контроллер
ЭОИ — электрооптическое изображение
СГ — сопряженный градиент
ОК — ошибка классификации
ВВП — внутренний валовой продукт
НМ — нечеткое множество
НЧ — нечеткое число
НЛ — нечеткая логика
ЛП — линейное программирование
333