Text
                    А.Б. Барский
искусственный интеллект и
ЛОГИЧЕСКИЕ НЕЙРОННЫЕ СЕТИ
курс лекций
Санкт-Петербург
ИЦ «Интермедия»
2019


УДК 004.032 ББК 3.30 Б26 Рецензент: Гагарина Л.Г. доктор технических наук, профессор Национального исследова¬ тельского университета «Московский институт электронной техники»; Барский А.Б. Искусственный интеллект и логические нейронные сети: учеб, пособие / А.Б. Барский. - СПб.: ИЦ «Интермедия», 2019. - 360 с. ISBN 978-5-4383-0155-4 В рамках известных парадигм Н.М. Амосова исследуются основные задачи искус¬ ственного интеллекта и возможности их решения с помощью логических нейронных се¬ тей, построенных на основе математической логики событий. Предлагаются модели де¬ дуктивного и индуктивного мышления на базе языка логического вывода ПРОЛОГ. На базе аппарата логических нейронных сетей приводится решение актуальных и перспек¬ тивных задач ассоциативных вычислений: аппроксимации опытных данных и построения информационно-справочных систем по принципу ассоциативной выборки, задач распо¬ знавания объектов и символов, построения рейтинговых систем и банковского монито¬ ринга, систем управления качеством, обучаемых и самообучающихся систем управления, способов ускорения реакции операционной системы суперкомпьютера, задачи «живого» моделировании. Демонстрируется простейший подход к построению и развитию обучен¬ ных нейронных сетей. Книга предназначена для студентов, обучающихся в магистратуре технических и экономических вузов, аспирантов, инженеров и исследователей в области применения со¬ временных информационных технологий искусственного интеллекта в системах модели¬ рования, управления и принятия решений. Учебное издание Барский Аркадий Бенционович ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И ЛОГИЧЕСКИЕ НЕЙРОННЫЕ СЕТИ Главный редактор: Т.С. Кулакова Техническая подготовка: В.Ю. Антипова Дизайн обложки: В.С. Кулаков Подписано в печать 07.10.2018. Формат 60 х 88 1/16. Печать цифровая Уел. печ. л. 22. Тираж 500 экз. Заказ № ООО «Издательский центр “Интермедия”». Адрес: 198334, Санкт-Петербург, ул. Партизана Германа, 41-218. Отпечатано с готового оригинал-макета в ООО «Арт-экспресс». Адрес: 199155, СПб., В,О,, ул. Уральская, д, 17, ISBN 978-5-4383-0155-4 ООО «Издательский Центр “Интермедия”», 2019 А. Б. Барский, 2019
СОДЕРЖАНИЕ ПРЕДИСЛОВИЕ 7 ВВЕДЕНИЕ 9 ГЛАВА I. ЛОГИЧЕСКИЕ ОСНОВЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА 14 Лекция 1. Математическая логика событий и логические нейронные сети 14 1.1. Исчерпывающее множество событий 14 1.2. Дерево логических возможностей. Факторное пространство событий 15 1.3. Система принятия решений 19 1.4. «Схемотехническое» представление системы принятия решений 21 1.5. Достоверность высказываний о событиях 23 1.6. Система принятия решений на основе достоверности высказываний о событиях 26 1.7. Минимизация длины логической цепочки в системе принятия решений 29 1.8. Выбор и обоснование функции активации нейрона 34 Лекция 2. Силлогистика Аристотеля 37 2.1. Сущности и базовые высказывания 37 2.2. Законы силлогистики 42 2.3. Силлогизмы 44 Лекция 3. Основы математической логики 50 3.1. Булева алгебра 50 3.2. Исчисление высказываний 56 3.3. Основы исчисления предикатов 63 Лекция 4. Методы дедуктивных и индуктивных рассуждений 73 4.1. Возможности автоматизации достоверных (дедуктивных) рассуждений 74 4.2. Возможности автоматизации правдоподобных (индуктивных) рассуждений 77 4.3. Нечёткие рассуждения и выводы 84 Лекция 5. Вывод по базе знаний 88 5.1. Продукционные системы 89 5.2. Интеллектуальные операции над базой данных 90 5.3. Классификация продукций 91 5.4. Управление выводом 93 5.5. Вывод на семантической сети 99 з
5.6. Вопрос - ответ. Спор 102 Лекция 6. Десять задач искусственного интеллекта по Д.А. Поспелову и возможности логических нейронных сетей 106 6.1. Переход к аргументации 107 6.2. Проблема оправдания 109 6.3. Порождение объяснений 111 6.4. Поиск релевантных знаний 114 6.5. Понимание текстов 114 6.6. Синтез текстов 119 6.7. Когнитивная графика 121 6.8. Многоагентные системы 126 6.9. Сетевые модели 127 6.10. Метазнания 129 Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка логического вывода ПРОЛОГ 132 7.1. О языке логического программирования ПРОЛОГ 133 7.2. Возможность решения задач логического вывода с помощью языка ПРОЛОГ 133 7.3. Формирование базы знаний на языке ПРОЛОГ 135 7.4. Дедуктивное мышление 139 7.5. Получение новых знаний методом индуктивного мышления 140 ГЛАВА П.НЕЙРОСЕТЕВЫЕ МЕТОДЫ УПРАВЛЕНИЯ 145 Лекция 8. Обретение навыков построения систем ассоциативных вычислений, распознавания символов и принятия решений 145 8.1. Введение в ассоциативные вычисления 145 8.2. Распознавание нечётких символов персептроном 149 8.3. Система принятия решений «Железнодорожная рулетка» 152 8.4. Актуальная реализация бизнес-проекта 156 8.5. Формирование информации на рецепторном слое 164 Лекция 9. Развиваемая логическая нейронная сеть для распознавания объектов временного ряда по заданному набору признаков 169 9.1. Детерминированные оценки объектов временного ряда 169 9.2. Структурированная, не однослойная логическая нейронная сеть 175 9.3. Преобразование структурированной нейросети в однослойную, допускающую неограниченное развитие 177 9.4. Нечёткие оценки признаков объектов временного ряда 181 9.5. Введение обратных связей 182 Лекция 10. Логические нейронные сети с обратными связями 185 10.1. Нейронная сеть по А.П. Чехову 185 4
10.2. Развитие гипотезы 188 Лекция 11. Рейтинговые системы на логических нейронных сетях 192 11.1. Структура нейросети и способы обучения 192 11.2. Структура экрана рецепторов 194 Рис. 11.1. Экран рецепторов 195 11.3. Структура экрана выходного слоя, отображающего рейтинг банков - эталонов 196 Рис. 11.2. Экран выходного слоя 196 11.4. Пример определения рейтинга на основе банков - эталонов 198 11.5. Построение обученной логической нейронной сети на основе интервалов значений показателей 200 11.6. Отображение и управление рейтинговой системой с помощью матриц связей 203 Лекция 12. Управление качеством при модернизации и развитии сложных систем в условиях финансовых и технологических ограничений 206 12.1. Задача управления качеством сложной системы 207 12.2. Рейтинг объектов сложной системы 208 12.3. Рейтинговая система на основе интервалов значений показателей качества объектов сложной системы 209 12.4. Отображение системы концентрических областей одинакового рейтинга 213 12.5. О стратегии повышения качества сложных систем в условиях финансовых и технологических ограничений 218 Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления и принятия решений на логических нейронных сетях 220 13.1. Аппроксимация опыта и ассоциативные «бесформульные» вычисления 220 13.2. Медицинские информационно-справочные системы 224 13.3. Идентификация пользователя в компьютерной сети по «почерку» 228 13.4. Адаптивная пошаговая маршрутизация в беспроводной телекоммуникационной сети 232 13.5. Некоторые «незаконченные» системы принятия решений 236 13.6. Самообучающиеся системы управления 249 13.7. Динамический выбор оптимальной стратегии распараллеливания в многопроцессорной вычислительной системе.... 252 Лекция 14. Нейросетевой метод ускоренного принятия решений операционной системой суперкомпьютера /ІРІС-архитектуры 260 14.1. Выбор моделей логической нейронной сети 260 14.2. Возбуждение рецепторов 266 5
14.3. Схема поиска решения 268 14.4. Оптимизация скалярного умножения векторов при счёте значения функции активации 270 14.5. Распараллеливание скалярного умножения векторов 272 Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации и тактических игр 275 15.1. Логическая нейронная сеть — средство пошагового принятия решений 275 15.2. Нейросетевая транспортная модель динамической маршрутизации 276 15.3. Движение транспорта с выбором альтернативного пункта смещения 281 15.4. Нейросетевой «подсказчик» в тактической игре 284 Лекция 16. Основы трёхмерного «живого» моделирования 288 16.1. Какую задачу мы хотим решить? 289 16.2. Создание графических объектов в модели трёхмерной памяти ... 291 16.3. Логические нейронные сети в основе управления трёхмерными компьютерными объектами 296 16.4. Создание стереоэффекта с помощью системы прозрачных мониторов 299 16.5. Прямоугольное экранное пространство 302 16.6. Сферическое экранное пространство 303 16.7. Цилиндрическое экранное пространство 306 16.8. Вычислительные средства управления объёмным экраном 307 16.9. Возможность применения реагирующего объекта для прогноза погоды 308 Лекция 17. Перспективные нейросетевые технологии 311 17.1. Служба безопасности 312 17.2. Парк фантасмагорий 313 17.3. Компьютерный человечек КОМЛИ 316 17.4. Диагностика 318 17.5. Тестирование в сфере образовательных услуг 319 17.6. Печать рукописи 321 17.7. Экстренное торможение локомотива 323 17.8. Интеллектуальное протезирование конечностей 324 17.9. Сивилла-прорицательница 329 ЗАКЛЮЧЕНИЕ 332 ОБЩИЙ ГЛОССАРИЙ 333 ЛИТЕРАТУРА 340 6
ПРЕДИСЛОВИЕ Об искусственном интеллекте (ИИ) говорят много. Зачастую любое применение компьютера является поводом для объявления о применении средств ИИ. Однако каждое глубокое исследование, тем более, в рамках точ¬ ных наук, должно начинаться с определений и классификации. От этого сле¬ дует исходить, определяя круг задач искусственного интеллекта. Любой интеллект - и «естественный», и искусственный - основан на возможности логического вывода. Всё остальное - автоматизация проектиро¬ вания, планирования, производства, управления, обучения и пр. Только в этом смысле применение методов или элементов искусственного интеллекта для тех же задач автоматизации служит построению быстрых, высоконадёж¬ ных, самонастраивающихся (адаптивных) систем, способных качественно превысить интеллектуальные возможности человека. В этом и заключается привлекательность методов и средств ИИ вопре¬ ки спекуляциям бездарных политиков. Основным средством решения задач искусственного интеллекта явля¬ ется модель мозга - нейронная сеть. Мозг обрабатывает сигнальную инфор¬ мацию. Всё, что мы видим, слышим, осязаем, - всё немедленно, на входе, с помощью органов чувств, преобразуется в возбуждение рецепторов, в вели¬ чины сигналов из некоторого «технически» допустимого диапазона, в сигна¬ лы, которые можно рассматривать как достоверность высказываний о при¬ надлежности данных. На выходе формируется приоритетный ряд значений указателей на возможные решения - на значение функции, на величину штрафа, на приказ, на результат диагностики, на алгоритм действий и т.д. Таким образом, мозг на самом деле оперирует средствами математической логики, распространённой из области булевых переменных в область дей¬ ствительных переменных, интерпретируемых как вероятность наступления события. Это позволяет привести разнородные данные к одному типу и к единому измерению, а также строить длинные цепочки логического вывода. Представляется, что изложенная выше концепция логических нейронных се¬ тей в большей степени адекватна мозгу. Вопросам логического обоснования искусственного интеллекта, а так¬ же практическому применению логических нейронных сетей посвящена дан¬ ная книга, выполненная в виде курса лекций. В основу Введения положены разработки Н.М. Амосова. Лекции 2, 4, 5 и 6 в основном используют материалы Д.А. Поспелова. В основу Лекции 3 положена книга П.С. Новикова по основам математической логики в интер¬ претации В.М. Глушкова для практического применения в сложных киберне¬ тических системах. Упоминание имён подчёркивает роль замечательных оте¬ чественных учёных в становлении и развитии данной тематики. Остальные лекции отображают разработки автора. 7
Предисловие Курс лекций ориентирован на широкий круг читателей, знакомых с ос¬ новами информационных технологий, включая студентов, магистрантов и аспирантов технических, экономических, медицинских и других вузов, а так¬ же может быть полезен в сфере повышения квалификации и при выборе тем научных исследований. 8
ВВЕДЕНИЕ Истина - не то, что доказуемо, истина - это простота. Антуан де Сент-Экзюпери. Планета людей. Логическое моделирование процессов, происходящих в головном моз¬ ге, привлекло внимание человечества по следующим причинам: 1. Высокая скорость выполнения сложных логических конструкций - предикатов, обусловленная высоким параллелизмом действий. 2. Простота алгоритмов логических действий мозга, основанная не на численном манипулировании, а на принципах ассоциативного мышления, «на что это похоже в большей степени из расширяемого багажа моих зна¬ ний?» 3. Возможность решения трудно формализуемых задач, в которых сов¬ местно используются данные логически несовместимой природы, противо¬ речивые, неполные, «зашумлённые», некорректные (задачи эмоций, полити¬ ки и др.). 4. Устойчивость работы, совместимая с расширением, трансформиро¬ ванием и совершенствованием знаний. 5. Возможность построения самообучающихся и самонастраивающихся систем. 6. Прекрасная сочетаемость с традиционными «вычислительными» ал¬ горитмами обработки информации, позволяющая строить сложные адаптив¬ ные, надёжные системы управления. 7. Отсутствие специальных требований к «традиционно» развиваемым вычислительным средствам. Единственно стимулируемый принцип - парал¬ лелизм. Здесь логика проста: для реализации параллельной системы - нейро¬ сети, желательна параллельная вычислительная система. Ведь для выявления параллелизма, в частности, мы и обращаемся к модели мозга! Наряду с раз¬ работкой параллельных вычислительных устройств - нейрокомпьютеров, значительный стимул развития обретают сети ЭВМ, - для реализации в них «больших» нейросетей. Определение. Нейроном, ши нейроподобнвм элементом, называется прибор, реализующий пороговую функцию активации. Из этого определения следует многообразие технологий «изготовле¬ ния» нейрона: биохимическая («мясная», как в природе), электронная, аппа¬ ратно-программная, микропрограммная, программная процедура и др. Импульс развития нейросетевые технологии, как и другие технологии искусственного интеллекта (ИИ), обрели в начале 80-х годов, когда жёстко проявилась проблема достижения сверхвысокой производительности вычис¬ лительных средств военного назначения. 9
Введение Проблема развития и внедрения нейросетевых технологий, как средств искусственного интеллекта, характеризуется двумя аспектами: научным и практическим. Научный аспект базируется на философски-математическом представ¬ лении задач ИИ, выражающемся в формализации процесса мышления. Среди отечественных ярких, основополагающих работ в этом направлении выделя¬ ются работы Н.М. Амосова с учениками [1] и Д.А. Поспелова [2, 3]. Н.М Амосов обосновал и систематизировал подход к созданию средств искус¬ ственного интеллекта. Этот подход в следующем. Н. М. Амосов В основе стратегий ИИ лежит понятие парадигмы - взгляда (концепту¬ ального представления) на суть проблемы или задачи и подхода к её реше¬ нию. Рассматривают две парадигмы ИИ. Парадигма эксперта. Эта парадигма предполагает следующие объек¬ ты, а также этапы разработки и функционирования системы ИИ: 1. Формализация знаний - преобразование экспертом проблемного знания в форму, предписанную выбранной моделью представления знаний. 2. Формирование базы знаний (БЗ) - вложение формализованных зна¬ ний в программную систему. 3. Дедущия - решение задачи логического вывода на основе БЗ. Эта парадигма лежит в основе применения экспертных систем, систем логического вывода, в том числе на языке логического программирования ПРОЛОГ. Считается, что системы на основе этой парадигмы изучены в большей степени. Парадигма ученика. Эта парадигма включает следующие положения и последовательность действий. 1. Обработка наблюдений, изучение опыта частных примеров - форми¬ рование базы данных (БД) системы ИИ. 10
Введение 2. Индуктивное обучение - превращение БД в БЗ на основе обобщения знаний, накопленных в БД, и обоснование процедуры извлечения знаний из БЗ. Это означает, что на основе данных мы делаем вывод об общности той зависимости между объектами, которую мы наблюдаем. Основное внимание здесь уделяется изучению аппроксимирующих, вероятностных и логических механизмов получения общих выводов из частных утверждений. Затем мы можем обосновать, например, достаточность процедуры обобщённой интер¬ поляции (экстраполяции), или процедуры ассоциативного поиска, с помощью которой будем удовлетворять запросы к БЗ. 3. Дедукция - по обоснованной или предполагаемой процедуре мы вы¬ бираем информацию из БЗ по запросу (например, - оптимальную стратегию управления по запросу, характеризующему сложившуюся ситуацию). Считается, что исследования и разработка в рамках этой парадигмы проведены пока слабо, хотя она лежит в основе построения самообучающих¬ ся систем управления. (Мы можем привести замечательный «старинный» пример самообучающейся системы управления - правила стрельбы в артил¬ лерии.) Чем база знаний, общий и обязательный элемент системы ИИ, отлича¬ ется от базы данных? Возможностью логического вывода! Теперь обратимся к «естественному» интеллекту. Природа не создала ничего лучшего, чем человеческий мозг. Значит, мозг является и носителем базы знаний, и средством логического вывода на её основе. И это независимо от того, по какой парадигме мы организовали своё мышление, то есть, каким способом мы заполняем базу знаний, - учимся! В [2] исследуются методы мышления, придерживаясь которых можно создавать конкретные системы логического вывода и управления. В частно¬ сти, Д.А. Поспелов исследует теорию Аристотеля (384 - 322 д.н.э.) - силло¬ гистику и предлагает принципы ее моделирования. Развивая теорию модели¬ рования мышления, он указывает на важность формализации механизма мышления. Этим механизмом уже давно, со времен Аристотеля, затем Лейб¬ ница (1646 - 1716) и далее - до появления алгебры (булевой алгебры) Джор¬ джа Буля (1815 - 1864) и до наших дней, является математическая логика, се¬ годня отображенная во многих работах выдающихся математиков. Отметим монографию П.С. Новикова [4], ставшую классической. Необходимая ин¬ формация и ее анализ в интересах моделирования содержатся и в [5]. Математическая логика, ее важный раздел «Алгебра высказываний», действительно соединили принципы мышления и их автоматизированное во¬ площение. Отметим, что «Исчисление предикатов» не менее (возможно, - более) важный раздел математической логики, действующий на высоком уровне моделирования мышления, выше, чем уровень, достаточный для со¬ здания несложных систем принятия решений. п
Введение Мозг является гигантской нейронной сетью, фиксирующей причинно- следственные связи, создающей базу знаний и владеющей процедурами ло¬ гического вывода. Таким образом, нейронные сети реально являются основой формализа¬ ции средств мышления. Справедливо считать, что исследование нейронных сетей опирается на достижения математической логики, и следование этому постулату способно привести к успеху при построении конкретных систем распознавания, управления и принятия решений. Если мы с помощью булевых функций описали поведение объектов, распознавание, управление или принятие решений, то практически без каких- либо преобразований описания получили структуру нейросети, соответству¬ ющую этой системе и имитирующую ассоциативное мышление. Подавая на рецепторы информацию о сложившейся ситуации или изображение, на вы¬ ходе получаем указание на результат распознавания или на необходимые действия. Однако целесообразно упрощающее эквивалентное преобразова¬ ние булевых функций, в результате которого получаются самые простые од¬ нослойные логические нейронные сети, обеспечивающие не только минимум операций обработки, но и повышающие достоверность выводов по нечётким данным. Практический аспект рассматриваемой проблемы заключается в сле¬ дующем. Среди задач управления и принятия решений выделяется значительный класс трудно формализуемых задач. Эти задачи не характеризуются строги¬ ми математическими зависимостями между компонентами, их исходные данные несовместимы по природе, типам, размерности. Принимаемое реше¬ ние порой основывается на неполной, противоречивой, «зашумленной», не¬ достоверной информации. Это приводит к необходимости имитации ассоци¬ ативного мышления, к моделированию методов искусственного интеллекта, основным средством которого являются нейронные сети. Традиционный подход к построению нейросетевых технологий [10] от¬ личается тем, что на входе нейросети стремятся задать числовые данные, ха¬ рактеризующие ситуацию, а на выходе - получить числовые данные, харак¬ теризующие решение. Поэтому, когда хотят подчеркнуть такие «вычисли¬ тельные» применения нейросетей, то говорят о нейроподобных задачах, и это не в полной мере отображает ту простоту и универсальность механизмов, ко¬ торые свойственны мозгу. В живой природе на рецепторный слой нейронной сети (подсети, уп¬ равляющей работой органа чувств) поступают оценки информации. Каждый рецептор способен воспринимать сигнал в некотором весьма небольшом диапазоне, определяемом способом «технического» воплощения. На выходе нейросети сигналы могут варьироваться в том же диапазоне, едином для жи¬ вого объекта. Тогда нейрон выходного слоя способен лишь указать на реше¬ ние, посылая максимальное значение сигнала на другой логический уровень 12
Введение вывода - в другую (в другие) нейронную подсеть. Сама собой напрашивается такая модель нейронной сети, при которой блуждающие в ней сигналы носят смысл или булевых переменных, или достоверности. Причём достоверность (вероятность события) представляются в большей степени адекватными реа¬ лиям. А это теоретически диктует связь математической логики с теорией ве¬ роятностей. Эта связь определяет предпосылки построения теоретических основ класса логических нейронных сетей. Распределение величин возбуждения нейронов выходного слоя, а чаще всего нейрон, обладающий максимальной величиной возбуждения, позволя¬ ют установить соответствие между комбинацией и величинами возбуждений на входном слое (изображение на сетчатке глаза) и получаемым ответом (что это). Таким образом, эта зависимость и определяет возможность логического вывода вида «если - то». Сеть работает в двух режимах: в режиме обучения и в режиме распо¬ знавания (рабочем режиме). В режиме обучения производится формирование логических цепочек. В режиме распознавания нейросеть по предъявляемому образу или по возникшей ситуации с высокой достоверностью определяет, к какому типу они относятся, какие действия следует предпринять и т.д. Нас не интересует, как устроен нейрон, в котором насчитывают до 240 химических реакций. Нас интересует, как работает нейрон на логическом уровне, как выполняет он логические функции. 13
ГЛАВА I. ЛОГИЧЕСКИЕ ОСНОВЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА Лекция 1. Математическая логика событий и логические нейронные сети Аннотация. Отражены теоретические вопросы построения логических нейронных сетей. Исследуется структурированное логическое описание си¬ стемы принятия решений. Составляется вспомогательная «электронная» схе¬ ма. Описываются средства нечёткой логики. Рассматривается переход к при¬ менению «стандартных» нейронов, реализующих функцию активации. Про¬ водится преобразование сложной нейронной сети в однослойную. Ключевые слова: событие, высказывание, исчерпывающее множество событий, дизъюнктор, конъюнктор, дерево логических возможностей, си¬ стема принятия решений, логическая нейронная сетъ Учёные объяснения большей частью производят то впечатление, что бывшее ясно и понятно становится темно и запутанно. Л.Н. Толстой. Дневники, 1900, сентябрь. 1.1. Исчерпывающее множество событий Следующие ниже построения не могут не затронуть смысловых осо¬ бенностей высказываний о событиях. Кроме чисто формальных свойств вы¬ сказываний, выражающихся в их истинности или ложности, невозможно пол¬ ностью абстрагироваться от содержательной сути или от контекста, в кото¬ ром они звучат. Определение 1.1. Исчерпывающее множество событий (ИМС) обра¬ зуют те события, совокупность высказываний о которых покрывает весь воз¬ можный смысловой диапазон проявления объекта высказывания, и каждая допустимая ситуация характеризуется тем, что значение ИСТИНА (1) может принимать единственное высказывание из этой совокупности, а сумма веро¬ ятности этих событий равна единице. Рассмотрим примеры. 1) Времена года бывают: весна, лето, осень, зима. 2) В состав редколлегии входят трое: Иванов, Петров, Сидоров. Тогда провозглашение одной из этих фамилий определяет выдвижение единствен¬ ного представителя коллектива в президиум собрания. То есть, если Иванов, а затем и Петров взяли самоотвод, то однозначно в президиум направляется Сидоров. 14
Лекция 1. Математическая логика событий и логические нейронные сети 3) Наказуемое превышение скорости автомобиля делится на диапазо¬ ны: до 10%, от 10% до 20%, свыше 20%. Однако, если в регламентирующем документе заданы только диапазоны до 10% и от 10% до 100% (а что далее?), то это не будет соответствовать исчерпывающему множеству событий. Такие нестрогие определения возможного диапазона ситуаций являются причиной юридической казуистики, требующей дальнейшего исследования прецедента. Итак, ИМС, которому соответствует множество высказываний А = {х\, ...,хп}, характеризуется тем, что при соответствующих обстоятельствах одно и только одно высказывание из этого множества может принимать значение 1. Это и определяется операцией ИСКЛЮЧАЮЩЕЕ ИЛИ, которую обозна¬ чим ѵ. Говоря же о сумме вероятностей событий, мы несколько забежали вперёд. Очевидны главные свойства высказываний о событиях из ИМС: 1.2. Дерево логических возможностей. Факторное пространство событий Для строгого логического мышления, исключающего неопределен¬ ность, приходится оперировать не отдельными событиями и даже не исчер¬ пывающими множествами таких событий (высказываниями о них), а компо¬ зициями таких множеств. Между событиями, принадлежащими различным множествам, возможна зависимость, порождающая сложные высказывания. Да и сами ИМС могут определяться и инициироваться обстоятельствами, обусловленными событиями из других ИМС. Связи между ИМС, образую¬ щие сложные высказывания, отображаются деревом логических возможно¬ стей [20]. Рассмотрим пример. Пансионат для ветеранов труда обеспечивает постояльцам активный отдых круглый год. Представим схемой (рис. 1.1) распорядок дня отдыхаю¬ щих. Такая схема и определит дерево логических возможностей. Уровни ветвления могут формироваться разными способами. Напри¬ мер, первый уровень можно сформировать на основе времён года и т.д. Од¬ нако в порядке рекомендации можно следовать правилу: события располага¬ ются на более низких уровнях по сравнению с теми уровнями, которые зани¬ мают события, от которых зависят данные события. Бабушка пишет внуку: «Зимой я после завтрака катаюсь на лошади, и летом я после завтрака катаюсь на лошади, а также весной после завтрака прогулка бывает на лошади». ...Что-то ей не нравится, и она строит схему Xj JC\ V . . . V VJC/+1 V . . . V*^72* 0, при і ф у, (1.1) X при I = J (1.2) 15
Глава I. Логические основы искусственного интеллекта своего составного высказывания: / = х\ л хі л хи ѵ х\ л jcs л х\4 ѵ х\ л лч л jcio ajci4. Несколько поразмыслив, бабушка использует вынесение за скобку: / хіа хи а(х5 ѵ xj ѵ Х4 а х\о). Тогда окончательный текст сообщения принимает вид: «После завтрака я катаюсь на лошади летом или зимой, а также, бы¬ вает, и весной, вместо прогулки». Как же бабушка определила форму того логического выражения, — функции, отображающей все возможные вариан¬ ты, и даже пути, ведущие к свершению интересующего события? Рис. 1.1. Полное дерево логических возможностей Ответ следующий: необходимо на каждом пути в дереве логических возможностей, ведущем к заданному событию, построить конъюнкцию со¬ бытий, образующих этот путь. Затем все такие конъюнкции объединить опе¬ рацией дизъюнкции. Поскольку используются только исчерпывающие мно¬ жества событий, очевидно, что эта дизъюнкция выполняется с помощью опе¬ рации ѵ, т.е. ИСКЛЮЧАЮЩЕЕ ИЛИ (хотя можно пользоваться значком ѵ, опираясь на действительный, «физический» смысл возможных событий). 16
Лекция 1. Математическая логика событий и логические нейронные сети Полученная таким способом функция вызывает естественное желание быть подвергнутой эквивалентному преобразованию — вынесению за скоб¬ ки. Напомним список эквивалентных преобразований из булевой алгебры [4]: Закон коммутативности: Закон ассоциативности: Закон дистрибутивности: Закон де Моргана: Закон идемпотенции: Закон поглощения: Закон склеивания: Операция переменной с инверсией: Операция с константами: Двойное отрицание: хѵу = уѵх; ХАу = у АХ. xv(yvz) = (xvy)vz; XA(yAZ) = (ХАу) AZ. ХА (yvz) = (XAy)v(XAz); XV(yAz) = (хѵу) A (xvz). X VT= X A y\ X А у = X V у. xvx = x; XAX = X. XV(XAy) = X\ ХА (хѵу) = X. (XAy)v( X Ay) = y; (xVy)A(x vy) = y. XV X = 1; XAx = 0. jcaO = 0, xa\ =x; jcvO = x, xv\ = 1. x =X. (1.3) Практически, например, при конструировании электронных устройств, известно заранее, какой сигнал на отдельно взятом выходе должен формиро¬ ваться при различных значениях сигналов на входе. Тогда значения логиче¬ ской функции, описывающей формирование сигнала на данном выходе, за¬ даются таблично, в зависимости от всех возможных ситуаций на входе. По такой таблице аналитическое выражение для искомой логической функции формируется в виде совершенной дизъюнктивной нормальной формы (СДНФ). Её общий вид продемонстрируем на примере трёх переменных: / = /0, 0, 0) л(^л^л^) ѵ/0, 0, 1) л(^д^л^з) ѵ/о, 1, 0)л( X, Л Х2 А Х3) ѵДО, 1, 1)л(х, л Х2А Хз) ѵДІ, 0, 0)л (^і лх2 лх3 ) ѵДІ, 0, 1)л(д-ілх2 /аз) ѵ X1, 1, 0) Л (ііЛІ2Лх3 ) ѵДІ, 1, 1) Л (Х1ЛІ2ЛІ3). Отметим, что в результате такого способа построения искомая функция принимает вид, при котором каждая используемая переменная-высказывание входит не более одного раза. 17
Глава I. Логические основы искусственного интеллекта Например, функция, отображающая такое событие в жизни бабушки, как езда на велосипеде, имеет вид: g = х\ л л хю л хц v х\ а xs а хи = х\ л Л (Х4 Л -ХГю V х5). Однако далее будет показано, что не всегда единственного вхождения переменных можно добиться с помощью указанных эквивалентных преобра¬ зований. Иногда требуются дополнительные действия для его осуществле¬ ния. Определение 1.2. Совокупность всех исследуемых в данном контексте событий, т.е. множество - объединение всех рассматриваемых ИМС, образу¬ ет факторное пространство событий. Как и ранее, точку факторного пространства (ситуацию) будем обозна¬ чать {*і, Как видно из примера, факторное пространство событий отображается ветвящейся структурой на основе отдельных исчерпывающих множеств со¬ бытий, входящих в его состав. Тогда подмножества, состоящие из таких ИМС, тоже являются факторными подпространствами, которые в некотором контексте можно исследовать отдельно. Например, можно отдельно исследовать факторное подпространство, сформированное на основе первых двух уровней ветвления (рис. 1.2) в при¬ ведённом на рис. 1.1 дереве логических возможностей. Это может быть необ¬ ходимо при планировании финансовых расходов пансионата на питание. Можно, в соответствии с поставленной задачей (в контексте исследо¬ ваний), формировать другие факторные пространства событий. Например, планирование использования спортивного инвентаря по времени года приво¬ дит к целесообразности факторного пространства, структура которого пока¬ зана на рис. 1.3. Рис. 1.2. Факторное подпространство для исследований финансовых затрат на питание 18
Лекция 1. Математическая логика событий и логические нейронные сети 1.3. Система принятия решений Для некоторой логической функции / от переменных из факторного пространства событий воспользуемся операцией следования (импликации) и сформируем логическое выражение вида ...,*„)-> Л. (1.4) Здесь / следует рассматривать как выражение, определяющее условие, сложившуюся ситуацию, посылку, а R высказывание, которое рассматрива¬ ется как следствие: правило поведения, значение векторной функции, указа¬ ние к действию и т.д. Таким образом, возможно формирование связей вида «посылка - следствие», «если - то». При этом функция/задаётся на множе¬ стве ситуаций и указывает на то, что, если на некоторой ситуации она при¬ нимает значение 1 (ИСТИНА), то такое же значение принимает высказыва¬ ние R, являясь руководством к действию, к принятию определённого реше¬ ния. 19
Глава I. Логические основы искусственного интеллекта Подобно (1.3), можно описать множество логических выражений, оп¬ ределяющих стройную систему управления или принятия решений в соот¬ ветствии со складывающейся ситуацией в факторном пространстве событий: f(x\, ...,xn)^Ri fm(% 15 ■ ■ ■ ■> хп) ^ R-m (1.5) Определение 1.3. Система логических выражений вида (П.5), заданная на факторном пространстве (подпространстве) событий, обладающая полно¬ той и непротиворечивостью, называется системой принятия решений (СПР). Поясним важность свойств, указанных в определении. То, что система функций /i, является полной, означает, что любая точка факторного пространства событий входит в область задания хотя бы одной из этих функций. Непротиворечивость означает, что по каждой ситуа¬ ции одна и только одна из этих функций принимает значение 1, приводящее к истинности соответствующего высказывания - решения. Однако отметим, что, в действительности, на основе смыслового содержания задачи, по каж¬ дой или некоторой ситуации может быть известно более одного правильного решения, приводящего к успешным действиям. В таком случае высказывания об этих решениях могут быть объединены операцией ИЛИ, что приводит к приведённому выше предположению о непротиворечивости. Приведём теорему, которая даёт обоснование общего вида логического описания любой системы принятия решений - того вида, к которому на пути упрощения задачи рекомендуется приводить описание СПР для нейросетевой реализации. Теорема 1.1. Любая логическая функция, входящая в состав описания системы принятия решений, может быть приведена к дизъюнкции конъюнк¬ ций высказываний о событиях. Доказательство. Из основ математической логики (в частности, - тео¬ рии булевых функций) известно, что каждая такая функция может быть пред¬ ставлена дизъюнктивной нормальной формой. Однако в ней, наряду с пере¬ менными, участвуют их отрицания. Ориентируясь на применение исчерпы¬ вающих множеств событий, воспользуемся (1.1) для выражения таких отри¬ цаний. «Раскроем скобки», вновь выделив конъюнкции, объединённые опе¬ рациями дизъюнкции. Упростим эти конъюнкции с помощью (1.2). Получим форму, объявленную в теореме. Теорема доказана. Данная теорема объясняет, почему в последующих примерах преиму¬ щественно принимается именно объявленная форма описания СПР, или лег¬ ко сводящаяся к ней, а отрицания событий не рассматриваются. Пусть наша бабушка планирует занятия физкультурой и спортом во все времена года по времени дня: после завтрака, после обеда и после ужина. 20
Лекция 1. Математическая логика событий и логические нейронные сети Объединяя высказывания по принципу «если - то» и пользуясь обозначения¬ ми на рис. 1.1, она формирует систему принятия решений, которой, не пола¬ гаясь на память, намерена строго следовать, добившись согласия админист¬ рации. Система имеет вид: 1. Х\АХ4 —» R\ = «Прогулка на велосипеде»; 2. х\/ѵсб ѵ Х2ЛХ4 -л ІІ2 = «Шахматы»; 3. Х2ЛХ5 ѵ Х\ЛХ2 —» R3 = «Верховая езда»; 4. х\/\х$ ѴХ2ЛХ6 —» Ra = «Байдарка»; (1.6) 5. хз л(х4 ѵ хе) -л Rs = «Дискотека»; 6. л'2 аі7 Re = «Пешая прогулка»; 7. хз л(х5 ѵ хі) -л Re = «Пешая прогулка». Планируя пешую прогулку, бабушка первоначально получила следую¬ щее выражение: (х2 лхі ѵ Хт, ЛХ5) ѵ (л'з лх7) -л Re = «Пешая прогулка». Однако выше не напрасно обращается внимание на целесообразность однократного вхождения переменных в подобное выражение. (Ведь далее, при переходе к функции активации нейрона, возможно неоднократное сум¬ мирование одних и тех же переменных.) Выражение, полученное первонача¬ льно, с помощью эквивалентных преобразований привести к такому виду не удаётся. Тогда бабушка решает разбить это выражение на два подобных, сформировав получение одного и того же решения («размножив» решение) на основе двух условий. Это и послужило появлению в (П.6) двух выраже¬ ний, определяющих одно решение R6. Легко убедиться, что все возможные ситуации факторного простран¬ ства событий охвачены, что демонстрирует полную ясность действий бабуш¬ ки. Системы принятия решений могут образовывать сложные иерархиче¬ ские структуры. В этом случае необходимо, чтобы высказывания-решения Ri, ...,Rm отображали события, образующие ИМС. 1.4. «Схемотехническое» представление системы принятия решений Отобразим (с нарушением некоторых стандартов) схемотехнически ба¬ бушкину СПР, подобно электронной схеме (рис. ПА) с помощью конъюнк- торов и дизъюнкторов. На вход будем подавать значения истинности пере¬ менных-высказываний (ситуации) так, чтобы на одном из выходов формиро¬ валась единица - значение истинности соответствующего решения. Задавать 21
Глава I. Логические основы искусственного интеллекта значение ситуаций следует корректно, чтобы соблюдать требования вхожде¬ ния переменных в исчерпывающие множества событий. Реализовав эту схему на логических элементах, бабушка получит ре¬ альное средство подсказки: что она должна делать в данное время года и су¬ ток. Например, бабушка хочет вспомнить, чем она должна заниматься ле¬ том после обеда. Она полагает хі = Х5 = 1 при нулевых значениях других пе¬ ременных и запускает программу, моделирующую работу электронной схе¬ мы. На выходе R3 формируется сигнал, соответствующий высказыванию «Верховая езда». Рис. 1.4. «Электронная» схема системы принятия решений Электронная схема, имитирующая систему принятия решений, требует корректного задания исходной информации, т.е. корректной формулировки вопроса в соответствии со смыслом задачи. Одновременно должна существо¬ вать уверенность в получении единственного решения, в том числе предпо- 22
Лекция 1. Математическая логика событий и логические нейронные сети латающего задание альтернативных вариантов, если это предусмотрено при построении СПР. В таком случае окончательный выбор альтернативы может быть предусмотрен при развитии системы, при анализе новых вводимых факторов. При некорректной формулировке вопроса возникнут коллизии, не¬ однозначные или неправильные выводы. Таким образом, СПР может отве¬ чать только на те вопросы, на которые она настроена. 1.5. Достоверность высказываний о событиях Говоря о высказываниях как о логических переменных, мы, несомнен¬ но, предполагаем наличие субъективного фактора: ведь это кто-то сказал. И мы говорим верному другу: «Я мало доверяю этому человеку, но он сказал ..., а дыма без огня не бывает». Очевидно, недостаточно резких, кардинальных, взаимоисключающих, крайних суждений о высказываниях, подразделяющих их на истинные и лож¬ ные. Жизненный опыт говорит, что стопроцентной правды не бывает. Таким образом, необходимо ввести понятие достоверность высказы¬ вания, которая идеально представляет вероятность того, что данное высказы¬ вание о свершении события истинно, т.е. представляющая его логическая пе¬ ременная равна 1. В этой оценке достоверности вновь практически преобладает субъек¬ тивный фактор. Поэтому при построении экспертных систем применяется двойная оценка: оценка, данная экспертом по запросу, и вес самого эксперта. Здесь эффективно используется аппарат нечётких множеств. Говоря о сложных высказываниях, отображаемых деревьями логичес¬ ких возможностей, тем более трудно судить о достоверности высказываний о событиях, особенно тех, которые отображаются концевыми вершинами. Рассмотрим пример. Информатор сообщает Агенту о том, что видел своими глазами, как Марина передала Васе пачку денег. Напрягая богатый опыт, Агент рассуждает логически: 1. Насколько можно доверять Информатору, который три дня не брился и от которого дурно пахнет? 2. Мог ли находиться Информатор в это время в нужном месте, чтобы «видеть своими глазами»? 3. Насколько верно то, что в переданной пачке были деньги? 4. Можно ли оперативно воспользоваться существующими математи¬ ческими методами оценки (например, аппаратом нечётких множеств) заодно учитывающими другие факторы, как, например, личные финансовые затруд¬ нения, или необходимые оценки следует выполнить интуитивно, «с потол¬ ка»? 5. Так какова же должна быть формулировка отчёта в Центр, для полу¬ чения максимального вознаграждения за поимку взяточника? 23
Глава I. Логические основы искусственного интеллекта Таким образом, видно, что оценка достоверности высказываний неиз¬ бежна, но представляет значительные практические трудности, тем более, — при требуемой оперативности этих оценок, столь важной в реальных систе¬ мах управления и принятия решений. Итак, на основе алгебры высказываний можно создавать электронные системы принятия решений: на входе задавать ситуацию, на выходе получать указание на правильную реакцию. Всё дело лишь в интерпретации предмет¬ ной области - во вскрытии причинно-следственных связей, в исследовании личного или коллективного опыта, в изучении теории. Необходимы и схемо¬ технические навыки запоминания связей. Однако смущают два обстоятельства: 1. Неопределённость исходной информации о ситуациях, исключающая точный ответ на вопрос о наличии или отсутствии события и делающая не¬ правомерным использование исключительно булевых переменных. Высказы¬ вания не бывают истинными и ложными, как это предполагается в классиче¬ ской математической логике. Высказывания оцениваются своей достоверно¬ стью, которая принимает действительные значения на отрезке [0, 1], и под¬ чиняется известным положениям теории вероятности. 2. Способность человека логично мыслить на неформальном уровне не реализуется с помощью конъюнкторов и дизъюнкторов в составе мозга. Именно вскрытие механизмов мышления, особенно того, которое мы называ¬ ем рефлекторным, привлекает внимание исследователей. Необходимо искать механизмы мышления, оперирующие не с булевыми переменными, а с дей¬ ствительными, несущими смысл достоверности. Пусть рассмотренные выше переменные-высказывания {л,}, образую¬ щие факторное пространство, могут принимать значения достоверности {Рі}, 0<Рі<\,і = 1, ...,М Так как факторное пространство формируется на основе исчерпываю¬ щих множеств событий, то внутри каждого такого множества выполняется известное правило нормировки: сумма достоверностей событий каждого та¬ кого множества равна единице. Перегруппируем события и дополним дерево логических возможно¬ стей, представленное на рисунке 1.1, указав на его ветвях (стрелках), в каче¬ стве весов этих ветвей, значения достоверности событий (рис. 1.5). Получим вероятностное дерево логических возможностей [21]. При организации ветвления в этом дереве также предполагаются все возможные альтернативы, т.е. исчерпывающие множества событий. Поэтому сумма вероятностей всех событий, отображаемых вершинами, которые свя¬ заны входящими стрелками, исходящими из некоторой вершины, равна еди¬ нице. В отличие от дерева логических возможностей, вероятностное дерево явно отображает зависимость событий. События, зависимые от данного, 24
Лекция 1. Математическая логика событий и логические нейронные сети отображаются более низкими уровнями ветвления. Такая зависимость опре¬ деляется на уровне смыслового анализа факторного пространства. Например, логично предположить, что формы труда, отдыха и спор¬ тивных развлечений зависят от времени года, затем, — от распорядка приёма пищи. Такая зависимость и отображается на рис. 1.5. Тогда достоверность событий формируется с помощью условных веро¬ ятностей, зависящих от путей, по которым достигаются эти события. Поэто¬ му на вероятностном дереве логических возможностей целесообразно повто¬ рять вершины одного смыслового содержания, в результате чего размножа¬ ются варианты ветвления, а дерево существенно разрастается. От совмеще¬ ния путей страдает наглядность, и не более того. Рис. 1.5. Вероятностное дерево логических возможностей 25
Глава I. Логические основы искусственного интеллекта Чтобы найти вероятность некоторого события Ъ при условии сверше¬ ния события а (событию а может соответствовать корневая вершина, тогда речь идёт о полной, а не условной вероятности), необходимо найти все пути, ведущие из а в Ъ. По каждому пути необходимо перемножить все веса вет¬ вей. Полученные по всем путям произведения необходимо сложить. Пример 1. Найдём вероятность того, что отдыхающий весной и летом в произвольно выбранный момент времени совершает прогулку верхом: 0,25x0,33x0,5x0,4 + 0,25x0,33x0,3 = 0, 04125. Пример 2. Найдём вероятность того, что в произвольно выбранный момент времени в течение года отдыхающий совершает прогулку верхом: 0,25x0,33x0,5x0,4 + 0,25x0,33x0,3 + 0,25x0,33x0,2 = 0,05775. 1.6. Система принятия решений на основе достоверности высказываний о событиях Изменения, внесённые в дерево логических возможностей и представ¬ ленные на рис 1.5, отобразим в электронной схеме системы принятия реше¬ ний, представленной на рис. 1.4. Теперь исходными данными для конъюнк- торов и дизъюнкторов становятся не булевы, а действительные значения, для которых логические операции не определены (рис. 1.6). Так перейдём к по¬ нятию нечёткой логики. Следуя далее по пути приблизительных оценок (ибо практически до¬ стоверность, как категория теории вероятностей, принадлежит области весь¬ ма приблизительных оценок), разработаем некоторый суррогат операций конъюнкции N\ и дизъюнкции N2 на основе передаточной функции или функ¬ ции активации некоторого порогового элемента. Этот элемент преобразует сумму входных величин в выходные значения, которые приближённо «напо¬ минают» результаты упомянутых логических операций. Данный путь - путь ухода от точного выбора в сторону выбора решения на основе степени похо¬ жести ситуаций на уже известные. Это путь ассоциативного мышления. Так мы перейдём к рассмотрению тех нейроподобных элементов, что реализова¬ ны в природе! Существует множество вариантов подбора пороговой передаточной функции, или функции активации, лежащей в основе такого элемента. Введём сквозную нумерацию всех узлов схемы, реализующих дизъюн¬ кцию и конъюнкцию. Пусть / - номер такого узла, у номер входа этого узла при количестве mt активных входов (в данном примере каждый узел имеет два входа), щ - вес входа. Тогда простейшая функция активация (обратите внимание: наши помыслы сосредоточены на нейроне!)^, реализуемая /-м уз¬ лом для замены логических операций конъюнкции и дизъюнкции, имеет вид 26
Лекция 1. Математическая логика событий и логические нейронные сети L = Z>если Zfjc°j -h>0, j=i ;=i О, в противном случае. (1.7) Здесь fj — величина сигнала, поступающая на j-й вход. Тогда элемент Ni, подобный конъюнктору, может быть реализован при щ = \/т;, j =1, ..., ти с помощью существенно высокого порога (рис. 1.7), где значение 5і обусловлено некоторой поправкой, достаточной, чтобы для преодоления порога сигналы возбуждения с большой степенью уверенности поступали обязательно по всем входам. Рис. 1.6. Система принятия решений на основе достоверности событий 27
Глава I. Логические основы искусственного интеллекта f/m, filmi Узел і, реализующий функ¬ цию М, h = 1 - & fm Iflj Рис. 1.7. Элемент Ni На этапе настройки и верификации СПР предполагается, что входные сигналы — булевы переменные, принимающие значения 0, 1. Тогда целесо¬ образно выбрать значение S, < І/mi. Очевидно, что для того, чтобы преодо¬ леть порог, на всех входах должны быть «1»; недостаток хотя бы одной «1» приведет к тому, что сумма поступивших сигналов будет более чем на 1/тпі меньше указанной суммы весов. При переходе к действительным переменным, когда вместо событий рассматриваются, например, лишь предполагаемые вероятности их наступ¬ ления, экспериментальное уточнение значения может обусловить ту гра¬ ницу, когда считаться с возможностью данной комбинации событий нецеле¬ сообразно. Элемент N2, подобный дизъюнктору, реализуется, наоборот, при низ¬ ком значении порога и при C0j = \,j = 1, ..., гпі (рис. 1.8, единичные веса не обозначаются). Порог выбирается так, чтобы уже при возбуждении на одном входе возникал сигнал возбуждения на выходе. При этом если дизъюнкция задана на исчерпывающем множестве событий, как это чаще всего бывает, сигнал на выходе не превышает «1», а значение St выбирается эксперимен¬ тально достаточно малым. Задав на входе СПР значения достоверности переменных-высказыва¬ ний и рассчитав значения на выходах пороговых элементов, на выходах схе¬ мы получим некоторые значения. Максимальное из этих значений «голосу¬ ет» в пользу соответствующего решения. Узел і, реализующий цию N2, h = $ Рис. 1.8. Элемент N2 28
Лекция 1. Математическая логика событий и логические нейронные сети Предложения, касающиеся создания пороговых элементов N\ и N2, но¬ сят лишь рекомендательный характер. Здесь неограниченный простор для творчества. Напомним, что корректность задания исходной информации (соблюде¬ ние условия нормировки на исчерпывающих множествах событий, оценки достоверности с помощью вероятностного дерева логических возможностей) гарантируют практически приемлемый результат. Если же на входах задавать что угодно, то СПР преобразует это в какую угодно рекомендацию по прин¬ ципу: «каков вопрос — таков и ответ». На рассмотренном жизненном примере проанализируем принимаемые бабушкой решения на основе двух вариантов СПР: с помощью электронной схемы (рис. 1.4), использующей определённость знания о ситуации, и с по¬ мощью схемы, основанной на неопределённости, на предполагаемой досто¬ верности этих знаний (рис. 1.6). Положим (на основе интуиции) S = 0,3 для всех і. Данные сведены в таблицу 1.1. Таблица 1.1. Сравнительные оценки получаемых решений Переменные Решение по элек¬ тронной схеме Решение на осно¬ ве достоверности событий XI (Рі) Х2 ІРі) хз (ft) Х4 (А) Х5 (Рь) Хб (А) Х7 (Рі) 1 1 Ri Ri 1 1 1 R3 R3 1 1 Нет решения Нет решения 0,8 0,2 0,4 0,5 Решение не определено Ri 0,2 0,4 0,6 1 0,5 Решение не определено R2 Более точный выбор значения S, производится на этапе верификации СПР по известным вариантам нахождения решения. В данном случае пред¬ ставляется, что этот выбор произведён успешно. 1.7. Минимизация длины логической цепочки в системе принятия решений Замена логических операций операцией суммирования при счёте пере¬ даточной функции приводит к актуальности однократного учёта всех входя¬ 29
Глава I. Логические основы искусственного интеллекта щих переменных, т.е. к единственности вхождения переменных в каждое ло¬ гическое выражение, составляющее описание системы принятия решений. Выше с целью обеспечения такого единственного вхождения переменной был использован приём «размножения» решения Re. При разработке электронных схем исследуется понятие «длина логиче¬ ской цепочки» — под ней подразумевается максимальное количество элект¬ ронных элементов, которое должен преодолеть сигнал на входе схемы, прой¬ дя последовательное тактируемое преобразование, чтобы на выходе схемы сформировался сигнал. От этой длины, определяющей время переходного процесса, зависит быстродействие схемы. Поэтому актуальной задачей явля¬ ется минимизация максимальной длины логической цепочки при возможно¬ сти параллельного выполнения всех таких цепочек (что характерно для про¬ хождения электрического сигнала по схеме). Очевидно, что в схеме на рис. 1.4 максимальная длина логической це¬ почки равна двум. Применим ко всем выражениям (1.5), каждое из которых является или может быть преобразовано в дизъюнкцию конъюнкций, приём «размноже¬ ния» решений. Теперь (рис. 1.9) схема состоит из цепочек единичной длины. Каждый входной сигнал подвергается обработке только конъюнктором. Так как электронная схема полностью определяет конструкцию системы приня¬ тия решений на основе достоверности событий, то можно преобразовать по¬ лученную электронную схему в однослойную схему СПР, показанную на том же рисунке. Таким образом, доказано следующее утверждение: Любая СПР, сформированная на основе логического описания булевы¬ ми функциями, способом «размножения» решений преобразуется в одно¬ слойную СПР на основе достоверности событий. Преимуществом таких СПР является то, что они представляют собой таблицы с ассоциативной выборкой по принципу наибольшей похожести. Конечно, можно за каждым решением закреплять один выход СПР, на котором объединить общее решение, полученное по разным путям, в виде текста. При корректно заданных исходных данных - на основе правил ис¬ пользования исчерпывающих множеств событий - СПР будет «работать» правильно, выдавая адекватные ответы. Тогда рекомендация «Прими реше¬ ние R» будет выдана, а информация о пути, приведшему к этому решению, будет утрачена. При составлении «электронной» схемы такое объединение производит¬ ся с помощью операции дизъюнкции, что приводит к длине логической це¬ почки, равной двум. Но ведь если, формируя структуру СПР, строго следо¬ вать порядку построения «электронная схема —» система принятия решений», то и СПР будет иметь максимальную логическую цепочку с длиной, равной 2. 30
Лекция 1. Математическая логика событий и логические нейронные сети Таким образом, «размножение» решений - операция, целесообразность которой свойственна СПР, что делает её построение отличающимся, разви¬ вающим «схемотехнический» подход. «Электронные» схемы целесообразно использовать на начальном этапе исследования логического описания СПР, а далее, оттолкнувшись от них, перейти к более совершенной однослойной структуре. «Размножение» решений имеет важное достоинство. Оно позволяет ус¬ тановить причину, дополнительно объяснить принимаемое решение, учесть в тексте аргументацию. Это означает, что текст решения может быть дополнен указанием причины принятия именно такого решения. л Л Л Ri Ri Ri Дз Дз R4 Ra Rs Rs R6 R6 Re Ni Re Рис. 1.9. Преобразование электронной схемы с единичной длиной логической цепочки в однослойную систему принятия решений 31
Глава I. Логические основы искусственного интеллекта Например, получив информацию о необходимости заказа велосипеда в отделе спортинвентаря, бабушка может воспользоваться и важным объясне¬ нием: «... потому что сейчас, скорее всего, весна, а Вы, вероятно, только что сытно позавтракали» (рис. 1.10). Рис. 1.10. Бабушка Таким образом, построен алгоритм параллельных (бесформульных!) вычислений сложных логических конструкций в области действительных пе¬ ременных, предназначенный для реализации высокого быстродействия в си¬ стемах управления и принятия решений. Более того, сведение СПР к одно¬ слойной нейросети приводит к применению лишь тех передаточных функций (элементов N\ на рис. 1.6 и 1.9), которые имитируют конъюнкторы. Это слу¬ жит повышению достоверности оценок, стандартизации и адекватности при¬ родным процессам. От логических операций совершён переход к их некоторым суррогатам на основе передаточной функции. Операционной основой этой функции яв¬ ляется сложение взвешенных сигналов на входе. Логические переменные оказались заменёнными действительными - достоверностью высказываний. Изображая передаточную функцию буквой N, и уже назвав её однажды функцией активации, мы подразумеваем нейрон, нейроподобный элемент - исполнитель этой функции активации, способный, подобно кирпичику, учас¬ твовать в образовании сложных сетевых структур. Теперь мы можем на ри- 32
Лекция 1. Математическая логика событий и логические нейронные сети сунке 1.9 заменить квадратики кружочками, подразумевая нейроны, как это отображено на рис. 1.11. При этом функции активации являются простейшими (монотонно воз¬ растающими по каждому сигналу на входе), и выбираться «на вкус». Как го¬ ворилось выше, операция сложения взвешенных сигналов на входе является основой такой функции. Практически всегда весами являются «нули» или «единицы». Велосипед! Шахматы! Шахматы! Верховая ез¬ да! Верховая ез¬ да! Байдарка! Байдарка! Дискотека! Дискотека! Пешая про¬ гулка! Пешая про¬ гулка! Пешая про¬ гулка! Рис. 1.11. Логическая нейронная сеть БАБУШКА 33
Глава I. Логические основы искусственного интеллекта В данном примере можно рекомендовать функцию активации: VѴ.-Н,если 'YV.-h>О, Г, = і О, в противном случае, j"пробегает" но входам с единичными весами. Значение /г = 1 гарантирует выполнение условия 0 < < 1. Это упро¬ щает применение формируемого на выходном слое сигнала для входа в сле¬ дующую нейронную сеть длинной логической цепочки. 1.8. Выбор и обоснование функции активации нейрона Требования к функции активации: 1. Эти функции в области преодоления порога должны быть монотонно возрастающими по каждому сигналу на входе нейрона; 2. Сигнал возбуждения при его прохождении по сети не должен уга¬ сать; 3. Сигналы возбуждения на выходном слое должны быть четко разли¬ чимы по величине для различных эталонных ситуаций; 4. Должен быть примерно равным диапазон изменения величин воз¬ буждения нейронов выходного слоя, закрепленных за разными решениями. Приведём ряд функций активации, тривиальных по выполнению и ис¬ пользуемых в данной книге: Г Л у-={ 1. ІО) х, при х > О, Л О, в противном случае.J 2. ' t Ve,I h V І V := if V > A then A else V. i V := if V > h then V else 0. i V :=ifV >h aV <1 then V - h else ifV>\ then 1 - h else 0. 1 Вес связи - переменная с двумя индексами; здесь для краткости не индексируется нейрон, а только его вход. 34
Лекция 1. Математическая логика событий и логические нейронные сети 5. Достаточно универсальной функцией активации является функция возбуждения нейрона по усреднённому значению сигналов на его входах (дендритах). Это усреднённое значение сигналов и принимается, как величи¬ на возбуждения нейрона. 2>г V = -= , V := if >h then V else 0. 2> i Если все веса щ = 1, то функция активации находится: Ѵ:=— ^ Ѵг; V := iJV > hthenV elseO, (n - количество П г активных входов нейрона, прообразом которого является конъюнктор). Не следует забывать, что нейронную сеть, реализующую СПР, необхо¬ димо рассматривать как одно звено в цепочке логического вывода, вырабаты¬ вающее информацию для последующих звеньев цепочки. Это позволяет строить сложные, многоуровневые СПР, как цепочки логических выводов, реализующие дедуктивное и даже индуктивное мышление. Конкретно это означает, что величины возбуждения нейронов выход¬ ного слоя должны, как и величины возбуждения рецепторов, принадлежать диапазону [0,1], моделируя всё ту же достоверность выводов. В однослойных нейронных сетях, где хороша каждая из перечисленных функций активации, предлагается использовать функцию активации 5. Здесь особенно актуально то, что прообразом нейрона выходного слоя является конъюнктор. Легко видеть, что величина возбуждения каждого нейрона сети удовлетворяет указанному диапазону. Функция активации 4 применима в задачах логического вывода, а так¬ же в системах диагностики, т.к. близка к воспроизведению булевой перемен¬ ной. Можно придумать и другие функции активации, удовлетворяющие приведённым выше требованиям. Ключевые термины Исчерпывающее множество событий образуют события, объединён¬ ные по смыслу так, что сумма вероятностей их наступления равна единице. Дерево логических возможностей формируется на основе компози¬ ции исчерпывающих множеств событий. Позволяет упорядочить эти множе¬ ства на основе последовательного ввода их в рассмотрение при предположе¬ нии о выполнении ранее рассмотренных. Применяется при изучении вариан¬ тов совместного выполнения событий. 35
Глава I. Логические основы искусственного интеллекта Факторное пространство событий образуется всеми рассматривае¬ мыми исчерпывающими множествами событий. Достоверность высказываний о событиях - предполагаемая вероят¬ ность наступления события. Ассоциативное мышление - выбор эталона, на который более всего похож исследуемый объект. Часто этот выбор производится методом усред¬ нения о нескольких эталонах, на которые этот объект похож с некоторыми весами. Размножение решений - результат разбиения логического выражения на отдельные конъюнкции (до того объединённые операцией дизъюнкции), определяющие одно и то же решение. Однослойная нейронная сеть отображает только связи вида (конъюнкция высказываний о событиях) -л (решение). Краткие итоги 1. Корректно составленная система принятия решений оперирует ис¬ черпывающими множествами событий. 2. Несколько исчерпывающих множеств событий, являющихся предме¬ том исследования при построении системы принятия решений, образуют факторное пространство событий. 3. Взаимосвязь событий различных исчерпывающих множеств целесо¬ образно отображать деревом логических возможностей. Оно позволяет выде¬ лять множества совместных событий, находить вероятности их наступления, строить факторные подпространства событий. 4. Дерево логических возможностей позволяет корректно строить логи¬ ческие функции в основе системы принятия решений. 5. Реализация логических функций по технологии «электронных» схем позволяет построить систему принятия решений, оперирующую с булевыми переменными. Применение исчерпывающих множеств событий исключает необходимость операции НЕ. 6. Переход от булевых переменных к действительным - к достоверно¬ стям высказываний о наступлении событий - возможен с помощью нечёткой логики, основанной на приближённом исполнении схем И и ИЛИ на нейро- подобных элементах. 7. Дальнейший переход к нейронным сетям при сохранении правиль¬ ной работы системы принятия решений также оказывается результативным, так как следует Природе. 8. Структура нейронной сети может быть значительно упрощена по из¬ вестным в математической логике и в схемотехнике методам сокращения максимальной длины логической цепочки. Так формируются однослойные нейронные сети. 36
Лекция 1. Математическая логика событий и логические нейронные сети Вопросы: 1. Что представляет собой исчерпывающее множество событий? 2. Что представляет собой факторное пространство событий и как его структуризация с помощью дерева логических возможностей помогает кор¬ ректно сформировать логическое описание системы принятия решений? 3. Как формируется полное и непротиворечивое логическое описание системы принятия решений? 4. Как логическое описание преобразуется в форму, предполагающую однослойную нейронную сеть? 5. Как осуществляется переход к нечётким данным - к достоверностям высказываний о наступлении событий? 6. Как на основе «схемотехнического» подхода производится обосно¬ вание однослойных логических нейронных сетей, реализующих системы принятия решений? Лекция 2. Силлогистика Аристотеля Аннотация. В историческом аспекте изучаются попытки формализа¬ ции мыслительных процессов человека. Рассматривается развиваемая до на¬ ших дней силлогистика Аристотеля, жившего в IV веке д.н.э. Он обслуживал модные в то время философские споры, в которых защищаемые тезисы не обязательно были достоверны. Однако актуальность именно таких установок оказывается живучей и сейчас. Материал представляется в интерпретации Д.А. Поспелова. Ключевые слова: софистические рассуждения, сущность, высказыва¬ ние, квантор, жергоновые отношения, силлогизм. - Индия, о высокочтимый мой учитель, находится почти на самом краю земного диска и отделена от этого края безлюдными и неизведанными пустынями, ибо на восток от неё не живут ни звери, ни птицы. Л. Лагин. Старик Хоттабыч 2.1. Сущности и базовые высказывания В науке порой долго живут идеи и теории, которые оказываются оши¬ бочными. Новые идеи опровергают старые и оказываются опровергнутыми вновь «более верными». Этот процесс вполне соответствует диалектическо¬ му закону «отрицания отрицания», на бытовом уровне утверждающего, что недостижимая правда лежит где-то посредине. Поэтому изучение истории развития науки должно привести к пра¬ вильным посылкам для создания искусственного интеллекта. 37
Глава I. Логические основы искусственного интеллекта В [2] Д.А. Поспелов подробно и критически рассматривает формаль¬ ную модель мышления на базе теории силлогистики, известного учёного древности (кстати, учителя Александра Македонского) Аристотеля, жившего в IV веке д.н.э. Он оставил существенный вклад в области теории мышления. Феномен заключается в том, что, возникнув в уме одного человека - Аристо¬ теля, силлогистика не подвергалась серьёзной критике или опровержению. Её только уточняли. Студенческая традиция: Если потрогать этот палец, - можно сдела¬ ться очень умным. Целью тогдашних философов было обслуживание софистических рас- суждений в учёном споре. Исходное положение спорщика, будь оно истин¬ ным или ложным, с высочайшим искусством должно было защищаться до полного признания противной стороной. Как видим, этого не удалось до¬ биться Вольке Костылькову, несмотря на поддержку Старика Хоттабыча. Рис. 2.1. Аристотель в Салониках 38
Лекция 2. Силлогистика Аристотеля Философы того времени уже знали, что бывают три типа рассуждений: Дедуктивные - от общего к частному; Индуктивные - от частного к общему; От частного к частному. Дедуктивный вывод следует считать истинным, достоверным. На основе двух других типов рассуждений верный вывод проблемати¬ чен. Эти типы рассуждений относят к правдоподобным. Лишь большое количество частных рассуждений способно при обоб¬ щении породить гипотезу для индуктивного вывода. Эта гипотеза подтвер¬ ждается в результате проверки правильности дедуктивных рассуждений на её основе (см. парадигму ученика; мы часто пользуемся выражением: «опыт яв¬ ляется критерием истины»). Рассуждения от частного к частному, среди правдоподобных, следует отнести к интуитивным, предполагаемым, способным привести к догадке по аналогии, но никак не к научным. (Какой вывод, кроме эмоционально-поэти¬ ческого, может следовать из того, что движущийся на вас танк похож на бо¬ льшую черепаху?) Таким образом, Аристотель исходил из двух положений: 1. Исходные посылки рассуждения являются истинными по определе¬ нию (но не по факту). 2. Правильно применяемые приёмы перехода от исходных посылок к другим вытекающим из них утверждениям, а также из этих утверждений (и исходных посылок) к новым утверждениям, должны сохранять истинность. Таким образом, априорно предполагаемые истинные посылки порож¬ дают только истинные следствия. Положения силлогистики Аристотеля позволили средневековому фи¬ лософу Фоме Аквинскому обосновать всю христианскую теологию. Его ис¬ ходной посылкой являлись Бого-вдохновенные, а потому истинные, сочине¬ ния Ветхого и Нового Заветов. Силлогистика Аристотеля, исходящая из установок сомнительной до¬ стоверности, привлекательна и сейчас. Однако то, что допустимо в политике, торговле и средствах массовой информации, недопустимо в экономике и точ¬ ных науках, в том числе - в сложных системах управления. Поэтому, научить «правильному» вранью так же важно, как научить честности. Основной логической единицей силлогистики является сущность. Сущностью называется объект (внимания, изучения), о котором мож¬ но что-либо утверждать. Сущности образуют классы S, Р, М, о содержательном смысле которых будет сказано ниже. Вводится понятие кванторов: всякий и некоторый. С помощью кванторов строятся шесть схем базовых высказываний, ис¬ пользуемых в силлогистике: 1. Всякий S есть Р. 39
Глава I. Логические основы искусственного интеллекта 2. Всякий S не есть Р. 3. Некоторый S есть Р. 4. Некоторый S не есть Р. 5. S есть Р. 6. S не есть Р. Отметим, что если S определяет сущности, о которых что-то утвер¬ ждается в высказываниях, то Р определяет, что именно о них говорится. Иногда S называют субъектом высказываний, а Р — предикатом высказыва¬ ния (формальным изображением смысла высказывания). Если высказывания 1-4 относятся к некоторым утверждениям о при¬ надлежности или не принадлежности множеств элементов S некоторому классу элементов, обладающих свойством Р, то высказывания 5 и 6 имеют несколько другую природу. Высказывание 5 утверждает, что класс S совпа¬ дает с классом элементов, обладающих свойством Р, а высказывание 6 гово¬ рит о том, что эти классы не совпадают. Для конкретных сущностей имеются две схемы базовых высказываний, введённых позднее (в силлогистике Аристотеля их не было): 7. а есть Р. 8. а не есть Р. Связки «есть» и «не есть» традиционно применяются в математике, указывая, скорее на суть, на принадлежность или равенство, чем на наличие. Например, «треугольник есть (суть, это) многоугольник», «сумма квадратов катетов есть (равна) квадрат гипотенузы», «Иванов не есть (не принадлежит) множество лысых». В теории множеств схемы 5-8 интерпретируются соответственно: S а Р, S сД a е Р, а <£ Р. Приведённая современная теоретико-множественная интерпретация схем позволяет выполнять две процедуры: а) по высказыванию определить, какие взаимоотношения между сущностями классов S' и Р реализуются; б) по знаниям о том, какие взаимоотношения между сущностями этих классов име¬ ют место, определять соответствующие высказывания с уверенностью, что они являются истинными. Смысл базовых высказываний можно задать наглядно с помощью так называемых жергоновых отношений, показанных на рис. 2.2. В табл. 2.1 показано соответствие между схемами базовых высказыва¬ ний и случаями, приведёнными на рис. 2.2. Легко заметить, что при отображённой в таблице интерпретации базо¬ вых высказываний схемы 3 и 4 аналогичны схемам 5 и 6, то есть эти выска¬ зывания с точки зрения истинности не различаются. В других интерпретаци¬ ях силлогистики они могут принимать значения ИСТИНА и ЛОЖЬ на раз¬ ных областях жергоновых отношений. 40
Лекция 2. Силлогистика Аристотеля а) б) в) г) Таблица 2.1. Соответствие схем базовых высказываний Номер схемы ба¬ зового высказы¬ вания Случаи, показанные на рис. 2.1 Номер схемы базо¬ вого высказывания Случаи, показан¬ ные на рис. 2.1 1 а, б 5 а, б, в, г 2 д 6 в, г, д 3 а, б, в, г 7 е 4 в, г, д 8 'W> і/П. Тогда необходимы специальные процедуры, которые могли бы прове¬ рять взаимосвязь классов S и Р, а также вхождение конкретной сущности а в класс Р. В силлогистике существование таких эффективно работающих про¬ цедур постулируется (предполагается с очевидностью). Приведём ряд примеров высказываний с указанием областей, в кото¬ рых эти высказывания интерпретируются как истинные. 1. Всякий огородный овощ съедобен (S - класс огородных овощей, Р - класс съедобных сущностей). 2. Всякий автомобиль не есть трамвай (S - класс автомобилей, Р - класс трамваев). 3. Некоторые люди могут прыгнуть в высоту на два метра (S - класс людей, Р - класс живых существ, которые могут прыгнуть в высоту на два метра и более). 41
Глава I. Логические основы искусственного интеллекта 4. Некоторые деревья сбрасывают на зиму свою листву (S - класс дере¬ вьев, Р - класс всех вечнозеленых растений, включающий в себя и те дере¬ вья, которые остаются зимой зелёными). 5. Отец и мать есть родители (S - класс, состоящий из двух элементов «отец» и «мать», Р - класс с именем «родители», в высказывании содержится утверждение о совпадении по объёму этих двух классов). 6. Приматы не есть все обезьяны (S - класс приматов, Р - класс всех обезьян, среди которых и все приматы). Аналогичный пример: люди высоко¬ го роста не только те, чей рост выше двух метров (S - класс высоких людей, Р - класс тех существ, чей рост выше двух метров). 7. Иванов есть сотрудник нашей лаборатории (а - единичный объект Иванов, Р - списочный состав «нашей лаборатории» - конкретной лаборато¬ рии, о которой говорится в данном высказывании). 8. Петров не есть член клуба филателистов Москвы (а - единичный объект Петров, Р - список членов клуба филателистов Москвы на тот момент времени, когда актуализируется это высказывание) 2.2. Законы силлогистики Любой вывод, представимый в силлогистике Аристотеля, может иметь или не иметь посылок. По числу используемых посылок можно различать выводы ранга 0, 1, 2 и т.д. Утверждения, для которых посылки не нужны, называются законами силлогистики (в некоторых логических системах они называются аксиома¬ ми). Таких законов в силлогистике Аристотеля три: закон тождества, закон противоречия и закон исключённого третьего. Прежде чем перейти к их формулировкам, введём обозначения, восхо¬ дящие к Петру Испанскому, жившему в XIII веке и написавшему широко распространённое в Средние века сочинение, в котором излагалась логика Аристотеля с возникшими к тому времени добавлениями. Эти обозначения (породившие кванторы в современной математиче¬ ской логике), следующие: А - Всякий + есть +. Е - Всякий + не есть +. /Некоторый + есть +. О - Некоторый + не есть +. В этих записях знак плюс означает свободное место, на которое можно поставить имя некоторого конкретного класса сущности. В первой позиции этот класс играет роль класса S, а во второй - Р. Тогда условимся для удоб¬ ства записи конкретные классы обозначать малыми буквами sup. Введём ещё один символ, называемый знаком выводимости I—. Запись F I— Q означает, что если относительно всех посылок, входящих в совокуп- 42
Лекция 2. Силлогистика Аристотеля ноетъ F, известно, что они выводимы, то заключение Q также выводимо. За¬ пись I—Q означает, что Q выводимо всегда и не зависит от выводимости ка¬ ких-то других утверждений. Это вывод нулевого ранга, т.е. закон силлоги¬ стики (мы говорим: принимаем за аксиому). Закон тождества формулируется следующим образом: всякий s есть .ѵ, или, в принятых обозначениях I—Ass. Смысл закона состоит в утверждении, что всякая конкретная сущность, входящая в класс S, обладает всеми свойствами элементов этого класса. Формально представляется, что в таком утверждении нет смысла. Однако в человеческом общении оно несёт не информационную, а эмоциональную нагрузку. «Осень есть осень», - говорим мы. «Да, ненастье есть ненастье», - отвечает собеседник. Для формулировки следующих законов введём две логические связки - конъюнкцию, которую будем обозначать &2, и дизъюнкцию, которую будем обозначать ѵ. Смысл их состоит в том, что сложное утверждение FI & F2 ис¬ тинно лишь тогда, когда истинны оба утверждения F1 и F2, а утверждение F1 ѵ F2 истинно в том случае, если истинно хотя бы одно из них. Пусть обо¬ значение интерпретируется в записи вида -F как утверждение о том, что неверно, что F является истинным. Тогда закон противоречия записывается следующим образом: I—^(Asp&Esp). Это означает, что невозможна ситуация, когда конкретные сущности из класса S одновременно входят в р и не входят в него. Известный поэт, «генерал» поэзии того времени, придрался к автору слов песни «Бухенвальдский набат» Исааку Соболеву: Сотни тысяч заживо сожжённых Строятся, строятся в шеренги к ряду ряд. Действительно, как могут строиться мёртвые? Поэт песни (композитор Ванно Мурадели), облетевшей весь мир, остался тщательно скрываем и умер в болезнях и нищете. Конечно, эти слова поэта явились поводом при гонени¬ ях «неудобного» правдолюбца, но мы могли бы воскликнуть: «Силлогистику - на службу коммунизма!» 2 Пытаясь в рамках одной книги отразить разные воззрения на предмет исследования, трудно ввести единую терминологию и единые обозначения. Согласимся с локальным, историческим характером символики, что¬ бы ещё более не запутать дело. Сейчас мы говорим о силлогистике Аристотеля. 43
Глава I. Логические основы искусственного интеллекта Ещё большую критику может вызвать закон исключённого третьего, записываемый следующим образом: I—(IspvOsp). Он говорит, что для каждой конкретной сущности а, входящей в s, ис¬ тинно одно из двух утверждений «а входит в р» или «а не входит в р» (треть¬ его не дано). Совместно эти два утверждения не могут быть истинными, что следует из закона противоречия. Закон исключённого третьего в процессе развития логики подвергается постоянной критике, ибо вся человеческая практика пронизана примерами его невыполнения. Из конструктивной логи¬ ки этот закон исключён. Геометрические теоретико-множественные (жергоновы) соотношения, следующие из рис. 2.1, позволяют написать несколько примеров вывода пер¬ вого ранга, т.е. с одной посылкой, истинность которой является достаточным условием для истинности заключения. Справедливость вывода непосред¬ ственно следует из рисунка и таблицы, задающей условия истинности для схем базовых высказываний. Эти примеры следующие: Asp I— -'Osp; Esp I— Esp; Asp I— Isp; Esp I— Isp\ Isp I— Ips; Esp I— Ops. 2.3. Силлогизмы Силлогизмы у Аристотеля - это выводы второго ранга, т.е. выводы, ко¬ торые можно сделать на основании двух посылок. В этих посылках фигури¬ руют три класса сущностей S, Р и М. По многовековой традиции их называ¬ ют меньший, больший и средний термин. Каждая посылка и заключение представляют собой базовые высказы¬ вания силлогистики. В соответствии с тем, как используются S, Р и М в высказываниях, в силлогистике выделяют четыре фигуры (рис. 2.3), пронумерованные на ри¬ сунке. Каков смысл этих фигур? Возьмём первую фигуру. Для того чтобы породить с её помощью конк¬ ретные типы силлогизма (они называются модусами), надо выбрать из четы¬ рёх символов А, E, I, О по одному для первой и второй посылок и для заклю¬ чения. Количество комбинаций расстановки четырёх символов по трём пози¬ циям равно 43 = 64. При четырёх фигурах это даёт 256 различных модусов. Проиллюстрируем несколько возможных модусов для первой фигуры. Рассмотрим комбинацию ААА. Ей соответствует следующий модус силлогизма: 44
Лекция 2. Силлогистика Аристотеля Всякий Месть Р Всякий S есть М Всякий S есть Р Попробуем проверить правильность этого силлогизма. А именно, если его посылки истинные, то всегда ли будет истинным заключение? Для этого используем жергоновы отношения в табл. 1. Первая посылка, как это следует из таблицы, даёт две возможности соотношений МиР. Эти возможности по¬ казаны в верхнем ярусе на рис. 2.4. Поскольку вторая посылка тоже истинна, то на нижнем ярусе того же рисунка показаны области, в которых одновре¬ менно выполняются требования к истинности обеих посылок. Первая посылка М » 9 ""* ■» х Вторая посылка S ** - Заключение .V •- Р м (1) Первая посылка Р « Вторая посылка S т Заключение S • Первая посылка М у Вторая посылка М І Заключение S • Первая посылка Р т Вторая посылка М щ* - ** Заключение S • ■? i М і - М (2) Р * 5 (3) ■т М S (4) Рис. 2.3. Фигуры установления истинности силлогизмов Таких возможных областей три, как это видно из рисунка. Для всех трёх областей между S и Р имеются жергоновы отношения такого типа, кото¬ 45
Глава I. Логические основы искусственного интеллекта рый обеспечивает истинность заключения силлогизма. Это значит, что при истинности его посылок результат вывода, т.е. переход к заключению, всегда возможен, и заключение будет истинным. Рис. 2.4. Требуемые соотношения для комбинации ААА Рассмотрим другой пример, приняв модус первой фигуры ЕЮ Всякий Мне есть Р Всякий S есть М Всякий S не есть Р. Для первой посылки есть одна возможная область истинности, показан¬ ная на верхнем ярусе рис. 2.5. При добавлении второй посылки с учётом тре¬ бований к её истинности можно получить четыре варианта, показанные на втором ярусе рисунка. Все четыре полученные области являются областями истинности для базового высказывания, соответствующего заключению в этом силлогизме. Следовательно, истинность его посылок всегда обеспечивает истинность зак¬ лючения. Рассмотрим, наконец, ещё один пример, взяв модус АЕЕ первой фигу¬ ры на рис. 2.6. Всякий Месть Р Всякий S не есть М Всякий S не есть Р. 46
Лекция 2. Силлогистика Аристотеля Рис. 2.5. Требуемые соотношения для комбинации ЕЮ Соответствующая графическая интерпретация дана на рис. 2.6. Для первой посылки возможны две области истинности в жергоновых отношениях, показанные на верхнем ярусе рисунка. Добавление второй по¬ сылки, показанное на нижнем ярусе рисунка, при первой возможности для первой посылки однозначно, а для второй возможности приводит к трём раз¬ личным возможностям расположения трёх классов сущностей. А именно, два средних случая на нижнем ярусе приводят к ложности заключения. Следова¬ тельно, силлогизм АЕЕ не является правильным. Из истинности его посылок не всегда следует истинность его заключения. Вот пример такого ошибочно¬ го заключения: Всякий железный брусок тонет в воде Всякий кирпич не есть железный брусок Всякий кирпич не тонет в воде. Таким образом, имеются силлогизмы, которые всегда обеспечивают правильный вывод, т.е переход к истинному заключению при истинности двух посылок. А есть силлогизмы неправильные, не обеспечивающие такого заключения. Закономерен вопрос: сколько силлогизмов из 256 возможных являются правильными? Ответ на него и есть ядро силлогистики. Перебирая все воз¬ можные модусы, можно обнаружить, что лишь 24 модуса являются правиль¬ ными, а все остальные могут привести к ошибочному выводу. Таким образом, правильные модусы образуют ядро теории дедуктивно¬ го вывода, в которой от правильных посылок всегда гарантируется переход к правильному заключению. Но, как стало ясно в последующих столетиях, 47
Глава I. Логические основы искусственного интеллекта Аристотель создал ядро дедуктивной теории, которое позволило расширить его, сохраняя все основные исходные положения. На этом мы остановимся в изучении силлогистики Аристотеля. Дело в том, что последующие её расширения (прежде всего, введение операции от¬ рицания) привели к современному состоянию теории «Математическая логи¬ ка». Как было показано в Лекции 1, именно на её базе (и на базе элементов теории вероятностей) построена математическая логика событий, легшая в основу логических нейронных сетей - средств реализации многих задач ис¬ кусственного интеллекта. Ключевые термины Силлогистика (Аристотеля) - одна из первых наук о законах логиче¬ ского мышления человека. Сущность - объект высказывания. Дедукция - рассуждения от общего к частному. Индукция - рассуждения от частному к общему. Гипотеза - индуктивный вывод, достоверность которого подлежит подтверждению. Базовые высказывания (в силлогистике) - высказывания по схеме, использующие кванторы всякий и некоторый; представляют восемь аксиом. Жергоновые отношения - теоретико-множественная интерпретация базовых высказываний в силлогистике. Законы силлогистики - закон тождества, закон противоречия, закон исключённого третьего. 48
Лекция 2. Силлогистика Аристотеля Силлогизм (Аристотеля) - вывод, который можно сделать на основа¬ нии истинности двух посылок. Модус - один из четырёх типов силлогизма. Софистика - наука о ведении спора, при котором необходимо убедить оппонента любыми средствами, несмотря на истинность или ложность ис¬ ходной посылки или промежуточных выводов. Краткие итоги 1. В силлогистике Аристотеля впервые и до настоящего времени утвер¬ дилось понятие о трёх типах рассуждений: дедуктивных, индуктивных и от частного к частному. 2. Индуктивные или правдоподобные рассуждения способны породить лишь гипотезу, нуждающуюся в подтверждении практикой, опытом. 3. Введение понятий сущностей и их классов, а также кванторов, под¬ нимает силлогистику с уровня исчисления высказываний на уровень исчис¬ ления предикатов. 4. Базовые высказывания - предикаты образуют восемь схем, опреде¬ ляющих систему аксиом силлогистики. 5. Теоретико-множественный подход позволяет наглядно представить характер взаимоотношений между сущностями классов - построить жерго- новые отношения. 6. На основе кванторов и классов сущностей сформулированы четыре закона (А, Е, /, О) силлогистики, породившие кванторы общности и суще¬ ствования современной математической логики. 7. Исследование истинности основных типов силлогизмов исчерпывает требования практического применения силлогистики сегодня. Вопросы 1. Каковы исходные положения силлогистики Аристотеля? 2. Каковы три типа рассуждений? 3. Почему для практических применений высказывания в силлогистике неотделимы от сущностей и их классов? 4. Используя кванторы, приведите восемь схем базовых высказываний в силлогистике. 5. Объясните понятие жергоновых отношений. 6. Объясните три закона силлогистики. 7. Приведите четыре фигуры силлогизмов Аристотеля и схемы доказа¬ тельства их истинности. Сколько силлогизмов являются «правильными»? 49
Глава I. Логические основы искусственного интеллекта Лекция 3. Основы математической логики Аннотация. Развиваются положения математической логики, частично использованные при построении логических нейронных сетей. Изложение ведётся в интерпретации В.М. Глушкова, направленной на применение в сложных кибернетических системах. Обсуждаются три направления: булева алгебра, исчисление высказываний и исчисление предикатов. Ключевые слова: булевы переменные, булевы функции, высказывания, предикаты, полнота, непротиворечивость. Изучать философию нужно, когда философия вам не нужна. Когда вы догадываетесь, что стулья в вашей гостиной и Млечный путь связаны между собою, и более тесным образом, чем причины и следствия, чем вы сами с вашими родственниками. И что общее у созвездий со стульями - бесчувственность, бесчеловечность. Иосиф Бродский. Выступление в Сорбонне 3.1. Булева алгебра Да, Поэт прав: всякая формализация основ нашей жизни - мышления, призвана утвердить на абстрактном уровне бесчувственность, бесчеловеч¬ ность. Но это оправдано, если целью наших исследований является не пара¬ зитическое применение методов человеческого интеллекта во благо лично¬ сти, а его развитие. Казалось бы, после Лекции 1 возвращаться к основам математической логики нет смысла. Но ведь там был приведён только материал, позволивший построить новую теорию - математическую логику событий. Были ли при этом исчерпаны все построения, позволяющие в широком плане моделиро¬ вать искусственный интеллект? Очевидно, нет. Кроме того, перед вами не монография, а учебное пособие, где в методическом плане разделы должны быть достаточно автономны и содержать допустимое повторение основ, в разных вариантах складывающихся в систему. В то же время, излишнее тео¬ ретизирование недопустимо. Джордж Буль (1815 - 1864) - английский математик и логик. В статье «Математический анализ логики» (1847) им впервые были высказаны идеи применения символического метода к логике. Буль не считал логику разде¬ лом математики, но находил глубокую аналогию между символическим ме¬ тодом алгебры и символическим методом представления логических форм и силлогизмов. Он показал, что логические конструкции в такой символике 50
Лекция 3. Основы математической логики можно решать с помощью аналогов операций алгебры. Таким образом, Д. Буль ввёл базовые операции математической логики и заложил основы буле¬ вых функций. Рис. 3.1. Джордж Буль Булевой алгеброй будем называть множество конечноместных (с конеч¬ ным числом переменных) булевых функций, рассматриваемое вместе с за¬ данными на нём операциями отрицания ( -і, НЕ), дизъюнкции ѵ (ИЛИ) и КОНЪЮНКЦИИ А (&, И). В общем случае булевы функции следует определять рекурсивно. Это следует из того, что аргументы могут быть или рассматриваться как булевы функции. При композиции или рекомпозиции структура булевых функций выра¬ жается с помощью скобок. Булевы функции и их композиции образуют формулы F. Одной из ос¬ новных задач булевой алгебры является установление тождественных со¬ отношений вида F\ = F2. Формулы являются тождественными, если при любом наборе значений переменных ИСТИНА (1) или ЛОЖЬ (0), их значе¬ ния истинности совпадают. Соблюдается ранжирование операций: первым при прочих равных ус¬ ловиях выполняется отрицание, затем конъюнкции, затем дизъюнкции. При необходимости выполнения действий в ином порядке употребляются скобки. Для булевой алгебры известен базовый набор тождественных соотно¬ шений, определяющий правила эквивалентных преобразований для установ¬ ления тождественности формул или для обслуживания технологических тре¬ бований. (В Лекции 1 утверждается, что любая система распознавания, управле¬ ния или принятия решений, описанная в терминах булевой алгебры, сводится к построению однослойной логической нейронной сети; это сокращает тру- 51
Глава I. Логические основы искусственного интеллекта доёмкость обработки, повышает достоверность выводов, и делает даже неце¬ лесообразным изучение структурированных логических нейронных сетей.) Подчеркнём ещё раз, что тождественность булевых функций устанав¬ ливается с помощью таблицы, где по каждому набору значений переменных рассчитываются значения функций. Должно соблюдаться полное соответст¬ вие. Рассматривая буквы латинского алфавита в качестве независимых пе¬ ременных, повторим здесь базовый набор тождественных соотношений, при¬ ведённый в Лекции 1: Закон коммутативности: хѵу = уѵх; (3.1) хлу = у АХ. (3.2) Закон ассоциативности: xv(yvz) = (хуу)ѵг; (3.3) хл(улг) = (хлу) лz. (3.4) Закон дистрибутивности: хл (yvz) = (хлу)ѵ(хлг); (3.5) хѵ(улг) = (хуу) л (xvz). (3.6) Закон де Моргана: х\/у= хлу; (3.7) X А у = X V у. (3.8) Закон идемпотенции: хѵх = х; (3.9) ХАХ =Х. (3.10) Закон поглощения: хѵ(хлу) = х; (3.11) ХА (хуу) = X. (3.12) Закон склеивания: (хлу)ѵ(х лу)= у; (3.13) Операция переменной с (хуу)л(х уу) = у. (3.14) инверсией: XV X = 1; (3.15) хлх = 0. (3.16) Операция с константами: хлО = 0, хлі =х; (3.17) 1 < о II 5-! 5-! < II (3.18) Двойное отрицание: X =Х. (3.19) Применяя эквивалентные преобразования на основе приведённого ба¬ зового набора, можно аналитически упростить формулу, сделать её короче, нагляднее. Это можно делать, например, раскрывая или вводя скобки, выде¬ ляя или формируя конструкции, попадающие под действия перечисленных выше законов и операций. Например, F(x 1, Л'2) = X, A (jCj V JCj) V (jCj А х2) = х2 V (jfj А X,) = (х2 V Х; ) A (х, V X,) = X, V X,. В данном случае функция F(x 1, Х2) нам задана. А можно ли сформиро¬ вать вид этой функции, задав с помощью таблицы её значения для всех воз¬ можных наборов значений переменных? 52
Лекция 3. Основы математической логики Да, табличный метод задания булевой функции породил полную, стан¬ дартизованную и легко реализуемую, предельно «прозрачную» форму - со¬ вершенную дизъюнктивную нормальную форму (СДНФ). Пусть задано табличное представление некоторой булевой функции че¬ тырёх переменных (табл. 3.1) Таблица 3.1. Табличное представление функции Ді *2 *3 Х4 F 0 0 0 0 1 0 0 0 1 0 0 0 1 0 0 0 0 1 1 1 0 1 0 0 0 0 1 0 1 0 0 1 1 0 1 0 1 1 1 0 1 0 0 0 0 1 0 0 1 0 1 0 1 0 1 1 0 1 1 1 1 1 0 0 0 1 1 0 1 0 1 1 1 0 0 1 1 1 1 1 Запишем в общем виде, основанном не на строгом доказательстве, а на догадке, СДНФ для четырёх переменных: F(x 1, Х2, Л'з, Х4) = F(xt,x2,x3,x4) а (хг ЛІ2Л X, А х4) V F(xx,х2,х3,х4) А (х4 ЛІ2Лх3 л х4)\/F(x1,x2,x3,x4) л (xf ЛІ2ЛІ3ЛІ4)V F(xi,x2,x3,x4) А (*, лх2 лхз л Х4) \zF(xi,X2,X3,X4) л (д^ л х2 а х3 л х4) V F(xi,x2,x3,x4) А (х4 Л12л хз л X4)v F(xi,X2,X3,X4) л (д^ л х2 а х3 л х4) V F(xl,x2,x3,x4) а (У, ajc2ax3aх4)\/F(x1,x2,x3,x4) л (д-, лі2лі3лі4)ѵ F(д-,,^,^,^)лах2ах3 /\х4)\/F(xl,x2,x3,x4)/\{х3 лх2лі3 лх4)ѵ (3.20) ТДд-,, Х2,Х3,Х4) А (jct лі2л Х3 л х4)\/ F(x1,x2,x3,x4) л(хг лх2 АХ3 л х4) V F(xi,X2,X3,X4) л (д-j лх2лі3 ax4)vF(x1,x2,x3,x4) а(х3 лх2 АХ3 А х4) V 77(д-1,д-2,д-3,д-4)л(д-1 ajc2 л д-3 ajc4). 53
Глава I. Логические основы искусственного интеллекта После подстановки заданных значений функции F получим: F(x 1, Х2, Хъ, Ха) =(Зс, л х2 а х3 а 5с4) ѵ(Зс, лх2лх3л х4) ѵ(Зс3 ах2 лх3 л х4)ѵ (x3 А х2 А хз А Зс4) v(jCj лх2 АХ3 A JC4) V(jCj ЛХ2ЛХ3Л JC4). Не будем искать дальнейших упрощений, так как полученный вид функции достаточно регулярен и, несмотря на кажущуюся избыточность, до¬ статочно легко реализуется схемотехнически самой короткой логической це¬ почкой. Необходимо на первом уровне выполнить инверсию (отрицание), на втором уровне - выполнить конъюнкции, а на третьем - дизъюнкцию. Это особенно важно при построении быстродействующих устройств суперком¬ пьютера и, как оказалось (см. Лекцию 1), - при построении однослойных ло¬ гических нейронных сетей. Как видим формула (3.20) получилась весьма длинной, и это всего лишь для четырёх булевых переменных! Можно ли записать короче для лю¬ бого количества п переменных? Пусть задан вектор Х= [хо, хі, ..., лѵі), где Xj,j = 0, ..., п-1, - булевы переменные. Введём понятие индексной маски вектора ИМВ. Она представ¬ ляет собой двоичный код длины п, принимающий 2й значений индекса / от равенства нулю до равенства единице всех разрядов. Пусть при данном при¬ менении единичные разряды ИМВ, образующие двоичное значение индекса указывают на те булевы переменные, которые используются в выражении (3.20) без знака отрицания. Такую /-ю выборку вектора обозначим Химв=». Функцию F от неё обозначим F(Xmm=l), а соответствующую ей конъюнкцию булевых переменных, с учётом того, что часть их фигурирует со знаком от¬ рицания, обозначим п—1 А ?=0ИМВ=/ х . . J Тогда всю формулу СДНФ можно записать: 2п -1 п-1 F— ѵ ) Л ( д Xj). (3.21) /=0 ?=0ИМВ=/ В рассмотренном выше примере для п = 4 не зря каждая следующая комбинация выбиралась по строкам таблицы условным сложением с едини¬ цей некоторой подразумеваемой маски. Эти комбинации образовали счётное множество с индексом /, пробегающим от нуля до единиц по всем четырём разрядам. Частный вид подтверждает общую формулу (3.21): 54
Лекция 3. Основы математической логики F V F(ХИМВ=і)Л ( Л хр- (3-22) г=0 •/=0ИМВ=/ В данном случае надо помнить о специальном назначении маски, ме¬ тящей булевы переменные, используемые без знака отрицания. Маски векторов используются программистами весьма часто: для аль¬ тернативного выполнения векторных операций, для маскирования прерыва¬ ния, для маскирования направлений обмена и пр. Из СДНФ легко выводится СКИФ - совершенная конъюнктивная нор¬ мальная форма, представляющая собой «конъюнкцию дизъюнкций». По¬ скольку она практически не применяется, мы её рассматривать не будем. Отметим, что табличная запись булевых функций не только достаточ¬ на, но практически всегда используется разработчиками цифровых электрон¬ ных устройств. Более того, сложилась практика использования ассоциатив¬ ной памяти (АП) для построения многих устройств компьютера, таких как: дешифратор, КЭШ в сверхоперативной памяти, механизм перевода матема¬ тических адресов в физические, устройство хранения и выборки глобальных данных, арбитры коммутаторов и др. Табличная запись значений одной или более булевых функций произ¬ водится в строках - регистрах АП, разбитых на две части: в левой части ука¬ зан набор значений переменных, а в правой - вектор значений булевых функций. В результате одновременного сравнения кода возникшей ситуации со всеми наборами переменных, мгновенно производится выбор вектора зна¬ чений выходов устройства. То есть, устройство со многими входами и мно¬ гими выходами записывается и работает с помощью модуля ассоциативной памяти, реализующего систему булевых функций. Так решаются задачи обеспечения высокого быстродействия, стандар¬ тизации и унификации. Требования стандартизации и унификации элементной базы и функци¬ ональных устройств электронной техники, в том числе нейросетевых техно¬ логий, выдвигает научную задачу синтеза сложных булевых функций на ос¬ нове более простых базовых, стандартных. В этом случае функция с мень¬ шим количеством булевых переменных «погружается» в более сложную бу¬ леву функцию, где добавляются новые переменные. Существует теорема разложения, которую проиллюстрируем кон¬ кретным, легко обобщаемым примером: F(xl,x2,x3,x4x5) = (xl ах2 aF(0,0,x3,x4,x5))v(x1 лх2 аТ(0, 1,х3,х4,х5))ѵ (*! ЛІ2 А А(1,0,х3,х4,х5))ѵ(х1 лх2 лF(l, 1,х3,х4,х5)). (3.23) 55
Глава I. Логические основы искусственного интеллекта 3.2. Исчисление высказываний Предметом дальнейших исследований примем любое законченное ут¬ верждение на любом формальном или неформальном языке - высказывание, для которого имеет смысл говорить о его истинности или ложности. Это бы¬ ло уже объявлено в Лекции 1. Основной задачей, которую ставит перед собой математическая логика, является формализация мыслительных процессов в широком смысле - в смысле доказательства или поиска истины, а также расширения знаний. Для этого надо сформулировать «правильное», непротиворечивое логическое ис¬ числение, включающее: • Формализацию представления высказываний; • Набор операций, позволяющий создавать формулы, как более слож¬ ные высказывания на базе более простых; • Аксиомы и правила вывода, позволяющие выводить логические след¬ ствия из любой заданной системы высказываний и формально характеризо¬ вать тождественно истинные высказывания и формулы. Тождественно истинными являются высказывания, которые не требуют задания каких-либо дополнительных условий для проверки своей истинности на протяжении всего процесса логического вывода. Например, высказывание «кислород является газом» имеет значение ИСТИНА (1) в тех условиях, в которых оно рассматривается. Ведь кислород может находиться не только в газообразном состоянии. Высказывание «дважды два - одиннадцать» на первый взгляд представ¬ ляется заведомо ложным. Однако если предположить, что вместо десятичной системы счисления используется троичная система, при условии сохранения привычных названий многозначных чисел, то данное высказывание стано¬ вится истинным. Поэтому обязательным условием правильности выводов и следствий является то, чтобы постоянное высказывание, подобно константе, не меняло значение истинности в процессе логического вывода. В исчислении высказываний не интересуются внутренней смысловой структурой элементарных высказываний. Естественно поэтому для их обо¬ значения использовать отдельные буквы некоторого алфавита (обычно ла¬ тинского и готического). Отдельными буквами могут обозначаться и так называемые переменные высказывания, что означает, что вместо этой буквы всегда может быть подставлено любое конкретное постоянное высказывание, как истинное, так и ложное. Высказывания, как постоянные, так и переменные, можно объединять в сложные высказывания, используя связки «и», «или», «если - то», «не» и т.п. Если в состав сложного высказывания входят переменные высказывания, представленные буквами, то при замене этих букв одними высказываниями 56
Лекция 3. Основы математической логики сложное высказывание может оказаться истинным, а при замене другими - ложными. Например, сложное высказывание «А и В», где Аж В- переменные высказывания, будет, очевидно, истинным в том и только том случае, если оба высказывания будут истинными. Существуют и такие сложные высказывания, содержащие в своём сос¬ таве переменные высказывания, которые остаются истинными при любых значениях переменных высказываний. Например, сложное высказывание «ес¬ ли неверно то, что высказывание А ложно, то высказывание А истинно» оста¬ ётся истинным, какое бы высказывание ни подставили на место переменного высказывания А Такие высказывания называют тождественно истинными. Например, возьмём высказывание «извозчик Петров - водитель кобы¬ лы». Если неверно то, что Петров не водитель кобылы, значит он водитель кобылы. Сложное высказывание истинно. Если же неверно, что Петров води¬ тель кобылы, значит он не водитель кобылы. Сложное высказывание снова истинно, ибо соответствует правде и не содержит противоречий. Задача выделения тождественно истинных высказываний во множестве всех возможных высказываний является важнейшей задачей любого логиче¬ ского исчисления. После всех предварительных замечаний перейдём к построению соб¬ ственно исчисления высказываний, или, как его ещё иногда называют, пропо- зиционного исчисления. Введём базовые операции. 1. Конъюнкция двух высказываний образует новое высказывание АлВ, которое является истинным тогда и только тогда, когда А и В истинны. В обычной речи этой операции соответствует связка «и». 2. Дизъюнкция АѵВ образует новое высказывание, которое истинно то¬ гда и только тогда, когда истинно хотя бы одно высказывание А или В. Одна¬ ко, хотя мы уже применили связку «или», под ней понимается не раздели¬ тельное «или», понимаемое в смысле «либо - либо», когда А и В не могут быть оба истинны. В данном определении высказывание АѵВ истинно и при истинности обоих высказываний А и В. 3. Высказывание А -л В ложно тогда и только тогда, когда А истинно, а В ложно. А называется посылкой, а В- следствием. В обычной речи операция —> (импликация) соответствует связке «если - то»: «если А, то В». В опреде¬ лении математической логики это высказывание при ложном А всегда истин¬ но, независимо от того, истинно или ложно высказывание В. Этот факт мож¬ но кратко сформулировать так: «из ложного следует всё что угодно». В обычной речи иногда подразумевается, что когда А ложно, то высказывание «если А, то В» не имеет смысла. (Порой кажется, что принятый формализм прямо-таки противоречит здравому смыслу. Например, высказывание «из то¬ го, что у льва есть когти, следует, что снег белый» формально истинно. Но так ли это в действительности, решать не математикам-логикам.) 57
Глава I. Логические основы искусственного интеллекта 4. Операция отрицание —А формирует ложное высказывание, если А истинно, и истинное, если А ложно. 5. Высказывание А - В истинно тогда и только тогда, когда А и В оба истинны или оба ложны. Это высказывание называется эквивалентностью. Как и в булевой алгебре, значение ИСТИНА будем обозначать едини¬ цей, значение ЛОЖЬ - нулём. В табл. 3.2 сведены соотношения истинности для базовых операций. Таблица истинности базовых операций А В АлВ АѵВ А^В —А А-В 1 1 1 1 1 0 1 1 0 0 1 0 0 0 0 1 0 1 1 1 0 0 0 0 0 1 1 1 Таблица 3.2. Как и в булевой алгебре введём ранжирование операций: —, л, ѵ, ~. Например, формула —А ѵ В лС ^ В ѵ С понимается как ((—А) ѵ (В лС) ^ (В ѵ С). Формула А - В ^ С должна пониматься как (А) ~ ((В) ^ (С)) и т.д. Введённые определения решают лишь две части задачи построения ис¬ числения высказываний: проблему формализации записи сложных высказы¬ ваний. Завершающая часть задачи - нахождение способа определения тожде¬ ственной истинности высказываний - может быть решена двумя путями: со¬ держательным и формальным. При содержательном подходе необходимо помнить о содержательном смысле букв и связок. В то же время, нет необходимости помнить само вы¬ сказывание, достаточно помнить функцию истинности этого высказывания: А = ИСТИНА, если высказывание, обозначенное этой буквой, истинно, и А = ЛОЖЬ, если высказывание ложно. Функция истинности отождествляется с самой буквой, которая теперь обозначает булеву переменную. Тогда каждую формулу Q исчисления высказываний можно интерпре¬ тировать как формулу в булевой алгебре с включённой в неё дополнительно операцией импликации ^. Входящие в формулу Q постоянные высказыва¬ ния должны быть заменены соответствующими булевыми константами (зна¬ чениями их функций истинности). Символы, соответствующие переменным высказываниям, рассматриваются как аргументы булевой функции, пред¬ ставляемой формулой Q. Эта функция называется функцией истинности сложного высказывания, выражаемого формулой Q. 58
Лекция 3. Основы математической логики На содержательном уровне построения исчисления высказываний тож¬ дественно истинными считаются те, и только те формулы этого исчисления (сложные высказывания), функции истинности которых принимают значения ИСТИНА (1) при всех значениях переменных. Представленный содержательный аспект исчисления высказываний позволяет сравнительно просто решить вопрос о тождественной истинности любого сложного высказывания: достаточно перебрать все возможные набо¬ ры значений истинности составляющих его переменных высказываний и про¬ верить, на всех ли этих наборах функция истинности рассматриваемого сложного высказывания принимает значение ИСТИНА. Например, рассмотрим формулу Q = АаВ^А и составим для неё таб¬ лицу истинности с учётом «промежуточного» результата А аВ: А В АаВ АаВ—>А 0 0 0 1 0 1 0 1 1 0 0 1 1 1 1 1 Видим, что при всех значениях переменных высказываний, сложное высказывание является истинным. Следовательно, рассмотренная формула Q тождественно истинная. Несмотря на простоту и «прозрачность», содержательный аспект ис¬ числения высказываний имеет ряд недостатков: 1. Он не может использоваться в других исчислениях, где множество аргументов может быть бесконечным. 2. Ему свойственна недостаточная формализация процесса доказатель¬ ства и самого понятия доказательства истинности тех или иных формул. При формальном подходе к установлению тождественной истинности пользуются эквивалентными преобразованиями булевой алгебры. Поскольку там нет импликации, исключим её согласно равенству: (С->£>) = (-.С vD). (3.24) Проверим его справедливость с помощью таблицы истинности: С D С^І) —iCvD 0 0 1 1 0 1 1 1 1 0 0 0 1 1 1 1 59
Глава I. Логические основы искусственного интеллекта Рассмотрим тот же пример: АаВ—>А = —і(АлВ)ѵА = -Аѵ-,ВѵА = (—АѵА)ѵ—В = іѵ-lВ = 1. Эта цепочка доказывает тождественную истинность заданной форму¬ лы. Таким образом, формальный аспект исчисления высказываний харак¬ теризуется тем, что полностью отвлекаются от содержательного смысла фор¬ мул и рассматривают их как конечные последовательности символов, подле¬ жащие эквивалентным преобразованиям. Для этих преобразований, подобно и в дополнение базовому набору соотношений булевой алгебры, известна наиболее употребительная система аксиом С.К. Клини: 1 .А->(В->А). (3.25) 2. (А -лВ) -у ((А -э (В -у С)) (А -у С). (3.26) З.А^(В^АлВ). (3.27) 4. АлВ^>А. (3.28) 5. АѵВ В. (3.29) 6.А^> АѵВ. (3.30) І.В^АѵВ. (3.31) 8.(А^>С)^((В->С)-> (АѵВ -э Q). (3.32) 9. (А —> В) —> ((А -> -,Д) -> -пА). (3.33) 10. (3.34) 11. ЦП^Ф (3.35) W Первые десять аксиом представляют собой десять формул исчисления высказываний, объявленных тождественно истинными по определению. Они предполагают возможность подстановки вместо букв А, В, С любых формул исчисления высказываний (не обязательно истинных). Такая подста¬ новка, по определению, не нарушает тождественной истинности аксиомы. Одиннадцатая аксиома - это так называемое правило вывода, позволя¬ ющее, по определению, считать доказанной истинность формулы % если ис¬ тинность формул Q и /2—» ІТ'уже была установлена ранее. Если формулы Q и Qбыли при этом тождественно истинными. То тождественно истинной будет и формула Ф. Предполагается по определению, что все тождественно истинные формулы (и только такие формулы) исчисления высказываний мо¬ гут быть получены из аксиом в результате подстановок 1 - 10 и применения (возможно, многократного) правил вывода 11. Формула ^называется непосредственным следствием формул О и О -лФ. 60
Лекция 3. Основы математической логики Формулы, тождественно истинные в содержательном смысле, для крат¬ кости будем называть просто содержательно истинными, противопоставляя их формально истинным, т.е. формально доказуемым. Говорят, что формула Ѳ исчисления высказывания выводится из услов¬ но истинных формул (истинность которых предполагается на протяжении рассматриваемого вывода) А, А, Аи, если она может быть получена из этих формул и аксиом 1-10 исчисления высказываний в результате приме¬ нения конечного числа раз правил непосредственного следствия. Более точно это означает последовательное использование трёх усло¬ вий, лежащих в основе правил вывода: 1. Любая из формул А, А,А выводима на основе аксиом. 2. Любая аксиома из 1 - 10 (с учётом возможности подстановки любых формул вместо входящих в них букв) выводима. 3. Если формулы А и А —» W выводимы, то выводимой будет также формула W. Цепочка формул, получающихся в результате последовательного при¬ менения этих трёх правил, которая кончается формулой Ѳ, называется фор¬ мальным выводом этой формулы. Для обозначения выводимости употребляется специальный символ I— (читается как «даёт»), слева от которого пишутся условно истинные форму¬ лы, а справа их следствия: А, А, А —» Ѳ. Аксиомы здесь как бы вклю¬ чаются в символ I--. Тогда для любой формально истинной формулы Ѳ, вы¬ водимой только лишь на основе аксиом 1-10, можно писать I—Ѳ. Приведём простейшие примеры формального вывода, нумеруя после¬ довательные шаги. 1. А —» (А —» А) (аксиома 1, в которой буква В заменена буквой А). 2. (А —^ (А —^ А)) —^ ((А —^ ((А —^ А) —^ А)) —^ (/4 —^ -4)) (аксиома 2, в ко¬ торой буква В заменена формулой А —» А, а буква С - буквой А). 3. (А —> ((А —» А) —> А)) —> (А —> А) (применение правила вывода 11 к формулам, полученным на шагах 1 и 2). 4. А —> ((А —> А) —> А) (аксиома 1, в которой буква В заменена форму¬ лой (А —> А)). 5 А —» А (применение правила вывода 11 к формулам, полученным на предыдущих двух шагах (А -> А), (А—>А)—>А (3.36) А Приведённая цепочка формул по определению является формальным доказательством формулы А —» А. Таким образом, эта формула принадле¬ жит к числу формально истинных формул, и её можно записать 61
Глава I. Логические основы искусственного интеллекта I—А ->А. Другим примером является получение следствий из трёх условно ис¬ тинных формул А, В, А —» (В —» С). За пять шагов из этих формул может быть получена формула С. 1. А (первая данная нам условно истинная формула). 2. В (вторая данная нам формула). 3. А —» (В —» С) (третья данная нам формула). 4. В —» С (непосредственное следствие по правилу вывода 11 их фор¬ мул 1 и 2). 5. С (непосредственное следствие формул 2 и 4). Таким образом, формула С выводима из формул X, 7?, X —» (Z? —» С) и мы можем записать А, В, А —»(В —» С) \~ С. Хотя условно истинные формулы и не обладают тождественной истин¬ ностью, легко видеть, что в окончательной записи (условной) выводимости любая буква может быть заменена произвольной формулой, если только та¬ кая замена производится как слева, так и справа от знака I—. Подобным же способом можно доказать соотношения: Цепное заключение X —» 7?, 7? —» С I— А —» С. (3.37) Перестановка посылок А->(В->С) I— В—>(А—>С). (3.38) Импортация А —» (В —» С) I— АлВ —» С. (3.39) Экспортация АлВ —» С I— А —» (В —» С). (3.40) Контрпозиция А В I В —» -іА. (3.41) л-введение А, ВI—АлВ. (3.42) Слабое -г-удаление А,—А I—5. (3.43) Обозначим Г произвольную конечную совокупность формул исчисле¬ ния высказываний. Применяя более сложную технику доказательства (индук¬ цию по длине вывода), можно доказать следующую теорему о дедукции. Теорема 3.1. Если в исчислении высказываний формула В выводима из совокупности формул Г и И, то из Г выводима формула^ —» В. В теории доказательств часто применяются две общие схемы. 1. Доказательство путём разбора случаев: если Г, А \~ С и Г, В I— С, то Г, АѵВ I— С. (3.44) 2. Приведение к абсурду: если Г, А I—В и Г, А I В, то Гь- -А. (3.45) 62
Лекция 3. Основы математической логики Легко проверить, что все аксиомы исчисления высказываний 1-10 представляют собой содержательно истинные формулы. Иначе говоря, соот¬ ветствующие им функции истинности принимают при всех значениях пере¬ менных значение ИСТИНА. Это свойство, очевидно, сохраняется при под¬ становках любых формул исчисления высказываний вместо букв, входящих в аксиомы. Из таблицы истинности для импликации —» непосредственно следует, что из содержательной истинности формул А и Q —» Ч/ вытекает содержате¬ льная истинность формулы Ч/. Но тогда очевидно, что все доказуемые (фор¬ мально истинные) формулы будут и содержательно истинными. Верно (хотя и гораздо сложнее доказуемо) также и обратное, что формулируется следу¬ ющей теоремой. Теорема 3.2. При формальном построении исчисления высказываний с помощью системы аксиом 1-11 формально доказуемыми (формально ис¬ тинными) будут все те, и только те формулы этого исчисления, которые яв¬ ляются тождественно истинными в содержательном смысле. Теорема 2 содержит в себе два утверждения относительно выбранной системы аксиом: эта система содержательно непротиворечива и эта система содержательно полна, т.е. нет ни одной содержательно истинной формулы исчисления высказываний, которую нельзя было бы доказать формально с помощью этой системы аксиом. При этом, естественно называть систему аксиом формально непроти¬ воречивой., если с её помощью нельзя вывести какую-нибудь формулу Q вме¬ сте с её отрицанием -і Д в противном случае она формально противоречива. Отметим, что хотя присоединение недоказуемых формул в качестве новых аксиом исчисления высказываний, нарушает свойство формальной не¬ противоречивости, ничто не мешает нам присоединить к системе аксиом формулы А, . А* в качестве не тождественно, а лишь условно истинных формул. (Это характерно, например, при переходе в мир грёз или сказок.) Противоречие возникает тогда и только тогда, когда конъюнкция Ал А л ... л От является тождественно ложной формулой. 3.3. Основы исчисления предикатов Особенностью исчисления предикатов является наличие предметных переменных, пробегающих конечную или бесконечную область значений, называемую предметной областью. Отдельные значения этой области назы¬ ваются предметами или объектами. Предикатом называют функцию предметных переменных Р(хі, Х2, ..., х„), представляющую собой переменное высказывание, истинность или лож¬ ность которого определяется наборами значений переменных хі,Х2,..., хп. 63
Глава I. Логические основы искусственного интеллекта Если предикат Р не является тождественно истинным или тожде¬ ственно ложным, то на одних наборах значений предметных переменных он принимает значение ИСТИНА (1), а на других - значение ЛОЖЬ (0). Какова цель построения исчисления предикатов? При построении теоретических основ логических нейронных сетей - математической логики событий - мы исходили из высказываний, вкладывая в них конкретный смысл на основе факторного пространства событий. Это пространство и отражало предметную область. Значит, до перехода к нечёт¬ ким данным, мы пользовались расширением исчисления высказываний в сферу исчисления предикатов! Действительно, ведь необходимо придать формальному языку логичес¬ кого вывода «человеческий», объектовый и событийный смысл. Чтобы ви¬ деть и подразумевать предметы и объекты, свойства и обстоятельства, о ко¬ торых что-то говорится. Чтобы не были истинными такого рода высказыва¬ ния, как «из-за того, что у льва когти, снег белый». Чтобы лев и снег дей¬ ственно участвовали в поиске истины. Введение понятия предметной области сразу же влечёт применение теоретико-множественного аппарата, подобно тому, что привлекался в сил¬ логистике. Мы подробно не останавливались и не будем останавливаться на ана¬ лизе преемственности учения о силлогистике и о современной математиче¬ ской логике, но готовы высказаться в защиту тезиса о том, что «всё новое - хорошо забытое старое». Именно поэтому мы ввели в курс об искусственном интеллекте силлогистику Аристотеля. Например, высказывание «четыре больше двух» в исчислении выска¬ зываний является неразложимым. Если же ввести предикат Р(х, у) на множе¬ стве целых неотрицательных чисел в качестве предметной области, который является истинным тогда и только тогда, когда х > у, то приведённое выска¬ зывание запишется в форме Р(4, 2), которая даёт ясное представление о внут¬ ренней структуре высказывания. Наличие предметных переменных позволяет ввести квантор общности \/х и квантор существования Зх. Выражение ЛхР(х) - условное обозначение высказывания «для всех л' предикат Р(х) является истинным»; выражение ЗхР(х) - условное обозначе¬ ние высказывания «существует х, для которого предикат Р является истин¬ ным». В теории доказательств эти кванторы связаны между собой: -пУхР(х) = Зх^Р(х) (3.46) Например, высказывание «все солдаты карантинной роты стригутся на¬ голо» в случае отрицания звучит: «не все солдаты карантинной роты стри- 64
Лекция 3. Основы математической логики гутся наголо». Это, в свою очередь, может быть сформулировано: «сущест¬ вует солдат карантинной роты, постриженный не наголо». Пусть Р(х) - функция «х стрижётся наголо». Тогда вышесказанная трансформация может быть изображена цепочкой: VxP(x); -iVxP(jc) —» Эх—lР(х). Если предметная область состоит из конечного числа объектов хі, хг, ..., Xk, подобных солдатам, то выражение ѴхР(х) сводится к конъюнкции Р(хі) л Р(хг) л ... л P(xk), а выражение ЗхР(х) - к дизъюнкции Р(х\) vPfa) v... v P(xk). В случае бесконечной предметной области подобное сведение оказы¬ вается невозможным, неконструктивной. Возьмём более сложный пример. Вспомним определение непрерывно¬ сти функции f[x) в точке хо\ «Функция f(x) непрерывна в точке хо, если для любого s > 0 существует 8 > 0, что если I jf - х{) \ < 8, то \f{x) - /(jco) I < £». Со¬ кращённо можно записать: V£>03J>0 U-jcoI If[x) -Дх0) I < e. (3.47) В случае нарушения непрерывности функции мы говорим: «не для вся¬ кого s > 0 существует 8> 0, что если | л - лд I < б, то ІДх) -fixo) I < £». Или: «существует s > 0, что для любого <5>0 —і(|лс-лсоІ<<^ —> ІДх) -flxo) I < s)». Последний предикат можно записать формально: 3s> 0\/8> 0 -пР(х, x0,f(x),f(xo), s, 8), где (3.48) Р(х, x0,f(x\f(xo\ s, S) = (\x-xo\< I f(x) -f(x о) I < £). В выражениях ѴхР(х) и ЗхР(х) переменная х оказывается связанной со¬ ответствующим квантором, в отличие от свободных переменных. В формулах (3.47) и (3.48) переменные £ и 8 связанные, а переменные х, хо, f(x), f(xo) - свободные. Обычно используют узкое исчисление предикатов, которое разреша¬ ет связывать с помощью кванторов лишь предметные переменные. Входящие в формулу предикаты предполагаются при этом неизменными. В так называ¬ емом расширенном исчислении предикатов употребляются переменные предикаты и предикатные кванторы. Как и в случае исчисления высказываний, при построении исчисления предикатов недостаточно указать лишь способ записи формул. Необходимо задать правила преобразования формул, выражаемые аксиомами. В число аксиом исчисления предикатов включаются все 11 аксиом ис¬ числения высказываний, (3.25) - (3.35). Кроме них, вводятся четыре специфических постулата, которым при¬ своим номера от 12 до 15: 65
Глава I. Логические основы искусственного интеллекта С —» Р{х) 12. С —» ЛхР(х) (3.49) 13. ѴхР(л-) -* P{t) (3.50) 14. P{t) -У ЗхР(х) (3.51) Р(х) С 15. ЗхР(х) —» С (3.52) С помощью указанных аксиом - постулатов можно производить фор¬ мальный вывод новых эквивалентных формул совершенно таким же спосо¬ бом, как и в исчислении высказываний. Заметим, что выражения Р(х) и P(t) в аксиомах 12-15 должны пони¬ маться не только как элементарные одноместные предикаты, но и как произ¬ вольные формулы исчисления предикатов, содержащие буквыіи/вкачестве свободных переменных. При всех подстановках подразумевается, что свободные и связанные переменные в формулах, получаемых в результате подстановок, должны обо¬ значаться различными буквами, как в (3.50) и (3.51). Такое условие позволяет избежать так называемой коллизии переменных, вызывающей непредвиден¬ ное связывание переменных, которые должны были бы остаться свободными. При условии принятия мер во избежание коллизии переменных, в ис¬ числение предикатов переносятся все результаты выводимости одних фор¬ мул из других. Остаётся справедливой и теорема дедукции. В частности, если формула ^выводима в исчислении высказываний из формулы Д то формула /2 —» при условии принятия мер против коллизии переменных, будет выводимой и в исчислении предикатов. Из аксиом 12-15 легко образуются следующие правила выводимости: Введение квантора общности (Ѵ-введение) А(х) I—хѴхА(х). (3.53) (Значок переменной т, который пишется над символом выводимости I—, означает, что соответствующая переменная варьируется, превращаясь из свободной в связанную. Тогда свободные переменные, не варьирующиеся в процессе вывода, принято называть фиксированными.) Введение квантора существования (3-введение) A(t) I— ЗхА(х). (3.54) 66
Лекция 3. Основы математической логики Удаление квантора общности (Ѵ-удаление) УхА(х) I— A(t). (3.55) Удаление квантора существования по С.К. Клини: Если Г, А(х) I— С, то Г, ЗхА(х) I—* С. (3.56) (Напоминаем, что Г - произвольная конечная совокупность формул.) Если имеет место выводимость Г, А I— В, причём, в процессе вывода свободные переменные, входящие в формулу А, остаются фиксированными, то имеет место сводимость Г I— А —>В. Используя символ эквивалентности ~ в том же смысле, что и в исчис¬ лении высказываний, и обозначая буквой А любую формулу, не содержащую свободной переменной х, можно легко вывести следующие соотношения: Правила (3.58) и (3.59) показывают возможность изменения порядка применения одноимённых кванторов. Для разноимённых кванторов смена их порядка в соотношении (3.61) не имеет места. Теоретико-множественный анализ соотношения I—ѴхЗуР(х, у) —» 3у\/хР(х, у), двойственного (3.61), об¬ наруживает примеры его абсурдности. («Отрицательный вывод не доказыва¬ ется, а показывается» - важное правило теории доказательства; см. пример о непрерывности функции.) Содержательная непротиворечивость исчисления предикатов, как и исчисления высказываний, понимается в том смысле, что выводимыми в этом исчислении могут быть лишь тождественно истинные формулы, т.е. такие формулы, которые остаются истинными для любой предметной обла¬ сти и для любой конкретной интерпретации входящих в них предикатов. Здесь кроется некоторая неконструктивность подхода, связанная с неявно предполагающейся возможностью перебора всех значений предметных пе¬ ременных при определении тождественной истинности. В случае бесконеч¬ ной предметной области это требует бесконечного числа шагов. Поэтому широко привлекается теоретико-множественный подход, основанный на смысловом анализе как предметной области, так и заданных на ней предика¬ тов. I—ѴхА ~ А, I—ЗхА ~ А; (3.57) (3.58) (3.59) (3.60) (3.61) I—УхУуР(х, у) ~ѴуУхР(х, у); І-- ЗхЗуР(х, у) ~ ЗуЗхР(х, у); I—ѴхР(л') —» ЗхР(х); I— ЗхУуР(х, у) —» УуЗхР(х, у). 67
Глава I. Логические основы искусственного интеллекта Подобным путём устанавливается и формальная непротиворечи¬ вость исчисления предикатов, как невозможность вывести в этом исчисле¬ нии некоторую формулу вместе с её отрицанием. В случае конечных предметных областей вопрос о содержательной полноте исчисления предикатов сводится к соответствующему вопросу для исчисления высказываний и потому решается конструктивно. Возможность формального вывода в этом исчислении любой тожде¬ ственно истинной формулы была решена К. Гёделем. Однако в случае беско¬ нечных предметных областей установление содержательной полноты исчис¬ ления предикатов требует привлечения средств, выходящих за пределы ко¬ нечной (финитной) математики. В противоположность содержательной полноте, называемой также полнотой в широком смысле, полнота в узком смысле уже не имеет места в исчислении предикатов. Действительно, к числу аксиом исчисления предикатов присоединим формулу ЗхР(х) -л ѴхР(х), не выводимую в этом исчислении, но не приводя¬ щую к противоречию, если предметная область состоит из единственного объекта. Если предметная область состоит из двух объектов х и у, указанная аксиома превращается в формулу Р(х)ѵР(у) —» Р(х)лР(у), не являющуюся тождественно истинной и потому не выводимую из остальных аксиом. Наряду с тождественно истинными формулами, в исчислении предика¬ тов рассматривают так называемые выполнимые формулы. Выполнимой будем называть такую формулу, которая может быть ис¬ тинной при выборе подходящей предметной области и при должном опреде¬ лении заданных на ней предикатов. При такой постановке обратной, в каком-то смысле, задачи первична формула, а вторичны условия, при которых она выполняется, становясь тож¬ дественно истинной, а не наоборот. Предполагается, что формула имеет об¬ щий вид и не содержит символов индивидуальных предметов и индивиду¬ альных предикатов. Каждая тождественно истинная формула является и выполнимой. Об¬ ратное в общем случае неверно. Примером выполнимой, но не тождественно истинной формулы может служить формула, рассмотренная выше, ЗхР(х) —» \/хР(х). Эта формула является тождественно истинной лишь на таких пред¬ метных областях, которые состоят из одного-единственного объекта. Проблема разрешимости для исчисления предикатов состоит в том, чтобы указать единый эффективный алгоритм для определения выполнимо¬ сти или невыполнимости любой заданной формулы исчисления предикатов на какой-либо предметной области. В отличие от исчисления высказываний, проблема разрешимости в об¬ щем случае для исчисления предикатов, как показали Чёрч и Тьюринг, вооб¬ ще не имеет решения. Иными словами, не существует единого конструктив¬ 68
Лекция 3. Основы математической логики ного приёма для установления выполнимости или невыполнимости любой формулы исчисления предикатов. Часто проблема разрешимости для исчисления предикатов формулиру¬ ется несколько в иной форме: найти алгоритм для определения тождест¬ венной истинности любой данной формулы в этом исчислении. Таким образом, в отношении проблемы разрешимости, исчисление пре¬ дикатов коренным образом отличается от исчисления высказываний. Если ограничиться частными видами формул, то разрешающий алго¬ ритм может быть построен и в случае исчисления предикатов. Такой алгоритм можно, например, построить для формул исчисления предикатов, содержащих лишь одноместные предикаты. Для установления выполнимости или невыполнимости формулы, содержащей п одноместных предикатов, достаточно ограничиться рассмотрением предметных областей, состоящих не более чем из 2” объектов. В результате проверка выполнимости (или тождественной истинности) предикатной формулы (после замены кван¬ торов конъюнкциями или дизъюнкциями) сводится к проверке выполнимо¬ сти (или, соответственно, тождественной истинности) полученной формулы исчисления высказываний. В общем случае при решении вопроса о выполнимости или невыпол¬ нимости конкретной формулы существенную помощь может оказать предва¬ рительное приведение этой формулы к так называемой нормальной форме. Различают два вида нормальных форм: предварённую форму и нор¬ мальную форму Сколема. Предварённая форма отличается тем, что все кванторы, если они име¬ ются, должны быть вынесены в самое начало формулы, а область действия каждого из них должна распространяться до конца этой формулы. В нормальной форме Сколема требуется дополнительно, чтобы все кванторы существования предшествовали всем кванторам общности. Если формула записана в предварённом виде, то её часть, стоящая по¬ сле кванторов (бескванторная часть формулы), может рассматриваться как формула исчисления высказываний. Каждый предикат рассматривается при этом просто как переменное высказывание. Тогда в этой формуле можно ис¬ ключить все знаки импликации, заменяя конструкции вида А —» В через -iАѵВ, а затем привести её к дизъюнктивной нормальной форме. Такое пре¬ образование приводит исходную предикатную формулу к эквивалентной ей предикатной формуле. Справедлива теорема: Теорема 3.3. Для всякой формулы Q (узкого) исчисления предикатов существует эквивалентная ей формула записанная в предварённой форме. Существует единый алгоритм приведения произвольной предикатной фор¬ мулы к предварённой форме. Справедливость сформулированной теоремы вытекает из легко прове¬ ряемых соотношений: 69
Глава I. Логические основы искусственного интеллекта 1 1 ѴхР(х) ~ ' Зх-іP(x); (3.62) 1 1 ЗхР(х) ~ Ѵлс—i P(x); (3.63) 1—Qa\/xP(x) ~ Vx(QaP(x)); (3.64) 1—Qa3xP(x) - ~ 3x(QaP(x))\ (3.65) 1—Qv\/xP(x) ~ Px(QvP(x)X (3.66) 1—Qv3xP(x) - ~ 3x(QvP(x))- (3.67) Поскольку импликация может быть заменена операциями дизъюнкции и отрицания, то с помощью выписанных формул при соблюдении условий, исключающих возможность возникновения коллизии переменных, можно производить последовательную перестановку кванторов со всеми составля¬ ющими формулу символами, отличными от кванторов, пока все кванторы не окажутся в левой части формулы. Приведём пример подобного преобразования: Р(х)ѵ VyQ(x, у) ~ P(x)v 3y^Q(x, у) ~ 3y(P(x)v-,Q(x, у)). Последняя формула соответствует требуемой предварённой форме ис¬ ходной формулы. Для нормальной формы Сколема прямого аналога теоремы 3.3 не су¬ ществует: не для всякой формулы исчисления предикатов существует экви¬ валентная формула, имеющая нормальную форму Сколема. Однако понятие эквивалентности может быть так обобщено, что лю¬ бую формулу исчисления предикатов можно будет привести к нормальной форме Сколема. Введём понятие дедуктивной эквивалентности. Формула П называется дедуктивно эквивалентной формуле1^ если, присоединив формулу П к системе аксиом исчисления предикатов, получим возможность вывести формулу^из расширенной системы аксиом и наобо¬ рот, присоединив к системе аксиом формулу ¥, получим возможность выве¬ сти формулу Q. Это определение применимо не только к исчислению предикатов, но и к любому логическому исчислению, в том числе к исчислению высказыва¬ ний. Легко видеть по рассмотренному выше примеру, что обычная эквива¬ лентность формул влечёт их дедуктивную эквивалентность. Справедлива следующая теорема Сколема: Теорема 3.4. Для всякой формулы узкого исчисления предикатов су¬ ществует дедуктивно эквивалентная ей формула, записанная в нормальной форме Сколема. Существует алгоритм приведения любой формулы к дедук¬ тивно эквивалентной ей сколемской форме. Очевидно, что если две формулы дедуктивно эквивалентны, то из тож¬ дественной истинности одной следует тождественная истинность другой. То 70
Лекция 3. Основы математической логики есть, приведя формулу к нормальной форме Сколема, следует решать про¬ блему тождественной истинности относительно этой формы. Это же обстоятельство может быть использовано при доказательстве содержательной полноты исчисления предикатов, поскольку для такого дока¬ зательства достаточно установить выводимость всех тождественно истинных формул, записанных в нормальной форме Сколема. Действительно, устано¬ вив выводимость всех указанных формул, мы тем самым установим и выво¬ димость всех дедуктивно эквивалентных им формул, т.е. всех тождественно истинных формул исчисления предикатов. Известно большое количество классов формул, для которых проблема разрешимости решается положительно. Ограничения, с помощью которых выделяются указанные классы, касаются не только характера, числа и поряд¬ ка расположения кванторов, но и вида бескванторных частей формул, запи¬ санных в предварённой нормальной форме. Известны исследования возможности построения разрешающих проце¬ дур за пределами узкого исчисления предикатов, в частности, - процедур разрешения некоторых формул исчисления предикатов второй ступени. В этом исчислении используются не только предметные, но и предикатные кванторы («для любого предиката Р», «существует такой предикат Р»), Од¬ нако предикаты могут зависеть только от предметных переменных и не могут быть включены в число предметов, составляющих предметную область. Ключевые термины Совершенная дизъюнктивная нормальная форма - каноническое представление логической функции в виде дизъюнкции конъюнкций; в каж¬ дой конъюнкции представлены все булевы переменные, где во всех комбина¬ циях часть из них входит со знаком отрицания, а остальные - без этого знака. Конъюнкция присутствует в формуле только в том случае, если логическая функция от соответствующей комбинации переменных и их отрицаний имеет значение 1 (ИСТИНА). Тождественная истинность высказывания - равенство 1 при всех возможных наборов значений переменных. Аксиомы (правила вывода) - полный и непротиворечивый набор простейших тождественно истинных формул, позволяющих производить эк¬ вивалентные преобразования. Содержательный подход к определению тождественно истинных вы¬ сказываний основан на переборе значений всех переменных. Формальный подход к определению тождественно истинных выска¬ зываний основан на формальном преобразовании исходной формулы на ос¬ нове аксиом - к приведению её к значению 1 (ИСТИНА). Предикат - логическая функция, заданная на предметной области. 71
Глава I. Логические основы искусственного интеллекта Квантор общности (V) - аналогичен высказыванию «для всех jc ис¬ тинно Р(х)». Квантор существования (3) - аналогичен высказыванию «существует л-, для которого истинно Р{х)у>. Узкое исчисление предикатов - допускает использование кванторами лишь предметных переменных. Исчисление предикатов второй ступени - допускает применение предикатных кванторов. Коллизия переменных - возникает тогда, когда в разных логических функциях, участвующих в сложной формуле, используются одни и те же обозначения общих предметных переменных. Выполнимая формула - та, для которой может быть определена пред¬ метная область и уточнены смысловые значения предикатов. Предварённая форма - получается в результате эквивалентных пре¬ образований формулы, где кванторы сосредоточены в начале записи. Нормальная форма Сколема - отличается от предварённой формы тем дополнением, что все кванторы существования предшествуют всем кван¬ торам общности. Краткие итоги 1. Булева алгебра является основой построения не только цифровых компьютеров, её принципы легли в основу построения ещё более общих и мощных логических исчислений, позволяющих формализовать логическое мышление человека. 2. Исчисление высказываний основано на ограниченной аксиоматике, отделено от смысла объектов высказываний, и потому не даёт полного пред¬ ставления о действительно логическом подходе к определению истинности. Например, высказывание ЛОЖЬ -л ЛОЖЬ является истинным, но не отра¬ жающим смысл высказываний. 3. Исчисление предикатов расширяет исчисление высказываний при¬ влечением предметной области. Применение кванторов общности и суще¬ ствования позволяет расширить возможности логических преобразований на основе расширенной аксиоматики. 4. Задача определения тождественной истинности высказываний (пре¬ дикатов) является главной задачей любого логического исчисления. 5. В исчислении предикатов в большинстве случаев для решения теоре¬ тически неразрешимой проблемы определения тождественной истинности используется нормальные формы - предварённая и Сколема, для которых из¬ вестны алгоритмы приведения. 6. Математическая логика событий построена на основе исчисления предикатов, где предметная область (факторное пространство) является опре¬ 72
Лекция 3. Основы математической логики деляющим. Хотя «классическое» исчисление предикатов не распространяет¬ ся на нечёткие данные. Вопросы 1. Как строится совершенная дизъюнктивная нормальная форма для произвольной логической функции? 2. Приведите базовый набор тождественных соотношений. 3. Какое логическое исчисление следует считать полным и непротиво¬ речивым? 4. Охарактеризуйте содержательный и формальный аспекты проблемы установления тождественной истинности высказываний. 5. Охарактеризуйте систему аксиом Клини. 6. Как исчисление предикатов развивает исчисление высказываний? Что позволяют кванторы общности и существования? 7. В чём суть теоремы дедукции? 8. Как в исчислении предикатов в формальном аспекте пытаются ре¬ шить проблему установления тождественной истинности? Какие нормальные формы известны для преобразования формул в исчислении предикатов? Лекция 4. Методы дедуктивных и индуктивных рассуждений Аннотация. Рассматриваются «древесный» и «сетевой» методы дедук¬ тивных рассуждений. Исследуется схема индуктивных (правдоподобных) рассуждений. Приводятся принципы причинно-следственных отношений Д.С. Милля и основанный на них метод индуктивного мышления. Даются ос¬ новы нечётких рассуждений. В основу лекции положены разработки Д.А. Поспелова. Ключевые слова: дерево вывода, логическая сетъ, гипотеза, эмпириче¬ ская и теоретическая истина, квантификатор, лингвистическая шкала. - Аннушка... Аннушка?.. - забормотал поэт, тревожно озираясь, - поз¬ вольте, позвольте... К слову «Аннушка» привязались слова «подсолнечное масло», а затем почему-то «Понтий Пилат». Пилата поэт отринул и стал вязать цепочку, на¬ чиная со слова «Аннушка». И цепочка эта связалась очень быстро и тотчас привела к сумасшедшему профессору. М.А. Булгаков. «Мастер и Маргарита» 73
Глава I. Логические основы искусственного интеллекта 4.1. Возможности автоматизации достоверных (дедуктивных) рассуждений Если у тебя спрошено будет, что полезнее, солнце или месяц? - ответ¬ ствуй: месяц. Ибо солнце светит днём, когда и без того светло; а месяц - но¬ чью. Козьма Прутков Опишем общую схему выводов, лежащих в основе большого количе¬ ства моделей человеческих достоверных (дедуктивных) рассуждений. На рис. 4.1 показано некоторое дерево вывода истинности утверждения /ю- Рис. 4.1. Дерево вывода истинности утверждения/ю Первый ярус дерева образуют вершины /і, /2, ./з, ./4, выполняющие роль аксиом, или утверждений, истинность которых задаётся извне. Стрелки схо¬ дятся в одной точке (например, Д —» /ю и Дв —»/ю), если значение ИСТИНА второго высказывания, достигается при значении ИСТИНА всех первых вы¬ сказываний (т.е. по схеме И). Стрелки входят в разные точки, если значение ИСТИНА имеет хотя бы одно «входящее» высказывание (если обусловлен¬ ные ими связи действуют по схеме ИЛИ). Во избежание коллизии стрелки могут дублироваться (две стрелки Д -л До), а стрелки, обозначающие дизъ¬ юнкцию, соединяются скобкой (стрелки f -^Д и ->f5,fs —»/10 и —»/10 и ДР)- Таким образом, возможны разные пути доказательства любого проме¬ жуточного и конечного утверждения. Например, доказательство утверждения Д возможно двумя путями. Раз доказаны утверждения^ иД, то /) следует из их доказанности. Утверждение Д следует из доказанности^, тогда/9 следует из доказанности few fi. Второй путь доказательства Д следует из доказатель¬ ства Д на основеили Д. Схема вывода не обязательно описывается в виде дерева. Она может иметь вид произвольной ориентированной или неориентированной сети (рис. 4.2). «Жирная» точка означает, что, например, для доказательстванеобхо- 74
Лекция 4. Методы дедуктивных и индуктивных рассуждений димо доказательство как Д, так и fi. Такая логическая сеть называется И-ИЛИ сетью. Мы сразу нашли решение, потому что видим его. Но как построить ал¬ горитм перебора возможных смещений в лабиринте возможностей для дока¬ зательства пути в целевую вершину? В данном случае, перебирая возможности смещения из fi, мы пытаемся вывести утверждение/j, но этого нельзя сделать, т.к. требуется доказатель¬ ство утверждения fi. Обнаруживаем, что доказательство возможно. Теперь доказаны f и fi. Попытка продвинуться в fi я fi оказывается успешной. На следующем шаге доказываются утверждения fa, я fi. После «чистки» ненуж¬ ных выводов, остаётся реальный кратчайший путь доказательства fi —> /3 -л- fi /б- Возможен и другой путь доказательства - метод обратной волны (ана¬ лог метода динамического программирования). Чтобы доказать fi, надо дока¬ зать /5; чтобы доказать fi, надо доказать fi\ следует воспользоваться началь¬ ным утверждением fi. Рассмотрим блестящее умозаключение Козьмы Пруткова, рекомендуе¬ мое в эпиграфе. Дерево вывода изображено на рис. 4.3. На первом ярусе от¬ ражены исходные посылки - аксиомы, обладающие (с точки зрения К. Прут¬ кова) значениями ИСТИНА. 75
Глава I. Логические основы искусственного интеллекта Как видим, солнышку вообще делать нечего, что вполне в духе софи¬ стических рассуждений. Известны схемы вывода альтернативные деревья, альтернативные се¬ ти и другие аналоги метода «ветвей и границ». В рамках данного раздела совершим неформальный переход к нечёт¬ ким данным, концепция которых уже легла в основу разработки математиче¬ ской логики событий. Будем оперировать высказываниями, значение ИСТИ¬ НА которых определена с некоторой вероятностью, как было рассмотрено в Лекции 1. Рассмотрим пример расчёта надёжности управляющего компьютера, как вероятности решения своей задачи в цикле управления длительности 1. На рис. 4.4 представлено вероятностное дерево логических возможно¬ стей, отражающее многие пути следования к обоснованию положительной ситуации - успешного решения задачи. Мы видим, что дерево вывода как бы перевёрнуто и обладает не единственной целевой вершиной. Принятые обо¬ значения и формулы: Рис. 4.4. Вероятностное дерево логических возможностей для расчёта надёжности компьютера 76
Лекция 4. Методы дедуктивных и индуктивных рассуждений Кг - коэффициент готовности, находится из отношения Кг = А Г(1 + г О б< где 7о - среднее время безотказной работы, Тві среднее время восстановления оборудования при неисправности; Л\ - частота сбоев, Лі - частота отказов, Л = Л\ +Лі, /Ѵф-сб - вероятность успешного устранения последствий сбоев во время решения задачи; PWi. - вероятность успешного перехода на резерв во время решения задачи. Тогда надёжность Р находится как сумма произведений условных ве¬ роятностей по всем ветвям дерева, ведущим к успеху: P = Y^{e-** + 4l(1- ext) /Ѵф.с6 + і(1- e?J)PWi.) (4.1) Л Л 4.2. Возможности автоматизации правдоподобных (индуктивных) рассуждений ... из всех зверей пусть государь уподобится двум: льву и лисе. Лев бо¬ ится капканов, а лиса - волков, следовательно, надо быть подобным лисе, чтобы уметь обойти капканы, и льву, чтобы отпугнуть волков. Тот, кто все¬ гда подобен льву, может не заметить канкана. Из чего следует, что разумный правитель не может и не должен оставаться верным своему обещанию, если это вредит его интересам, и если отпали причины, побудившие его дать обе¬ щание. Николо Макиавелли. Государь Аристотель говорит о двух основных процессах рассуждений: низхо- дящем или дедуктивном, и восходящем или индуктивном. В соответствии с положениями Н.М. Амосова, изложенными во Введении, дедукция - это рас¬ суждения «от общего к частному», а индукция - «от частного к общему». При таком понимании этих двух процессов возникает иллюзия, что они как будто обратны друг другу, и одну схему рассуждений можно получить из другой прямым обращением. Этой иллюзии поддался и Аристотель. Увле¬ чённый красотой и стройностью воздвигнутого им здания силлогистики, он попытался втиснуть в его объёмы и индуктивное рассуждение, ввести схему индуктивного силлогизма. Но здесь его подстерегала неудача. Индуктивные рассуждения никак не хотели отливаться в ту стройную форму, которая так подошла дедуктивным рассуждениям. Напомним ещё раз основную цель, которую преследовал Аристотель, создавая силлогистику. Она должна была стать непобедимым оружием в спо¬ ре. Если оппонент признавал общее положение, например, столь очевидную истину, что «все люди смертны», то после его убеждения в том, что «Сократ есть человек», следует вывод «Сократ смертен». Здесь возразить нечего. Это дедуктивная схема. 77
Глава I. Логические основы искусственного интеллекта При индуктивной схеме спорящий сначала должен сообщить оппонен¬ ту несколько утверждений, в истинность которых должны поверить оба, например, «Гомер смертен», «Фидий смертен», «Эзоп смертен». Далее надо убедить оппонента, что Гомер, Фидий и Эзоп являются людьми. Далее надо совершить главный индуктивный шаг, перейдя к утверждению о всём классе людей: «все люди смертны» и заставить оппонента принять это утверждение. Трудность возникает именно на последнем шаге спора: примет или не примет этот шаг оппонент. Этот шаг требует не умения логически обосновы¬ вать свои рассуждения, а веры в свою справедливость. На данном же уровне рассуждений утверждение-вывод является лишь гипотезой, обретающей предельную тождественную истинность в результате установления смертно¬ сти многих - многих людей. И если найдётся хотя бы один бессмертный че¬ ловек, то гипотеза рухнет, и оппонент победит. Мы знаем, что научные гипотезы, выдвинутые на основе огромного ко¬ личества экспериментов, постоянно уточняются или рушатся вообще, в соот¬ ветствии с неумолимостью диалектического закона «отрицания отрицания». Поэтому индуктивные умозаключения всегда являются правдоподоб¬ ными рассуждениями. Вплоть до середины XIX века их теории просто не существовало. Принципы причинно-следственных отношений Джона Стюарта Милля Джон Стюарт Милль, британский философ, экономист и политический деятель, 1806 - 1873, поставил перед собой задачу нахождения связей между фактами и явлениями на основе анализа их совместного появления или не появления в последовательности экспериментов. При этом он стремился не повторить знаменитой ошибки при установлении причинно-следственной связи «после этого, значит, вследствие этого. Рис 4.5. Джон Стюарт Милль 78
Лекция 4. Методы дедуктивных и индуктивных рассуждений Принципы установления причинно-следственных отношений, которые предложил Милль, основаны на выделении сходства иразличия в наблюдае¬ мых ситуациях. Принцип единственного различия Милля заключается в следующем: «Если после введения какого-либо фактора а появляется или после его уда¬ ления исчезает некоторое явление Д, то фактор а является причиной явления Д {а—>/3)у>. Разве в процессе диагностики транспортных средств или при лечении человека мы не применяем этот принцип? Конечно, так складывается пер¬ вичная гипотеза, наиболее верное предположение, требующее более глубоко¬ го исследования и обоснования его механизмов. Принцип единственного сходства Милля формулируется следующим образом: «Если все обстоятельства явления, кроме одного Д могут отсутство¬ вать, не уничтожая этим явление а, то это обстоятельство Д является причи¬ ной явления а{рл>а)». Принцип единственного остатка Милля формулируется следующим образом: «Если вычесть из явления ту часть его, которая согласно прежним исследованиям является следствием известных причин, присутствующих в явлении, то остаток явления есть следствие остальных причин». Например, если из грозы вычесть град, являющийся следствием опре¬ делённых параметров атмосферы, то оставшиеся параметры атмосферы, всё равно приведут к грозе в другом выражении. Выходит, аналитический ум мы отмечаем по следованию принципам Милля?! При использовании методов индуктивных рассуждений Милля весьма важную роль играет способ выделения признаков или фактов, с помощью ко¬ торых описываются ситуации. Рассуждения по аналогии Первая попытка формализации рассуждения по аналогии была пред¬ принята Еотфридом Вильгельмом Лейбницем, саксонским философом и ма¬ тематиком (1646 - 1716), в сочинении «Фрагменты логики». Он ввёл обоб¬ щённое понятие пропорции для отношения аналогии: «Вещь А так относится к вещи В, как вещь Л’ к вещи В’». Для рассуждений по аналогии необходим формальный (алгебраиче¬ ский) язык, на котором можно задавать характеристику, свойства объектов и некоторые правила их преобразования. Например, на рис. 4.7 показано преобразование F объекта А в объект В. Объект А\ сформированный в рамках языка, аналогичен объекту А. Требует¬ ся построить аналог Л’ объекта В в рамках тех же преобразований F, допу¬ стимых в языке. Ответ приведён на рисунке. 79
Глава I. Логические основы искусственного интеллекта Рис. 4.6. Готфрид Вильгельм Лейбниц Но как это сделать? Прежде всего, по требованию данной задачи в формальном языке должны быть определены объекты «солнце», «челове¬ чек», «луна», «фантастическое животное». Должны быть определены враще¬ ние и взаимное расположение объектов. Рис. 4.7. Преобразование по аналогии 80
Лекция 4. Методы дедуктивных и индуктивных рассуждений Алгоритм формирования В’ предполагает следующие шаги. 1. Устанавливается взаимно-однозначное соответствие аналогичных объектов А и А’: «солнце» <-» «луна», «человечек» <-» «фантастическое жи¬ вотное». 2. Устанавливается порядок следования объектов в А: «солнце» - пер¬ вый объект (слева), «человечек» - второй объект (справа). 3. Формируется алгоритм преобразования F для получения В: Поменять местами «второй объект» —» «первый объект», «первый объ¬ ект» —> «второй объект»; Повернуть «первый объект» на 180°; Зеркально отобразить «второй объект». 4. Повторить алгоритм преобразования F для получения В? на основе А\ Следует отметить, что модель Лейбница не описывает полностью все возможности и все случаи рассуждений по аналогии. Ассоциативное мышление, моделируемое с помощью логических ней¬ ронных сетей, обладает значительно большими возможностями. Однако все¬ гда необходимо обладать характеристиками факторного пространства собы¬ тий, аналогии в котором исследуются, а также определениями эквивалентно¬ сти. Метод индуктивного мышления Д.С. Милля (Л СМ-метод) Мы вновь возвращаемся к работам Д.С. Милля, чтобы объединить то, что уже известно, с рассуждениями по аналогии. Введём три множества: - множество причин А = {а\, ..., ар}; - множество следствий В = {Ъ\, ..., Ьм}; - множество оценок достоверности Q = {qі, ..., qb). Причины и следствия - предикаты. За дискретные оценки достоверно¬ сти может приниматься ряд величин от 0 до 1 с некоторым шагом, например, 1/(L-1). Выражение вида at -» Ь/, qk (4.2) будем называть положительной гипотезой, утверждающей, что а, явля¬ ется причиной bj с оценкой достоверности qu. Выражение вида а, bj\ qk (4.3) будем называть отрицательной гипотезой, утверждающей, что с досто¬ верностью qk а, не является причиной bj. Гипотезы являются предикатами, максимальная достоверность которых должна быть установлена. 81
Глава I. Логические основы искусственного интеллекта Д. Поспелов рассматривает пример, где впервые прибывший в Москву иностранец приходит к выводу, что все такси - жёлтого цвета: (жёлтый автомобиль) —» (такси); £/ = ? Начальные наблюдения порождают малое значение q достоверности данной гипотезы. По мере развития опыта уверенность в правоте гипотезы у него возрастает. Однако возникает существенный «тормоз» в том случае, ес¬ ли встречается автомобиль жёлтого цвета, не являющийся такси. Такая встреча порождает отрицательную гипотезу. Если отрицательных гипотез не возникает, то наш гость, вернувшись на родину, сообщает новое знание - своё индуктивное заключение: «В той стране, где я был, все жёлтые автомо¬ били - такси. Это верно на 100%!» Однако он мог высказать и другое утверждение на базе индуктивного мышления: «Там в основном такси - жёлтые машины, процентов на 60». Но могла бы возникнуть неопределённость такого рода: «Знаешь, там большинство такси - жёлтого цвета!» Здесь целесообразно говорить об эмпирической истине. Может ли достоверность гипотезы достичь единичного значения? По-видимому, весьма высокого значения, по мнению иностранного гостя, эта достоверность обретёт в случае его ознакомления с указом прези¬ дента о запрещении жёлтой окраски автомобилей и обязательной окраске такси в жёлтый цвет. Тогда говорят о теоретической истине. Итак, достижение теоретической истины теоретически возможно при достаточном количестве положительных примеров и при полном отсутствии примеров отрицательных. Это количество может быть разным у разных лю¬ дей: от малого для людей легковерных, до весьма большого для людей типа «Фомы неверующего». Не зря говорят, что практика - критерий истины. А критерий имеет численное значение, стремящееся к единице в ходе проверки положительной гипотезы. Заметим ещё, что на этом примере наблюдается связь между дедуктив¬ ным и индуктивным мышлением. Не зря эта связь в виде предпосылки изло¬ жена во Введении, в формулировке замечательного советского учёного Н.М. Амосова. Поэтому ДСМ-метод предлагает формальное описание действий в рамках известных сегодня парадигм искусственного интеллекта. Продолжим его рассмотрение. Выше уже рассматривалась единственная причина, приводящая к след¬ ствию. Такие причины являются необходимыми и достаточными. В советские времена мы могли бы сказать: (автомобиль «Волга» с ша¬ шечками на боку) —» (такси). В наши дни мы так сказать не можем из-за оби¬ лия марок, расцветок, расположения, а, возможно, и отсутствия «шашечек», из-за конструктивных особенностей, укомплектованности и т.д. 82
Лекция 4. Методы дедуктивных и индуктивных рассуждений Здесь должны быть выделены достаточные причины. Помимо откро¬ венной надписи «такси», это может быть принадлежность автомобиля из¬ вестной фирме «Таксомоторный парк № 20», или «Такси Цель» и пр. Этого достаточно для вывода о том, что вы действительно имеете тело с такси. Но если вы уже сели в такси, то ничего не знаете о том, какой фирме оно при¬ надлежит, и такси ли это на самом деле. Добавим, что причины могут быть необходимыми, но не достаточны¬ ми. Связка вида (автомобиль) —» (такси) говорит лишь о том, что чтобы транспортное средство было такси, необходимо, чтобы оно было автомоби¬ лем. Обобщая, отметим, что необходимо рассматривать несколько причин, приводящих к одному следствию. Тогда положительная гипотеза обретает следующий вид, где каждая причина рассматривается со своим весом: Здесь аіг е А, г = 1, ...,R,bj-e В, qu e Q, щг- вес r-й причины. Легко наблюдается переход к логической нейронной сети. Ясно, что нахождение множества причин - кандидатов для формирова¬ ния гипотез - дело сложное, и методология научных исследований очерчена весьма обще. В положительных и отрицательных примерах эти причины скрыты в описаниях реальных объектов, обладающих или не обладающих интересую¬ щими нас свойствами. Д.А. Поспелов сообщает, что первое реальное использование ДСМ- метода было направлено на решение задачи выделения причин того, что не¬ которое органическое соединение будет обладать свойством биологической активности. Предполагалось, что информация о причинах биологической ак¬ тивности скрыта в структурной формуле химического соединения. Экспери¬ ментально для многих соединений было установлено наличие или отсутствие в них биологической активности. Эти экспериментальные факты составили множество положительных и отрицательных примеров. Программы, реализующие ДСМ-метод, должны были найти новые, не¬ известные химикам и фармацевтам закономерности, позволяющие без доро¬ гой и длительной экспериментальной проверки оценивать вероятность того, 83
Глава I. Логические основы искусственного интеллекта что вновь синтезированные вещества будут обладать биологической актив¬ ностью. Ход исследований был таков: Рассматривается группа положительных примеров. Находится некото¬ рая часть описания объектов, общая для значительной совокупности из этой группы. Например, не вдаваясь в суть химических технологий, оказалось, что в значительной части структурных формул соединений, обладающих биоло¬ гической активностью, обнаружилась кольцевая структура с фиксированным заполнением позиций в ней. Тогда есть основание считать эту структуру кан¬ дидатом в причины. На каждом шаге работы ДСМ-метода используются новые наблюде¬ ния, подтверждающие или опровергающие уже сформированные гипотезы. На основе их подсчёта уточняется достоверность гипотезы. Гипотеза прини¬ мается за истинную, если её достоверность при достаточном количестве экс¬ периментов превысила заданный порог. Таким образом, с определённой точностью гипотеза становится эмпи¬ рически истинной, но подлежит длительному этапу экспериментального применения и оценки эффективности. Новые гипотезы формируются не только на основе определения в при¬ мерах некоторого сходства (общей части в описании структуры). Они могут использовать и принцип различия, также сформулированный Миллем. Раз¬ личие выявляется для примеров из положительных и отрицательных групп. Найденное различие также служит кандидатом формирующихся гипотез. 4.3. Нечёткие рассуждения и выводы Нежная Правда в красивых одеждах ходила, Принарядившись для сирых, блаженных, калек, - Г рубая Ложь эту Правду к себе заманила: Мол, оставайся-ка ты у меня на ночлег. В. Высоцкий. Притча о Правде и Лжи В теории предикатов отмечалось наличие кванторов общности и суще¬ ствования, как действенных операторов чёткого, точного единственного ло¬ гического вывода. Эти кванторы являются основой стройной и полной фор¬ мулировки, а также точного доказательства математических теорем. Кванторы общности и существования следует считать классическими. Однако для неточных, приближённых, даже эмоциональных оценок широко используются так называемые квантификаторы, которыми так кра¬ сочно снабжена речь человека, и которые не только участвуют в рассуждени¬ ях, но и формируют выводы. Конечно, эти выводы не следует считать строгими. Чаще всего они от¬ ражают индивидуальное восприятие писателя, поэта, художника-формалиста. 84
Лекция 4. Методы дедуктивных и индуктивных рассуждений К сожалению, часто квантификаторы используются в софистических спорах с оппонентами в интересах политики, экономики, социологии и др. Для формализации мышления рассматриваются нечёткие квантифи¬ каторы, связанные с нечёткой математикой, основанной Л. Заде. Основным объектом изучения нечёткой математики являются нечёткие множества на основе определения: Элемент а принадлежит данному нечёткому множеству А со степе¬ нью уверенности р,0 <р < 1. Мнения относительно принадлежности элемента нечёткому множеству никогда не бывает однозначным. Отсюда - заведомо неточные выводы. Именно поэтому разрабатываются ГОСТы - государственные стандарты. В Лекции 1 для перехода к логическим нейронным сетям указанная выше степень уверенности в истинности высказываний была определена как достоверность высказывания (о принадлежности данных). Достоверность - это вероятность того, что данное высказывание истинно, зачастую взятая «с потолка». Доказывая «полезность» и эффективность применения логических нейронных сетей, лектору приходится убеждать слушателей в том, что жизнь полна неопределённости и противоречий, что сказывается на процессе воз¬ буждения рецепторов. Но мы живём! Ибо человек - общественное животное. Коллектив (народ) поправит. Введём понятие лингвистической шкалы, как последовательности не¬ чётких квантификаторов, относящихся к оценке элементов нечёткого множе¬ ства по одному и тому же основанию (расстоянию, длительности, частоте, размерам и т.п.) Примером лингвистической шкалы может служить шкала расстояний: вплотную, очень близко, близко, ни далеко ни близко, далеко, очень далеко, в бесконечности. Другой пример - шкала размеров: крошечный, очень маленький, ма¬ ленький, средний, большой, очень большой, огромный. Для лингвистических шкал возможно принятие решений («гостирова- ние») о численных оценках и их границах в метрах, часах, квадратных кило¬ метрах и т.п. Интервалы оценок и нечёткие квантификаторы образуют вза¬ имно-однозначное соответствие. Именно такой подход реализуется во мно¬ гих системах принятия решений на логических нейронных сетях - при фор¬ мировании рецепторного слоя. Перейдём к нечётким рассуждениям. Один шаг достоверного (дедуктивного) вывода можно представить в виде схемы: Посылки F\; F2; ..., F„ ,. Следствия Ф\ , Ф1,..., Фт 85
Глава I. Логические основы искусственного интеллекта Например, запишем одиннадцатую аксиому исчисления высказываний: А’А^В (4.6) В Введём некоторые нечёткие квантификаторы и изменим схему (4.6): >1 1 А;А->В Аів Здесь >| 1 - нечёткий квантификатор, показывающий, что истинность А не является абсолютной. Поскольку в этом случае вывод не может быть до¬ стоверным, для степени его достоверности необходимо ввести некоторый квантификатор >1 2. Конкретизируем пример: Часто идёт дождь; Когда идёт дождь, я не выхожу на улицу ? Я не выхожу на улицу одссь чисти — іѵьшііііцшішіир -"i і. онак ьшірис tiuwi вмсі/іи ічвантифи- катора >1 2, который по интуиции логично принять за тот же >1 1 «часто». Вывод «часто я не выхожу на улицу» выглядит вполне логичным. Рассмотрим другую схему: А;А—>>\ 1 В Развивая п >12 В ер, запишем: Идёт дождь; Когда идёт дождь, я редко хожу гулять ? Я редко хожу гулять ли возможен, ведь отсутствует информация о частоте события А. Рассмотрим, наконец, схему >1 1А;А^^ЗВ , при конкретной реализации: >І2 В Часто идёт дождь; Когда идёт дождь, я редко хожу гулять $ет вряд ? Я хожу гулять Здесь выбор квантификатора более обоснован. Однако если использо¬ вать часто, то возникает некоторая синхронность гуляния с частотой дождя. Но ведь во время дождя «гуляние» происходит редко. Остаётся использовать 86
Лекция 4. Методы дедуктивных и индуктивных рассуждений «иногда», как бы суммируя как отсутствие дождя, так и прогулки под до¬ ждём. Численные оценки квантификаторов неотделимы от «физического смысла»: «дача далеко от Москвы» предполагает другую оценку расстояния, чем «Петербург далеко от Москвы». Принцип ситуационной инвариантности позволяет, проводя рассужде¬ ния для одной ситуации, преобразовать его формальным образом для сход¬ ных ситуаций. Для этого используется лингвистическая шкала. Переход от ситуации к ситуации связан со смещением всех интервалов, соответствующих кванти¬ фикаторам шкалы, на определённое число позиций влево или вправо по множеству значений признака, учитываемого данной лингвистической шка¬ лой. Такое смещение позволяет использовать в нечётких рассуждениях эле¬ менты рассуждений по аксиомам, так как в основе этих рассуждений лежит идея сходства, похожести. В дополнение рассмотренных схем, в [Посп] приводится ряд схем правдоподобных рассуждений: вероятностные схемы рассуждений, схемы с учётом необходимых условий и др. Ключевые термины Дерево вывода - схема последовательного доказательства истинности цепочки рассуждений, ведущая к истинному заключению. Логическая сеть - как и дерево вывода, определяет логическую взаи¬ мосвязь частных утверждений для нахождения пути доказательства истинно¬ сти утверждения, соответствующего целевой вершине. Эмпирическая истина - истинность высказывания, определённая опытным путём. Теоретическая истина - доказывается аналитически эквивалентными преобразованиями формулы для приведения её к тождественно истинной. Гипотеза - продукт достижения эмпирической и теоретической исти¬ ны. ДСМ-метод - признанный и сегодня метод индуктивного мышления Д.С. Милля. Нечёткое множество - множество, составленное из элементов, входя¬ щих в него с некоторой степенью уверенности (вероятности). Краткие итоги 1. Деревья вывода (деревья логических возможностей), как и логиче¬ ские сети, предоставляют возможности автоматизации дедуктивно- го(правдоподобного) вывода, если совместить логику со смысловым напол¬ нением вершин в рамках одного языка. 87
Глава I. Логические основы искусственного интеллекта 2. Возможен переход к рассмотрению вероятностных деревьев и логи¬ ческих сетей, что погружает проблему автоматизации в область действия ма¬ тематической логики событий. 3. Правдоподобные (индуктивные) рассуждения приводят к выработке лишь гипотезы, которая подвергается проверкой фактами.. 4. Принципы причинно-следственных отношений Д.С. Милля позволи¬ ли сформулировать метод индуктивного мышления. 5. Нечёткие рассуждения и выводы формируются с помощью кванти¬ фикаторов и лингвистических шкал. Вопросы 1. Приведите пример вывода по дереву логических возможностей. 2. Представьте схему доказательства истинности индуктивных рассуж¬ дений. 3. Обсудите проблему эмпирической и теоретической истины. 4. Каковы принципы причинно-следственных отношений Д.С. Милля? 5. Поясните ход рассуждений по методу индуктивного мышления Д.С. Милля. 6. Охарактеризуйте нечёткие рассуждения и выводы. Лекция 5. Вывод по базе знаний Аннотация. Рассматриваются продукционные системы, связывающие базу знаний с внешним миром. Анализируются интеллектуальные операции над базой знаний. Обсуждаются способы выбора из фронта готовых продук¬ ций. Исследуется вывод на семантической сети, а также проблема аргумен¬ тации в споре. Ключевые слова: база знаний, продукция, продукционная система, фронт готовых продукций, семантическая сетъ, спор. ... Пусть истина взовьётся как огонь Со дна души, разъятой вихрем взрыва! Беда тому, кто убедит глупца! Принявший истину на веру - Ею слепнет... Максимилиан Волошин. Бунтовщик 88
Лекция 5. Вывод по базе знаний 5.1. Продукционные системы База знаний (живая!) отличается от (мёртвой) базы данных возможно¬ стью логического вывода. Это означает, что базе знаний (БЗ) обязательно придана некоторая процедура (или несколько таких процедур), с помощью которой можно производить дедуктивные или даже индуктивные рассужде¬ ния. Эти процедуры в настоящей теории логического вывода называются продукциями, обладающими конкретным смыслом в соответствии с формой «если - то». Такая форма характерна для фиксации и выборки знаний в раз¬ личных областях человеческой деятельности. Признан универсальный характер продукций. К ним относятся все ка¬ зуальные, т.е. причинно-следственные утверждения и связи. Поэтому продукционные системы (к ним относятся и логические ней¬ ронные сети) получили наибольшее распространение при представлении знаний в рамках искусственного интеллекта. Обобщённая модель Д.А. Поспелова, отражающая взаимодействие внешнего мира W и базы знаний К с помощью рассуждающей системы R, по¬ казана на рис. 5.1. Рис. 5.1. Взаимодействие базы знаний с внешним миром через рассуждающую продукционную систему Рассуждающая система R черпает из внешнего мира W информацию в соответствии с уже накопленными ранее данными о закономерностях этого 89
Глава I. Логические основы искусственного интеллекта мира и его состоянии. Из внешнего мира в рассуждающую систему (её ещё называют решатель) приходит сиюминутная, текущая информация о наблю¬ даемых в этом мире фактах и явлениях. Из базы знаний (БЗ) поступает информация более фундаментального значения. Она может описывать законы внешнего мира, правила действий в нём, целевые структуры или ожидаемые отклики внешнего мира на те или иные воздействия на него. В памяти рассуждающей системы хранится текущая информация, связанная с ходом рассуждений. Со временем она либо исчезает, либо пере¬ даётся для хранения в БЗ, если в ходе рассуждений появилась информация, которая может оказаться полезной для рассуждающей системы в будущем. 5.2. Интеллектуальные операции над базой данных Ставя целью - моделирование, мы на неформальном уровне силимся понять, а как «в жизни» производятся операции запоминания и выборки дан¬ ных из БЗ? Какие типы продукций осуществляют запоминание и логическую выборку? Именно эти продукции определяют тип мышления человека, по- разному проявляющийся. Запоминание знаний бывает: - образным; - предикативным; - алгоритмическим. Образы у большинства «мыслящих» людей являются чуть ли не глав¬ ным объектом запоминания: от букв родного алфавита до картин великих мастеров. Образы ассоциативно вызывают чувства радости и печали, красоты и отвращения, любовной родственности и т.д. Образное мышление определя¬ ет утончённость души. Но не только: каждый продуктивный учёный, даже «сухой» математик, мыслит образами, заставляя изучаемые объекты двигать¬ ся, упорядочиваться - чтобы «увидеть», зафиксировать и сформулировать причинно-следственную связь. Задачи динамического планирования не ре¬ шить иначе! А с какой благодарностью и навсегда запоминается объяснение теоремы «о двух милиционерах» в интерпретации замечательного препода¬ вателя, когда функция - оценка сверху исследуемой функции, в пределе схо¬ дится к функции - оценке снизу той же функции! Предикативное запоминание часто подобно зубрёжке: «F равно та», «Надёжность компьютера, решающего задачу за время t, равна сумме произ¬ ведений...». Но ведь прекрасные стихи - тоже предикаты! В чём же дело? За¬ чем нужны стихи, песни и пр.? - Описывать образы? Наконец, запоминание алгоритмов действий является важным услови¬ ем жизни. Человек всегда действует, руководствуясь целевой функцией, во имя выживания и даже счастья: «Как сварить суп?», «Как добиться располо¬ 90
Лекция 5. Вывод по базе знаний жения начальства?» и т.д. На экзамене по дисциплине «Архитектура вычис¬ лительных систем» возможен вопрос, предполагающий быстрый ответ: «Вот параллельная граф-схема задачи. Составьте план её решения за минимальное время на двух процессорах». Отвечающий впервые видит такую граф-схему, и только знание алгоритма диспетчера может его спасти. Однако никогда, или почти никогда, человек не использует лишь один вид запоминания. Комбинация образного и предикативного начала при чте¬ нии книг, все три составляющие при сложении стихов, при решении множе¬ ства научных, военных и игровых задач, требующих развитого комбинатор¬ ного мышления - всё это обнадёживает и говорит о продолжении славного пути развития человечества. Выборка из БЗ ассоциирует чувства. И наоборот: чувства - желаемые или уже вызванные чем-то - определяют ассоциативную выборку из БЗ. Всё сказанное реализуется с помощью логических нейронных сетей го¬ ловного мозга, если в соответствии с правдоподобными рассуждениями при¬ знать этот постулат истинным. 5.3. Классификация продукций От поэтических настроений вернёмся к оценкам формальных возмож¬ ностей моделирования искусственного интеллекта. Подберёмся поближе к вопросу: а какие продукции в рассматриваемой системе бывают? 1. Продукция типа А w =>Br. В левой части продукции подразумевается информация из внешнего мира IV, a в правой - сведения о вытекающих из этой информации изменени¬ ях в рассуждающей системе. Эти изменения сказываются на ходе рассужде¬ ний. Например, рассуждая утром о выборе места воскресного отдыха, вы услышали, что днём ожидается гроза. Это сообщение, рассматриваемое и как воздействие, и есть Aw, вносящие коррективы в ваши планы. Будут отброше¬ ны варианты, связанные с пребыванием на открытом воздухе. Больший вес обретут другие варианты. Изменение предпочтительности вариантов отдыха характеризуется правой частью Br продукции. Возможный вид продукции мог бы быть: «Если на улице дождь или гроза, или они ожидаются в течение дня, то вместо прогулки лучше пойти в кино или музей». 2. Продукция типа A w =>Вк. Такие продукции отражают передачу некоторого сообщения из внеш¬ него мира для запоминания в БЗ. Например, командир приказывает разведчику: «Всё что увидишь в окрестностях переправы, запомни, а потом передай через связного». Система работает в роли почтового отделения. Однако возможна перлюстрация кор¬ респонденции: рассуждающая система может воспользоваться информацией от Aw к В к для своих целей. 91
Глава I. Логические основы искусственного интеллекта Данную продукцию можно также трактовать, как способ описания ша¬ гов общения пользователя с системой в диалоговом режиме. Тогда Aw будет интерпретироваться как вопрос пользователя, а Вк- как ответ системы. Тогда ответ следует интерпретировать продукцией типа Ак => Bw. 3. Продукция типа Ак =>Bw. В этом случае рассуждающая система также выступает в роли отделе¬ ния связи. Только передача происходит из базы знаний во внешний мир. Например, некто X предполагает, что у Y пятеро детей. Однако некто Z сообщил, что у Y только трое детей. Тогда рассуждающая система X образует продукцию, в которой Ак характеризует факт наличия противоречивой ин¬ формации, a Bw - некоторое действие, которое X предпринимает в связи с этим. Например, Bw может соответствовать разговору X с Y при попытке вы¬ яснить истинное количество детей у него. 4. Продукция типа Ar => Вк. Эта продукция соответствует тому, что некоторый факт, полученный рассуждающей системой, передаётся на хранение в БЗ. 5. Продукция типа Ак =>Br. Эта продукция также описывает обмен информацией при работе рас¬ суждающей системы. Например, на основе информации, почерпнутой из ба¬ зы знаний, рассуждающая система формирует или координирует параметры технологического процесса. 6. Продукции типа Aw =>Bw. Эти продукции называют продукциями непосредственного отклика. Левая часть Aw описывает некоторую наблюдаемую ситуацию во внешнем мире или воздействие внешнего мира на рассуждающую систему. Правая часть Bw описывает действие, которое «поступает» от системы во внешний мир. Выполнение подобных продукций напоминает рефлекторный отклик, например, отдёргивание руки от горячего. Рассуждения не успевают срабо¬ тать. Система лишь транслирует информацию от A w к Bw адресатам. 7. Продукции типа Ar => Bw. Эти продукции описывают воздействие на внешний мир, порождаемое рассуждающей системой. Мудрый совет гласит: «Подумай, прежде чем де¬ лать». Он призывает того, к кому он обращён, воспользоваться продукцией данного типа, а не продукцией непосредственного отклика. 8. Продукции типа Ar => Br. Это внутренние продукции рассуждающей системы. Они описывают промежуточные шаги процесса вывода и не влияют непосредственно на со¬ держимое БЗ и состояние внешнего мира. То есть, эти продукции описывают единичные шаги многошаговых процессов рассуждений. 9. Продукции типа Ак => Вк. Эти продукции описывают процедуры преобразования знаний в БЗ: обобщение знаний, получение новых знаний из ранее известных с помощью 92
Лекция 5. Вывод по базе знаний логического вывода, установление закономерностей между знаниями на ос¬ нове обработки сведений о единичных фактах, хранящихся в БЗ, и т.п. Рас¬ суждающая система используется в качестве инструмента, с помощью кото¬ рого производится изменение состояния базы знаний. Иногда применяют более общее описание продукции: (имя продукции); 77, Р, А => В, Q. Здесь А В - обычная продукция «если - то» одного из рассмотрен¬ ных выше типов, которая в данной записи называется ядром продукции. Элемент Р характеризует внешние условия, или условия применимости продукции, определяемые факторами, не входящими непосредственно в А, например, целями, стоящими перед рассуждающей системой. Условия Р поз¬ воляют из всех продукций, у которых в левой части ядра стоит А, отбирать нужную часть продукции. Элемент 77 характеризует сферу проблемной области базы знаний или предусловия применимости продукции. Эти предусловия ничем не отличают¬ ся от Р, но выделяют системы продукций на ранг выше тех, которые выде¬ ляют условия. Например, в обычном мире лошади не летают. Поэтому про¬ дукция «если х лошадь, то она летать не может» в обычном мире всегда име¬ ет место (истинна). Но если мы от обычного мира перейдём к миру греческих мифов, то продукция «если лошадь есть Пегас, то она летант», тоже станет истинной. В мире русской сказки продукция «если лошадь есть Конёк- Горбунок, то она летает» принимается без всякой критики. Значит, предусловия 77 должны развести между собой обычный мир, мир греческих мифов и мир русской сказки. Элемент Q характеризует постусловия продукции, указывающие на те изменения, которые необходимо ввести в БЗ и в систему продукций после реализации данной продукции. 5.4. Управление выводом Продукционной системой называют любую упорядоченную, реализу¬ ющуюся последовательно, совокупность продукций, в которую могут вхо¬ дить продукции любого из перечисленных выше типов. Если схема реализации продукционной системы такова, что на некото¬ ром шаге процесса может быть реализована не одна продукция, а несколько, возникает ситуация, в которой необходимо управлять ходом процесса выво¬ да. Предположим, что на рис. 5.1 информация из внешнего мира W посту¬ пает в базу знаний К, минуя рассуждающую систему R. Это позволит рас¬ сматривать лишь продукции типа Ак Вк. Таким образом, как условия ак¬ тивизации продукции, так и результат её выполнения, связаны с информаци¬ ей, хранящейся в БЗ. 93
Глава I. Логические основы искусственного интеллекта Будем также считать, что интеллектуальная система функционирует в некоторые дискретные моменты времени t, определяющие такты работы. В эти моменты времени в БЗ из внешнего мира может поступать некоторая ин¬ формация. В эти же такты времени производится проверка условий срабаты¬ вания продукций. Введём понятие состояния базы знаний dt. Это состояние может изме¬ няться по двум причинам: 1) в момент t + 1 из внешнего мира в базу знаний может прийти новая информация; 2) в этот момент времени в базу знаний будет занесена новая информация, как результат срабатывания некоторой продукции. Если в некоторый момент t состояние dt таково, что удовлетворяются условия для некоторого множества продукций, то все они образуют фронт готовых продукций. Основная задача управления состоит в выборе из этого фронта очередной продукции для исполнения. Для такого выбора важен вопрос о влиянии порядка выбора на оконча¬ тельный вариант рассуждений. Если имеются две продукции, и ситуация та¬ кова, что изменение состояния базы знаний, которое может возникнуть при срабатывании одной из них, сказывается на выполнимости условий срабаты¬ вания для другой, то такие продукции взаимозависимы. Если две продукции независимы, то порядок их выбора из фронта не может сказаться на результате рассуждения. Поэтому особый интерес пред¬ ставляют взаимозависимые продукции. Рассмотрим пример (заимствован у Д. Поспелова). В двухчасовой перерыв между лекциями группа студентов решает, ку¬ да пойти - в кино или в кафе - мороженное. Ясно, что выбор одного варианта исключает выбор другого. При отсутствии информации о фильме и о часах работы кафе остаётся бросить жребий, т.е. произвести случайный выбор. Но если в момент обсуждения появился сокурсник, который говорит, что фильм скучный (тем самым он меняет состояние «баз знаний» студентов), то выбор активизируемой продукции похода в кафе - мороженное станет однознач¬ ным. Рассматриваемая в примере ситуация является экстремальной. Чаще всё не так: после неудачного выбора можно вернуться к альтер¬ нативному выбору и попробовать другой вариант, если сохранено состояние базы знаний на момент выбора. Можно вспомнить известную стратегию обучения «метод проб и оши¬ бок», или хождение по лабиринту, или пересчёт участка программы с «кон¬ трольной точки» в случае сбоя компьютера и т.д. Практически все системы моделирования рассуждений в интеллекту¬ альных системах используют этот приём, который называется «бэктрекинг» (эффективно используется при логическом выводе в языке ПРОЛОГ). Не найдя аналогов в современной психологии, исследователи исполь¬ зуют эвристические приёмы, основанные на «решающих правилах», чаще 94
Лекция 5. Вывод по базе знаний всего минимизирующих время выполнения фронта готовых продукций. Рас¬ смотрим некоторые приёмы (стратегии). 1. Принцип «стопки книг» лежит в основе процедуры быстрого поиска нужной книги из стопки при повторном или регулярном обращении. Если каждый раз, использовав некоторую книгу, класть её в стопку сверху, то ча¬ сто используемые книги постепенно сосредоточатся в её верхней части, а внизу будут лежать те, которые почти никогда не требовались. Если продукции во фронте будут упорядочены по частоте их предше¬ ствующего успешного применения, а активизироваться первой будет первая из этого фронта, то принцип стопки книг будет реализован. Подобный «стопке книг» принцип применяется при буферизации памя¬ ти на «быстрых» регистрах, автоматически действующий при выполнении программы компьютером. Часто используемые данные с указанием их адре¬ сов в оперативной памяти «оседают» на регистрах буфера. Время обращения к ним значительно сокращается. Если к данным долго нет обращения, зани¬ маемые регистры переводятся в ресурс. 2. Проверка по самому «редкому» признаку производится при анализе ряда быстро следующих объектов, обладающих рядом признаков. Например, если предложено обнаружить объект данного пола, роста, размера и т.д., и среди признаков - наличие фетровой шляпы (сегодня мало кто носит шляпу), то прежде всего следует обратить внимание на этот признак. Однако изве¬ стен случай, когда террорист совершил нападение, будучи в красных носках. Конечно, при попытке скрыться он сразу бы их снял. 3. Проверка продукции с самым длинным условием А. В систему про¬ дукций вводятся метапродукции, заключающие в себе фактическую ин¬ струкцию, как выбрать продукцию из фронта. Например, Д. Поспелов сообщает об одной экспертной системе, диа¬ гностирующей инфекционные заболевания, в которой действует следующая схема метапродукции: Если инфекция есть А, и имеются продукции, входящие в состав фронта, где в условиях А упоминается слово х, и в составе фронта есть продукции, где в условиях А упоминается слово у, то продукции, у которых в А имеется слово л-, следует активизировать раньше, чем продукции, содержащие в условии А слово у. 4. Часто возможность применения той или иной продукции зависит не только от того, какие именно продукции входят во фронт, но и от того, какие продукции в этот фронт не вошли. То есть, влияние может оказывать как «положительный», так и «отрицательный» контекст, в котором происходит выбор продукции из фронта готовых продукций. 95
Глава I. Логические основы искусственного интеллекта Другой проблемой управления реализацией системы продукций явля¬ ется поиск эффективных (по критерию времени) способов проверки выпол¬ нения условий А в множестве продукций при текущем состоянии dt базы зна¬ ний. При большой БЗ процедура перебора весьма неэффективна. Каков ана¬ лог данного процесса у человека? У психологов бытует термин «поле активного внимания». В это поле попадает та часть информации, хранимой в памяти человека, которая обу¬ словливает его текущие размышления или рассуждения. Эта информация освещается, выхватывая из огромного хранилища всевозможные данные. Развивая пример буферизации памяти компьютера, отметим, что часто используемые данные при записи автоматически оседают в так называемом КЭШе - «через», параллельно направляясь в оперативную память. Зато при выборке таких данных вызов из оперативной памяти быстро прерывается, ес¬ ли эти данные обнаруживаются в КЭШе. Нечто аналогичное специалисты применяют в области БЗ, вводя окно активации знаний. С помощью такого окна активируются определённые фрагменты, использующиеся для проверки условий в продукциях. Для вы¬ числения фрагментов пользуются условиями Р, активирующими ту область продукционной системы, которая оказывается тесно связанной с фрагментом знаний, попавшим в окно активации знаний. Постусловия Q позволяют уп¬ равлять перемещением окна по полю памяти, а также его размерами. Управлять окном могут и специальные метапродукции, подобные тем, что используются для приоритетного выбора из фронта готовых продукций. До сих пор рассматривались продукции, в которых В обязательно, с ве¬ роятностью 1, следовало при активизации продукции. Однако весьма часто продукции используются для правдоподобного вывода с некоторым коэффи¬ циентом правдоподобности, как это рассматривалось в Лекции 4. Приведём пример из упоминающейся ранее экспертной системы, когда в ряде случаев эта система не может выдать рекомендацию со стопроцентной уверенностью. Она выдаёт её с оценкой правдоподобности. Если инфекция, которая требует терапии, есть менингит и пациент имеет признаки серьёзных кожных инфекций мягких тканей и микроорганизмы не окрашены по Грэму на пробах культуры и тип инфекции бактериальный то микроорганизмы, которые могут вызывать инфекцию, с правдоподобностью 0,75 есть staphylococcus coadroos или с правдоподобностью 0,5 есть streptococcus-gronp-a. При работе с правдоподобными продукциями используются приёмы, аналогичные рассмотренным в разделе 4.2. 96
Лекция 5. Вывод по базе знаний Согласившись с концепцией баз знаний и учитывая, что логические нейронные сети образуют БЗ вместе с продукцией извлечения знаний, спро¬ сим себя, как на новом уровне представления достойно закончить пример расчёта надёжности компьютера, обязательно сохраняющего рабочее состоя¬ ние в течение всего цикла управления tl Кг = Кі*Ѵ) ? Кг = Кіі2)1 Кг = ЛУ*Н) ? Лі=Лі(1)? Лі = Лі(,І) ? Лі = Л2(1) ? Л2=Л2(п)? Ру стр. со = Рустр.сб(1) ? -Рустр.сб =Рус1р.сб(,,) ? Р = Р (1) ? * реэ. pes. ; Ррез. = Ррез/И^ ? t = tV? t = t ? P = Pl P = P2 P = Pn Puc. 5.2. Информационно-справочная система «Надёжность управляющего ком¬ пьютера» 97
Глава I. Логические основы искусственного интеллекта На этапе испытаний системы управления рассчитаем надёжность ком¬ пьютера по формуле (4.1) в достаточном числе точек шестимерного фактор¬ ного пространства {КГ е \Кгтт, Кгтах], А\ е [А\тіп, А\тах], Т2 е [Я2тг", Af,ax\ Рустр.сб е [0, 1], Ррез. е [0, 1], t e [?гаги, tmax]} так, чтобы более-менее равномер¬ но покрыть этими точками всё факторное пространство. Пусть п - развивае¬ мое (при недостаточной точности) количество этих точек. Построим рецепторный слой однослойной логической нейронной сети (рис. 5.2), закрепив группы рецепторов за отдельными факторами, а внутри каждой группы - за упорядоченными по возрастанию значениями фактора. (Для определённости считаем, что никакие «координаты» двух любых выб¬ ранных точек не совпадают, хотя в действительности это возможно.) Каждый рецептор, соответствующий некоторому значению какого-то фактора («координате» точки), свяжем с нейроном, соответствующим этой точке факторного пространства. Каждый нейрон пусть указывает на значение надёжности в этой точке. Веса связей примем единичными. Введём функцию активации нейронов: F \ 6 п — Z L, если это значение превышает порог /г, < 6иг=і О, в противном случае. Порог h выбирается экспериментально. Если мы возбудим рецепторы «одной точки» до значения 1, то очевид¬ но, что максимально возбудится нейрон, соответствующий этой точке и ука¬ жет на значение надёжности в ней. А как, пользуясь принципом ассоциативного мышления, установить по произвольной ситуации, на какую или какие известные ситуации она больше всего похожа, и найти приблизительное значение надёжности? Простейший приём возбуждения рецепторов заключается в следую¬ щем. Пусть испытывается ситуация - точка {Жг*, Лі*, 12*, Р*устр.сб , Р*Рез., t*}. Найдём два значения K/J> и K;(j+V> такие, что Kr(j) < Кг* < KrJ+V). Распреде¬ лим «единицу» обратно пропорционально «расстоянию» Кг* до левого и правого ограничения, положив возбуждение рецептора К^\ равным кЯ+Ѵ)-к*„ Тогда возбуждение рецептора K]’J+X) положим равным 'Г Г к(/+1) - дополнением найденного значения до единицы. Так возбудим рецепторы и других факторов. После возбуждения рецепторов рассчитаем значение функции актива¬ ции для всех нейронов. Ответ может быть выдан двумя способами: 1) по ука¬ занию максимально возбудившегося нейрона, преодолевшего порог, т.е. по результату «голосования» в пользу решения; 2) по усреднённому ответу не¬ 98
Лекция 5. Вывод по базе знаний скольких нейронов, возбуждение которых преодолело порог. Во втором слу¬ чае значения надёжности, для счёта по известной формуле нахождения сред¬ него, выбираются с весами, равными величине возбуждения соответствую¬ щих нейронов. Таким образом, БЗ реализует информационно-справочную систему «Надёжность управляющего компьютера». Мы видим, что эта система легко модернизируется, развивается с накоплением опыта и с расширением фак¬ торного пространства, уточняется на опыте, отходя от возможной неточности формул. В процессе эксплуатации может понадобиться введение весов свя¬ зей, отличных от единичных. Представление логической нейронной сети матрицей связей позволяет легко вводить любые изменения. Конечно, вычисления по формуле (4.1) не столь трудоёмки. Но пред¬ ставьте себе «ужасные на вид» системы интегрально-дифференциальных уравнений прогноза погоды! Не зря Гидрометцентр периодически обновляет суперкомпьютеры. И эти системы уравнений надо считать ежедневно по ог¬ ромной территории от холодной Арктики до жарких песков пустыни! Только ассоциативные вычисления по БЗ, заполняемой, развиваемой и уточняемой на основе обратной связи во все возможные интервалы времени между опе¬ ративными запросами, могут выручить. 5.5. Вывод на семантической сети Кроме обычных приёмов вывода (как достоверного, так и правдопо¬ добного) для продукционных систем применяется вывод на семантической сети. Семантические сети - это наиболее общая модель представления зна¬ ний об окружающем (интеллектуальную систему) мире и способах действия в нём. Вершины семантической сети соответствуют объектам - понятиям, фактам, явлениям или процессам. Дуги, связывающие вершины, определяют отношения между объектами. Они снабжены именами или описаниями, в це¬ лом задающими семантику отношений. Д.А. Поспелов исследует пример на основе романа Э. Хемингуэя «Ост¬ рова в океане» (рис. 5.3). Роман начинается так: «Дом был построен на самом высоком месте уз¬ кой косы между гаванью и открытым морем. Построен он был прочно, как корабль, и выдержал три урагана. Его защищали от солнца высокие кокосо¬ вые пальмы, пригнутые пассатами, а с океанской стороны крутой спуск вёл прямо от двери к белому песчаному пляжу, который омывался Гольфстри¬ мом». Отобразим информацию, содержащуюся в этом отрывке с помощью семантической сети. Для этого введём понятия, обозначив их первыми бук¬ вами слов в тексте: Д - дом, СВМ - самое высокое место, К - коса, Г - га¬ 99
Глава I. Логические основы искусственного интеллекта вань, ОМ - открытое море, КП - кокосовые пальмы, С - солнце, КС - крутой спуск, ДВ - дверь, ПП - пляж песчаный, ТГ - течение Гольфстрим. Присту¬ пим к построению, постепенно вводя (определяя) необходимые отношения (рис. 5.4). Рис. 5.3. Дом был построен... Отношение R\ означает «быть между». Отношение Ri означает «при¬ надлежать». Оно применяется дважды: для указания о том, что СВМ (самое высокое место) принадлежит К (косе), и о том, что ДВ (дверь) принадлежит Д (дому). Отношение R3 интерпретируется как «находится на», а текст около 100
Лекция 5. Вывод по базе знаний вершины Д принадлежит описанию этой вершины. Отношение Ra - «защи¬ щать от», Rs - «соединять», Re - «омывать». Совместно действующие факто¬ ры объединяются скобками. В дополнительных описаниях вершин допустим произвол, позволяющий постичь смысл всего изображения. От смысловой нагрузки отношений зависит классификация семантиче¬ ских сетей. Если сеть отражает причинно-следственные (казуальные) связи, как в рассмотренном примере, такая семантическая сеть называется сценари¬ ем. Семантическая сеть отображает классификацию, если использует отно¬ шения принадлежности. Если отношения связывают аргументы функции, то такие семантические сети называются вычислительными моделями. Отметим, что различные модели рассуждений при различии интерпре¬ тации отражают общую суть и могут легко сводиться одна к другой. Так, пример расчёта надёжности компьютера можно бы было привести в данном разделе. Однако как производится логический вывод на семантической сети? Вывод на семантической сети можно представить с помощью продук¬ ционной системы, где каждая продукция имеет вид Fr\ => Frl. Слева и спра¬ ва стоят фрагменты семантической сети. В зависимости от типа продукции, она может описывать изменения в базе знаний или результаты промежуточ¬ ных шагов вывода в рассуждающей системе (решателе). В базах знаний реализация указанных продукций обычно называется процедурой поиска по образцу. В качестве образца при поиске обычно вы¬ ступает фрагмент Frl. Выполнение может быть различным. Например, если в базе знаний найден фрагмент Frl, то он удаляется, а в неё добавляется новый фрагмент Frl. Другой вариант: если в БЗ обнаружен фрагмент Frl, то утверждению Frl решатель присваивает значение ИСТИНА. Если при выводе на семантической сети фрагмент Frl добавляется в БЗ без выбрасывания Frl, то говорят о процедурах пополнения знаний. Человек в своей деятельности часто выполняет подобные процедуры, используя из¬ вестные ему знания о закономерностях внешнего мира. В более сложных случаях для поиска могут использоваться условия применения продукций, о которых говорилось при обсуждении общей фор¬ мы продукции. Например, продукционная система может иметь вид «Если имеет место Frl, то Frl, иначе Fr3». Образцы такого типа определяют аль¬ тернативные выводы в БЗ. Рассмотрим простейший пример продукции поиска фрагмента Frl в БЗ и, при обнаружении, исключения соответствующей инструкции из БЗ с до¬ бавлением в неё фрагмента Frl. Рис. 5.6. Продукция поиска фрагмента в базе знаний 101
Глава I. Логические основы искусственного интеллекта На рис. 5.5. показан начальный вид такой продукции. Вершины семан¬ тической сети соответствуют персонажам мужчинам и женщинам с извест¬ ными фамилиями. Имя вершины со знаком вопроса должно быть сформиро¬ вано на основе БЗ. Найденное имя появится в продукции справа. Отношение R\ имеет смысл «быть отцом», отношение Ri - «быть матерью», а отношение R3 - «носить фамилию». Тогда продукция, показанная на этом рисунке, мо¬ жет интерпретироваться как: «Если в БЗ есть сведения о детях, для которых Д является отцом, а К - матерью, то эту информацию из БЗ следует убрать, добавив в неё информацию о том, что все эти дети носят фамилию М». 5.6. Вопрос - ответ. Спор - Деньги вперёд, - заявил монтёр, - утром - деньги, вечером - стулья или вечером - деньги, а... утром - стулья. - А может быть, сегодня - стулья, а завтра - деньги? - пытал Остап. И. Ильф, Е. Петров. Двенадцать стульев Давно известно, что правильно сформулированный вопрос во многом содержит в себе информацию о возможном ответе. Правильно поставитъ во¬ прос можно только тогда, когда ответ на него известен. Это философское умозаключение исключительно важно знать преподавателям. Существует не¬ сколько типов вопросов к базе знаний, которые задаются наиболее часто Условно их пока делят на шесть типов в зависимости от того, какие процедуры требуются при ответе на них. 1. ЧТО-вопросы. Это вопросы типа «Что ты знаешь о Иванове?» или «Сообщи, что ты знаешь о гриппе» и т.д. Для ответа необходим обзор БЗ и извлечение необходимой информации. Однако в БЗ между единицами ин¬ формации возможны связи, например, если БЗ отражает семантическую сеть. Следовательно, необходимо определять релевантное окружение той инфор¬ мации, которая является прямым ответом на поставленный вопрос. (Релевантность - семантическое, смысловое соответствие (адекват¬ ность) поискового запроса требуемому ответу.) 2. ЛИ-вопросы. Такие вопросы предполагают конечное множество альтернативных ответов для выбора истинного варианта. То есть, для ответа необходима процедура проверки истинности всех альтернатив. Возможные вопросы: «Петя ходит в школу или в детский сад?», «Перестала Маша по утрам ходить на музыку?» Возможным ответом может быть: «Не знаю», если информация в БЗ отсутствует, либо она противоречива. 3. КАКОЙ-вопросы. Эти вопросы похожи на ЛИ-вопросы, но отлича¬ ются тем, что либо множество альтернатив является бесконечным, либо ответ определяется не по самому вопросу, а требует выполнения специальных про¬ цедур по его нахождению. Например, «Какие сотрудники института имеют детей в возрасте до пяти лет?» Поиск ответа характерен для реляционных баз данных. Поэтому КАКОЙ-вопросы часто называют типовыми вопросами к 102
Лекция 5. Вывод по базе знаний реляционным базам данных или просто реляционными вопросами. В более общем случае ответ на КАКОЙ-вопрос требует не только поиска, но и вы¬ полнения процедуры логического вывода из БЗ. Для этого может быть ис¬ пользован язык ПРОЛОГ. 4. ПОЧЕМУ-вопросы. Это вопросы о причинах явлений или фактов, перечисленных в вопросе. Ответы на них требуют использования каузальных логик. То есть, они требуют обращения к анализу причинно-следственных связей, отражённых в БЗ. После этого моделируется рассуждение, схема ко¬ торого и есть ответ на ПОЧЕМУ-вопрос. 5. ЗАЧЕМ-вопросы. Это вопросы о целях. Ответ на них внешне похож на поиск ответа на ПОЧЕМУ-вопросы, но вместо каузальных связей в БЗ ис¬ пользуются связи типа «цель - средство» или «цель - подцель». Ответом служит найденный путь, ведущий от текущей ситуации к целевой (целевым). При невозможности найти соответствующий путь при ответах на ПОЧЕМУ- вопрос или ЗАЧЕМ-вопрос ответом может быть «Не знаю» или «Отсутствует информация для ответа». 6. КАК-вопросы. Эти вопросы предполагают, что в качестве ответа на них будут выданы пояснения о способах получения тех или иных результа¬ тов. Например, если КАК-вопрос касается того, как получен некоторый ло¬ гический вывод, то в качестве ответа можно воспроизвести этот вывод или наиболее важные его части. Для этого удобно хранить в БЗ «треки» («следы», пути) ранее полученных выводов, пока вопрос типа КАК остаётся актуаль¬ ным. Из приведённой типологии вопросов ясно, что ответы на многие из них могут трактоваться как объяснения. Проблема объяснения - одна из цен¬ тральных в современных интеллектуальных системах Она обязательно долж¬ на разрешаться в экспертных системах и системах принятия решений. Поль¬ зователь должен быть уверен, что совет, данный интеллектуальной системой, верен и получен из исходных данных с учётом всей информации о задаче, имеющейся у него. В более широком смысле от интеллектуальной системы требуется не просто объяснение, а, скорее, аргументированное обоснование того результа¬ та, который получен системой. Проблему аргументации можно сформулировать, как проблему поиска тех фактов (из которых данный факт вытекает), которые могли бы обосно¬ вать проявление интересующего нас факта. Например, из каких фактов более высокого уровня - политического, экономического, морального, личностного и т.д. следует факт неуклонного снижения финансирования высшего образования? Какие факты следует изу¬ чить, чтобы обосновать наблюдаемый факт? Можно считать, что аргумента¬ ция - это такой процесс, при котором одна из сторон пытается сменить си¬ стему аксиом у собеседника, на основе приведённой совокупности фактов 103
Глава I. Логические основы искусственного интеллекта «настроить» его на вывод об истинности того утверждения, которое эта сто¬ рона защищает. Процесс такого рода в практике человеческого общения называется спором. Мы можем заключить, что вся изложенная выше теория рассужде¬ ний в большей или меньшей степени обслуживает споры. Виды спора Споры бывают самыми различными по своим целям и формам. Приведём ряд типичных видов спора. 1. Спорящий хочет увеличить собственную уверенность в справедливо¬ сти того положения, которое он отстаивает. Возможно, что в процессе аргу¬ ментации оппонента он изменит свою точку зрения, в соответствии с посло¬ вицей «В споре рождается истина». 2. Спор происходит с единственной целью убеждения оппонента в справедливости защищаемого положения. При этом лицо, выдвинувшее те¬ зис, может считать, а может и не считать его истинным. Во втором случае оправданием спора для него служит убеждение, что если оппонент примет тезис (хотя он и неверен), то оппоненту будет лучше. Например, больному внушают, что его болезнь не смертельна. Принцип «ложь во имя спасения» всегда действенен и гуманен. Два указанных вида исчерпывают понятие рационального спора. Спо¬ рящие в них имеют свои чётко осознаваемые цели и не прибегают к крими¬ нальным методам обмана. Имитация таких споров в современных интеллек¬ туальных системах вполне возможна. По крайней мере, ясно, как принципи¬ ально делать процедуры решателя и использовать возможности базы знаний. Другие виды спора реализовать в интеллектуальных системах не только труднее, но, главное, не столь актуально, учитывая не столь давно принима¬ емые обязательства чтить «Моральный кодекс строителя коммунизма». 3. Спор происходит ради победы в нём. Наградой за победу является укрепление личной установки, эмоциональное подкрепление своей всесиль- ности, корысть. В таких спорах используются обманы, подмены одних тези¬ сов другими. Таким образом, споры данного вида представляют психологи¬ ческую игру, в которой целью является не истина, а доказательство своего превосходства над другим человеком. В книге «Наполеон» Е. Тарле приводит слова своего героя: «Я бываю то лисой, то львом. Весь секрет управления за¬ ключается в том, чтобы знать, когда следует быть тем или другим». Но мы-то с вами поняли, что Наполеон читал Макиавелли! Нет, мы такой спор моделировать не будем! 4. Спор может использоваться «для убивания времени» (часто, как и другие игры). Люди спорят просто ради любви к спору, к тем эмоциям, кото¬ рые его сопровождают. 5. Спор ради обучения спору, когда неопытный спорщик обучается приёмам аргументации, уловкам и ловушкам. Такие споры использовались античными философскими школами для подготовки учеников. Сократиче¬ 104
Лекция 5. Вывод по базе знаний ские диалоги являются одним из видов такого спора (за что он, в конце кон¬ цов, поплатился жизнью). Вся силлогистика Аристотеля выросла из практики споров подобного рода. 6. Спор ради оскорбления оппонента, стремления унизить его, дока¬ зать, что его система ценностей намного хуже той, которой пользуется спор¬ щик. В таком споре люди плохо слышат оппонента. В процессе спора спорящий может имитировать предпочтительные (на его взгляд) рассуждения или действия своего оппонента, пытаясь его обма¬ нуть. В этом случае он пользуется схемами рассуждения - схемами рефлек¬ сии. Чаще всего эти схемы срабатывают как бы автоматически в случае опас¬ ности, страха, необходимости быстрого ответа, защиты от нападения (оппо¬ нента - врага), погони, преследования, аварии и т.п. Обучение ряду житей¬ ских правил способствует быстрому принятию правильных рефлекторных решений в «споре» с врагом, с правилами дорожного движения и с другими обстоятельствами. Например, «Если драки не избежать, бей первый!», «Если не знаешь что говорить, говори правду», «Не уверен, не обгоняй», «Не высо¬ вывайся», «Поступай так, как лучше детям», «Не за всеми деньгами накло¬ няйся» и др. И главным назиданием к успеху молодого человека является не мгно¬ венное (рефлекторное), а постоянно действующее рациональное правило- девиз: «Подставляйся Случаю!» Ключевые термины База знаний - база данных, обладающая возможностью логического вывода. Продукция - процедура, реализующая предикат вида «если - то». Продукционная система - композиция продукций. Фронт готовых продукций - образуют продукции, для которых удо¬ влетворяются условия выполнения. Метапродукции - продукции, управляющие выполнением других продукций, погружённых в них. Семантическая сеть - связывает вершины, соответствующие смысло¬ вым объектам, с их отношениями. Аргументация - поиск тех фактов, из которых вытекает данный факт и которые могут обосновать проявление интересующего нас факта. Часто выражается в споре, в котором одна из сторон пытается изменить систему аксиом у собеседника. Краткие итоги Е Работа с базой знаний осуществляется с помощью продукционных систем. Продукция - процедура, реализующая предикат вида «если - то». 105
Глава I. Логические основы искусственного интеллекта 2. Операции запоминания и выборки из БЗ со стороны рассуждающей системы и внешнего мира осуществляются продукциями девяти типов. 3. Полное описание продукции содержит условия применимости, сферу проблемной области и постусловия - изменения, которые необходимо внести в БЗ после выполнения данной продукции. 4. В некоторые моменты состояния БЗ могут сложиться условия для выполнения некоторого множества продукций. Они составляют фронт гото¬ вых продукций. Основная задача управления состоит в выборе из этого фронта очередной продукции для выполнения. Здесь важную роль играет взаимозависимость продукций. 5. Другим аспектом управления выполнением продукций является ми¬ нимизация времени проверки выполнения условий в множестве продукций. Для этого используются многие приёмы кэширования. 6. Продукции могут обладать коэффициентом правдоподобия. 7. Вывод по семантической сети позволяет вскрывать взаимоотноше¬ ния объектов, образуя сценарий, при отображении каузальных связей, или классификацию. 8. Правильно поставить вопрос можно только тогда, когда ответ на не¬ го известен. 9. Проблема аргументации - проблема поиска фактов, которые могли бы обосновать проявление интересующего нас факта. Вопросы 1. Что такое продукция? 2. Что собой представляет продукционная система? 3. Дайте и поясните полное описание продукции. 4. Какие типы продукции вы знаете? 5. Что такое фронт готовых продукций? 6. Осветите способы сокращения времени проверки условий выполне¬ ния продукции. 7. Что собой представляет метапродукция? 8. Какие типы вопросов вы знаете? 9. Охарактеризуйте проблему аргументации. 10. Что понимается под рациональным спором? Лекция 6. Десять задач искусственного интеллекта по Д.А. Поспелову и возможности логических нейронных сетей Аннотация. Излагается точка зрения Д.А. Поспелова на основные за¬ дачи искусственного интеллекта. Рассматриваются возможности решения 106
Лекция 6. Десять задач искусственного интеллекта по ДА Поспелову и возможности... этих задач с помощью логических нейронных сетей, реализующих принцип ассоциативного мышления. Ключевые слова, правдоподобная аргументация, проблема оправдания, релевантные знания, понимание текстов, когнитивная графика, метазна¬ ния. . . . и написал на скрижалях слова завета, десятословие. Ветхий Завет. Исход 6.1. Переход к аргументации В начальный период развития ИИ предполагалось, что все, или почти все задачи, претендующие на интеллектуальность, можно решать путём по¬ строения некоторого логического вывода. Такое предположение породило многочисленные работы в области автоматического доказательства теорем, разработки языков представления знаний логического типа, в частности, хо¬ рошо известного языка ПРОЛОГ. Значительные усилия были затрачены на создание методов вывода в исчислении предикатов, которое различным обра¬ зом модифицировалось, чтобы адаптировать его для нужд искусственного интеллекта. Классический подход в ИИ, реализующийся под явным давлением ло¬ гических моделей в представлении знаний, породил экспертные системы, ос¬ нованные на продукционных правилах, теорию реляционных баз данных, теорию решателей и планировщиков. Но уже к середине 70-х годов постепенно выясняется, что классических логических моделей и схем вывода явно не хватает для того, чтобы строить достаточно богатые и практически значимые интеллектуальные системы. Принципы, опирающиеся на классическое понимание формальной системы дедуктивного вывода, стали слишком узкими для решения задач ИИ. Воз¬ никло нечто вроде кризиса в физике, ярко проявившегося в начале ХХ-го ве¬ ка. В чём же состояла основная проблема? i Рис. 6.1. Д.А. Поспелов 107
Глава I. Логические основы искусственного интеллекта Логический подход в его классической форме требовал для каждой предметной области, для которой применялись методы ИИ, наличия полного перечня исходных положений, которые можно было бы считать аксиомами этой предметной области. Их существование (сюда естественно включаются и априорно задаваемые правила вывода) обеспечивало замкнутость исполь¬ зуемых моделей, позволяло ставить и решать круг проблем, связанных с пол¬ нотой, результативностью и непротиворечивостью используемых моделей и процедур. Однако различные приложения, к которым стремился искусственный интеллект, оправдывая свою практическую значимость, в подавляющем большинстве случаев не давали возможностей построения аксиоматических систем. Знания о предметных областях, как правило, были неполными, не¬ точными и литъ правдоподобными, что приводило к эффектам фальсифика¬ ции ранее полученных утверждений, получаемых в результате последова¬ тельного (даже при так называемых параллельных модификациях) процесса логического вывода. Так возникла проблема замены формальной системы с присущими ей процедурами дедуктивного вывода иной, столь же мощной моделью, где от¬ ражались бы основные особенности поиска решения в плохо определённых, постоянно уточняющихся предметных областях, которые описываются как открытые системы с обновляемыми знаниями об их строении и функциони¬ ровании. Это потребовало перехода в нечёткую логику, где классические ме¬ тоды логического вывода были бы щедро «разбавлены» вероятностным под¬ ходом. С конца 70-х годов ХХ-го века подход, опирающийся на идею строгого логического вывода, начинает постепенно сменяться новым подходом, про¬ возглашающим, что основной операцией при поиске решения должна быть правдоподобная аргументация. Работа с аргументами «за» и «против», снаб¬ жённых соответствующими весами, приводит к процедурам с этими весами. Это обстоятельство оказалось решающим для перехода к аргументации в ин¬ теллектуальных системах. Здесь-то мы и наблюдаем требование совершенствования искусствен¬ ного аппарата мышления, перехода к логическим нейронным сетям, как к средству воплощения этого аппарата, в большей степени адекватного «моз¬ говым» процессам. Таким образом, справедливы следующие доводы в пользу применения логических нейронных сетей. 1. При «чисто логическом» подходе предполагается точное знание ло¬ гических функций fj, определяющих аксиоматику СПР. В общем случае, практически, существует лишь далеко не исчерпывающий опыт, на абстракт¬ ном уровне образующий таблицы для ассоциативного поиска решений. (Как мы доходим до полного автоматизма при действии с рулевым колесом авто- 108
Лекция 6. Десять задач искусственного интеллекта по ДА Поспелову и возможности... мобиля, выбирая угол поворота? Ведь, первый раз сев за руль, мы сразу же въехали в бордюр.) Имея в виду сложные системы принятия решений (СПР), приходится немедленно сталкиваться с трудно формализуемыми задачами. Именно для их решения привлекаются средства ИИ. Знание логических функций, формально описывающих причинно-следственные связи, это про¬ блема из области теории познания, как известно, не имеющая отношения к прикладному уровню оперативного мышления. Тем не менее, такие функции могут быть построены приближённо на основе указанных выше таблиц де¬ дуктивного вывода. Но для этого необходимо решить проблему моделирова¬ ния индуктивного вывода на основе анализа и абстрактного обобщения свя¬ зей в таких таблицах. 2. Неопределенность исходной информации о ситуациях исключает точный ответ на вопрос о наличии или отсутствии события и делает непра¬ вомерным использование исключительно булевых переменных. Высказыва¬ ния в действительности не бывают истинными или ложными, с вероятностью 1 или 0, как это предполагается в математической логике. Высказывания об¬ ладают степенью достоверности, а достоверность принимает действитель¬ ное значение на отрезке [0, 1] и подчиняется известным положениям теории вероятности. 3. Медицинские исследования человеческого мыслительного аппарата - мозга исключают наличие под черепной коробкой таких приборов, как конъюнкторы и дизъюнкторы. Вместо этого обнаружено до 100 млрд, (назы¬ вают уже и большее число) унифицированных и стандартных нейронов, объ¬ единённых в сеть локально-случайной и глобально-детерминированной кон¬ фигурации, со слабой подверженностью генетической преемственности. Нейроны реализуют пороговую функцию активации, монотонно возрастаю¬ щую, в области преодоления порога, от каждого из до 10 000 входных воз¬ буждений и формирующих возбуждение на единственном ветвящемся выхо¬ де. Веса входных связей нейронов, способные к изменению, обеспечивают направленное распространение возбуждения в нейронной сети. Это позволя¬ ет создавать и запоминать схемы, фиксирующие причинно-следственные связи, подобные электронным. 6.2. Проблема оправдания При заполнении памяти интеллектуальных систем знаниями, получен¬ ными от экспертов, хорошо знающих данную предметную область и способы решения возникающих в ней задач, инженеры по знаниям столкнулись с од¬ ной весьма любопытной особенностью. При объединении баз знаний, сфор¬ мированных различными экспертами, каждая из которых в отдельности до¬ вольно успешно решала тестовые задачи, возникала противоречивая база знаний. Если это были базы, в которых знания фиксировались в виде продук¬ 109
Глава I. Логические основы искусственного интеллекта ционных правил, то возникали правила с одинаковыми левыми частями и противоречащими друг другу правыми частями. Как скоро стало очевидным, явление это объяснилось тем, что экспер¬ ты погружали свои профессиональные знания в некоторые концептуальные модели предметных областей, которые могли не совпадать у разных экспер¬ тов. Если, например, речь шла об извлечения знаний из области онкологиче¬ ских заболеваний, то в качестве таких различных моделей могли выступать вирусная или генетическая модель порождения злокачественных опухолей. Если же речь шла о добыче нефти и поиске наиболее перспективных мест её разведки, то альтернативными концептуальными моделями оказывались мо¬ дели органического и неорганического происхождения нефти. Приверженцы той или иной концептуальной модели сознательно (а иногда подсознательно) отбирали только те знания, которые согласовывались с принятой концепту¬ альной моделью, отвергая те знания, которые ей противоречили (или, при¬ уменьшая их вес правдоподобия). Другими словами, использовался своеоб¬ разный механизм «психологической защиты» от знаний, разрушающих при¬ нятую концептуальную модель, которая оправдывалась принятой системой знаний. Ясно, что механизмы оправдания, связанные с искажением весов прав¬ доподобия, накопленных в данной предметной области знаний (включая и отторжение некоторых знаний), нужно изучать и учитывать при заполнении баз знаний и их объединении. Но как это делать? По-видимому, в этой «горячей точке» (по выражению Д.А. Поспелова) можно сделать лишь пессимистический прогноз. Дело в том, что помимо разнящихся предметных областей следует учесть, что искусственный интеллект является моделью «естественного». А любое моделирование немыслимо без анализа целевой (критериальной) функции. Для чего создаётся система ИИ? Что она отображает, а главное, - что должна оптимизировать? Повышать достоверность вывода (Рвывода —» 1)? Сокращать время принятия решения (Трешения —» minfl Или задача является многокритериальной? Поэтому механическое объединение разных баз знаний, без согласова¬ ния целевой функции ничего не даёт, пока неизвестно, что оно должно дать в результате. Целевая функция существенно влияет на всю модель, на обоснование и выбор факторов (образующего множества событий) факторного простран¬ ства. И здесь не поможет даже общность предметной области. Если один банк существует для централизации прибыльных инвестиций, а другой - для валютных спекуляций, то объединение плута и мошенника уже представля¬ ется весьма трудной задачей. Им надо согласовать общую цель, определить общие показатели, создать их приоритетный ряд и т.д. Различие целевых функций даже в одной предметной области может приводить к несовместимости баз знаний. Например, в политике отсутствие ПО
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... определений принимается по определению, - для обслуживания и оправда¬ ния интересов, демагогии, передёргивания фактов, оглупления народных масс и т.д. В математике, в том числе в математической логике, основой рас¬ суждения являются строгие, непротиворечивые, исчерпывающие определе¬ ния. Разумный математик не возьмётся автоматизировать принятие полити¬ ческих решений. Для этого их лживость должна стать очевидной. А кому это нужно? Хотя где-то в промежуточной области социологических исследова¬ ний такое сотрудничество возможно. Напоминая о том, что ИИ является моделью интеллекта естественного, следует не забывать, что человек - общественное животное, призванное на базе взаимного обучения и компромиссов строить «светлое будущее». И можно только мечтать о том, чтобы его борьба за мир во всём мире проводи¬ лась не силовыми методами. Таким образом, несовместимость баз знаний (которую можно отнести к свойству Природы) следует считать закономерной и, прежде всего, - исхо¬ дящей из различия целевых функций. 6.3. Порождение объяснений Различие в механизмах поиска решений у человека, специалиста по решению определённого класса задач, и интеллектуальной системы приводит к появлению эффекта непонимания. Видя окончательный результат деятель¬ ности интеллектуальной системы, специалист не может оценить степень его достоверности (даже если система одновременно с решением выдаёт вычис¬ ленную ею оценку). Процесс «верить - не верить» не может привести к ка¬ кому-либо разумному результату, если нет какой-то дополнительной инфор¬ мации. Эта информация, начиная с первого поколения экспертных систем, выдаётся специалисту по его требованию в виде объяснения. Объяснение (термин «объяснение» прочно прижился в искусственном интеллекте, вместо слова «обоснование») может быть различным. Наиболее распространены шк-объяснения и иочет/у-объяснения. При лт*-объяснении система выдаёт пользователю информацию о процедуре получения решения, например, выдаёт ему всю трассу движения по дереву вывода. При почему- объяснении система включает в текст объяснения те основания, которые бы¬ ли использованы ею в процессе поиска решения. Другие типы объяснений (что-объяснения, з<чч«л/-объяснения и т.п.) пока в интеллектуальных систе¬ мах практически не используются. В начальный период развития экспертных систем объяснение порожда¬ лось жёсткими процедурами, связанными с наличием априорно заданного сценария объяснения, заполняемого конкретными сведениями в процессе по¬ иска решения. Такой подход в какой-то мере годится для как-объяснений и несколько хуже подходит для иочежу-объяснений. Но он совершенно непри¬ годен при необходимости порождения объяснений иных типов. Ill
Глава I. Логические основы искусственного интеллекта Ясно, что проблема генерации объяснений связана с наличием в памяти интеллектуальной системы концептуальных моделей предметных областей и энциклопедических знаний об особенностях этих областей. Для порождения объяснений нужны базы знаний энциклопедического типа. Энциклопедические базы знаний отличны по своей структуре и назна¬ чению от проблемно-ориентированных баз знаний, применяемых в современ¬ ных экспертных и других интеллектуальных системах. Организация знаний в энциклопедических базах, механизмы порождения текстов по запросам к ним требуют решения ряда проблем, относящихся к форме представления знаний в таких базах и принципам построения системы отношений на хранимых в них знаниях. Далее будут рассмотрены возможности и примеры построения инфор¬ мационно-справочных систем на логических нейронных сетях, описывающих результаты моделирования или даже стратегии лечения. Выдаваемый по сложившейся ситуации (запросу) текст ответа может содержать все необхо¬ димые обоснования - и «как», и «почему». Таким образом, как энциклопеди¬ ческие, так и проблемно-ориентированные базы знаний могут быть успешно реализованы с помощью логических нейронных сетей. При этом нейронная сеть должна быть открытой для модификации зна¬ ний, их уточнения и дополнения. Однако такая модернизация нейронной сети должна производиться на основе оценки результатов её работы. Тогда, для обратной связи, должна существовать возможность параллельного получения правильных результа¬ тов для сравнения с теми, что даёт логическая нейронная сеть, или получения оценок возможного отклонения. Выходит, что явное присутствие модели предметной области обязате¬ льно? Но следует спросить, а зачем она, нейронная сеть, тогда нужна? Для ответа необходимо использовать исторический опыт. В конце 70-х, начале 80-х годов стало ясно, что создание суперЭВМ, удовлетворяющих требованиям к производительности со стороны сложных управляющих си¬ стем, на основе традиционных алгоритмов вычислений невозможно. Только средства ИИ, использующие «бесформульные» вычисления на основе таб¬ личной модели ассоциативного мышления, способны заменить громоздкие алгоритмические вычисления (вспомним «японский вызов») и, следователь¬ но, решить проблему эквивалентной сверхвысокой производительности. (Че¬ ловек - сложнейшая управляющая система выполняет самые разнообразные жизненные функции, много дней не считая даже сдачу в табачном ларьке.) Следовательно, не говоря уже о трудно формализуемых задачах, логи¬ ческие нейронные сети универсально решают проблему достижения сверх¬ высокой производительности. Как же совместить «быструю» работу нейрон¬ ной сети с трудоёмким контролем правильности? Открываются две замечательные возможности, основанные на ситуа¬ ционном управлении Д.А. Поспелова. 112
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... 1. Модель ситуационного управления, основанного на табличном зада¬ нии ситуаций и связанных с ними решений, органично сплетается с моделью логической нейронной сети на основе причинно-следственных связей вида «если - то». То есть, попросту реализуется логической нейронной сетью. Максимально упрощается процедура интерполяции промежуточных решений на основе усреднения высокого возбуждения нескольких нейронов выходно¬ го слоя. При этом для развития и коррекции нейросети применима вся теория ситуационного управления. 2. Однако более значительные перспективы связаны с возможностью построения самообучающихся систем управления. Здесь важным является традиционный характер функционирования сложных систем, когда в интер¬ валах времени отсутствия запросов на обслуживание производится функцио¬ нальный контроль. Пусть логическая нейронная сеть реализует таблицу, в смысле ситуационного управления содержащую ситуации (задаваемые до¬ стоверностью событий на рецепторном слое), по которым известны прини¬ маемые решения (они закрепляются за нейронами выходного слоя). Таблица имеет некоторый текущий вид, сформированный в режиме обучения - пред¬ варительного или динамического. В рабочем режиме эта таблица использу¬ ется для оперативного принятия решений. В случае отсутствия запросов на обслуживание система переходит в режим динамического обучения. А имен¬ но, случайным образом формируется запрос на обслуживание - случайная или подчиняющаяся некоторой стратегии ситуация. Логическая нейронная сеть на основе текущего вида указанной таблицы обрабатывает запрос и формирует решение. Эта же ситуация обрабатывается моделью предметной области, в результате чего находится точное решение, соответствующее дан¬ ной ситуации. Если отклонение нейросетевого решения удовлетворяет тре¬ бованиям точности, система приступает к анализу другой случайной (или стратегически обоснованной) ситуации. В противном случае нейросеть «до¬ учивается»: фиксируется входная ситуация (для этого производится закреп¬ ление или дополнение нейронов-рецепторов), выделяется нейрон выходного слоя для указания на точное решение и производится трассировка, связыва¬ ющая причину со следствием. Лучше всего использовать для этого одно¬ слойные логические нейронные сети. Таким образом, та условная таблица «ситуация - решение» развивается до насыщения, при котором возрастает уверенность в полном обучении си¬ стемы. Человеческая практика знает примеры таких самообучающихся систем. Одна из них обусловлена правилами стрельбы в артиллерии, где система «стреляющий + батарея» обучается на местности, трансформируясь в своей работе от трудоёмкой подготовки данных и пристрелки к переносу огня от поражённых целей или реперов (условных реальных целей, поражаемых не в боевых условиях). Замечательной командой по окончании каждой стрельбы является: «Стой! Записать...», по которой фиксируются пристрелянные уста¬ 113
Глава I. Логические основы искусственного интеллекта новки по поражённой цели для дальнейшего использования при переносе ог¬ ня. 6.4. Поиск релевантных знаний Базы знаний в интеллектуальных системах используются в самых раз¬ личных процедурах, связанных с вводом знаний, преобразованием и исполь¬ зованием их для поиска решений. Все эти процедуры требуют наличия меха¬ низмов, которые позволяли бы по тексту запроса к базе знаний найти в базе именно те знания, которые понадобятся для получения ответа. В отличие от баз данных, для которых механизмы поиска ответов на запросы достаточно хорошо изучены, соответствующие проблемы для баз знаний пока ещё далеки от каких-либо эффективных решений. Известно, что основным механизмом реализации процедур поиска в базах знаний служит поиск по образцу, являющийся своеобразным видом ассоциативного поиска. Но основной проблемой остаётся поиск ответа на вопрос: «Как сфор¬ мировать образец по тексту поступившего запроса?». Сложность этой проблемы можно проиллюстрировать на следующем простом примере. Пусть в систему введён текст: «Петя залез на стул, открыл дверцу заветного шкафа, достал конфеты и быстро, торопясь, съел несколько штук. Вечером мать, доставая конфеты для чая, посмотрела на Петю и сказа¬ ла: «Странно. Конфет стало меньше». Петя густо покраснел». Предположим, что интеллектуальная система должна ответить на во¬ прос: «Почему Петя покраснел?» На основании какой информации она смо¬ жет это сделать? Как мы сами отвечаем на подобные вопросы? Проблема поиска релевантной некоторому тексту информации пока остаётся нерешённой. В этой области пока больше вопросов, чем ответов. Возможно, что появление энциклопедических баз знаний облегчит эту зада¬ чу. 6.5. Понимание текстов Что значит понять текст? Ответ на этот вопрос, приемлемый в равной степени для лингвиста, психолога или философа, отсутствует. Феномен по¬ нимания во многом ещё остаётся загадочным. В интеллектуальных системах имеется способ уточнить интерпретацию этого термина. Можно, например, считать, что система понимает введённый в неё текст, если с точки зрения некоторого человека (или группы экспертов) она правильно отвечает на все вопросы, связанные с информацией, отражённой в тексте. Логические нейронные сети отвечают на вопрос: «На что более всего похож предъявляемый образ, и какие ассоциации с этим связаны?» Но в этом и заключается задача понимания текста! 114
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... Исследуя процесс понимания абстрактного, формализованного изоб¬ ражения человеческой мысли, каким является текст, надо вскрыть историче¬ ские корни необходимости и развития средств такого изображения. Первобытный человек поступал прямо, с присущей ему непосредствен¬ ностью. Он изображал мамонта - объект своих вожделений - на стене пеще¬ ры. Глядя на это изображение, особенно перед охотой, он возбуждал в себе сложную гамму чувств: красоты, ярости, восторга силы, любовной жертвен¬ ности, борьбы, надежды и уверенности в победе и, наконец, - возбуждающе¬ го обострения голода. Если включить воображение, можно увидеть, что все человеческие чувства можно стимулировать, глядя на одно лишь наскальное изображение мамонта, сцены охоты, битвы (не говоря уже о благотворном, регулярном - не менее одного раза в год - посещении Третьяковской гале¬ реи). Изначально чувственный подход лежал в основе изображения и форма¬ лизации мысли. Именно этот подход и развивался с появлением письменно¬ сти. Первые опыты письма основывались на образности и постепенном аб¬ страгировании. С помощью изображения зверюшек, птичек, рыбок и чело¬ вечков, с нехитрыми связками, формировалась и отображалась мысль - за¬ пись события, назидания, любовного послания и т.д. Целью, прежде всего, являлось ассоциативное возбуждение чувственности. Дальнейшая формализация пошла по пути абстрагирования при изоб¬ ражении мысли: слова-символы, отображающие объекты, стали отображать комбинациями условных элементов из некоторого их набора, что характерно, например, для клинописи. Это уже подавляюще действовало на чувствен¬ ность, отодвигало непосредственное воздействие на неё, требовало хладно¬ кровных познаний, образования. Фонетическое разложение звукового языко¬ вого изображения (применение букв - звуков) всё далее уводило человека от чувственных основ мышления, превращая его в сложную информационно¬ логическую машину, использующую абстрактные представления. Возможно, те народы, которые оказались в стороне от бурной языковой формализации, сохранившие образность мышления и языка, условность вос¬ приятия, ассоциативность, значительно более продвинулись в развитии чув¬ ственности, в утончённости интеллектуальной организации? Что в большей степени и непосредственно влияет на чувственное восприятие, на эмоцио¬ нальное состояние: буква или иероглиф? Может быть здесь, на пути сохране¬ ния и развития образности мышления, кроются истоки высоких достижений в области тонкого, фантасмагорического, многообразного и чувственного ис¬ кусства? Или - предрасположенность и достижения в области высоких тех¬ нологий и микроминиатюризации? Может быть народы, пошедшие по пути фонетического разложения мысли на составляющие буквы и звуки, притупи¬ ли своё чувственное восприятие, стали «толстокожими» и чёрствыми, с глу¬ пой уверенностью проповедуя своё превосходство? 115
Глава I. Логические основы искусственного интеллекта Понимая, что ИИ является моделью «естественного» интеллекта, необ¬ ходимо сформулировать целевую функцию. Что означает - понимание тек¬ ста? Возбуждение чувственности? Выполнение приказа? Запись новой ло¬ гической цепочки «причина - следствие», «если - то»? В любом случае это адекватное реагирование, и участие в этом логических нейронных сетей (как и самого мозга) несомненно. Известны исследования по смысловой обработке текстов. Простейшие из них касаются текущей (в данный исторический период) частоты появле¬ ния некоторых значительных, определяющих, знаковых, символических слов и выражений, могущих быть положенными в основу определённых выводов на базе исторического опыта. Несомненно, высокая частота появления имени важного должностного лица, в сочетании с некоторыми другими словами, определённо влияет на настроение общества, воскрешая воспоминания о культе личности. Слова «реформирование армии», «дедовщина», «контрактник», «антитеррористиче¬ ская операция» и др. напрямую влияют на высокую привлекательность плат¬ ного высшего образования, аспирантуры и т.д. Так создаётся значительная составляющая для автоматизированного содействия эксперту-политологу, а также политтехнологу, при прогнозировании общественного развития. Несомненно также пособничество логической нейронной сети в лекси¬ ко-графическом анализе текстов для повышения уровня осмысленного пере¬ вода на другие языки. Такая интерпретация связана с классификацией типов вопросов, кото¬ рые, в свою очередь, определяют уровни понимания текста. На первом уров¬ не все вопросы прямо связаны с предложенным текстом и ответы на них в явном виде содержатся в этом тексте. Если использовать вышеприведённый текст про Петю, съевшего конфеты, то вопросами первого уровня могли бы быть, например, следующие: «Куда залез Петя?» или «Что сказала мать?» Вопросы второго уровня требуют специального логически получаемого рас¬ ширения текста. Ибо ответы на них в явном виде в тексте отсутствуют. При¬ мер такого вопроса: «Почему конфет стало меньше?». Ответ на такой вопрос опирается на некоторую схему рассуждения. Третий уровень понимания свя¬ зан с расширением текста за счёт привлечения релевантных знаний. Пример такого вопроса был приведён при обсуждении соответствующей проблемы. Но возможны и более высокие уровни понимания. Например, уровни, свя¬ занные с тем, что текст понимается не буквально, а метафорически. Особым случаем понимания текста является вычленение из него прагматической со¬ ставляющей, некоторого руководства к действию. Такая интерпретация про¬ цесса понимания тесно связана с задачей планирования поведения на основе текстового описания условий и целей. Какие ассоциативные механизмы предлагает логическая нейронная сеть для поиска релевантных (адекватных, соответствующих смыслу вопро¬ 116
Лекция б. Десять задач искусственного интеллекта по Д. А Поспелову и возможности... са) знаний и, в частности, для логического объяснения необходимости нака¬ зания Пети-сладкоешки? Пусть любящая мама, руководствуясь высокими современными требо¬ ваниями к естественному интеллекту, использует широко рекламируемую базу знаний МОЯ СЕМЬЯ, предварительно адаптировав и заполнив её акту¬ альными данными, а также логическими причинно-следственными связями и даже скорректированными весами. Несомненно, мама «ведёт» свою базу зна¬ ний, отслеживая условия жизни и семейные обстоятельства. Рассмотрим фрагмент этой базы знаний (рис. 6.2). 117
Глава I. Логические основы искусственного интеллекта В логической нейронной сети на входном, рецепторном слое отобра¬ жены все действующие лица, предметы и даже обстоятельства. Нейронная сеть использует обратные связи, что развивает представление о рецепторном слое, т.к. установившееся возбуждение нейронов в данном случае двух слоёв вносит свой вклад в решение. Первоначально мама, обнаружив недостачу и не сомневаясь в совер¬ шении шкоды, сообщает значительное возбуждение нейрону «Шкода». Од¬ нако сообщённая величина возбуждения, соответствующая предполагаемой достоверности события всё же меньше единицы, т.к. мама самокритична, и по забывчивости могла сама съесть те конфеты. Так как шкодливыми членами семьи являются Петя и Кот Вася, мама определяет их участие по принципу «фифти-фифти», полагая равными 0,5 величины возбуждения нейронов «Петя» и «Кот Вася». Но факт, что конфет стало меньше, и мама максимально, до единичного значения, возбуждает нейрон «Конфеты». Целесообразно, во избежание коллизии, исследовать только одно про¬ исшествие. Другое происшествие, например, связанное с оборванной зана¬ веской, скорее всего, Котом Васей, мама собирается исследовать потом. Мама «топает» мышью, запуская нейросеть. В соответствии с потакто- вой работой модели нейронной сети, рассчитываются значения возбуждения нейронов 1-5. Максимально возбуждается нейрон 1, обуславливая необхо¬ димость произнесения фразы, соответствующей первому этапу дознания. С помощью отрицательной обратной связи «нейрон 1 —» «Кот Вася» уменьша¬ ется значение возбуждения нейрона «Кот Вася», принижая роль Кота Васи в данном происшествии. Так как укоризненное замечание высказано, наступа¬ ет второй этап дознания. С помощью положительной обратной связи максим¬ ально возбуждается нейрон «Укор Пете». Чтобы не допустить зацикливание на этом этапе дознания, с помощью отрицательной связи «Укор Пете» —» нейрон 1», исключается повторение высокого возбуждения нейрона 1. Те¬ перь максимального возбуждения достигает нейрон 3, связанный с заявлени¬ ем «Петя густо покраснел». Обратная связь «нейрон 3 —» «Петя» призвана повысить достоверность участия Пети в исследуемом происшествии, т.е. до¬ стоверность его вины. Теперь осталось выяснить, каким образом Петя достал конфеты. Мама максимально, до единичного значения, возбуждает нейрон «Шкаф», и с по¬ мощью высоких значений возбуждения нейронов «Петя» и «Конфеты» мак¬ симально возбуждается нейрон 5, выдающий текст соответствующего объяс¬ нения. Нейросеть, несомненно, отражает текущий исторический период, ибо, когда Петя вырастет большой, ему не надо будет вставать на стул, чтобы во¬ ровать конфеты из шкафа. Так что мама должна постоянно отслеживать те¬ чение жизни и корректировать базу знаний. 118
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... Использование обратных связей повышает актуальность фактора вре¬ мени и требует перехода от статического, аналитического описания СПР с помощью системы логических выражений, приведённой выше, к представле¬ нию алгоритмической, логической схемы имитационного моделирования. И хотя представленная здесь схема по-женски не слишком последовательна, но, - жить можно! Необходимо отметить, что рассмотренная логическая нейронная сеть, являясь средством принятия решений, не производит статический анализ текста. Однако следует предположить эффективность подобного логического вывода на основе анализа текста, о котором говорит Д.А. Поспелов. 6.6. Синтез текстов С проблемами поиска релевантного знания и понимания текстов весьма тесно соприкасается ещё одна проблема, привлекающая внимание специали¬ стов, работающих в ИИ. Она связана с разгадкой механизмов, лежащих в ос¬ нове процедур порождения текстов на заданную тему. Без ответов на возни¬ кающие тут вопросы нельзя организовать полноценный обмен информацией между людьми и системами искусственного интеллекта. Ибо механизм гене¬ рации целенаправленного текста вместе с механизмом анализа и понимания текстов образует основу процесса коммуникации - главного процесса в орга¬ низации человеческого поведения и реализации всех видов его деятельности. Как и процесс понимания, процесс синтеза текстов имеет многоуровне¬ вую структуру. После зарождения мотивов его генерации и осознания целей, которые предполагается достигнуть в акте общения, наступает этап порож¬ дения когнитивной структуры текста. Этот этап реализуется на уровне внут¬ ренних представлений системы о мире, хранящихся в базе знаний. Знания, релевантные целям, которые направляют процесс «строительства» текста, отбираются некоторым планировщиком на знаниях и собираются во внут¬ реннюю структуру текста. После этого на уровне лингвистической компо¬ новки текста другой планировщик превращает эту структуру в линейный текст на естественном языке. Этот текст ещё лишён того, что в психолингви¬ стике называют читабельностью. Он ещё слишком связан с машинными представлениями. Куски плохо пригнаны друг к другу, отсутствует гладкость переходов и ясность изложения целей. Эти недостатки «глубинного текста» исправляются на третьем уровне генерации, который реализуется стилисти¬ ческим планировщиком. Описанная процедура генерации ставит перед её создателями ряд про¬ блем, не решённых к настоящему времени. Например, неясно, какие принци¬ пы лежат в основе построения когнитивных структур текстов. В пользу того, что такие принципы существуют, убедительно свидетельствуют, например, эксперименты по генерации текстов волшебных сказок или музыкальных произведений (также текстов, но использующих специальный язык для об- 119
Глава I. Логические основы искусственного интеллекта щения с пользователями). В первом случае когнитивная структура определя¬ ется набором глубинных функций В.Я. Проппа, задающих достаточно жёст¬ кий сценарий будущего текста. Во втором случае имеется конечная система правил, делающих процедуру композиции в нужной мере формальной. Но остаются, по крайней мере, две важные проблемы, решение кото¬ рых пока не найдено: а) как цели связаны с когнитивной структурой и б) как описываются когнитивные структуры тех типов текстов, которые нужны, например, в процессе естественно-языкового диалога. Большое внимание к проблемам теории речевых актов (нового направления в лингвистике) со сто¬ роны специалистов по ИИ подогревается надеждами найти здесь ответы на поставленные вопросы. Наименьшей проблемой является переход от нелинейной структуры текста к её линейному представлению. Этот переход тесно связан с исследо¬ ваниями по гипертекстам. Определённый бум, возникший в этой области, как раз и связан с осознанием того факта, что линейный по форме текст, как пра¬ вило, является внешним кодом нелинейной структуры, на которую он «натя¬ нут». Гипертекстовые технологии призваны не только обеспечить возмож¬ ность работы с нелинейным представлением текстов, но и должны как-то решать задачи его линеаризации и перехода от линейного представления к гипертекстовому. Продолжим рассмотрение приведённого выше примера, желая полу¬ чить определённые обобщения, касающиеся формирования текстов умоза¬ ключений, и пытаясь подняться на более высокий уровень логического выво¬ да. Это поможет при рассмотрении предлагаемой «горячей точки». В результате проделанных мамой усилий оказались максимально воз¬ буждёнными, даже с единичным значением, несколько нейронов, и мы вспо¬ минаем школьный урок детства. Учительница говорит: «Дети, придумайте рассказ со словами «шкода», «шкаф», «конфеты», «ай-яй-яй», «густо покраснел». Дети усиленно ищут, пробуют возможные связи, напрягая уже сложившиеся ассоциации и навы¬ ки3. Наконец, отличник Коля произносит рассказ - умозаключение, запом¬ нившееся детьми на всю жизнь, как богатый источник творческого подража¬ ния: «Петя совершил шкоду. Он стал на стул и достал из шкафа конфеты. А когда мама сказала «Ай-яй-яй», он густо покраснел». Согласимся, что это урок более высокого уровня мышления, хотя всего лишь дедуктивного. Однако в нём уже содержатся элементы индуктивного мышления, т.к. он предполагает анализ и обобщение не только сложившейся ситуации, но содержит и попытку абстрагирования - анализ причинно- следственных связей, присущих этой ситуации из жизни Коли. 3 Исследование методов и процессов начального обученіи весьма благотворно влияет на результативность исследований в области логических нейронных сетей. 120
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... Приведённая схема порождает схему логическую, определяя действия алгоритмиста-исследователя. Значит, логическая схема - прообраз логиче¬ ской нейронной сети - в решении этой «горячей точки» занимает главное ме¬ сто. Есть ли здесь место обобщению логической схемы до уровня логиче¬ ской нейронной сети? Есть, в том случае, если цели и средства определены нечётко. Например, «проектируемая» сказка, - насколько должна быть весёлой, грустной, назидательной, «страшной»? А на что должны быть похожи сред¬ ства её выражения, - немножко баллада, немножко стихи? С неизбежностью возникают веса факторов, приводящие к столь же взвешенным решениям. Приходится переходить в область вероятностей, нечётких множеств и других недетерминированных механизмов. А это уж точно - логические нейронные сети. 6.7. Когнитивная графика Рис. 6.3. П. Пикассо. Купальщицы Исторически сложилось так, что системы технического зрения и ма¬ шинной графики всегда находились где-то на окраине области ИИ. Как и мо¬ дели распознавания образов, методы, используемые для решения возникаю¬ щих здесь задач, по своей сути были мало чем похожи на те, которые тради¬ ционно использовали специалисты по искусственному интеллекту. Для клас¬ сических «систем, основанных на знаниях», как часто называются эксперт¬ ные и другие интеллектуальные системы, уровень сенсорных и перцептив¬ ных процессов, играющих фундаментальную роль при зрительном восприя¬ тии или восприятии речи, оказался слишком «мелким». В их базах знаний был реализован куда более «крупный» уровень ментальных представлений. 121
Глава I. Логические основы искусственного интеллекта И пока специалисты по использованию зрительной и акустической информа¬ ции в интеллектуальных системах занимались «нижними» уровнями воспри¬ ятия и генерации, остальные специалисты, работающие в области ИИ, не находили с ними общего языка. Настоящее общение с ними началось в 80-е годы, когда стали появ¬ ляться первые исследования в области ментальной интерпретации перцеп¬ тивных образов (анализ трёхмерных сцен) и в области анимации зрительных картин, связанных с ментальными представлениями. Установление связи между текстами, описывающими сцены, и соответствующими изображения¬ ми потребовало наличия в базах знаний специальных представлений для зри¬ тельных образов и процедур соотнесения их с традиционными формами представления знаний. Графическая информация стала трактоваться с помощью знаний, со¬ держащихся в ней. Если до этого её функция сводилась к иллюстрации тех или иных знаний и решений, то теперь она стала включаться равноправным образом в те когнитивные процессы, которые моделируются в базах знаний и на основе их содержимого. Термин «когнитивная графика» отражает этот принципиальный переход от иллюстрирующих изображений к видеообразам, способствующим решению задач и активно используемых для этого. Когнитивная функция изображений использовалась в науке и до появ¬ ления компьютеров. Образные представления, связанные с понятиями граф, дерево, сеть и т.п. помогли доказать немало новых теорем. Круги Эйлера позволили визуализировать абстрактное отношение силлогистики Аристоте¬ ля. Диаграммы Вейна сделали наглядными процедуры анализа функций ал¬ гебры логики. Систематическое использование когнитивной графики в компьютерах в составе человеко-машинных систем сулит многое. Даже весьма робкие по¬ пытки в этом направлении, известные как мультимедиа-технологии, привле¬ кающие пристальное внимание специалистов, занятых созданием интеллек¬ туальных обучающих систем, показывает перспективность подобных иссле¬ дований. Действительно, образное мышление бывает определяющим в творче¬ ской деятельности человека. Не говоря о людях искусства, даже математики, чьё мышление, казалось бы, основано на формальных выкладках, на деле развивают свои выводы на основе внутренних визуальных представлений. Образно, похоже, аналогизированно представить себе исследуемую структу¬ ру с её внутренними отношениями, заставить её двигаться, следить за этим движением раз за разом и, наконец, уловить искомое свойство, догадаться о его причине и лишь после этого обобщить и формализовать новое причинно- следственное отношение - вот путь творческого мышления впечатлительного учёного - приверженца точных наук. (Какова здесь роль «третьего глаза» - эпифиза?) Образные, графические аналоги, как механизмы, способствующие логическому выводу, действительно неотъемлемая проблема ИИ. А точнее, 122
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... это - проблема ассоциативного мышления, где роль логических нейронных сетей несомненна. Имитацию образного мышления, способность создания видео-аналогий исследуемого процесса, не просто иллюстрирующих, но моделирующих, и следует считать воплощением когнитивного мышления. Например, при поиске оптимального плана выполнения частично- упо¬ рядоченных работ, «в голове» исследователя возникает множество аналогов- брусочков, связанных верёвочками, относительное смещение которых огра¬ ничено по оси времени. Усилием воображения эти брусочки сдвигаются так, чтобы уложиться в оптимальное расписание для данного количества испол¬ нителей за минимальное время. Повторяя эти попытки многократно, иссле¬ дователь выявляет и формулирует то решающее правило, которое, будучи применённым бессознательно, привело к успеху. Сформулированное правило дополнило базу знаний. Таким образом, переход к видео-абстракциям - основная задача когни¬ тивной графики на пути индуктивного обретения новых знаний. Стараясь приблизить ИИ к точной науке, мы должны следовать точным определениям. Что мы понимаем под абстракцией, абстрактным мышлением, позво¬ ляющим операровать образами? По-видимому, это выделение главных свойств объектов или их взаимо¬ действия, которые можно изобразитъ (!) на основе известных аналогий из базы знаний. Даже художник, изображающий натуру (см. эпиграф), наносит мазок, согласуясь со своим абстрактным представлением. Мы восхищаемся искус¬ ством Чурлёниса или великих французских импрессионистов, искренне по¬ нимая и то, что мы этого достойны, мы способны правильно реагировать, мы достаточно высоко организованы. Почему в Ереванском музее абстрактного искусства, успешно функци¬ онировавшем в эпоху социалистического реализма, мы равнодушно прохо¬ дим мимо массы картин, и вдруг!.. Какие наши душевные и абстрактно вос¬ произведённые струны сработали в унисон? И мы возвращаемся, чтобы по¬ стоять, пережитъ... Можно ди без постоянного наполнения базы знаний перейти к чув¬ ственному восприятию аналогий? В детском садике ребёнок учится изобра¬ жать солнышко, маму, небо, лошадку... Конечно, здесь действуют ограничивающие каноны. Наблюдательный, восторгающийся лошадьми ребёнок радостно спешит домой, чтобы запечат¬ леть новую увиденную деталь. Но наталкивается на необъяснимое, ласковое замечание отца: «Не надо это рисовать». Так начинается его знакомство с этическими возможностями. Много аналогий на пути абстрагирования можно привести относитель¬ но музыки. Это, как отдельный мир, отдельная тема, которую также вряд ли 123
Глава I. Логические основы искусственного интеллекта возможно поднять на этих страницах. Можно вспомнить в числе первых ки¬ бернетических опытов конца 50-х - начала 60-х годов музыкальную работу «Уральские напевы», где на ЭВМ «Урал» Р.Х. Зарипов успешно применил известные правила композиции. Случайно вырабатываемые мелодии получа¬ лись вполне приемлемыми на не слишком притязательный вкус. Но мы по¬ нимаем, что на таком наивном уровне все чувственные секреты музыки не раскрыть. Другой важной проблемой рассматриваемой «горячей точки» является «живое» моделирование. Продолжая логическую цепочку воспроизведения интеллекта, следует спросить, а что является вершиной его воплощения? Ко¬ нечно же, живое существо или, научно, - реагирующий объект. Ведь идеалом робототехники является максимальная степень реализации механизмов жиз¬ ни. Находясь в сфере точной науки, следует руководствоваться точными определениями. Какой объект следует считать живым? 1. Живое существо адекватно реагирует на внешние раздражители. 2. Адекватность реакции живого существа подчиняется критерию «хо¬ рошо - плохо». Философски уместно говорить о жизни существа не в абсолютном ас¬ пекте, а в аспекте моделирования: вся жизнь представляет собой игровую модель, а задачей любого моделирования является минимизация целевой функции, в конечном итоге отделяющей понятие «хорошо» от понятия «пло¬ хо». Считая достаточными положения 1 и 2, мы понимаем, что желательно достичь такого уровня обучения, когда система сама начинает осознавать, что хорошо, а что плохо на основе индуктивного и дедуктивного мышления. Сегодня мы вынуждены решать задачу-минимум, требуя, в основном для культурно-развлекательных целей, адекватности реакции. Степень этой адек¬ ватности в соответствии с означенным критерием мы предусматриваем сами. Например, можно научить объект улыбаться, если он видит картинку с пре¬ обладанием розовых тонов, но гневаться, если на картинке превалирует ко¬ ричневый цвет и т.д. Однако задача «живого» моделирования актуальна в более широкой постановке. Управление сложными системами с возможным участием операторов и диспетчеров предъявляет высокие требования к динамическому отображе¬ нию их состояния для оперативного анализа ситуации и принятия решений. Задача оператора значительно усложняется в случае территориальной разоб¬ щённости средств системы, превращаясь в задачу многоуровневого контроля и диагностики. Возникает необходимость интеллектуальной надстройки всей системы отображения, контроля и принятия решений, производящей опера¬ тивную первичную обработку многообразной регистрирующей, отображаю¬ щей и управляющей информации для предварительного, грубого отображе¬ 124
Лекция 6. Десять задач искусственного интеллекта по ДА Поспелову и возможности... ния происходящего процесса. Задачей такого предварительного, поверхност¬ ного отображения является выяснение того, протекает процесс в пределах нормы, грозит ли уход за эти пределы, установление факта и причин тревоги ит.д. Отображение должно быть наглядным, не требовать постоянных кро¬ потливых усилий операторов, доступным и понятным широкому кругу наблюдателей, бесспорным и образным. Важна и эстетическая составляю¬ щая. Это и приводит к целесообразности использования реагирующих объек¬ тов - моделей живых существ или других «оживляемых» образов, по поведе¬ нию которых можно судить о состоянии сложной системы. Для такой предварительной, грубой оценки применимы принципы си¬ туационного управления. Однако информацией для реагирующего объекта является чрезвычайно большое количество данных разнообразной природы и типов. Задача осуществления реакции становится трудноформализуемой. Её решение возможно только с применением средств искусственного интеллек¬ та. Множество зависимостей вида «если - то» в основе решения этой задачи приводит к выводу о целесообразности применения логических нейронных сетей. Таким образом, на вход реагирующего объекта подаётся большое число разрозненных или связанных показателей состояния сложной системы, опре¬ деляющих факторное пространство. Эти показатели разбиты по характеру влияния на значимые интервалы, отдельные объекты, дискретные значения или булевы переменные (вида «есть - нет»), позволяющие оценить достовер¬ ность значения каждого фактора, что может быть использовано для возбуж¬ дения рецепторного слоя нейросети. На основе накапливаемого опыта, экс¬ пертных оценок или теоретических исследований строится обученная, разви¬ ваемая в процессе эксплуатации, логическая нейронная сеть - основа поведе¬ ния реагирующего объекта. Модели реагирующих объектов могут быть трёх типов: • Натурная модель, выполненная, в частности, в соответствии с из¬ вестными технологиями робототехники или театра кукол; • Компьютерная (электронная) модель, использующая графические технологии - двумерные и трёхмерные; • Компьютерная (электронная) модель на основе клип-технологий. Все три типа моделей предполагают связь нейронов выходного слоя с соответствующими программами (процедурами) имитации реакции объектов на ситуацию по принципу ассоциативного мышления. При этом величина возбуждения нейрона выходного слоя служит основным параметром соот¬ ветствующей программы, определяющим реакцию. Этим обеспечивается воз¬ можность совмещения различных реакций, дающих некоторую результиру¬ ющую. Помимо актуальной задачи интеллектуального отображения в сложных управляющих системах, применение реагирующих объектов может быть зна¬ 125
Глава I. Логические основы искусственного интеллекта чительно более широким. Это - системы развлекательные, игровые, демон¬ страционные, рекламные, медицинской и технической диагностики, экологи¬ ческого прогнозирования и предупреждения, контроля несанкционированно¬ го доступа к данным и другие системы искусства, науки, техники, бизнеса. 6.8. Многоагентные системы Г де-то в первой половине 80-х годов стало ясно, что эффективная реа¬ лизация ряда важных для интеллектуальных систем процедур требует парал¬ лельной и асинхронной их организации. Подобные процессы интегрируют в себе активности отдельных центров, решающих свои локальные задачи. Но эти локальные задачи и пути их решения должны быть согласованы в грани¬ цах некоторых глобальных целей. Примерами процедур такого рода могут быть процедуры согласования мнений различных экспертов по поиску решения сложной многоцелевой за¬ дачи, согласование локальных локомоций при синтезе интегрального движе¬ ния (например, движение робота, снабжённого зрением и манипуляторами) или процедура коллективного взаимодействия интеллектуальных систем при решении в автономном режиме некоторой общей задачи. Появление специальных архитектур, призванных поддерживать такую организацию процессов (например, параллельные вычислительные системы, в которых используется принцип «доски объявлений»), ещё более усилило интерес к многоагентным моделям. Наконец, уверенность в том, что в нерв¬ ных тканях живых организмов реализуется асинхронный и параллельный режим поиска решения, также оказала своё влияние на исследования в обла¬ сти многоагентных систем. Нужно отметить, что идеология моделей такого рода во многом опира¬ ется на методы и результаты, полученные ранее вне сферы интересов соб¬ ственно искусственного интеллекта. Ещё в конце 50-х годов появились пер¬ вые работы в области клеточных автоматов и моделей коллективного пове¬ дения автоматов. Эти работы заложили основу для появления многоагентных систем. Новое, что внесли в эти исследования специалисты по интеллекту¬ альным системам, - это повышение «уровня интеллекта» агентов. Они стали способны использовать свои локальные знания для достижения своих целей. И задачи согласования, организации их целесообразного взаимодействия трансформировались на верхнем уровне в задачи согласования целей и зна¬ ний, т.е. стали напрямую соотноситься с проблематикой искусственного ин¬ теллекта. Возникающие тут проблемы тесно связаны с проблемами динамиче¬ ских баз знаний, с необходимостью оценки конфликтных целей, противоре¬ чий в знаниях. Они также предполагают использование упоминавшихся вы¬ ше процедур оправдания в системах имеющихся знаний и концептуальных моделей. 126
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... Существует проблема, отображающая коллективный разум. Это может соответствовать как системам вида «человек - модель ИИ», так и системам взаимодействующих моделей ИИ. Игровые системы и того и другого рода уже используются. Здесь сетевые технологии распределённых вычислений становятся определяющими. Представим себе парк фантасмагорий, где группа туристов неожиданно встречается с натурными моделями реагирующих объектов. Каждый из них снабжён средствами компьютерного зрения и с помощью логической нейронной сети реагирует на динамически предъявляемую картинку. («Жен¬ щина в красной кофте! Отойдите от крокодила!..») При компьютерной реализации реагирующих объектов можно проде¬ лать следующий эксперимент: образовать круг мониторов (снабжённых средствами видеовхода каждый) рабочих станций локальной вычислительной сети, чтобы реализованные на этих станциях объекты «видели» других чле¬ нов коллектива. Можно понаблюдать, как они будут реагировать друг на друга - придёт ли система в умиротворённое состояние или, всё более воз¬ буждаясь, потребует постороннего вмешательства? Согласитесь, что любая реализация сулит хороший бизнес! 6.9. Сетевые модели Интеллектуальные системы, основанные на правилах (продукциях), принесли не только радость решения ряда важных задач, но и породили со¬ мнения в том, что именно они призваны остаться основными моделями пред¬ ставления знаний в интеллектуальных системах. Многочисленные дискуссии 80-х годов, проводившиеся специалистами в области ИИ по этому поводу, привели к укреплению сетевой парадигмы, несколько отодвинутой в сторону триумфальным выходом на сцену продукционных моделей. И хотя исследо¬ вания в области семантических сетей, каузальных сетей и сетей другого типа продолжались, они были малочисленными и не слишком продуктивными. Но к концу 80-х годов сетевые модели стали развиваться более быст¬ рыми темпами. Этот процесс совпал с пробуждением интереса к давно забы¬ тым нейронным архитектурам, появлением транспьютерных систем и нейро¬ компьютеров, а также с возвращением к работам, опирающимся на эволюци¬ онные модели и эволюционное программирование. Возник определённый бум, который был даже окрещён неодарвинизмом. Если к концу первого этапа развития сетевых моделей (в основном в виде нейронных многослойных систем типа персептронов) наступило разо¬ чарование в их возможностях и простоте их аппаратной реализации, то в 80-х годах эти сомнения были отброшены. Комплекс исследований в этой области так возрос, что произошло практическое отпочкование специалистов, рабо¬ тающих в области сетевых моделей, от основного ядра тех, кто причисляет себя к искусственному интеллекту. Этот разрыв, по-видимому, приведёт к 127
Глава I. Логические основы искусственного интеллекта возникновению двух наук, связанных с построением интеллектуальных си¬ стем. Одна из них будет по-прежнему опираться на уровень ментальных (ин¬ формационных) представлений, а другая - на уровень структурной организа¬ ции (по типу нервных тканей), порождающей нужные решения. Теория нейронных сетей в действительности также развивается по двум направлениям. Грубо это различие в следующем. Если на вход нейронной сети подаются сами данные, измеренные в ки¬ лометрах, долларах и т.д., и установившийся режим возбуждения нейронов порождает решение также в явных единицах измерения, то это означает, что решаются нейроподобные задачи на нейронных сетях специальной структуры и топологии. Такие задачи свойственны многочисленным сетям типа Хоп- филда, Кохонена, волновых, квадратичных, генетических и т.д. Если же на вход подаются не сами данные, а их весовые оценки, подоб¬ ные достоверности, а выходы указывают на логическое следствие (сокраще¬ ние мышцы, приказ, текст медицинской рекомендации и т.д.), то это - логи¬ ческая нейронная сеть, работа которой может быть описана в терминах мате¬ матической логики событий. А таким, в сущности, табличным способом с процедурой ассоциативной выборки, могут быть представлены самые разно¬ образные модели искусственного интеллекта. Тип данных на входе нейросети существенен. Именно он определяет похожесть на природное воплощение. Ведь энергетика мозга, как и компью¬ тера, определяется диапазоном возможной величины сигнала, которой опе¬ рирует устройство. На этом сигнале и строится вся логика работы. Задачи, решаемые с помощью логической нейронной сети, следует отнести именно к нейросетевым задачам, подразумевая мозг. В [10] полно отражена история искусственных нейронных сетей приве¬ дением основополагающих и значительных работ в этой области. Необходимо отметить работы Ф. Розенблата, с персептронов которого, в сущности, начались логические нейронные сети, хотя он этого не осознал. Упомянутый Д.А. Поспеловым кризис возник в связи с оценкой М. Минским предельных возможностей персептрона, моделирующего, как все¬ гда утверждалось авторами и исследователями, сетевые структуры мозга. Представляется, что критика этих возможностей скорее относится к степени адекватности конкретных исследуемых моделей персептрона, чем к принци¬ пиальным проблемам моделирования нейросети. Следует предположить, что логические нейронные сети, построенные на базе обобщения теории персеп¬ трона, её перевода в область математической логики, в большей степени точ¬ но, на логическом уровне функционирования, воспроизводят мозговые про¬ цессы и открывают новые возможности моделирования ИИ. Наконец-то положительно решается спор на тему: «Может ли машина мыслить?» Перефразируя тезис диалектики (Гегеля) «Всё логичное действи¬ тельно, всё действительное логично (в смысле - выводимо, объяснимо, охва¬ тывается разумом), следует снять страх, неуверенность и идеологические пу- 128
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... ты. Ведь подобно тому, как человек не производит скорость, а производит автомобиль - средство скорости, так человек не производит мысль сверх своих способностей, а производит средство мышления на основе познания принципов мозга. Средство, гораздо лучшее чем то, что могла произвести Природа, находясь в рамках известных «технологических» ограничений и требований жизнеобеспечения. Достоверность предположения о «всесилии» логических нейронных се¬ тей основана на том, что кроме мозга, т.е. нейронной сети, столь продуктив¬ ного средства мышления мы не знаем. Да и здесь мы стоим на позициях су¬ губо материалистических, напрочь, непреложно и самоуверенно отвергая то, что нам кажется мистикой. Мы уверены лишь в одной части философского тезиса «Мир познаваем...» и стараемся умалить другую его часть «... но все¬ го познать нельзя (ибо, мы догадываемся, - бесконечность!)» Однако на до¬ статочном сегодня логическом уровне всё же представляется возможным «потрогать» и даже слегка попотрошить мозг. Говоря об аппаратной реализации «мозговых» принципов, следует рас¬ смотреть логический ряд: от проблемы распараллеливания вычислений, че¬ рез транспьютерные сети к общей проблеме нейрокомпьютеров и их приме¬ нения. Действительно, вопрос о применении транспьютерных сетей сразу же натолкнул А.И. Галушкина на мысль о реализации моделей нейронов: один транспьютер - один нейрон. Связи между транспьютерами превращаются в синапсические связи. В дальнейшем развитии этой идеи происходит отделе¬ ние нейронной сети от средства её реализации. В многопроцессорной вычис¬ лительной системе целесообразно распределять (поровну) количество нейро¬ нов, инвариантное относительно количества процессоров, между процессо¬ рами. Так реализуется ЖТЮ-технология, когда каждый процессор цикличе¬ ски выполняет одну и ту же процедуру обработки нейрона (его функцию ак¬ тивации), используя данные других, с учётом их взаимосвязи. Такой способ обработки нейросети, совместимый с известными параллельными алгорит¬ мами обучения, предъявляет основные требования к современному нейро¬ компьютеру. Это - просто универсальная, параллельная, симметричная вы¬ числительная система на основе современных достижений в микроэлектро¬ нике. 6.10. Метазнания Метазнания или знания о знаниях - непременный атрибут познаватель¬ ных процессов. В искусственных системах они в том или ином виде присут¬ ствовали всегда (например, в виде схем баз данных в базах данных или в ви¬ де стратегий управления в продукционных системах). Но только с полным осознанием глобальной цели искусственного ин¬ теллекта, которую можно сформулировать, как создание метасистемы, спо¬ собной порождать все необходимые конкретные программы деятельности, 129
Глава I. Логические основы искусственного интеллекта стало ясно, что уровень метазнаний сам по себе представляет немалый инте¬ рес для изучения. Метазнания тесно связаны с теми основными для человека процедурами, которые позволяют ему учиться новым видам деятельности. Именно поэтому интерес к метазнаниям тесно связан с глубоким вниманием к процессу обучения, которое характерно для начала 90-х годов. Интеллектуальные обучающие системы, использующие метазнания для организации учебного процесса, ориентированного на конкретного обучае¬ мого, стали первым объектом, в котором метазнания «овеществились», при¬ обрели все необходимые конкретные качества. Говоря об обучающих системах, основанных на метазнаниях, необхо¬ димо подчеркнуть, что любая методика обучения базируется на алгоритми¬ зации выполнения последовательностей (с возможными обратными связями) отношений вида «если - то». Значит, формализация процесса обучения сулит широкое применение аппарата логических нейронных сетей. Эффективность применения этих сетей в самообучающихся системах управления обсуждалась ранее. Необходимо помнить тот же тезис диалектики: «Мир познаваем, но всего познать нельзя». Следовательно, знания о знаниях должны быть разви¬ ваемыми. База знаний должна постоянно пополняться, желательно, сама. Это возможно на основе моделирования индуктивного мышления. Индуктивное мышление возможно на основе анализа пополняемых фактов (отображённых в фактографической логической нейронной сети), установления повторяю¬ щихся связей или логических цепочек, их обобщения и формирования гипо¬ тез, дополняющих понятийную логическую нейронную сеть. Высокая досто¬ верность гипотезы устанавливается только в результате её многократного успешного (следовательно, в соответствии с критериальной функцией) при¬ менения в процессе дедукции, т.е. на основе фактов. Так может быть вопло¬ щена философская теория познания. Ключевые термины Правдоподобная аргументация - обусловлена нечёткими данными, которые использует интеллектуальная система. Проблема оправдания - проблема объединения нескольких баз зна¬ ний, где конкретные знания могут пониматься по-разному. Объяснение (здесь) - снабжение выводов интеллектуальной системы информацией типа «как» и «почему». Релевантные знания - знания, адекватные запросу. Понимание текстов - выражается в адекватной реакции на них. Синтез текстов - составление общего текста на основе единства темы и смысла. 130
Лекция 6. Десять задач искусственного интеллекта по Д.А Поспелову и возможности... Когнитивная графика - продукт образного мышления, графическое условное представление объектов или их взаимодействия, а также объект «живого» моделирования. Многоагентная система - составляется на основе нескольких интел¬ лектуальных взаимодействующих систем. Сетевые модели - представляют наложение проблем искусственного интеллекта на компьютерную сеть. Метазнания - знания о знаниях, определили создание интеллектуаль¬ ных обучающих систем. Краткие итоги 1. Методы искусственного интеллекта должны опираться на использо¬ вание неполных, нечётких, правдоподобных данных, характеризующихся степенью достоверности. Основной операцией при поиске решения должна быть правдоподобная аргументация. Это предусмотрено при использовании логических нейронных сетей. 2. При объединении нескольких баз знаний возникает эффект противо¬ речивости знаний. Должна быть решена проблема оправдания данных на ос¬ нове выбора общего критерия для составляющих БЗ. 3. Выводы интеллектуальной системы должны сопровождаться объяс¬ нениями типа «как» и «почему», что вполне доступно логическим нейрон¬ ным сетям. 4. Принцип ассоциативного мышления, применяемый в логических нейронных сетях, обеспечивает релевантность знаний, извлекаемых из БЗ по запросу. 5. Понимание текста неразрывно связано с адекватной реакцией на не¬ го. Обеспечение такого ассоциативного понимания - главная задача логиче¬ ской нейронной сети. 6. Процедуры порождения текстов на заданную тему основаны на мно¬ гоуровневом подходе от когнитивного (мысленно-графического) представле¬ ния до линейного лингвистического. Здесь много нерешённых задач. Гипер- текстовые технологии способствуют решению многих задач. Эти технологии могут использовать логические нейронные сети. 7. Проблемы когнитивной графики проявляются пока ещё недостатком исследований в области адекватного восприятия зрительных и акустических сцен, образных представлений, а также «живого» моделирования. 8. Многоагентные системы, как системы коллективного взаимодей¬ ствия интеллектуальных подсистем при совместном решении задач, связаны с необходимостью решения проблем динамических баз знаний, проблем оценки конфликтных целей, противоречивых знаний и других проблем кол¬ лективного разума. 131
Глава I. Логические основы искусственного интеллекта 9. Усиливается тенденция к симбиозу компьютерных и нейронных се¬ тевых технологий, определяющая путь как удовлетворения требований к сверхвысокой производительности, так и построения сверхбольших нейрон¬ ных сетей, сравнимых по объёму с мозгом. 10. Метазнания как «знания о знаниях» являются основным инструмен¬ том искусственного интеллекта, порождающим новые знания. Интерес к ме¬ тазнаниям тесно связан с процессом обучения человека на базе интеллекту¬ альных обучающих систем. Вопросы 1. Что представляет собой проблема правдоподобной аргументации? 2. Охарактеризуйте проблему оправдания. 3. Прокомментируйте использование объяснений «как» и «почему». 4. Как в интеллектуальной системе обеспечивается релевантность зна¬ ний? 5. В чём заключается проблема понимания текста? 6. Охарактеризуйте проблему понимания текстов. 7. Объясните проблемы когнитивной графики. 8. Что представляют собой многоагентные системы? 9. Какая связь между компьютерными и сетевыми технологиями? 10. Как применяются метазнания в искусственном интеллекте? Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка логического вывода ПРОЛОГ Аннотация. В соответствии с двумя парадигмами искусственного ин¬ теллекта - эксперта и ученика - исследуются возможности построения моде¬ лей дедуктивного и индуктивного мышления человека на базе языка логиче¬ ского вывода ПРОЛОГ. Ключевые слова: парадигмы искусственного интеллекта, дедуктивное и индуктивное мышление, логическая нейронная сетъ, ПРОЛОГ, логические цепочки. ...Вот вы упомянули сейчас умение наблюдать и умение делать выво¬ ды. А мне казалось, что это - почти одно и то же. - Нет, это разные вещи, ответил Шерлок Холмс... Отбросьте всё, что не могло иметь место, и останется один-единственный факт, который и есть ис¬ тина. А. Конан Дойл. Записки о Шерлоке Холмсе 132
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... 7.1. О языке логического программирования ПРОЛОГ Идея использования математической логики в качестве языка програм¬ мирования возникла впервые в начале 70-х годов. Первыми исследователями были Роберт Ковальский из Эдинбурга (теоретические аспекты), Маартен Ван Эмден из Эдинбурга (экспериментальная демонстрационная система) и Ален Колмероэ из Марселя (реализация). Сегодняшней своей популярности ПРОЛОГ во многом обязан эффективной реализации этого языка, получен¬ ной в Эдинбурге Дэвидом Уорреном в середине 70-х годов. Пролог представляет собой базу знаний как совокупность фактов и правил (вывода). Факты и правила по смыслу группируются в процедуры, имеющие имя. Процедурная структура позволяет включать (в правила) кон¬ струкции любых других алгоритмических языков. То есть, ПРОЛОГ является логической надстройкой, сублимирующей лишь операции логического выво¬ да. Формируется цель логического вывода, и если она не противоречива, выявляются факты, из которых эта цель следует. Например, цель может иметь вид: дядя{Х, Y). Её решение (вывод) за¬ ключается в нахождении всех пар переменных (имён объектов) Хи Y, для ко¬ торых истинно утверждение «Xявляется дядей Г». Для решения такой задачи используется приём трансформации цели, где цель на основе рекурсии правил представляется дедуктивной цепочкой - сложной целью, в которой фигурируют переменные. Перебираются все вари¬ анты связывания переменных, т.е. придания им возможных значений на ос¬ нове фактов. Каждый вариант связывания переменных проверяется на непро¬ тиворечивость. Процедура такой проверки называется унификацией. Вариант полного связывания всех переменных, прошедший унификацию, определяет решение. Последовательное, пошаговое связывание переменных в случае не¬ удачи (не проходит унификация) или при поиске всех решений, естественно приводит к возврату на предыдущий шаг для испытания другой возможно¬ сти. Стратегия такого поступательно-возвратного связывания переменных называется бэктрекингом (backtracking). Для учебных целей с примерами и задачами язык ПРОЛОГ хорошо описан в [25]. Достаточные сведения читатель получит из последующего текста. 7.2. Возможность решения задач логического вывода с помощью языка ПРОЛОГ Из чего следует исходить, приступая к моделированию индуктивного мышления? 133
Глава I. Логические основы искусственного интеллекта 1. Наука призвана открывать новые (не известные ранее) законы при¬ роды - законы взаимодействия объектов и явлений. 2. «Наука начинается тогда, когда начинают считать», - сказал Д.И. Менделеев. Действительно, вглядываясь в достижения мировых учёных, об¬ наруживаем важный факт статистического обеспечения экспериментов и вы¬ водов. Сколько раз, по известной легенде, должно было упасть яблоко на го¬ лову И. Ньютона, чтобы он сформулировал гипотезу: F = та? (Ведь для под¬ тверждения гениальной догадки яблоки должны были падать и падать!) 3. Значит, кроме статистической обработки опыта, наука питается ло¬ гической выводимостью новых знаний. В «простейшем» случае - это мате¬ матические теоремы. На основе каких статистических оценок Д. Буль мог со¬ здать «булеву алгебру»? Да и И. Ньютон, если верить легенде, мог сделать свой вывод на основе измерения получаемой (его головой) энергии W = mgh. Затем, в результате аналитических выкладок, он смог перейти к столь важ¬ ному основополагающему заключению. Даже в наши дни появляются факты, подтверждающие математически выведенные гипотезы большой давности. Кстати, а почему F равно та, а не, скажем, та2? Ведь на основе такого предположения, такой аксиоматики, вполне можно построить некоторый мир. Физики - математики это знают, препарируя вдоль и поперёк второй за¬ кон механики для вывода новых знаний (учеников) о нашем мире. А по зако¬ нам диалектики Гегеля всё действительное логично (логически выводимо)4, а всё логически выводимое - действительно! Это что, - вопрос о параллельных мирах? Пытаясь расширить действие второго закона механики, мы можем вы¬ сказать смелую гипотезу. В Мире Божием действует закон F = maR, где R - действительное, при¬ нимающее значение от 0 до оо. Мы сможем это проверить сегодня экспериментально? Но ведь воз¬ можно, что более развитые существа научились осуществлять дрейф по дан¬ ному показателю степени, и нечёткие НЛО, внезапно появляющиеся и исче¬ зающие, это демонстрируют (если это не искусный обман). Таким образом, мы наблюдаем неразрывную связь между дедуктивным и индуктивным мышлением, опирающуюся на многообразие законов приро¬ ды. Однако важно осознать приоритет: индуктивное мышление строится на основе дедуктивного и далее питает его. Если моделирование дедуктивного мышления изучено достаточно и является основной целью данного языка, то модель индуктивного мышления, 4 Получила распространение неправильная трактовка слова «логично», воспринятая при раннем изучении трудов Г егеля как «разумно, правильно». Это слово следует воспринимать как «охватываемое разумом, ло¬ гически выводимо». «Тогда фашизм разумен?!» - объясняют коммунистические идеологи исключение пер¬ вой части данного тезиса в официальной марксистской философии. А.И. Герцен в «Былое и думы» объясня¬ ет «дурно понятую фразу Гегеля». Фраза «Всё действительное разумно» - «иначе высказанное начало до¬ статочной причины и соответственности логики и фактов». 134
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... то есть, формирования новых знаний в рамках языка ПРОЛОГ, предлагается впервые. Суть её в следующем. По базе знаний строятся все возможные де¬ дуктивные цепочки логического вывода, следующие из фактов на основе применения правил. Во всём множестве таких цепочек обнаруживаются и выделяются законченные, желательно, повторяющиеся конструкции. Связан¬ ные переменные заменяются их абстрактным представлением для формиро¬ вания обобщённого вида выделенной конструкции. Так создаются гипотезы об описании новых понятий. Этим гипотетическим понятиям присваиваются имена, и они становятся новыми правилами, дополняющими базу знаний. Одновременно описание новых правил дополняет понятийную логическую нейронную сеть для возможности работы с нечёткими данными. Практика успешного, непротиворечивого применения новых правил должна утвердить их высокую достоверность. В соответствии с высказанной выше идеей, конкретизируем основопо¬ лагающие парадигмы ИИ для решения наших задач с помощью языка ПРО¬ ЛОГ. Г Парадигма эксперта обретает следующие особенности: а) Формализация знаний и б) Формирование базы знаний (БЗ) реа¬ лизуются в результате описания фактов и правил на языке ПРОЛОГ для кон¬ кретной изучаемой системы. в) Дедукция осуществляется методом подстановки в развиваемую кон¬ струкцию на основе правил. Однако если поставлена цель, то она достигается (доказывается) методом «бэктрекинга», как рассматривалось выше. 2. Парадигма ученика предполагает действия: а) Обработка фактов, наблюдений и опыта кроются в уже постав¬ ленной задаче в виде фактов и правил, действующих в изучаемой системе. б) Индуктивное обучение обеспечивается представлением в ПРОЛО¬ ГЕ фактов и правил, обусловленных изучаемой системой. Новые знания формируются путём вскрытия одинаковых языковых конструкций в записях различных логических цепочек, следующих из фактов и формируемых на ос¬ нове правил. Эти конструкции могут быть обобщены и выделены в качестве новых понятий (правил) и обретают имя. в) Дедукция предполагает правильный вывод с учётом расширенного набора правил в результате индуктивного обучения. 7.3. Формирование базы знаний на языке ПРОЛОГ Как известно [8], БЗ на ПРОЛОГе задаётся множеством фактов, объ¬ единённых в процедуры, и множеством правил (вывода). Несколько отойдя от специфической терминологии, рассмотрим пример БЗ, описывающей родо¬ словную жителей далёкого села, посещаемого лишь залётными молодцами (рис.7.1). 135
Глава I. Логические основы искусственного интеллекта Факты: Процедура «мужчина» мужчина(Иван) мужчина(Василий) мужчина(Пётр) мужчина(Фёдор) мужчина(Юрий) Процедура «женщина» женщина(Марья) женщина(Елена) женщина(Ольга) женщина(Ирина) Процедура «родитель» родитель(Марья, Иван) (читать: Марья родитель Ивана) родитель(Марья, Василий) родитель(Юрий, Фёдор) родитель(Елена, Фёдор) родитель(Елена, Марья) родитель(Ольга, Пётр) родитель(Ольга, Ирина) родитель(Федор, Ирина) родитель(Фёдор, Пётр) родитель(Пётр, Иван) родитель(Пётр, Василий) Правила: мать(Х, Y) :- женщина(X), родитель(X, Y); отец(X, Y) :- мужчина(X), родитель(Х, Y); брат(X, Y) :- мужчина (Х), родитель(Р, Х); родитель(Р, Y), X<>Y; сестра(X, Y) :- женщина (Х), родитель(Р, Х); родитель(Р, Y), X<>Y; дядя(Х, Y) :- брат(Х, Р), родитель(Р, Y); тётя(Х, Y) :- сестра(Х, Р), родитель(Р, Y). 136
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... Правила рекурсивно определяют понятия, которыми можно опериро¬ вать на данном уровне знаний о рассматриваемом населённом пункте. Оче¬ видно, что расширение списка понятий, производимое на основе анализа свя¬ зей, зафиксированных в БЗ, т.е. введение новых понятий, и является целью индуктивного мышления. Построим логические нейронные сети, отображающие наш объект ис¬ следования в динамике его развития. Этим мы совершим переход в область нечётких данных, столь актуальный для следственных органов. Фактографическая нейронная сеть представлена на рис. 7.2. В ней вы¬ делены и те связи, которые будут доказаны ниже. Мужчина Иван Мужчина Василий Мужчина Фёдор Женшина Марья Женщина Ольга Марья - родитель Ивана Юрий - родитель Фёдора Елена - родитель Марьи Ольга - родитель Ирины дитель Ирины Фёдор - родитель Петра шелъ Ивана Пётр - родитель Василия пра Фёдора Ирина - сестра Петра чина Петра Елена - бабушка Петра •шка Ивана Елена - прабабушка Ивана Елена - бабушка Василия Елена - прабабушка Васшшя )едушка Ивана Юрий - прадедушка Василия Рис. 7.2. Фактографическим пеирипная сетъ 137
Глава I. Логические основы искусственного интеллекта Целесообразно использовать следующую функцию активации i-го ней¬ рона данной однослойной сети: fi к. i 2 у ■ J=1 J если эта сумма > h, 0 в противном случае. Здесь Vj - величина возбуждения j-го рецептора, связанного с i-м нейроном, кі - количество входов этого нейрона. 138
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... Мы видим, что, несмотря на требование (к системам принятия реше¬ ний) об однозначности выводов, неоднозначность в данном случае, напри¬ мер, о том, что Елена одновременно и бабушка, и прабабушка Ивана, также справедлива и может приниматься к действию. На рис. 7.3 отображена понятийная нейронная сеть. Для сокращения количества рисунков здесь также отображены новые выводы, определяющие понятия, которые предполагается получить на основе моделирования индук¬ тивного мышления. Целесообразно использовать ту же функцию активации. 7.4. Дедуктивное мышление Для проверки корректности формулировки, решим задачу логического вывода методом дедуктивного мышления. Процедуры этого вывода встроены в язык ПРОЛОГ. Сформулируем цель, т.е. определим ту конкретную задачу, для решения которой достаточно (или не достаточно) имеющихся знаний. Например, поставим целью выявление всех пар (X, У), для которых справедливо отношение сестра(Х, Y). Для этого используется метод прямо¬ го, пошагового перебора вариантов связывания переменных, с возвратом к предыдущему шагу в случае образующегося противоречия. Этот метод назы¬ вается backtracking. Он воспроизводит стратегию «ветвей и границ», где «границы» определяются логически противоречивыми действиями, не до¬ пускающими развитие варианта связывания переменных. Про противоречи¬ вую попытку связывания переменного говорят: не проходит унификация. Установление факта унификации не всегда возможно «внутри» языка ПРО¬ ЛОГ. Часто должны быть привлечены другие знания «физического смысла задачи». Расшифруем правило: сестра(Х, Y) женщина (X), родитель(Р, X); родитель(Р, Y), XoY. Первый шаг связывания переменных - X = Марья. Для сокращения анализируемых при переборе записей, высказывания со всеми связанными переменными исключаются. Преобразуемая далее запись принимает вид родителъ(Р, Марья), роди тел ь(Р, Y), Марья о Y В процедуре «родитель» находим высказывание роднтель(Елена, Ма¬ рья) и полагаем Р = Елена. Преобразуемая далее запись принимает вид роди тел ь (Елена, Y), Марья о у Первое по порядку значение F = Марья приводит к противоречию. Находим другое высказывание - родитель(Елена, Фёдор). Преобразуем за¬ пись: Марьяофёдор. Унификация проходит - одна пара «сестра - брат» найдена. 139
Глава I. Логические основы искусственного интеллекта Продолжим поиск других пар. На предыдущем шаге ищем другое под¬ ходящее значение Р, но его нет. Возвращаемся ещё на шаг назад и полагаем X = Елена. Преобразуемая запись принимает вид родитель(Р, Елена), родитель(Р, Y), Еленао у Получаем противоречие (не проходит унификация), так как в процеду¬ ре «родитель» нет информации о родителе Елены. Пробуем значение X = Ольга. Запись принимает вид родитель(Р, Ольга), родитель(Р, Y), ОлъгаоУ. Вновь не проходит унификация, так как родители Ольги неизвестны. Пробуем последнее значение Х = Ирина. Запись принимает вид Родитель(Р, Ирина), родитель(Р, Y), ИринаоУ Варианты связывания переменной Р на данном шаге backtracking’а проходят унификацию лишь при Р = Ольга. Запись принимает вид родшпель(Ольга, Y), Иріінаоу В процедуре «родитель» находим не исследованное ранее высказыва¬ ние родитель(Ольга, Пётр) и полагаем F = Пётр. Запись вырождается: ИринаоПётр, что вполне справедливо, то есть, унификация проходит. Продолжив перебор, убеждаемся, что с данным отношением родства существуют только две пары: (Марья, Фёдор) и (Ирина, Пётр). На основе сделанных выводов развивается фактографическая нейрон¬ ная сеть, что частично представлено на рис. 2. 7.5. Получение новых знаний методом индуктивного мышления На основе фактов и процедуры «родитель» построим полную систему логического дедуктивного вывода. На генеалогическом дереве это соответ¬ ствует всем логическим цепочкам, следующим из каждой вершины, кроме концевых: 1) мужчина(ІОрий), родитель(Юрий, Фёдор), родитель(Фёдор, Ири¬ на), 2) мужчина(ІОрий), родитель(Юрий, Фёдор), родитель(Фёдор, Пётр), родител ь (Пётр, Иван) , 3) мужчина(ІОрий), родитель(Юрий, Фёдор), родитель(Фёдор, Пётр), родитель(ІІётр, Василий)', 4) женщина(Елена), родитель(Елена, Фёдор), родитель(Фёдор, Ири¬ на), 5) женщина(Елена), родитель(Елена, Фёдор), родитель(Фёдор, Пётр), родител ь (Пётр, Иван) , 6) женщина(Елена), родитель(Елена, Фёдор), родитель(Фёдор, Пётр), родитель(1 Іётр, Василий)', 7) женщина(Елена), родитель(Елена, Марья), роди тел ь (Мар ья, Иван)', 140
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... 8) женщина(Елена), роди тел ь (Елена, Марья), родител ь (Мар ья, Ва¬ силий): 9) женщина(Ольга), родитель(Ольга, Ирина), 10) женщина(Олъга), родитель(Ольга, Пётр), родитель(Пётр, Иван), 11) женщина(Ольга), родитель(Ольга, Пётр), родитель(Пётр, Ва¬ силий)', 12) мужчина(Пётр), родитель(Пётр, Иван), 13) мужчина(Пётр), родитель(Пётр, Василий), 14) женщина (Марья), родител ь (Мар ья, Иван) , 15) женщ ина (Мар ья), родител ь (Мар ья, Василий). Первая стратегия анализа логических цепочек. Анализируя первую цепочку, видим, что она представляет собой неко¬ торую странную конструкцию, не лишённую закономерности. Чтобы пред¬ ставить её в абстрактной форме, изменим обозначение конкретных имён пе¬ ременных по принципу: за крайними будем закреплять абстрактные символы X, Y, ... , а за внутренними - символы Р, Q, .... Тогда первая цепочка примет вид: мужчина(Х), родитель(Х, Р), родитель(Р, Y). Находим, что эта абстрактная конструкция, при разных вариантах свя¬ зывания переменных, повторяется в цепочках 2, 3, 5, 6. В 2 и 3 такую кон¬ струкцию можно выделять дважды, с пересечением. Если процедура «муж¬ чина» при этом явно не фигурирует, она подразумевается, благодаря первому вхождению мужского имени. Тогда целесообразно столь жизненно важное отношение между объек¬ тами X и Y выделить в отдельное правило, придумав ему наименование: дедушка(Х, Y) мужчина(Х), родитель(Х, Р), родитель(Р, Y). Конечно, с высоты познаний мы с некоторой иронией относимся к формализации нашего мышления. Мы-то знаем названия тех понятий, кото¬ рые хотим вывести автоматически. Новым правилом дополняем понятийную логическую нейронную сеть на рис. 7.3. Решив «целевую» задачу дедуктивного вывода, дополняем факто¬ графическую логическую нейронную сеть, что частично отображено на рис. 7.2. Аналогично замечаем, что абстрактная конструкция вида женщина(Х), родитель(Х, Р), родитель(Р, Y), впервые встретившаяся при анализе цепочки 4, тоже многократно ис¬ пользуется в последующих логических цепочках - 5,6,1, ѣ, 10, 11. Выбрав название (на основе детского лепета), сформулируем новое правило: бабушка(Х) женщина(Х), родитель(Х, Р), родитель(Р, Y). Однако слишком длинными представляются нам некоторые цепочки, даже после замены новыми правилами. Например, цепочка 2 принимает вид 141
Глава I. Логические основы искусственного интеллекта дедушка(Юрий, Пётр), родитель (Пётр, Иван). Абстрагируясь и придумав имя новому понятию, получаем новое пра¬ вило: прадедушка(Х, Y) дедушка(Х, Р), родитель(Р, Y). Аналогично получается правило: прабабушка(Х, Y) бабушка(Х, Р), роди тел ь(Р, Y). На основе новых правил и следующих из них фактов могут быть до¬ полнены фактографическая и понятийная нейронные сети, что частично от¬ ражено на рисунках 2 и 3. Выше говорилось, что новые знания остаются гипотезами до достаточ¬ но полного подтверждения опытом и дедуктивными рассуждениями. Предположим, что явился (не запылился) Залётный Молодец, который сообщил Ивану, что он - его дед. Воспользуемся правилом дедушка и попро¬ буем решить задачу дедукции: дед)чика(3илётпыйМолодец, Иван) мужчина(3алётный Молодец), роди тел ь (Залети ый Молодец, Р), родитель(Р, Иван). Первое же высказывание в этой цепочке не проходит унификацию, так как в фактах нет соответствующей регистрации! Если даже будет установле¬ но, что Залётный Молодец - мужчина, то установление праотцовства - весь¬ ма болезненный процесс. Так что второе высказывание вряд ли пройдёт уни¬ фикацию, и рекомендовать Ивану проявление прародительской почтительно¬ сти мы не станем. Но это доказывает весьма высокую действенность выве¬ денного правила! При появлении следующего поколения можно будет установить истин¬ ность и непротиворечивость выведенных выше правил. Вторая стратегия анализа логических цепочек основана на совмест¬ ном рассмотрении логических цепочек, являющихся альтернативным про¬ должением одна другой. Предположим, что нам неизвестны правила брат(Х, Y) и сестра(Х, Y) При совместном анализе цепочек 1 и 2 находим, что их различие начи¬ нается с высказываний родитель(Фёдор, Ирина) (первая цепочка) и роди- тель(Фёдор, Пётр). Запишем в абстрактном, обобщённом виде: родитель(Х, Y) родитель(Х, Z). Возникает вопрос: в каком отношении родства находятся Y и Z при общем X, если а) Y - обязательно мужчина, б) Z - обязательно женщина? За¬ пишем проект конструируемых понятий: II (Y, Z) мужчина(У), роди тел ь(Х, Y), родитель(Х, Z), YoZ; F2(Z, Y) женщина(Z), родитель(Х, Z), родитель(Х, Y), ZoY. Воспользуемся где-то услышанными красивыми названиями, сменим обозначения для приведения к «стандартному» виду и запишем два новых правила: брат(Х, Y) мужчина(Х), родитель(Р, X), родитель(Р, Y), Х<>\ ; 142
Лекция 7. Моделирование дедуктивного и индуктивного мышления с помощью языка... сестра(Х, Y) женщина(Х), родитель(Р, X), родитель(Р, Y), XoY. Новые правила отражаются в БЗ и подтверждаются при их применении в задачах достижения цели. На основе данного множества фактов, осуществляя стратегию совмест¬ ного анализа цепочек логического вывода, можно высказать гипотезу о но¬ вых понятиях племянник и племянница. племянник(Х, Y) мужчина(Х), родитель(Р, X), сестра(Р, Y); племянница(Х, Y) женщипа(Х), родитель(Р, X), брат(Р, Y). Дальнейшее обобщение на базе существующих фактов невозможно. Действительно, мы знаем, что Ирина - племянница Марьи, а Иван и Василий - племянники Фёдора по материнской линии. (По отцовской линии они внуки Фёдора.) Следует надеяться, что с появлением новых поколений станет возмож¬ но дальнейшее обобщение, которое способно привести к неоднозначности и противоречивости выводов. Например, в дополнение к прежнему, может быть сформулирован вывод племянник(Х, Y) мужчина(Х), родитель(Р, X), брат(Р, Y). Для устранения возникшего противоречия в определении племянник следует расширить использование в ПРОЛОГе логических операций И и ИЛИ (в «классическом» ПРОЛОГе ограниченно используется символ ;, как знак дизъюнкции, а скобки в предложениях не применяются). Ведь под запя¬ той, разделяющей высказывания в одном предложении, подразумевается конъюнкция И, а если использовать в предложениях символ дизъюнкции ИЛИ, единственное непротиворечивое правило примет вид: племянниках, Y) мужчина(Х), родитель(Р, X), (брат(Р, Y) ИЛИ сестра(Р, Y)). Аналогично, племянница(Х, Y) женщина(Х), родителъ(Р, X), (брат(Р, Y) ИЛИ сестра(Р, Y)). Ключевые термины Правила (вывода) - именованные абстрактные связи между фактами в описании БЗ. Дедуктивный вывод - процедура выделения всех фактов, удовлетво¬ ряющих цели вывода. Цель - выделение всех наборов фактов, удовлетворяющих требуемой связи между ними. Индуктивный вывод (здесь) - формирование новых правил на основе выделения из всех возможных логических цепочек абстрагированных связ¬ ных структур, которым присваиваются имена, и которые затем дополняют правила базы знаний. 143
Глава I. Логические основы искусственного интеллекта Связывание переменных - подстановка значений переменных в пра¬ вила, образующие логическую цепочку. Унификация - проверка непротиворечивости варианта связывания пе¬ ременных. Бэктрекинг (backtracking) - поступательно-возвратная стратегия свя¬ зывания переменных в сочетании с унификацией. Краткие итоги 1. Алгоритмический язык логического вывода ПРОЛОГ позволяет строить программные процедуры не только дедуктивного, но и индуктивного вывода на основе именованных фактов и правил, описанных в базе знаний. 2. Выделение законченных подструктур связей между фактами, осо¬ бенно - повторяющихся в различных цепочках дедуктивного вывода, позво¬ ляет абстрагировать и именовать эти подструктуры для включения в состав базы знаний в качестве новых правил. Так формируются новые знания. 3. Развиваемый ПРОЛОГ должен отображать в правилах вывода не только связи вила И, но и связи типа ИЛИ. Вопросы 1. Какие идеи лежат в основе дедуктивного вывода с помощью языка ПРОЛОГ? 2. Что представляет собой стратегия «бектрекинг»? 3. Как формируются новые правила (вывода) в рамках языка ПРОЛОГ? 4. Какие расширения языка ПРОЛОГ необходимы? 144
ГЛАВА ІІ.НЕЙРОСЕТЕВЫЕ МЕТОДЫ УПРАВЛЕНИЯ Лекция 8. Обретение навыков построения систем ассоциативных вычислений, распознавания символов и принятия решений Аннотация: Лекция посвящена внедрению начальных и, как выяснится в дальнейшем, вполне достаточных навыков построения логических нейрон¬ ных сетей для ассоциативных вычислений, распознавания букв, символов и других объектов, отображённых на экране или на модели сетчатки глаза, а также систем принятия решений вполне общего характера. Ключевые слова: ассоциативное мышление, база знаний, логическая нейронная сетъ, функция активации, рецепторы, веса связей, возбуждение нейронов, матрица связей. ... письмоводитель градоначальника, вошедши утром с докладом в его кабинет, увидел такое зрелище: градоначальниково тело, облечённое в виц¬ мундир, сидело за письменным столом, а перед ним, на кипе недоимочных реестров, лежала, в виде щегольского пресс-папье, совершенно пустая градо- начальникова голова. М.Е. Салтыков-Щедрин. История одного города. 8.1. Введение в ассоциативные вычисления Пусть некоторая система характеризуется значениями трёх параметров х, у, z, которые принято называть факторами факторного пространства. Оценка эффективности этой системы сводится к определению некоторых финансовых затрат $, сопряжённых со значениями этих параметров. Матема¬ тические зависимости для данной оценки отсутствуют, задача является труд¬ но формализуемой. Пусть значение фактора jc определяется в сантиметрах {см), значение фактора у - в килограммах {кг), значение фактора z - в количестве человек {чел.), занятых в эксперименте. Составим схему, связав стрелками значения параметров, для которых известны оценки, с этими оценками, как показано на рис. 8.1. Таким образом, схематично представлена некоторая база данных, которую необходимо преобразовать в базу знаний (БЗ), дополнив возможно¬ стью логического вывода. 145
Глава 11. Нейросетевые методы управления х = 0,1 см? ___ / 1 J V / х = 0,3 см? х = 0,5 см? у = 25 кг? у = 40 кг? z = 5 чел. ? z = 10 чел. ? С 1 У $50 С4 У $70 Рис. 8.1. Логическая нейронная сетъ, реализующая базу знаний Представим построенную схему, как схему однослойной логической нейронной сети, где слева показан рецепторный слой, а справа - единствен¬ ный выходной слой нейронов. «Оживим» эту сеть, введя функцию активации нейронов: К - £ ѵ., если это значение не меньше порога Л, 3 ] (8.1) О, в противном случае. Здесь V, (i 1, 2, 3, 4) - величина возбуждения нейрона выходного слоя, Vj (je 7}) - величина возбуждения рецептора. Выберем h = 0,5. Таким образом, на основе опытных данных, в виде обученной логиче¬ ской нейронной сети с единичными весами связей сформирована база зна¬ ний, отображающая некоторые финансовые расходы. С помощью данной се¬ ти можно производить ассоциативные вычисления для точек факторного пространства, первоначально не представленных на рецепторном слое. Ведь 146
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... перед пользователем или исследователем возникает вопрос: можно ли для произвольной ситуации в области задания параметров хотя бы приблизи¬ тельно предсказать связанные с ней расходы? Рассмотрим пример ассоциативных вычислений для значений + = 0,2 см, у = 30 кг, z = 6 чел. Значение х лежит как раз посредине, между представ¬ ленными на рецепторном слое значениями л- = 1 и х = 3. Тогда полагаем ѵу = Ѵ2 = 0,5, vj = 0. Заданное значение у находится между 25 и 40, но ближе к первому. Распределим единицу обратно пропорционально «расстоянию» у = 30 до указанных двух значений и положим ѵ4 = 0,66, Ѵ5 = 0,33. Аналогично примем ѵв = 0,8, Vj = 0,2. Находим Vi = 0,65, V2 = 0,65, Ѵз = 0, К* = 0 и среднее ожидаемое значение затрат п_50хѴ]+60хѴ2+ѢОхѴ3+70хѴ4 _ 50x0,65 + 60x0,65 1 — — Ѵ1+Ѵ2 + Ѵ3+Ѵ4 1,3 Теперь усложним пример, введя, на основе накопленного опыта и экс¬ периментов, веса связей, как показано на рис. 8.2. (Непомеченные связи - единичные.) С учётом весов связей целесообразно выбрать другую функцию акти¬ вации і-го нейрона: У ѵ со ^ J П V = < г если это отношение не меньше h, 0, в противном случае (8.2) Здесь Ѵі - величина возбуждения і-го нейрона, у, - величина возбужде¬ ния рецептора, связанного с і-м, со,, - вес связи j-го рецептора с і-м нейроном. Рассчитаем среднее количество затрат для той же ситуации. Возбужде¬ ние рецепторов остаётся тем же, и при том же значении h находим Ѵ\ = 0,63, Н2 = 0,5, Ѵз = 0,Ѵ4 = 0, р _ 50 х Ѵх + 60 х Г2 + 80 х Ѵ3 + 70 х Ѵ4 = 50 х 0,63 + 60 х 0,5 = = $54 4 Ѵ1+Ѵ2 + Ѵ3+Ѵ4 1,13 Учитывая, что решение могло быть не численным, или допускало бы нечисловую компоненту, сформируем простейшую методику проведения ассоциативных вычислений по логической нейронной сети: 1) Задание исследуемой ситуации на рецепторном слое. 2) Расчёт величины возбуждения нейронов с помощью пороговой функции активации. Ъ,а) Если все нейроны своим возбуждением указывают на численное значение некоторой величины, находится среднее значение (по возбуждению всех нейронов) в качестве ответа решаемой задачи. 147
Глава II Нейросетевые методы управления х = 0,1 см? х = 0,3 см? х = 0,5 см? у = 25 кг? у = 40 кг? z = 5 чел. ? z = 10 чел.? \ 2 1 $60 1 ) $80 ( 4 1 $70 ( 1 Рис. 8.2. Логическая нейронная сеть с весами связей 3,6) Если нейроны указывают не на численные значения, например, на текст, символ объекта, качественное значение и пр., находится нейрон с мак¬ симальным значением возбуждения (не единственность такового разрешает¬ ся пользователем, например, уточнением ситуации или рассмотрением до¬ полнительных факторов). Принимается ответ, на который указывает макси¬ мально возбудившийся нейрон. Этот процесс выбора подобен голосованию в пользу предпочтительного решения по данной ситуации. 3,в) Если решение представляет собой вектор, то пункты 3,а и 3,6 вы¬ полняются отдельно для каждой компоненты этого решения. Это означает, что где можно выполнить усреднение, оно производится, где нельзя, на ре¬ шение указывает максимально возбудившийся нейрон. Однако ощущение неудовлетворённости мучает нас. Хорошо, действи¬ тельно - всё так просто! Но как такую нейросеть всунуть в компьютер? Средства мультимедиа, что ли использовать? 148
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Нет. Всё гораздо проще! Логическая нейронная сеть представляется и обрабатывается с помощью матрицы связей. Для рассмотренного примера она представлена в табл. 8.1. Таблица 8.1. Матрица связей для логической нейронной сети Рецепторы дс=0,1 х=0,3 х=0,5 ,Ѵ=25 о ’’Т II z=5 z=H) Пример 0,5 0,5 0 0,66 0,33 0,8 0,2 Решение 1 1 1 0,6 Решение 2 1 1 1 0,8 Решение 3 1 1 0,5 Решение 4 1 1 0,5 8.2. Распознавание нечётких символов персептроном Подобно сетчатке глаза, сформируем экран 8 х 16 клеток. Каждую клетку будем рассматривать в качестве рецептора, способного воспринимать извне величину возбуждения в диапазоне 0 - 1. Для обучения букве О условно нарисуем на экране эталон этой буквы. Окружим линию этого эталона клетками (рецепторами) с некоторым запасом по толщине линии (как показано на рис. 1.3) так, чтобы создать «ловушку» для захвата основной части нечётко и с искажениями изображаемой буквы О. Соединим все рецепторы «ловушки» буквы О связями (с единичными веса¬ ми) с нейроном, отвечающим за вывод: «Это буква О». Выберем функцию активации этого нейрона /0 = Z/ - Л, при от¬ рицательном значении разности принимающую нулевое значение. Здесь No - количество рецепторов, образующих «ловушку» буквы О, f - величина воз¬ буждения /-го рецептора, h - единый порог, подбираемый экспериментально для всех букв, распознаванию которых производится обучение. По рисунку No = 64. На этом же экране построим «ловушку» для искажённой, «зашумлён¬ ной» буквы А, как показано на рис. 8.4. Все рецепторы «ловушки» свяжем с нейроном, отвечающим за вывод: «Это буква А». Функция активации этого нейрона имеет тот же вид fA = N однако, в нашем примере Na = 74. (Данное нормирование производится для уравнивания значимости всех букв, которым обучается нейросеть.) 149
Глава 11. Нейросетевые методы управления ■ ■ Это буква О! Рис. 8.3. Ловушка для захвата буквы О Это буква А! Рис. 8.4. Ловушка для захвата буквы А 150
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... ,9 Д ,6 ,5 ,4 ,3 ,4 ,5 ,7 ,8 ,8 ,9 ,9 ,6 ,4 ,4 ,6 ,4 ,6 ,4 ,5 ,6 ,7 ,3 ,7 4 ,9 ,2 ,3 ,8 ,9 ,8 ,8 ,8 ,8 д Д ,7 ,9 ,8 ,8 ,6 ,5 ,2 ,9 ,9 ,8 ,9 ,5 ,6 ,2 д ,8 ,8 ,7 ,8 ,7 Д ,2 д ,3 ,6 ,8 ,6 ,5 ,4 ,3 ,4 ,2 ,9 ,8 ,9 ,9 Д Д д д ,9 ,7 ,8 ,9 ,8 Д д ,6 ,9 ,8 ,6 ,8 ,5 Д д ,8 ,4 ,2 ,6 ,6 ,3 ,3 ,6 ,8 ,3 Д ,5 ,8 ,6 ,6 ,7 ,4 ,4 ,2 д ,8 ,8 ,9 ,8 ,5 ,3 ,8 д ,2 ,9 ,6 ,2 д Д ,9 д ,6 ,5 ,4 ,3 ,4 ,5 ,7 ,8 ,8 ,9 ,9 ,6 ,4 ,4 ,6 ,4 ,6 ,4 ,5 ,6 ,7 ,3 ,7 Д ,9 ,2 ,3 ,8 ,9 ,8 ,8 ,8 ,8 д Д ,7 ,9 ,8 ,8 ,6 ,5 ,2 ,9 ,9 ,8 ,9 ,5 ,6 ,2 д ,8 ,8 ,7 ,8 ,7 Д ,2 д ,3 ,6 ,8 ,6 ,5 ,4 ,3 ,4 ,2 ,9 ,8 ,9 ,9 Д Д д д ,9 ,7 ,8 ,9 ,8 Д д ,6 ,9 ,8 ,6 ,8 ,5 Д д ,8 ,4 ,2 ,6 ,6 ,3 ,3 ,6 ,8 ,3 д ,5 ,8 ,6 ,6 ,7 ,4 ,4 ,2 д ,8 ,8 ,9 ,8 ,5 ,3 >8 д ,2 ,9 ,6 ,2 д Д Рис. 8.5. Распознавание с помощью ловушек По чётко заданным эталонам букв (с единичной засветкой клеток экра¬ на по правильному контуру) предварительно подберём порог h так, чтобы существенно возбуждался лишь тот нейрон, который соответствует предъяв¬ ляемой букве. Показ «чужого» символа, которому нейросеть не обучалась, должен приводить к нулевому возбуждению нейронов. В процессе экспери¬ мента и при добавлении новых букв значение порога может уточняться. 151
Глава 11. Нейросетевые методы управления Перейдём к рабочему режиму распознавания. На рис. 8.5 показан вари¬ ант зашумлённой засветки экрана. Слева наложена «ловушка» для распозна¬ вания буквы О. Справа - «ловушка» для распознавания буквы А. Сумма сигналов в «ловушке» О равна 49,2. Пусть h = 0,7. Тогда fo = 0,77 - 0,7 = 0,07. Сумма сигналов в «ловушке» А равна 36,9,/4 = 0. Нейросеть высказалась за то, что ей была предъявлена «зашумлённая» буква О. Расширьте эксперимент, произведя обучение для трёх, четырёх и т.д. символов. Выбор набора значительно отличающихся символов определяет вариант выполняемой лабораторной работы. Для представления экрана и для расчётов целесообразно использовать EXEL. Вы, несомненно, столкнётесь с малой разрешающей способностью экрана 8 х 16. Кроме того, данная лабораторная работа ограничена центров¬ кой и масштабированием образов. Так что перед экспериментатором откры¬ ваются неограниченные возможности! 8.3. Система принятия решений «Железнодорожная рулетка» Рассмотрим увлекательную детскую игру «Железнодорожная рулетка», основанную на так хорошо знакомой Вам задаче о встрече. Помните: «Из пунктов А и В навстречу друг другу...» и т.д.? Начальник станции Кукуевка (ведущий) и начальник станции Пырлов- ка одновременно выпускают навстречу друг другу два паровоза (рис. 8.6) со скоростью либо 60, либо 80 км/час. Длина перегона составляет 4 км. Не¬ большой нюанс заключается в том, что пути перегона то сходятся в один, на протяжении одного километра, то расходятся. И тогда, в зависимости от точ¬ ки встречи, со станции Кукуевка надо выслать на соответствующий километр либо линейного - даму с приветственным платочком, либо линейного с под¬ стилочной соломкой. Решение о такой посылке усложняется помехами в линии передачи данных, в связи с чем скорости паровозов сообщаются с достоверностью, меньшей единицы. Кроме того, необходимо каждый эксперимент связать с ожидаемыми денежными затратами на единовременную добавку к пенсии линейных. Тогда Вы понимаете, что без элементов искусственного интеллекта не обойтись. Вы ищете что-то похожее на табличный метод, но с автоматиче¬ ской интерполяцией, что-то связанное с ассоциативным мышлением... И Вы решаетесь... Произведём предварительные расчёты, чтобы представить себе все ва¬ рианты будущего поведения нашей системы принятия решений — для её обучения. Представим (рис. 8.7) графически структуру логического функци¬ онирования создаваемой системы принятия решений для каждой возможной ситуации. 152
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... [стТЯыРл0в*л, )| 3 км 2 к'м / і» S = s встречи у у Рис. 8.6. Интеллектуальная игра «Железнодорожная рулетка» Ситуация 1. Кукуевский паровоз имеет скорость 60 км/ч (Событие А1). Пырловский паровоз имеет скорость 60 км/ч (Событие В1). Одновременное выполнение этих событий обозначим А1&В1. Тогда точка встречи находится как раз посредине перегона, что, скорее всего, требует помощи линейного с соломкой. Но возможно и везение за счёт неточного определения скоростей. Тогда на всякий случай потребуется дама с платочком. Принимаемое реше¬ ние, заключающееся в отправлении обоих линейных на границу второго и третьего километров, назовём решением R1. С ним связаны расходы на еди¬ новременное пособие Ml. Ситуация 2. Кукуевский паровоз имеет скорость 60 км/ч (Событие А1), но пырловский паровоз имеет скорость 80 км/ч (Событие В2). (Выполняется условие А1&В2.) Тогда их точка встречи находится на втором километре пу¬ ти, и, следовательно, требует решения R2: «Отправить даму с платочком на второй километр!» В активе указанной дамы появляется сумма М2 условных единиц. Ситуация 3. Кукуевский паровоз имеет скорость 80 км/ч (Событие А2), пырловский паровоз имеет скорость 60 км/ч (Событие В1). (Выполняется условие А2&В1.) Тогда их точка встречи находится на третьем километре пу- 153
Глава II Нейросетевые методы управления ти, что требует сочувственного вмешательства линейного с соломкой (реше¬ ние R3), с оплатой труда в М3 условных единиц. Рис. 8.7. Система принятия решений и её Нейросетевая интерпретация Ситуация 4. Кукуевский и пырловский паровозы имеют скорость 80 км/ч (Событие А2&В2), что, ввиду высокой скорости перемещения линейных в середину перегона, требует решения R4 с затратами М4. А теперь оживим эту структуру, заставим её действовать, как, по- видимому, на логическом уровне действуют структуры нашего мозга. Представим себе, что на месте каждого овала (потом — кружочка, на рисунке 8.7 справа) действует нейроподобный элемент (просто нейрон). Ней¬ роны входного слоя — рецепторы приходят в возбуждённое состояние извне (подобно сетчатке глаза) в соответствии с той ситуацией, которую мы задаём на входе системы. Например, мы хотим испытать ситуацию А1&В2. Тогда мы полагаем величины возбуждения рецепторов А1 и В2 равными единице и за¬ писываем: Ѵаі = Ѵв2 = 1. При этом мы не забываем позаботиться о том, чтобы величины возбуждений нейронов А2 и В1 остались равными нулю. Для нейронов, «принимающих» возбуждение рецепторов в соответ¬ ствии со стрелками, введём функцию активации, в результате выполнения которой формируется величина V возбуждения каждого нейрона. Для нашего случая, не долго думая (ибо существует большой произвол в выборе вида функции активации, на любой вкус), определим вид такой функции v=Yy-h, і где i — индекс нейрона (в данном случае - рецептора), «передающего» своё возбуждение данному нейрону, h — порог. 154
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Положим h = 1 и рассчитаем величины возбуждения нейронов R1 - R4 для чётко заданной единицами, эталонной, ситуации А1&В2 Ѵт\ 1 + 0 - 1 = 0, Пді = 0; Vr2\ 1 + 1 -1 = 1, Vr2 = 1; Ѵез\ 0 + 0-1 =-1,Яи = 0; VR4\ 0 + 1 - 1 = 0, Vr4 = 0. Таким образом, «высветилось» то решение, которое необходимо при¬ нять, и старт линейным должен быть дан. Продолжим верификацию провер¬ кой, что так же работает наша сеть по всем эталонам, по которым мы её обу¬ чили, проложив «проводочки» от каждой исходной посылки к следствию. Теперь поэкспериментируем. Задавая события по принципу «да - нет», «1 - 0», мы предполагали бу¬ левский тип исходных данных. А что, если поменять, обобщить тип исход¬ ных данных, допустив рассмотрение нечётких значений возбуждения рецеп¬ торов, интерпретируемых как достоверность? Или даже каких-то других вза¬ имных оценок, которые используются часто в быту людьми, не сведущими в теории вероятности и не знакомых с понятием «исчерпывающее множество событий»? Например, в результате искажения информации начальник станции Ку- куевка принял решение считать скорость пырловского паровоза равной не то 60, не то 80 км/ч. Но, скорее всего — 60! И подойдя к компьютеру, он по наитию набирает: А1 = 1, А2 = 0, В1 = 0,7, В2 = 0,4. На какую ситуацию это указывает, и какое решение наиболее правильно? Считаем: VRJ: 1 + 0,7 -1 = 0,7, VR1 = 0,7; Vr2. 1 + 0,4 - 1 = 0,4, Vr2 = 0,4; Vr3\ 0 + 0,7 - 1 = -0,3, Vr3 = 0; Vr4. 0 + 0,4 - 1 = -0,6, Vr4 = 0. Мы видим, что максимальной величины возбуждения достиг нейрон R1, определивший главное решение. Но мы вправе учесть и решение R2 с меньшим приоритетом, дав даме с платочком дополнительные указания. И в этом проявится наша мудрость. По известной формуле нахождения среднего мы можем оценить мате¬ матическое ожидание того, на сколько облегчится карман начальника Куку- евской станции: ,, М1-0,7+М2-0,4+МЗ-0+М4-0 м= , 0,7+0,4+0+0 где М\ — М4 — конечно же неизвестные нам (и налоговому инспектору) суммы. 155
Глава 11. Нейросетевые методы управления 8.4. Актуальная реализация бизнес-проекта В России революция — дрогнула мать сыра земля, замутился белый свет... Артём Весёлый. Россия, кровью умытая Будем считать, что рассматриваемый пример был актуален в суровые, но славные 90-е годы прошлого столетия, и с этим покончено навсегда! Вася и Петя — друзья. Нет, не в том смысле, а в смысле вечной святой мужской дружбы, без смущения применяющей слово «друг». Обозначим А — множество друзей, А = {Вася, Петя}. Вася и Петя — крутые парни. Они плохо учились в школе, и это хоро¬ шо! Они создали «крышу», под которой успешно трудится ряд палаток С = {«Оксана», «Роксана», «Марина», «Регина», «Св. Аполлинария»}, заботливо опекаемые хозяйками, соответственно, Оксаной и Роксаной, Мариной и Региной, а также Аполлинарией. Палатки реализуют продукцию фирм В = {Красный Киллер, Пират, Ночная Бабочка}. Фирма Красный Киллер в секретных подвалах славных подразделений бойцов холодной войны на основе бабушкиного самогона и контрабандного синтетического спирта гонит всемирно известную вино-водочную продук¬ цию отличного качества. Фирма Пират производит ауди- и видеопродукцию и другие культурные ценности. Фирма Ночная Бабочка выдаёт отличную французскую косметику из мосластых московских дворняг. Ситуацию контролирует дядя Рамзай из налогового ведомства, кото¬ рый имеет свой маленький частный бизнес. С каждой сложившейся ситуаци¬ ей, определяемой тем, кто из друзей какие палатки посетил, и какая продук¬ ция там находилась на реализации, дядя Рамзай связывает свою долю прибы¬ ли, основанную, мягко говоря, на шантаже. Дядя Рамзай имеет свой штат осведомителей: пару бомжей — жертв предыдущей амнистии, и пару-тройку голопузых апологетов трудного детства, которые с некоторой долей досто¬ верности, за небольшую мзду и мелкое попустительство, доставляют ему информацию. Дядя Рамзай - прогрессивный бизнесмен, ему не чужды идеи иннова¬ ционной политики в области предпринимательства, и оценки прибыли он решает проводить на высоком математическом уровне, обратившись за по¬ мощью к нам (рис. 8.8). Мы хорошо учились в школе, и это — плохо! Мы, как истинные альтруисты и учёные-бессеребренники, с радостью поможем ему, — бесплатно. А информации приходится обрабатывать дяде Рамзаю много. Он, пря¬ мо скажем, работает в условиях неопределённости и усиленных помех. Су¬ дите сами. Оксана делит любовь между Васей и Петей. Роксана — пока нет. 156
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Марина и Регина, жалея, подкармливают юных следопытов. Аполлинария вообще закадрила хахаля из местной мэрии и разъезжает в длиннющем «лин¬ кольне». Тщетно пытаясь разрушить узы бескорыстной дружбы, фирма Пи¬ рат напрямую подмазала Васю, снизив нагрузку вымогательства на свою продукцию. Петя, кажется, пошёл на нарушение Конвенции и вторгается в область, контролируемую конкурентами. (Ох, не избежать благородной раз¬ борки, со стрельбой и окровавленными трупами!) Скоро отмотает свой срок Никита, и предприятие расширится и т.д., и т.д., и т.д.... Рис. 8.8. Предмет исследования Все такие обстоятельства прямо или косвенно влияют на долю прибы¬ ли дяди Рамзая. Разбираясь в столь сложной ситуации, — для демонстрации действите¬ льно очень трудно формализуемой задачи, — мы чувствуем, как чем-то лип¬ ким покрываются наши честные ладошки. А потому мы решительно оттал¬ киваемся от ... и со сладким упоением возносимся на уровень милого сердцу абстрактного, математического, формально-логического мышления. Но, прежде всего, принимая столь ответственный заказ, мы хотим чёт¬ ко уяснить, что хочет дядя Рамзай, — чтобы всё же максимально формализо¬ вать задачу. И после долгих согласований мы устанавливаем: 1. Он хочет, задавая исходную информацию на входе той системы, ко¬ торую мы для него создадим, на основе, возможно, не полной или недосто¬ верной информации своих агентов, всё-таки распознать с наибольшей опре- 157
Глава 11. Нейросетевые методы управления делённостью, что это за ситуация (на какую ситуацию в наибольшей степени указывают сложившиеся обстоятельства), чтобы знать, на какой навар можно рассчитывать; 2. Он хочет, задавая исходную ситуацию на входе системы, установить среднюю величину прибыли, так как в разной степени определённости речь идёт о нескольких возможных ситуациях; 3. Он хочет сделать вывод о частоте появления различных ситуаций, чтобы перераспределить тарифные ставки за умолчание о шалостях Васи и Пети. Пусть по стечению обстоятельств, которые мы будем называть событи¬ ями, принимаются решения. Решения образуют конечное множество. Каждое решение соответствует некоторой, в общем случае не единственной, комби¬ нации событий. Предположим наличие нескольких вариантов одного собы¬ тия. Считаем, что варианты каждого вида событий образуют исчерпывающее множество, т.е. сумма их вероятностей равна единице. Перебрав все возможные ситуации, получим систему логических вы¬ сказываний, как основу формализации задачи при построении нейросети: А 1лВ1л(С1 ѵС2ѵСЗѵС4ѵС5) ->R1; А1л(В2 ѵВЗ)л(С1 ѵС2 ѵСЗ) -> R2; А1л(В2ѵВЗ) л(С4и:5) ->R3; (8.3) А2лВЗл(С1ѵС2ѵСЗѵС4ѵС5) ->R4; А2л(П1 ѵВ2)л(С1 ѵС2ѵСЗ ѵС4ѵС5) -+R5. Здесь R1 — R5 — принимаемые решения. Первое логическое высказывание означает: «Если Вася отправился в одну из пяти палаток, и все они торгуют сегодня продукцией фирмы Крас¬ ный Киллер, то следует принять решение R1 (например, заказать туристиче¬ скую путевку)». Второе логическое высказывание означает: «Если Вася посе¬ тил одну из палаток С/, С2 или СЗ, торгующих сегодня продукцией фирм В2 и (или) ВЗ, то следует принять решение R2» и т.д. Построим (рис. 8.9) схему, реализующую алгоритм счета значения вы¬ ражения (8.3), если на вход подаются значения булевых переменных, обозна¬ чающих события. Такая электронная схема могла бы верно служить в качестве основного механизма системы принятия решений, способствуя быстрому определению необходимой реакции на сложившуюся, вполне определённую, ситуацию, Но ведь не зря мы обращаем внимание на те помехи и неопределённость, в усло¬ виях которых приходится жить и работать. Мы должны оперировать только достоверностями либо другими оценками событий, пытаясь определить, ка¬ кой ситуации более всего соответствуют сложившиеся обстоятельства. 158
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Рис. 8.9. «Электронная» схема системы принятия решений Значит, мы должны из точного, детерминированного представления перейти в область ассоциативного, неточного, приблизительного мышления! Но степень (частота) угадывания должна быть достаточно высока. Именно здесь должна помочь нейросеть, реализующая нечёткую логи¬ ку. В Приложении, в котором представлена теоретическая часть проблемы логических нейронных сетей, показывается, как построить нейроны, специа¬ лизированные для приближённого выполнения операций конъюнкции и дизъюнкции. Однако выясняется, что один «стандартный» нейрон, подобный рассмотренным выше, способен с достаточной точностью заменить обе опе¬ рации. (Это не совсем так; в [7] подробно рассмотрены меры повышения до¬ стоверности выводов, полученных с помощью структурированных логиче¬ ских нейронных сетей, нейроны в которых первоначально отражают либо конъюнкцию, либо дизъюнкцию.) 159
Глава II. Нейросетевые методы управления Изобразим логическую нейронную сеть, воспользовавшись нейронами вместо приборов, выполняющих операции конъюнкции и дизъюнкции. Введём функцию активации без ограничения по величине возбужде¬ ния, но не отрицательную (отрицательное значение разности примем нуле¬ вым): т Ѵі:= I Vjcoji-h. (8.4) j = i Положим (по наитию) со,, = 0,8, h = 0,2. Сеть, на которой отслеживается счёт варианта для её верификации, представлена на рис. 8.10. Максимальное возбуждение действительно достигается предусмотренным нейроном. Однако, как говорилось ранее, преобразование логического описания системы принятия решений приводит к получению упрощённой однослойной логической нейронной сети, предполагающей имитацию с помощью нейрона лишь операции конъюнкции. Последуем этим путём. Раскроем скобки в (1.3) и получим окончательный вид однослойной логической нейронной сети, ко¬ торый может быть представлен дяде Рамзаю (рис. 8.11). Однако наш первый опыт построения системы принятия решений, где успешно действуют Вася, Петя & К0, нельзя считать совершенным. Придётся поглубже погрузиться в специфику бизнеса дяди Рамзая! Во-первых, задача невнятно сформулирована дядей Рамзаем: что озна¬ чает информация о том, что, например, Марина торговала товаром В1, когда её навестил Вася? Что, другого товара не было? Но если был и товар В2, то какое решение из этого следует? Каковы предпочтения? Как количественно учитывается наличие разных товаров? Во-вторых, наличие сложных логических конструкций, определяющих одно решение, затрудняет развитие и модернизацию системы принятия ре¬ шений, включение новых факторов, изменение условий. Целесообразно при построении системы принятия решений применить принцип разумной избы¬ точности, что свойственно мозгу. Хорошо усвоив главную рекомендацию об упрощении подхода, об упрощении логических выражений, об избыточном размножении решений, о сведении сети к однослойной и даже - к совершенной, где каждое решение связано с единственной точкой факторного пространства, приступим к уточ¬ нению системы принятия решений, взывая к опыту дяди Рамзая. А именно, заставим его объём своей прибыли поставить в зависимость от количественных оценок товара, находящегося на реализации в каждой торговой точке. Продукцию В1 будем отображать ящиками, разбив их коли¬ чественно на значимые, возможные интервалы. Аналогично, сотнями кассет будем измерять продукцию В2, а килограммами - продукцию ВЪ. 160
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Рис. 8.10. Нейронная сетъ и пример расчёта по ней Например, существенно влияющими на «результат» могут быть следу¬ ющие оценки поступившей на реализацию продукции В1: до 5 ящиков, от 5 до 10 ящиков, от 10 и выше. Продукцию В2 можно учитывать следующим образом: до 5 сотен кассет, от 5 до 10 сотен, от 10 сотен и выше. Продукцию ВЪ по характеру значимости целесообразно рассматривать: до 10 кг, от 10 до 100 кг, от 100 кг и выше. Предположим, что в результате длительного опыта «проб и ошибок» дядя Рамзай нашёл оптимальную шкалу соотношений между складывающи¬ мися ситуациями и значениями личной прибыли. Для составления обученной однослойной логической нейронной сети свяжем напрямую все возможные ситуации (задаваемые на рецепторах), для которых дядя Рамзай знает ответы, с нейронами, «отвечающими» за реко- 161
Глава 11. Нейросетевые методы управления мендуемые решения. Закрепление рецепторов за значениями факторов и не¬ которые примерные связи показаны на рис. 8.12. Рис. 8.11. Окончательный вид однослойной логической нейронной сети Несомненно, работа с нечёткими данными значительно усложнилась. Ведь дядя Рамзай может «работать» только на уровне предположений, опи¬ раясь на совесть недобросовестных осведомителей. Накопив достаточный опыт, дядя Рамзай может ввести веса, с которыми разные ситуации или зна¬ чения отдельных факторов влияют на рекомендуемые решения. Он легко по¬ полнит нейросеть новыми фигурантами. Возможности развития СПР поисти¬ не неограничены! 162
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Вася Петя В1, [0, 5) В1, [5, 10) В1, [10, выше] В2, [0, 5) В2, [5, 10) В2, [10, выше] В3, [0, 10) В2, [10, 100) >- В2, [100, вы-ше] Марина Регина >- Оксана Роксана Св. Апол¬ линария Рис. 8.12. Примерный вид нейронной сети 163
Глава 11. Нейросетевые методы управления 8.5. Формирование информации на рецепторном слое Определим возбуждение рецепторного слоя, учитывая то, что по нейросетевым технологиям решаются сложные, чаще всего трудно формали¬ зуемые задачи. Исходная информация этих задач может быть настолько несовместима по смыслу, типам данных и единицам измерения, что приведе¬ ние ее к некоторому количественному воплощению — величине возбужде¬ ния нейронов входного слоя — представляет серьёзную проблему. Например, как объединить величину превышаемой водителем скорости и тип автомобиля иностранного производства со вчерашним неудачным вы¬ ступлением любимой автоинспектором футбольной команды, — при нахож¬ дении величины штрафа? Ведь каждый из перечисленных факторов должен определить некоторые общие, приведенные значения возбуждения. Такое приведение также зависит от задачи. Поскольку нейроны — не¬ что стандартное для данной задачи или класса задач, то каждая характери¬ стика нейрона — величина возбуждения, веса его синапсических связей, по¬ рог, функция активации — должны быть одинаковы или принадлежать об¬ щему (по каждой характеристике) для всех нейронов диапазону возможных значений. Дадим рекомендации, основанные на «событийном» принципе. Разобьем скорость на диапазоны штрафования, например, [90, 100), [100, ПО), [ПО, 120), [120, 200]. За каждым диапазоном скорости закрепим нейрон входного слоя — рецептор. Универсальный подход основан на связывании величины возбуждения рецептора с достоверностью - вероятностью того, что величина скорости принадлежит одному или нескольким диапазонам. Такому подходу будем следовать в дальнейшем. А именно, хотя бы интуитивно (а интуиция основана на тщательном изучении Инструкции) определим достоверность того, что интересующая нас величина принадлежит данному диапазону. С какой достоверностью она принадлежит второму диапазону? А третьему? Грамотный инспектор помнит, что должен исходить из свойств ИМС - исчерпывающих множеств событий, с которыми имеет дело. Для ИМС сумма вероятностей событий равна единице. Тогда, в соответствии с высказанными положениями, инспектор не должен, например, задавать значение достовер¬ ности того, что скорость автомобиля находится в пределах 100 - 120 км/ч, равной 0,8, и в то же время достоверность того, что она находится в пределах 120 - 140 км/ч, равной 0,7. Более того, в соответствии с рекомендациями тео¬ рии нечётких множеств он следует нормальному закону распределения плот¬ ности вероятностей (рис. 8.13). 164
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... Рис. 8.13. Распределение возбуждения рецепторов по нормальному закону А именно, если он считает, что, скорее всего, скорость принадлежит диапазону 100 - 120 км/ч, и полагает достоверность этого высказывания рав¬ ной 0,6 (математическое ожидание), то куда деть остальные 0,4? Инспектор распределяет эту величину между «смежными» по смыслу событиями, ими¬ тируя нормальный закон, например, полагая значения возбуждения рецепто¬ ров, как показано на рисунке. В случае не столь высокой грамотности, полагаясь на универсальность аппарата логических нейронных сетей, имитирующего массовое ассоциатив¬ ное мышление, можно даже уйти от понятия достоверности, как вероятност¬ ной категории. Все ли мы на бытовом уровне знакомы с понятием исчерпы¬ вающего множества событий, связанным с условием нормировки, т.е. - с условием равенства единице суммы их вероятностей? Ведь часто можно услышать: «Даю голову на отсечение, что это так, хотя и допускаю, что все наоборот...» Главное, чтобы исходные оценки информации были относи¬ тельными, отражающими принцип «больше - меньше». Это расширит попу¬ лярность нейросетевых технологий, исключит необходимость специальных знаний. Ведь какие-то начальные возбуждения рецепторов, при их относи¬ тельном различии, распространятся по нейросети, определяя предпочтитель¬ ность принимаемого решения! Тогда, на этапе формирования обученной нейросети, получим возмож¬ ность формирования аналога некой таблицы, в соответствии с которой будет действовать инспектор. Выделим нейроны, «отвечающие» за типы автомобилей: отечественно¬ го производства, «мерседес», «вольво», «джип» и т.д. Величину возбуждения этих нейронов будем полагать равной 1 — на этапе верификации, или равной 165
Глава 11. Нейросетевые методы управления достоверности события — в рабочем режиме. Аналогично выделим рецепто¬ ры, «отвечающие» за другие возможные события: степень интеллигентности водителя (так же по диапазонам изменения), выигрыш или проигрыш люби¬ мой команды и т.д. Следовательно, на входном слое будут формироваться приведённые значения возбуждения. В рабочем режиме мы, таким образом, получили возможность исполь¬ зования неопределённой, недостоверной информации. Например, инспектор не смог из-за высокой скорости отличить «ниву» от «чероки». Тогда он ре¬ шает ввести значение 0,5 в графу «нива» (величина возбуждения рецептора, «отвечающего» за «ниву» станет равной 0,5) и 0,5 - в графу «джип «чероки» (такой же станет величина возбуждения соответствующего рецептора). Од¬ нако, подумав, он на всякий случай вводит величину 0,2 в графу ВАЗ 2104, что также во власти его сомнений. Так же инспектор поступает и с другими характеристиками сложившейся ситуации в поисках наиболее достоверного решения по принципу наибольшей похожести. Следует сделать важное замечание. Всегда ли обязательно разбиение параметров, отражаемых непрерывными функциями, на диапазоны измене¬ ния? Часто удобно закреплять рецепторы не за диапазонами изменения зна¬ чений параметров, а за конкретными значениями, как это рассматривалось ранее. В этом случае опыт носит дискретный характер. Например, в этом же примере о штрафовании может быть известен опыт вида: «Если скорость автомобиля равна 100 км/час & (другие характеристики ситуации), то размер штрафа составляет...» «Если скорость автомобиля равна 120 км/час & (другие характеристики ситуации), то размер штрафа составляет...» и т.д. Тогда как задать возбуждение рецепторов, если инспектор точно уста¬ новил, что скорость автомобиля при наезде на пешехода была равна 114 км/час? По-видимому, он рассуждает на основе обратно пропорциональной близости скорости к границам указанного интервала: «Достоверность того, что скорость автомобиля составляет 100 км/час, я найду как (120 - 114):(120 - 100), а достоверность того, что скорость автомобиля составляет 120 км/час, я найду как (114 - 100):(120 - 100). Следует обратить внимание на то, что сумма найденных достоверностей равна единице. Таким образом, указан самый простой и практичный способ возбужде¬ ния всего двух рецепторов, «охватывающих» испытываемое значение факто¬ ра. Конечно, если очень хочется, можно пользоваться нормальным законом распределения вероятностей. И не ищите методов точной оценки порогов, весов связей, возбуждения рецепторов и пр. Оценки эти определяются интуицией, питающейся опытом. Поэтому в задании исходных данных для логической нейронной сети всегда 166
Лекция 8. Обретение навыков построения систем ассоциативных вычислений... присутствует фактор волюнтаризма, неопределенности, случайности и даже предвзятости личного мнения (начальника). Что ж, не зря же человек - обще¬ ственное животное. Ключевые термины Нейрон - прибор, выполняющий пороговую функцию активации. Функция активации нейрона - формирует величину возбуждения ней-рона в зависимости от возбуждения передающих нейронов или рецепто¬ ров. Предикат - форма представления любого высказывания на предмет¬ ной области, принимает значения ИСТИНА или ЛОЖЬ. Достоверность высказывания - вероятность того, что соответствую¬ щий предикат имеет значение ИСТИНА. Нейронная сеть - множество взаимно связанных нейронов, обладаю¬ щее входным - рецепторным и выходным слоями. Отсутствуют пути, исхо¬ дящие из нейронов рецепторного слоя и не приводящие хотя бы к одному нейрону выходного слоя. Логическая нейронная сеть - нейронная сеть, реализующая предика¬ ты - высказывания типа «если - то». Возбуждение рецепторов формируется на основе достоверности высказываний о принадлежности данных. Матрица следования - форма компьютерного представления логиче¬ ской нейронной сети. Персептрон - прибор, построенный по технологии нейронной сети, служащий для распознавания образов. Ассоциативные вычисления - распознавание результата вычислений на основе усреднения наиболее близких, известных, точных результатов счё¬ та, на которые указывают возбудившиеся нейроны Краткие итоги 1. Нейронные сети образуют базовый механизм самого низкого уровня ассоциативного мышления. 2. Рецепторный слой изначально формируется на основе известных то¬ чек или диапазонов факторного пространства, которые в совокупности со значениями других факторов представляют множество ситуаций, для кото¬ рых известны решения. Ситуации и решения образуют базу знаний на основе отношений вида «если - то». В рабочем режиме компоненты интересующей ситуации могут не совпадать с теми значениями, для которых существуют рецепторы. Кроме того, данные о возникшей ситуации могут быть нечётки¬ ми, то есть определяемыми с некоторой вероятностью. В этом случае необ¬ ходимо возбуждать рецепторы в соответствии с оценкой достоверности при¬ надлежности фактора тем значениям или диапазонам, для которых суще¬ 167
Глава 11. Нейросетевые методы управления ствуют рецепторы (распределяя «единицу» между «близкими» рецепторами). Пользователь может при желании приближённо реализовать некоторый пред¬ полагаемый закон распределения этой достоверности - не только нормаль¬ ный. 3. Не следует непременно строить сложные аппроксимирующие зави¬ симости при обработке опытных данных и результатов моделирования. До¬ статочно по экспериментальным данным построить базу знаний, объединя¬ ющую выводы, полученные в некоторых точках факторного пространства. Ассоциативные вычисления с помощью логической нейронной сети для «промежуточных» точек позволяют более точно, по сравнению с известными численными методами интерполяции, получать необходимые выводы для всех типов данных. Если же точность оказывается недостаточной, следует продолжить эксперимент или моделирование в недостаточно изученной об¬ ласти. 4. Распознавание символов (после центровки и масштабирования) це¬ лесообразно производить с помощью заключения эталонов в области экрана (эталонные области, ловушки), достаточно широко (с учётом искажений ис¬ пытываемых символов) охватывающие эти эталоны. Исследуется, какую из известных эталонных областей в наибольшей степени и с превышением по¬ рога покрывает испытываемый символ. Для этого функция активации стро¬ ится на основе суммирования сигналов в каждой эталонной области. Если при проверке всех известных эталонных областей порог распознавания не был превышен, подаваемый символ признаётся неизвестным. 6. Построение сложных систем принятия решений производится на ос¬ нове их логического описания, преобразованного в форму конъюнкций или «конъюнкция дизъюнкций», позволяющую построить однослойную логиче¬ скую нейронную сеть. Вопросы: 1. Как формируется обученная логическая нейронная сеть с помощью системы правил вывода по всем исследованным ситуациям? 2. Как формируется обученная нейронная сеть типа персептрона для распознавания символов с помощью эталонных «ловушек»? 3. Как задаётся информация и как формируются решения по нечётким данным? 168
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... Лекция 9. Развиваемая логическая нейронная сеть для распознавания объектов временного ряда по заданному набору признаков Аннотация: Рассматривается возможность распознавания и выбора объектов временного ряда по значениям множества признаков. Аппарат ло¬ гических нейронных сетей позволяет производить параллельное, одновре¬ менное сравнение значений всех признаков с эталонными, на основе расчёта функции активации нейронов. Демонстрируется постепенное усложнение се¬ ти в процессе эксплуатации, введение новых признаков и решений, а также введение обратных связей. Ключевые слова: временной ряд, система принятия решений, струк¬ турированная логическая нейронная сетъ, обратная связь. Агафья Тихоновна. .. .Если бы губы Никанора Ивановича да при¬ ставить к носу Ивана Кузьмича, да взять сколько-нибудь развязности, какая у Балтазара Балтазарыча, да, пожалуй, прибавить к этому ещё дородности Ива¬ на Павловича - я бы тогда тотчас же решилась. Н.В. Гоголь. Женитьба. 9.1. Детерминированные оценки объектов временного ряда Важным объектом анализа и исследования в области информационных технологий являются временные ряды. Временной ряд характеризуется ре¬ альным временем поступления данных, например, - от регистрирующей ап¬ паратуры при проведении испытаний сложных систем, и столь же оператив¬ ной обработкой этих данных. Обработка возможна и с меньшим темпом - при частичном накоплении информации. Однако всегда можно выделить ту первичную обработку, которая проводится в темпе поступления информа¬ ции, т.е. в реальном масштабе времени. Первичная обработка временного ряда связана с распознаванием и классификацией данных для запуска средств последующей их обработки. Это порождает надежду на эффективное применение на данном этапе таких средств искусственного интеллекта, как логические нейронные сети. Маша хочет замуж... Нескончаемой чередой мимо её окошка по город¬ ской улице проходят мужчины... Идеал настоящего мужчины, достойного стать её мужем, Маша определила по следующим свойствам - признакам: • Он брюнет; • Его рост - не менее 180 см; • Он обладатель длинного носа; • Он должен носить шляпу. 169
Глава 11. Нейросетевые методы управления Поток мужчин настолько интенсивен, что Маша принимает единствен¬ но правильное решение: она должна автоматизировать процесс селекции мужчин, обладающих указанными признаками, для того чтобы в реальном времени, с применением методов распараллеливания, проводить (в своих мечтах) обработку встретившегося «кандидата». Итак, имеется временной ряд - поток объектов, характеризующийся набором данных по каждому из них. Необходимо так же в реальном времени решать задачи обработки этих объектов. Эти задачи разнообразны: аппрок¬ симация функциями времени, вероятностная обработка результатов испыта¬ ний, обработка динамики состояния фондового рынка, динамический кон¬ троль состояния сложной системы и т.д. Среди этих задач важное место занимает задача селекции и идентифи¬ кации - задача ассоциативного поиска по эталону. Такая задача возникает, например, при сопровождении спутника, вновь появившегося в секторе обзо¬ ра. В простейшей постановке задача формулируется следующим образом. Объекты, составляющие временной ряд, т.е. последовательно предъяв¬ ляемые для обработки, обладают множеством признаков А = {а\, ..., ат). За¬ дан эталон, соответствующий фиксированному значению этих признаков В = {Ъi, ..., Ьт}. Необходимо в динамике последовательного анализа объектов временного ряда выделять (и направлять на специальную обработку) те объ¬ екты, где все значения признаков совпадают с эталонными, = bj, і = 1, ..., т. Обобщением постановки этой задачи, превращающим её в задачу клас¬ сификации, является следующее дополнение: Произвести распознавание каждого возможного набора значений признаков А = {а\, ..., ат} для приня¬ тия решения по дальнейшей обработке объекта, признаки которого обладают этими значениями. Очевидно, решение данной задачи включает в себя реше¬ ние задачи, поставленной ранее. Основным элементом данной задачи является распознавание. В общем случае оно усложняется тем, что точное совпадение признаков с эталонными маловероятно. В этом случае можно говорить лишь о допустимой степени достоверности этого совпадения. Правомочен вопрос: «На какой эталон в значительной степени похож анализируемый объект?» Это указывает на эф¬ фективность применения параллельных нейросетевых технологий, опираю¬ щихся на несложный расчёт значений функции активации нейроподобного элемента, лежащий в основе модели ассоциативного мышления и адекватно отображаемый логической нейронной сетью. Конечно, Маша могла бы построить традиционный алгоритм последо¬ вательного анализа признаков проходящих мужчин. Затем бы она решила проблему минимизации сложности полученного алгоритма. Она бы догада¬ лась, что минимизировать количество основных операций сравнения можно, 170
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... если проводить это сравнение, упорядочив признаки по не убыванию часто¬ ты появления интересующего значения. Например, она заметила, что реже всего появляются мужчины в шля¬ пах. Тогда, если она увидит мужчину в шляпе, это повлечёт анализ других признаков. Значит, чем реже будут встречаться мужчины в шляпах, тем реже придётся отвлекаться на дополнительное сравнение. В то же время, сокраще¬ ние затрат на последующий анализ мужчины в шляпе требует, чтобы интере¬ сующее значение признака, с которого этот анализ начинается, также был редко встречающимся и т.д. Однако такой порядок анализа признаков требует периодического ис¬ следования выборок из временного ряда для выявления частоты появления требуемых значений признаков. В комплексе, исследование ряда и частотный анализ значений признаков (по каждому эталону!) можно рассматривать как путь построения самонастраивающегося (по минимуму требуемой произво¬ дительности) алгоритма поиска с помощью последовательного сравнения значений признаков с эталонными. Машу такой путь не устраивает. Ей хочется получить алгоритм парал¬ лельного анализа всех признаков сразу, методом, подобным методу ассоциа¬ тивного мышления - для дальнейшего обоснования применения параллель¬ ных вычислительных средств: многопроцессорного суперкомпьютера, кла¬ стера локальной вычислительной сети или нейрокомпьютера. Кроме того, она рассчитывает в дальнейшем принимать решения не по единственному эталону и даже - не по единственному идеалу. Приступим к формированию логической нейронной сети - основы ма¬ шиной системы принятия решений (рис. 9.1). Для формирования нейронов рецепторного слоя произведём градацию «мужских» признаков па основе понятия исчерпывающего множества со¬ бытий. 1. Пусть в Машином представлении мужчины бывают брюнеты, блон¬ дины, прочие. Это требует введения трёх нейронов-рецепторов. 2. В области интересов, касающихся роста, Маша выделила четыре ис¬ черпывающих диапазона, которым соответствуют высказывания: «ниже 180 см», «180- 190 см», «190 - 200 см», «выше 2 м». Это требует использования ещё четырёх нейронов рецепторного слоя. 3. В части длины носа у Маши выработался свой стереотип, в соответ¬ ствии с которым она делит носы на «короткие», «картошечкой» и «длин¬ ные», также предполагая, что все возможности исчерпаны, и трёх рецепторов ей достаточно. 4. Наличию шляпы соответствует булевы переменные «шляпа есть» и «шляпы нет». (Не забывать, что они задаются значениями истинности соот¬ ветствующих высказываний!) Значения этих переменных преобразуются в действительные. Для данных переменных необходимы два рецептора. 171
Глава 11. Нейросетевые методы управления Сладко помечтать о возможном счастье Выше 2м Воскликнуть: "А ведь хорош! Но...' Нос короткий Нос "картошечкой" Hoc длинный Он в шляпе Блондин Воскликнуть: "Ну почему он такой высокий!" Воскликнуть: "Как только таких на улицу выпускают!" Прочий Ниже 180 см 180 - 190 см 190 - 200 см Рис. 9.1. Система принятия решений Для краткого описания системы принятия решений (СПР) введём обо¬ значения всех фигурирующих высказываний (это отражено на рис. 2.1): х\ = «Брюнет»; Х2 = «Блондин»; хз = «Прочий»; у\ = «Ниже 180 см»; У2 = «Между 180 и 190 см»; уз = «Между 190 см и 2 м»; У4 = «Выше 2 м»; z\ = «Нос короткий»; 22 = «Нос картошечкой»; 23 = «Нос длинный»; к\ = «Шляпа есть»; 172
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... кг = «Шляпы нет». Маша создаёт уже обученную сеть, вводя необходимые связи с еди¬ ничными весами. Прежде всего она формирует нейрон выходного слоя Вых 1, который будет максимально возбуждаться при появлении идеального муж¬ чины. Маша связывает с этим нейроном все рецепторы, реагирующие на ин¬ тересующие её значения признаков. Предположим, что кроме «идеальной» комбинации, Машу интересуют не все возможные комбинации признаков проходящих мужчин. Некоторые комбинации она вовсе не удостаивает вниманием. Однако по некоторым она готова сделать замечания, хотя бы связанные с сожалением о близком сча¬ стье. Поэтому создаваемая Машей нейронная сеть содержит несколько нейронов выходного слоя, соответствующих лишь тем решениям, замечани¬ ям и сожалениям, которые готовы слететь с губ за чашкой чая у раскрытого окна. Тогда логическое описание СПР имеет вид: Х\л(у2ууз)лгзлк\ —> R\ = (Сладко помечтать о возможном счастье); Х\лу4лгзлк\ —» Ri = (Воскликнуть: «Ну почему он такой высокий!»); JC2а(уiyy4)A(zi\/Z2)/\ki -л R3 = (Воскликнуть: «Как только таких на улицу выпускают!»); хзлу4лгзлкг —> Ra = (Воскликнуть: «А ведь хорош! Но...») Необходимо отметить, что при решении общей задачи анализа всех возможных ситуаций количество N нейронов выходного слоя в данном слу¬ чае должно составлять 3x4x3х2 = 72. Каждый нейрон выходного слоя в этом случае указывал бы на решение, принимаемое для соответствующей ему комбинации значений признаков. В общем случае обработки временного ря¬ да справедливо учитывать все возможные ситуации, принимая по каждой из них отдельное решение. Учёт не всех комбинаций признаков приводит к необходимости тща¬ тельного подбора параметров функции активации. Ведь решение должно приниматься не просто по максимальному возбуждению нейронов выходного слоя (оно существует всегда!), а по возбуждению, превысившему достаточно высокий порог. Маша выбирает функцию активации на основе счёта значений следу¬ ющих выражений: Здесь Vj - значение возбуждения на у'-м входе нейрона выходного слоя, поступившего от связанного с ним рецептора. На этапе обучения значение /, если ft>h, О в противном случае. (9.1) 173
Глава 11. Нейросетевые методы управления возбуждения рецептора принимается равным единице, если значение выска¬ зывания о наличии соответствующего признака является истинным, и рав¬ ным нулю в противном случае. Порог h выбирается из следующих соображений. Поскольку возбужде¬ ние нейрона выходного слоя должно быть высоким только в случае поступ¬ ления на его вход ровно четырёх единиц, следует выбрать значение 4 > h > 3. Легко проверить, что все ситуации, по которым предусмотрено решение, обнаруживаются с помощью высокого возбуждения единственного нейрона выходного слоя. Если ситуация относится к тем, по которым решение не предусмотрено, то ни один нейрон выходного слоя не возбудится, и Маша просто проигнорирует появление на улице очередного мужчины. На рис. 9.1 система принятия решений представлена полностью. Конечно, в виде, представленном на рисунке, нейронная сеть не обра¬ батывается компьютером. Информационная технология обработки логиче¬ ской нейронной сети основана на представлении её матрицей связей (табл. 9.1). Каждая строка и столбец соответствуют нейрону, а связи показаны их единичными весами в том столбце, который соответствует их исходу. Матрица связей Таблица 9.1. Хі Х2 *3 У\ Уі .Уз У4 Zi ^2 ^3 к\ к2 Вых 1 1 1 1 1 1 Вых 2 1 1 1 1 Вых 3 1 1 1 1 1 1 Вых 4 1 1 1 1 Однако, несколько подумав, Маша приходит к выводу, что наличие длинного носа чревато серьёзными последствиями в семейной жизни. Нос «картошечкой», несомненно, благотворнее влияет на мягкость нрава. Тогда Маша решает, что при последующей модификации она обязательно введёт в рассмотрение веса связей. Она положит вес йіз->вых і связи, ведущей из ней¬ рона-рецептора Z3 к нейрону Вых 1, равным 0,5. В то же время она введёт но¬ вую связь, соединяющую нейрон z2 с нейроном Вых]. Вес этой связи вых і она выберет также равным 0,5. Приведённый проект не отражён на рисунке. Он лишь иллюстрирует прекрасные возможности взвешенного учёта различ¬ ных факторов при модификации и развитии логической нейронной сети, что будет рассмотрено ниже. Очевидно, что с помощью построенной однослойной логической ней¬ ронной сети можно параллельно (!) исследовать значения всех признаков проходящих мужчин (в общем случае - всего множества признаков каждого объекта временного ряда). Это отражает тот факт, что искусственная нейрон¬ ная сеть, как и естественная, имитирует параллельную обработку сигналов, 174
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... одновременно поступивших на все рецепторы, то есть производит распарал¬ леливание выполнения сложных логических конструкций вида «если - то». Относительно матрицы следования это означает возможность параллельной обработки всех строк, соответствующих нейронам выходного слоя, с помо¬ щью функции активации. В общем случае эта обработка параллельно¬ последовательная. Элемент последовательности возникает в связи с преем¬ ственностью информации внутри длинных логических цепочек, когда вы¬ ходной слой нейронов одной логической сети становится рецепторным слоем другой. Однако при программном исполнении на компьютере непараллельной архитектуры обработка нейроподобных элементов сети производится после¬ довательно. Этого вполне достаточно для Маши, но крайне затруднительно в общем случае обработки временного ряда. Поэтому построение нейрокомпьютера, допускающего параллельную обработку многих нейронов по SPMD-технологии [15], следует считать обос¬ нованным и актуальным. 9.2. Структурированная, не однослойная логическая нейронная сеть Маша готова к компромиссу. Её представления об идеальном мужчине расширяются. В качестве желанного жениха она готова рассмотреть не менее шикарный вариант {блондин, рост от 180 до 190 см, нос «картошечкой», шляпа отсутствует}. Казалось бы, достаточно дополнить нейронную сеть на рис. 9.1 связя¬ ми, ведущими из рецепторов, соответствующих указанным параметрам, к нейрону Вых 1, указывающему на решение R\. Однако это не так. При попыт¬ ке ограничиться одним слоем, необходимо проверить, не поглотило ли мно¬ жество рецепторов, участвующих в нахождении планируемого решения, не¬ которое его подмножество, инициирующее совсем другое решение. Следова¬ тельно, может случиться, что для некоторых ситуаций возможно неодно¬ значное решение. В данном случае, при выбранном множестве решений, такая опасность пока отсутствует. Однако при расширении системы принятия решений, то есть при формировании новых решений по некоторым, пока не рассмотрен¬ ным ситуациям, возможна неоднозначность рекомендуемых решений. Например, Маша скоро захочет сформировать новое решение R$ на основе логического выражения (л'і лу2 лZ2 л к\) -л Rs = {.Воскликнутъ: «Душечка!»). Легко видеть, что при непосредственном связывании рецепторов с нейронами выходного слоя в однослойной сети задание (единицами) указан¬ ной ситуации приведёт к активизации двух решений - R\ и Rs. Известны два способа ликвидации неоднозначности решений. 175
Глава II Неиросетевые методы управления Первый способ заключается в строгом воспроизведении структуры но¬ вого логического выражения, определяющего решение R\: (Х\ а (у2 ѵу3) л z3 л к\) ѵ fa лу2 л г2 Л к2) -> R\. (9.2) Наличие скобок указывает на структуризацию формируемой сети (рис. 9.2); она становится не однослойной. Ri Ri R3 Ri 176
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... В [7] показано, как, подбирая веса связей и значения порогов, доби¬ ваться высокой достоверности решений структурированной логической ней¬ ронной сети. Этот путь настолько сложен, что не рекомендуется на страни¬ цах данной книги. Тем более, что на основе фактов математической логики любая структурированная логическая нейронная сеть легко, ещё на уровне логического описания системы принятия решений, сводится к однослойной, не допускающей неоднозначных решений. 9.3. Преобразование структурированной нейросети в однослойную, допускающую неограниченное развитие Второй способ ликвидации неоднозначности принимаемых решений называется размножением решений. Он заключается в том, что каждая конъюнкция в выражении вида (9.2) приводит к возбуждению одного нейро¬ на выходного слоя. То есть, каждый нейрон, выполняющий роль конъюнкто- ра, инициирует одно и то же решение, которое закреплено за разными нейро¬ нами. В этом случае можно записать два логических выражения, обусловли¬ вающих решение R\. заданное первоначально и новое х2 лу2 а Z2 л к2 -» R\. Появившаяся интерпретация того же решения вводит в искушение раз¬ вития системы принятия решений. Например, первое вхождение R\ в описа¬ ние системы может быть дополнено разъяснением: R\\ = {Сладко помечтать о возможном счастье с высоким брюнетом). Второе вхождение R\ может привести к аналогичному изменению: R\2 = {Сладко помечтать о возможном счастье с симпатичным блон¬ дином средней упитанности). Таким образом, принимаемые решения в действительности отличаются одно от другого, а нейронная сеть остаётся однослойной (рис. 9.3). Это об¬ легчает её обработку и исключает неоднозначность решений. И тут Машу впервые посещает мысль о действенности такого важного свойства - признака мужчины, как упитанность (на рис. 9.3 отражено реше¬ ние Ru для признака высокой упитанности; веса, равные единице, не отмече¬ ны). Создавая исчерпывающее множество событий, Маша полагает, что упитанность бывает низкой, средней и высокой. Следовательно, необходимо рецепторный слой дополнить тремя рецеп¬ торами /1,12 и /з. Влияние нового фактора на принятие решений неодинаково. Так, ситуация (высокий брюнет с длинным носом, да ещё и в шляпе), приво¬ дящая к решению Ru, подавляет фактор упитанности, исключает какую-либо зависимость от неё. Поэтому к решению Ru должны вести связи от всех ре¬ цепторов, ведающих упитанностью. 177
Глава 11. Нейросетевые методы управления Сладко помечтать о возможном счастье с высоким брюнетом Рис. 9.3. Развитие однослойной логической нейронной сети с функцией активации (9.1) 178
Лекция 9. Развиваемая логическая нейронная сеть для распознавания объектов... Ситуация, приводящая к решению Rn, как говорилось ранее, напрямую учитывает фактор упитанности, но не так что уж полностью. Впервые введя веса и подумав, Маша решает учитывать среднюю упитанность с весом 0,8, а высокую - с весом 0,2. Решение Ri она не ставит в зависимость от упитанно¬ сти. Поэтому, как и к решению Rn, к решению Ri должны вести связи от ре¬ цепторов /i, h и /з. Решение R3 зависит от низкой упитанности с весом еди¬ ница. Вес высокой упитанности при принятии решений R4 и R5 также прини¬ мается равным единице. Введение в рассмотрение весов связей требует корректировки исполь¬ зуемой функции активации (9.1). Целесообразно выбрать следующую функцию активации на основе оценки средней величины сигнала, поступившей на /-й выход: Применение данной функции активации упрощает формирование свя¬ зей между рецепторами и нейронами (рис. 9.4): связи устанавливаются лишь те, от которых решение действительно зависит. Например, решение Rn не за¬ висит от упитанности - этих связей нет на рис. 9.4. /, еСШ 0 в противном случае. (9.3) 179
Глава 11. Нейросетевые методы управления Сладко помечтать о возможном счастье с высоким брюнетом Сладко помечтать о возможном счастье с симпатичным блондином средней упитанности Сладко помечтать о возможном счастье с симпатичным блондином высокой упитанности Воскликнуть: «Ну почему он такой высокий!» Воскликнуть: «Как только таких на улицу выпускают!» Воскликнуть: «А ведь хорош! Но...» Воскликнуть: «Ду¬ шечка!» Рис. 9.4. Развитие однослойной логической нейронной сети с функцией активации (9.3) 180
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... 9.4. Нечёткие оценки признаков объектов временного ряда Проходят годы, а Маша всё сидит за самоваром у раскрытого окошка и слабеющими глазами пытается угадать свой идеал. Конечно, только с долей вероятности (достоверности) она может оценить значение каждого из инте¬ ресующих её признаков, в комплексе влияющих на её настроение. В этих условиях неопределённости мы спешим на помощь, вооружён¬ ные современными положениями теории нечётких множеств, призванными обосновать задание исходной информации на рецепторном слое Машиной нейронной сети. Первоначально мы вынуждены признать, что каждое значение любого признака (не следует забывать, что эти значения соответствуют исчерпыва¬ ющему множеству событий) определяется с достоверностью Р < 1. А куда девать остальные 1 -Р1 Практический, «инженерный» подход заключается в рассмотрении нормального закона плотности распределения вероятностей. Согласно ему, все вероятности событий исчерпывающего множества, в сумме образующие единицу, распределены между «смежными» по смыслу и содержанию выска¬ зываниями, т.е. служат возбуждению соответствующих рецепторов так, что¬ бы измеренное или предполагаемое значение Р было близко к математиче¬ скому ожиданию значения признака или совпадало с ним. Продемонстрируем возбуждение рецепторов на основе нечётких оце¬ нок значений параметров. Пусть, оглядывая очередного проходящего мужчину, Маша быстро прикидывает: • Процентов на 70 я уверена, что он брюнет, хотя, возможно, он блон¬ дин или шатен. Ведь он, кажется, в шляпе; • Его рост не менее 190 см, в этом я уверена процентов на 80; • Носа я совершенно не вижу; возможно, он закрыт тенью от шляпы или шевелюры; • Не пойму: шляпа у него или такая шевелюра? Скорее, всё же, шляпа. Не смея долго раздумывать (ведь из соседней закусочной показался следующий мужчина), Маша формирует возбуждение рецепторов: Ѵх1 = 0,7, Ѵх2 = Ѵх3 = 0,15, Vyi = 0, Ѵу2 = 0,15, Ѵу3 = 0,8, Ѵу4 = 0,05, ѴА = 0,33, Ѵл = 0,33, Vz3 = 0,33, Vki = 0,6, Vk2 = 0,4. По-видимому, формирование эвристического алгоритма такого «раз¬ брасывания» вероятностей, на глазок воспроизводящего нормальный закон, не представляется трудным. Для функции активации (9.3) в условиях допущенной неопределённо¬ сти целесообразно принять значение порога h = 0,5. Рассчитаем возбуждение нейронов выходного слоя: Ѵвых 1 0? 32, Ѵвых2 Ѵвых3 Ѵвых4 Ѵвых5 0. Так что радости ещё есть место. 181
Глава 11. Нейросетевые методы управления В общем случае признаки объектов временного ряда преимущественно имеют действительные значения из широкого диапазона, являясь отражением измерений различных физических, динамических, временных и прочих ха¬ рактеристик. Разбивка этого диапазона на большое количество малых интер¬ валов значений - для закрепления за ними рецепторов - позволяет более точ¬ но воспроизводить нормальный закон распределения вероятностей. Это со¬ ответствует условному воспроизведению гистограммы. 9.5. Введение обратных связей Весьма высокая скорость обработки потока объектов временного ряда, исключающая возможность сопутствующих размышлений и переживаний, наводит Машу на справедливую мысль. В очередной раз, встретив свой иде¬ ал, следует некоторое время предаваться кайфу (специальной обработке ис¬ комого объекта временного ряда вне общего режима анализа потока), а не пялить глаза на всех подряд проходящих мужчин. Для этого необходимо использовать обратные связи, - с целью выра¬ ботки некоторого тайм-аута, позволяющего осмыслить и благотворно пере¬ жить важное событие - встречу с вожделенным объектом, несмотря на про¬ должающую изменяться ситуацию. Замедлить и растянуть встречу, то есть отвлечься на анализ и обработ¬ ку интересующего объекта временного ряда, можно с помощью продолжи¬ тельной поддержки возбуждения рецепторов, определивших появление ин¬ формации об объекте. Это позволит на некоторое время запомнить образ, по¬ держать его в памяти - навевающего сладкие мечты. Значит, необходимо сформировать положительные обратные связи (рис. 9.5), ведущие от каждого нейрона выходного слоя, соответствующего решению по объекту с интересующими (идеальными) признаками, к тем нейронам-рецепторам, которые вызывают его столь высокое возбуждение. Тогда это возбуждение будет поддерживать высокое возбуждение соответ¬ ствующих рецепторов, а они, в свою очередь, будут поддерживать высокое возбуждение нейрона выходного слоя. Поскольку на рецепторы в результате обратных связей следует пода¬ вать приведённые значения возбуждения, интерпретируемые как поправки к достоверности, то следует использовать функцию активации (9.3). Однако этот процесс поддержки высокого возбуждения нейрона вы¬ ходного слоя должен быть затухающим. Ведь повздыхав, Маше ничего не остаётся делать, как продолжать свои «исследования». Это затухание дости¬ гается с помощью значений весов обратных связей, меньших единице. На рис. 9.5 такие веса обратных связей приняты равными 0,5. (Комментировать решение Ru с помощью обратных связей Маша отказывается.) Спустя неко- 182
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... торое время СПР вернётся к регулярному режиму обработки объектов вре¬ менного ряда. Сладко помечтать о возможном счастье с высоким брюнетом Сладко помечтать о возможном счастье с симпатичным блон¬ дином средней упи- таиилгти Сладко помечтать о возможном счастье с симпатичным блон¬ дином высокой упи- тоиилгти Воскликнуть: «Ну почему он такой вы¬ сокий!» Воскликнуть: «Как только таких на ули¬ цу выпускают!» Воскликнуть: «А ведь хорош! Но...» Воскликнуть: «Ду¬ шечка!» Рис. 9.5. Логическая нейронная сетъ с обратными связями 183
Глава II Нейросетевые методы управления Параллельная обработка сигналов, поступивших на рецепторный слой, является непременным условием высокой скорости ассоциативного мышле¬ ния, свойственного мозгу. Обработка объектов (информационных кадров, со¬ стояния средств испытываемых сложных систем, потактового формирования управляющих воздействий и т.д.), образующих временной ряд, методами ас¬ социативной селекции позволяют приблизить эту обработку к режиму реаль¬ ного времени. Ключевые термины ^РМО-технология (Single Program - Multiple Data) - одновременная работа многих процессоров (компьютеров), выполняющих копии одной про¬ граммы по распределённым данным. Технология в максимальной степени адекватна распределённой обработке нейронов на параллельном нейроком¬ пьютере. Структурированная логическая нейронная сеть - характеризуется скобочной структурой логического описания системы принятия решений. Краткие итоги 1. Применение логических нейронных сетей значительно снижает тру¬ доёмкость распознавания объектов, следующих в потоке реального времени. 2. Снижение трудоёмкости обусловлено двумя факторами: а) примене¬ нием простейшей функции активации нейронов, б) возможностью парал¬ лельной и распределённой обработки большого количества нейронов. 3. Однослойные логические нейронные сети значительно упрощают обработку, устраняют неоднозначность решений, облегчают модификацию и развитие. 4. Обратные связи позволяют оперативно и временно изменять алго¬ ритм действия пользователя, расширять возможности его действий в случае возникновения некоторых ситуаций. Вопросы 1. Как на основе оценок признаков объектов временного ряда произво¬ дится логическое описание системы распознавания? 2. Как строится логическая нейронная сеть для обработки нечётких данных? 3. Как строится матрица следования для однослойной логической ней¬ ронной сети? 4. Почему попытка «механического» объединения ситуаций в рамках однослойной логической нейронной сети способна привести к некорректно¬ сти её решений? 184
Лекция 9. Развиваемая логическая нейронная сетъ для распознавания объектов... 5. Как производится развитие однослойной логической нейронной се¬ ти? 6. Как выбирается функция активации нейрона, если все или некоторые веса связей меньше единицы? 7. Для чего и как вводятся обратные связи? Лекция 10. Логические нейронные сети с обратными связями Аннотация. Обсуждается проблема применения в логических нейрон¬ ных сетях обратных связей, как элемента самонастройки, уточнения возмож¬ ной ситуации, выявления противоречия при выборе целесообразного реше¬ ния. Ключевые слова: система логического вывода, диалектика, закон от¬ рицания отрицания, обратная связь. ...если бы человек, властитель мира, умнейшее из дыхательных су¬ ществ, происходил от глупой и невежественной обезьяны то у него был бы хвост и дикий голос. Если бы мы происходили от обезьян, то нас теперь во¬ дили по городам Цыганы на показ и мы платили бы деньги за показ друг дру¬ га, танцуя по приказу Цыгана или сидя за решёткой в зверинце... Разве мы любили бы и не презирали бы женщину, если от неё хоть немножко пахло бы обезьяной, которую мы каждый вторник видим у Предводителя Дворянства? А.П. Чехов. Письмо к учёному соседу 10.1. Нейронная сеть по А.П. Чехову Тезисы «человек произошёл от обезьяны» и «человек произошёл не от обезьяны», в основе которых лежит обидная похожесть, по-видимому, оди¬ наково не верны, ибо из закона отрицания отрицания следует, что правда ле¬ жит где-то посредине. Вероятно, два процесса успешно сосуществовали: один — в соответствии с непреложностью идеи Развития, другой — в соот¬ ветствии с неотвратимостью внешнего цивилизованного воздействия. В схоластической защите лишь одного из этих тезисов сказывается от¬ сутствие обратной связи: влияния сделанного вывода на исходную посылку. Наличие обратной связи способно отвергнуть посылку, произвести доказа¬ тельство «от противного» так, как это блестяще выполнил Василий Семи- Булатов. Но не только сделанный вывод должен влиять на исходную посылку. На исходную посылку должны влиять и другие выводы, в совокупности определяющие знания. (Ведь вспомнили же мы закон отрицания отрицания!) Обратные связи без знаний могут свести на нет весь блеск интеллекта и при¬ вести только лишь к показанному великим писателем каламбуру. 185
Глава 11. Нейросетевые методы управления Человек произошёл -0,1667 от обезьяны -0,1667 -0,1667 У него есть хвост Г 1 L \ 7-Ы Тѵ Человека создал Бог Марсианская «элита» пересели¬ лась на Землю в связи с охлажде¬ нием Солнца Любовный позыв Законы диалектики -0,1667' 0,0833 3 1. -0,3 У него дикий голос 7 1 Его водят Цы¬ ган ы на показ 8 V У него дурной запах 9 V 10 1 Дальнейшее нарастание эротического возбуждения Рис. 10.1. Нейросеть для решения вопроса о происхождении человека Попробуем построить проект, эскиз, набросок фрагмента нейросети, отражающей глубину умозаключений чеховского героя и дополненной до¬ ступными нам понятиями более высокого свойства (рис. 10.1). При построении нейросети учитываем следующее. Посылка «человек произошёл от обезьяны» обязательно должна приве¬ сти к абсурдному выводу «у человека есть хвост» (нейрон 6). Тогда обяза¬ тельно должна существовать отрицательная обратная связь, которая ведет к нейрону 1 входного слоя, «ответственному» за указанный тезис, и снижает заданную извне величину его возбуждения. Это значит, что этот нейрон дол¬ жен получать возбуждение нейрона выходного слоя с помощью дендрита, 186
Лекция 10. Логические нейронные сети с обратными связями обладающего отрицательным синапсическим весом. Отрицательная связь помечена на рисунке знаком «-». Здесь рецепторы - такие же нейроны, как и все другие. Просто некото¬ рые их дендриты получают возбуждение извне, а некоторые — от других нейронов сети. Одновременно положительная обратная связь должна усиливать воз¬ буждение нейронов 2 и 3, «ответственных» за тезисы о Божественном и Мар¬ сианском происхождении человека. Такое же влияние на нейроны 1-3 должны оказывать и другие выво¬ ды, за которые «ответственны» нейроны 7-9. Однако действенен и довод: «То, что дурно пахнет, недостойно люб¬ ви». Дурной запах давит, угнетает позывы любви, порождая отрицательную обратную связь - признак сомнений в происхождении человека. На стрелках, обозначающих связи, указаны их веса со, в том числе - от¬ рицательные. Выбор весов обусловлен тем, что три события-высказывания, соответствующие нейронам 1-3, образуют исчерпывающее множество со¬ бытий. Тогда, в соответствии с условием нормировки, уменьшение достовер¬ ности одного из них должно увеличивать достоверность других. Выберем функцию активации j Ѵі := ifV>hi then ifV<l then Velse 1 else 0. Зададим значения порогов равными нулю для нейронов входного слоя и равными 0,33 для остальных нейронов, формирующих обратные связи. Зададим значения возбуждения нейронов входного слоя, соответству¬ ющие критикуемым положениям теории Дарвина, а также любовным настро¬ ениям и широте философских познаний чеховского героя. А именно, пусть Ѵ\ = 1, Ѵі = Ѵз = 0, Ѵа = Vs = 0,5. При этом оценку величины любовного позыва связываем с напряжён¬ ной умственной деятельностью, а величину возбуждения нейрона 5 - с само¬ критичной оценкой познаний и доверия к столь заумным философским по¬ ложениям. По заданным значениям произведём первый цикл обсчёта величины возбуждения остальных нейронов: Кб = ... = Кю = 1. При втором цикле обсчёта получаем Ѵ\ = Ѵі = Ѵз = 0,33, К4 = 0,2 при не изменившихся значениях величин возбуждения других нейронов. Третий цикл обсчёта позволяет уточнить значения Кб = Ѵі = Kg = К9 = 0, Кю=1. Видим, что значения возбуждения нейронов, порождающих обратные связи, более не влияют на величину возбуждения нейронов входного (он же выходной) слоя. Таким образом, сеть «высказалась» за равную действенность всех воз¬ можных утверждений о появлении человека на Земле. 187
Глава 11. Нейросетевые методы управления Более того, если в начале исследований мы уже недостаточно уверены в предположении, что человек произошёл от обезьяны, т.е. положили Ѵ\<\, то это лишь усиливает правоту предположения о Божественном или марси¬ анском его происхождении. Например, положим Ѵ\ = 0,8, Ѵг = Ѵ3 = 0,1. В результате первого же уточнения этих значений получим Ѵ\ = 0,267, Vj = Ѵъ = 0,367. И лишь возбуждение нейрона 10 остаётся неизменным, утверждающим тезис о том, что философское отношение к действительности благотворно влияет на физиологические возможности. Конечно, мы сплутовали: мы получили то, что хотели. Совсем в духе силлогистики Аристотеля, призванной обслуживать софистику тогдашних философов. Но ведь всегда высшая идея довлеет над нашими решениями. В то же время как с позиций диалектики согласовать правомочность всех трёх предположений о происхождении человека? Напрашивается следующая модель. Бог, конечно же, создал человека, но - на Марсе! В результате охлаждения Солнца марсианская «элита», в лице отнюдь не лучших представителей рабочего класса и трудовой интеллиген¬ ции, воспользовавшись высокими достижениями в области науки и техники (несомненно — ив области искусственного интеллекта), перебралась на Зем¬ лю, где успешно спуталась с местными обезьянами. Тогда вполне справедливо предположение о том, что в скором времени, по мере дальнейшего остывания Солнца, та формирующаяся новая «элита», что уже сейчас приобретает жильё по пять тысяч баксов за кв м, переберётся на Венеру, где её с нетерпением будут ждать тамошние обезьяны, вдохнов¬ лённые дармовой продукцией фирм Красный Киллер и Ночная Бабочка . 10.2. Развитие гипотезы Вопрос о происхождении человека столь сложен, что требует рассмот¬ рения различных гипотез в их взаимодействии, как это было начато в преды¬ дущем разделе. Там рассматривались и положительные, и отрицательные об¬ ратные связи. Однако на основе применения лишь положительных обратных связей также можно добиться аналогичных результатов. Как показала жизнь, а также свидетельствует глубокое знание законов диалектики, ни одна из версий о происхождении человека не противоречит тем качествам, которые вызывают возмущение чеховского героя. И наоборот, каждое из этих качеств лишь укрепляет уверенность в правоте каждого пред¬ положения о происхождении человека. Данное утверждение лежит в основе предположения о следующей структуре нейронной сети, отображающей мо¬ дель наших исследований (рис. 10.2). 188
Лекция 10. Логические нейронные сети с обратными связями Человек про¬ изошёл от обе- Глубокое знание законов диалекти¬ ки У него дурной запах 8 у 4 [у Рис. 10.2. Диалектически развиваем гипотезу о происхождении человека Здесь веса связей проставлены на стрелках. Веса связей нейронов вы¬ ходного слоя подобраны так, чтобы их значения возбуждения не превышали единицы. Это в большей степени соответствует равным условиям экспери¬ мента. Возьмём ту же функцию активации, но для единого значения порога h = 0,1: Ѵ:=У coV; j Vi\=ifV> h then ifV< \then Velse 1 else 0. 189
Глава 11. Нейросетевые методы управления Положив Ѵ4 = 1, что соответствует нашему глубокому знанию законов диалектики, рассчитаем установившиеся значения возбуждения нейронов, «отвечающих» за версии о происхождении человека. Определим устойчи¬ вость выводов нейронной сети по отношению к исходным предположениям для трёх вариантов исходных данных. Вариант 1. Ѵ\ = 0,5, Ѵі = 0,6, Ѵз = 0,4. Вариант 2. Ѵ\ = 0,2, Ѵі = 0,8, Ѵз = 0,5. Вариант 3. Ѵ\ = 0,2, Vi = 0,8, Ѵз = 0,5. Убедитесь в правильности результатов эксперимента. Вариант 1. Установившееся во втором цикле «работы» нейросети зна¬ чение Ѵ\ = Ѵі = Ѵз = 1 свидетельствует об устойчивости и правомочности всех трёх предположений о происхождении человека. Вариант 2. Установившееся во втором цикле «работы» нейросети зна¬ чение Ѵ\ = Ѵі = Ѵз = 1 свидетельствует об устойчивости и правомочности всех трёх предположений о происхождении человека. Вариант 3. Установившееся в третьем цикле «работы» нейросети зна¬ чение Ѵ\ = Ѵі = Ѵз = 1 свидетельствует об устойчивости и правомочности всех трёх предположений о происхождении человека. Что ж, читатель, конечно, обратил внимание на занимательный, даже иронический, характер изложения! Ведь увлекаться искусственным интел¬ лектом, не располагая достаточным чувством юмора, вредно для здоровья: может «крыша» поехать. Уж поверьте опыту! Однако не следует забывать и того, что мы пока ограничиваемся лишь дедуктивным способом мышления. Напомним, что в Лекции 9 рассматривается несколько отличный, но не менее распространённый пример применения обратных связей для регулиро¬ вания использования входных воздействий во времени. Ключевые термины Обратная связь - связь (дуга) в графе, отображающем нейронную сеть, порождающая цикл. В матрице следования приводит к появлению от¬ личных от нуля элементов выше главной диагонали. В однослойной нейрон¬ ной сети - временная или постоянная связь, ведущая от нейрона к одному или многим рецепторам. Диалектика - свод основных законов устройства и развития мира. Ле¬ жит в основе получения новых знаний. Закон отрицания отрицания - один из основных законов диалектики, гласящий, что правда лежит где-то посредине. Схоластические знания - знания, принимаемые к действию «на веру», без критического осмысливания. Силлогистика - умозаключение, получение нового суждения на осно¬ ве двух данных. Разработана Аристотелем (4 в.д.н.э.), как предшественница 190
Лекция 10. Логические нейронные сети с обратными связями современной алгебры логики. Представляет интерес её моделирование Д.А. Поспеловым. «Крыша» поехала - идиоматическое выражение, отражающее сума¬ сшествие. Краткие итоги 1. Схоластические знания, не подвергнутые анализу на основе диалек¬ тики мышления, заводят в тупик. 2. Как полученные или предполагаемые знания проверяются практи¬ кой, так и выводы логической нейронной сети могут быть проверены с по¬ мощью обратных связей. Предположение об их справедливости в этом слу¬ чае может привести или к явному противоречию, или к уточнению, или к подтверждению. 3. Действие обратных связей развивается во времени. Это требует мо¬ делирования (имитации) работы нейронной сети в течение нескольких тактов до получения установившегося процесса - до окончания изменения величи¬ ны возбуждения нейронов. 4. Выбор функции активации не ограничен введением обратных связей. 5. Формально силлогистика Аристотеля была призвана удовлетворить «заказ» философов - софистов. Основной «модной» целью в то время было решение вопроса: как на основе ложных посылок сформулировать истинное следствие? Как видно из примера, всегда можно склонить нейросеть к тому выводу, что хочется получить - на научной основе. Это ещё раз говорит о том, что мы живём в таком информационном пространстве, где главенствуют нечёткие данные, где открывается широкое поле деятельности ловким лю¬ дям, наделённым такими пороками - движителями прогресса, как алчность, честолюбие, тщеславие и пр. Не потому ли этот материал следует излагать со значительной долей иронии? Вопросы 1. Каково Ваше отношение к тезису: «Человек произошёл от обезья¬ ны»? Какое влияние Знаний Вы ощутили, создавая собственное представле¬ ние о происхождении жизни на Земле? 2. В какой степени Вы разделяете основные положения диалектическо¬ го материализма и готовы ли Вы признать вещественность идей, лежащих в основе мироздания? 3. С какой целью и как вводятся обратные связи? 4. Как во времени разворачивается процесс установления стабильного возбуждения нейронов? 5. Как Вы считаете, может ли этот процесс быть неустойчивым? 6. Как выбирается функция активации нейронов? 191
Глава 11. Нейросетевые методы управления 7. Сложилась ли у Вас уверенность в том, что в каждом случае рас¬ смотрения обратных связей следует поступать так, словно это делается в первый раз? Постигло ли Вас чувство оптимизма творческой смекалки? Лекция 11. Рейтинговые системы на логических нейронных сетях Аннотация. Исследуется возможность применения логических нейрон¬ ных сетей в системах определения рейтинга объекта по его основным показа¬ телям, найденным с учётом неопределенности. Технология применима для мониторинга экономических и политических систем, в сфере образования, для определения риска - странового, страхового, военно-стратегического, в управлении надёжностью сложных систем и пр. На примере упрощенной мо¬ дели банковского мониторинга демонстрируются два подхода: определение рейтинга контролируемого банка на основе кластеров эталонных банков, об¬ разующих рейтинговые области, и нахождение рейтинга на основе оценки принадлежности отдельных показателей некоторым диапазонам изменения, в совокупности, с определённой точностью, определяющим рейтинг данного банка. Ключевые слова: логическая нейронная сетъ, функция активации, банк-эталон, матрица связей, рейтинговая система, мониторинг. Стыдно быть бедным, и занимать низкое положение, когда в государстве царит закон; равно стыдно быть богатым и знатным, когда в государстве царит беззаконие. Конфуций 11.1. Структура нейросети и способы обучения Для определённости, доходчивости и общности построений рассмот¬ рим систему банковского мониторинга, достаточно отображённую в литера¬ туре. В [22] при построении программного приложения для решения этой за¬ дачи предлагается использовать Карты Кохонена. В них применяется «клас¬ сическая» нейронная сеть, в которой удалось использовать только семь пока¬ зателей: собственный капитал, сальдированные активы, ликвидные активы, обязательства до востребования, вклады населения, коэффициент ликвидно¬ сти, бюджетные средства. Фантазируя, можно развить этот ряд показателей. Ими могут быть: объём инвестиций в развивающуюся экономику, объём прибыли, прошлый рейтинг и значение его дрейфа, отчисления в фонд под¬ держки науки и образования, налоговые отчисления, отчисления в пенсион- 192
Лекция 11. Рейтинговые системы на логических нейронных сетях ный фонд, отчисления в благотворительный и культурный фонд, участие в программах ЮНЕСКО и т.д. Возможны два способа мониторинга банков. Первый способ предполагает наличие нескольких банков-эталонов, для которых известны их показатели и значения рейтинга, определённые экспер¬ тами. На экране создаются концентрические области одинакового рейтинга, занимаемые точками - образами банков-эталонов. По показателям (возмож¬ но, нечётким) анализируемого банка методом ассоциативного поиска по бли¬ зости к известным точкам находится область рейтинга, которой он принад¬ лежит. В этом случае логическая нейронная сеть отражает связь банков- эталонов с их образами - точками, расположенными в рейтинговых областях. Важно, что эти точки в рейтинговой области выбираются произвольно, рас¬ средоточено. Второй способ применяется, если известны значимые области измене¬ ния показателей, по принадлежности к которым в совокупности банку может быть присвоен тот или иной рейтинг. В этом случае логические функции, лежащие в основе мониторинга, связывают конъюнкции логических значе¬ ний (возможно объединение некоторых из них операцией дизъюнкции, если это не приводит к противоречию) принадлежности показателей определён¬ ным диапазонам, со значением рейтинга. Показатели анализируемого банка могут быть предполагаемыми, неточными. Напоминаем, что в обоих случаях нейронная сеть является однослой¬ ной, содержащей входной слой рецепторов и выходной слой, указывающий на значение координат или рейтинга. Выходной слой должен указывать не только на рейтинг, но и выдавать экспертные рекомендации, а также другие решения и выводы. Таким образом, нейроны своим возбуждением указывают на некоторые тексты, выдаваемые пользователю. Целесообразен простейший вид обучения (т.е. построения базы знаний, какой является сеть), определяемый концепцией создания нейросети «под за¬ дачу». Он заключается в непосредственном введении связей оператором- исследователем «вручную» — от рецепторов к нейронам выходного слоя в соответствии с причинно-следственными связями. Связи отображаются в матрице следования. Таким образом, сеть создаётся уже обученной, готовой к развитию. Её функция активации достаточно проста. Её главная составля¬ ющая основана на суммировании величин возбуждения на входе /-го нейро¬ на, умноженных на вес связи. Для реализации первого способа используем функцию активации: 2>/у V:=J ; ІЙ).- j (Ѵ, если V>h, V.=< i [0, в противном случае. 193
Глава 11. Нейросетевые методы управления Здесь Vi - искомая величина возбуждения /-го нейрона, Vj - величина возбуждения /-го нейрона (в данном случае - рецептора), связанного с /-м, щ - вес этой связи. (Значение j «пробегает» по всем нейронам-рецепторам, свя¬ занным с данным так, что значение V, в соответствии с известной формулой нахождения математического ожидания, определяет среднюю величину сиг¬ нала, поступившего на z-й нейрон.) Применение весов позволяет пользователю в разной степени оператив¬ но учитывать и изменять влияние различных показателей в процессе эксплу¬ атации. Порог h выбирается экспериментально для подавления слабых возбуж¬ дений и упрощения дальнейшей обработки результатов при включении логи¬ ческой нейронной сети в длинные логические цепочки. Применение матрицы следования позволяет оперативно вносить изме¬ нения и уточнения оператором-экспертом-пользователем, развивать сеть, вводя новые показатели (факторы), изменять веса на основе опыта, изменять тексты принимаемых решений. 11.2. Структура экрана рецепторов Могут использоваться два подхода к организации интерфейса: для пользователя, которому важно научиться лишь нажимать нужные кнопки, и для пользователя-оператора, творчески ведущего и развивающего СПР. При первом подходе экран рецепторов может быть, например, таким, как показан на рис. 11.1. Основную часть его составляет «окно прокрутки», через которое мож¬ но просматривать и задавать состояние рецепторного слоя, несомненно, не способного поместиться на статическом экране. В «окне прокрутки» указаны показатели и их оценочные значения (в диапазоне [0, 1]), задаваемые соответствующим рецепторам. Эти значения — вероятностные, по достоверности, интуитивные, экспертные. Они могут предполагать охват нескольких рецепторов. Например, оценка того, что соб¬ ственный капитал составляет не то 24, не то 34, не то 42 тыс. у. е., но скорее, всё-таки, 24, может привести к приблизительной оценке задаваемых величин возбуждения, равных 0,6, 0,2 и 0,2 (в сумме равных единице) соответственно рецепторов, «отвечающих» за диапазоны (20 - 25], (30 - 35], (40 - 45]. 194
Лекция 11. Рейтинговые системы на логических нейронных сетях \ Показатели Диапазоны и величины возбуждений т Ѳ © О Собственный ка¬ питал [al - (і2) =*о [а2 - аЗ) О [aN-1 - aN] о Сальдированные активы [Ы - Ъ2) [Ъ2 - ЪЗ) [bN-l - bNJ Т 0 © © Вклады населе¬ ния [dl - (12) [(12 -d3) [dN-l - dN] иО © © [dl - (12) [(12 -(13) [dN-l - dN] Меню: Введение новой связи Введение нового показателя Статистическая обработка и др. ок t I Рис. 11.1. Экран рецепторов На экране отображены задаваемые без прокрутки показатели, такие, как рейтинг в результате прошлых измерений, выборочные «прошлые» пока¬ затели, а также показатели политической, социальной и экономической конъюнктуры. (Их обилие и развитие могут всё-таки потребовать прокрут¬ ки.) Должно быть отображено управление прокруткой, а также меню ос¬ новных действий. Эти действия следующие: переход на экран выходного слоя, статистическая обработка результатов (предполагает переход к экрану 195
Глава 11. Нейросетевые методы управления выходного слоя), введение новой связи, введение нового рецептора, измене¬ ние веса связи, введение нового нейрона выходного слоя. 11.3. Структура экрана выходного слоя, отображающего рейтинг банков - эталонов Экран выходного слоя (рис. 11.2) может отображать систему вложен¬ ных прямоугольников или других плоских фигур, отражающих распростра¬ нение рейтинга по убыванию. В центре экрана яркими точками отражены са¬ мые преуспевающие банки или предполагаемые идеальные образы таких банков. По мере преуспевания банков, точки, соответствующие эталонам этих банков, распределены по другим рейтинговым областям. О О о о о оо г Область О преуспева¬ ющих бан- • • • • гэ гэ Область 1 менее преу¬ спевающих банков О о о В результате мо¬ ниторинга «точ¬ ка» банка оказа¬ лась в данной рей¬ тинговой области ООО о о и Рис. 11.2. Экран выходного слоя 196
Лекция 11. Рейтинговые системы на логических нейронных сетях Каждая точка экрана, отображающая банк-эталон, жёстко закреплена за нейроном выходного слоя, указывающего на её координаты. В результате мониторинга по принципу ассоциативного мышления, на экране должна по¬ явиться точка, соответствующая анализируемому банку. По её попаданию в область рейтинга известных банков, или по совпадению этой точки с точкой известного эталона, следует судить о значении рейтинга банка. В системах компьютерной графики точка начала координат располо¬ жена в левом нижнем углу экрана монитора. Для её переноса в центр с учё¬ том «сплющивания» по оси ординат необходимо выполнить преобразование: .X = X* -ХО, у = к(у*-уо). Здесь Л', у — декартовы координаты точки экрана рейтинговых областей, л-*, у* - декартовы координаты этой точки в используемой графической си¬ стеме, хо, уо - координаты центра экрана в этой системе, к - коэффициент «сплющивания» экрана по оси ординат. Однако экран, связанный с декартовой системой координат, как следу¬ ет из рисунка, затрудняет интерполяцию, необходимую при ассоциативном выводе. А именно, найденная на основе усреднения координата двух точек, принадлежащих некоторому, предположим, - низкому, рейтингу, может ока¬ заться между этими точками и принадлежать области высокого рейтинга. Для облегчения интерполяции целесообразно в качестве рабочей ис¬ пользовать сферическую систему координат Огф (рис. 11.3), связанной с де¬ картовой соотношениями г = yj'x2 + у2, ср = arc tg—. Центр О совпадает с х центром экрана. Тогда области одинакового рейтинга оказываются ограни¬ ченными сферическими эллипсами, как показано на рисунке. Поясним размещение на рисунке точек В\ - Be (точка В рассмотрена далее). Пусть в декартовой системе координат известны и произвольно рас¬ пределены по областям одинакового рейтинга точки, соответствующие бан¬ кам: 5і(6, 6), Я2(8, 5), Вз(3, 7), В4(7, 3), В5( 12, 6), Вб(4, 1). Тогда в сферической системе координат на рис. 4.3 эти точки определяются как: В\(3, 190°), В2(3, 300°), Я3(7, 45°), В4(8, 250°), Я5(12, 210°), £6(П, 80°). 197
Глава 11. Нейросетевые методы управления Рис. 11.3. «Сплющенный» экран в сферической системе координат 11.4. Пример определения рейтинга на основе банков - эталонов Все рекомендуемые построения проиллюстрируем простым примером, не претендующим на правильность применения в финансовой деятельности. Пусть Экспертный Совет выделил четыре показателя (фактора) для банков¬ ского мониторинга: • z\ - собственный капитал; • Z2 - вклады населения; • Z3 - объём вложений в культурные программы ЮНЕСКО; • Z4 - объём прибыли. Рейтинг банка может быть: R\ - высокий, R2 - средний, R2 - низкий. При этом вполне справедливо учитывать показатель гз с весом 0,5. Тогда каждому банку В соответствует вектор его показателей B{z\, zj, гз, гД лежащий в основе определения его рейтинга. Пусть известен рейтинг ряда крупных международных банков на осно¬ ве их показателей: £і($45 млрд.; $25 млрд.; $10 млрд.; $5 млрд.) -» R\ В2($25 млрд.; $12 млрд.; $5 млрд.; $2 млрд.) -» R\ 198
Лекция 11. Рейтинговые системы на логических нейронных сетях 5з($20 млрд.; $15 млрд.; $2 млрд.; $3 млрд.) -> R2 54($10 млрд.; $12 млрд.; $6 млрд.; $1 млрд.) -> R2 В5($20 млрд.; $1 млрд.; $0 млрд.; $0 млрд.) -> Ri В6($\ млрд.; $0,5 млрд.; $0 млрд.; $0,1 млрд.) -> R3. Эти соотношения определяют исходное содержание базы знаний (БЗ), которое может дополняться в ходе эксплуатации. На рис. 11.4 представлена логическая нейронная сеть, соответствующая данной БД. Рецепторы 1 - 21, в соответствии со значением достоверности приведённых при них высказываний, указывают на координаты точек на экране, соответствующих банкам-эталонам. Единичные веса не обозначены. По предполагаемым, возможно, неточным показателям методом ассо¬ циативных вычислений находится точка, соответствующая анализируемому банку. По области её попадания делается вывод о рейтинге этого банка. Пример 1. Найдём рейтинг банка В по предполагаемым показателям ($28 млрд.; $3 млрд.; $8 млрд.; $4 млрд.) Приведём общий приём возбуждения рецепторов. А именно для воз¬ буждения рецепторов, закреплённых за каждым показателем, делим «едини¬ цу» обратно пропорционально расстоянию значения испытываемого показа¬ теля между двумя ближайшими значениями этого показателя, отображённы¬ ми в сети. Тогда возбуждение К4 рецептора 4 приближённо полагаем равным 0,9, а возбуждение Vs рецептора 5-0,1. Аналогично, приблизительно полага¬ ем Ѵу = 0,8, Ѵ% = 0,2, Yu = V\5 = V2o = V2\ = 0,5. Возбуждение остальных ре¬ цепторов равно нулю. По функции активации при h = 0,2 (значение порога подбирается так, чтобы исключить из рассмотрения малые возбуждения) находим возбужде¬ ние нейронов, соответствующих точкам банков - эталонов на экране: Ѵв\ = 0,24, Ѵв2 = 0,46, Ѵвз = Ѵв4 = 0, Vbs = 0,23, Vm = 0. Используя полученные зна¬ чения возбуждения нейронов в качестве весов, по известной формуле нахож¬ дения среднего найдём значение координат искомой точки В на экране: 3-0,24 + 3-0,46 + 12-0,23 г — (р 0,93 190 ° • 0,24 + 300 ° • 0,46 + 210 ° • 0,23 0,93 = 240°. На рис. 11.3 показано примерное положение найденной точки В на экране. Она принадлежит области среднего рейтинга R2. 199
Глава 11. Нейросетевые методы управления Zi = $1 млод? Zi = $10 МЛОД? 1^—Ь zi = $20 млод? zi = $25 млод? ЧЧ z\ $45 млрд? гЧ z? = $0,5 млрд? Z2 = $1 млрд? г? = $ 12 млрд? -? = S15 млрд? Z2 = $25 млрд? Z3 = $0 млрд? Z3 = $2 млрд? Z3 = $5 млрд? Z3 = $6 млрд? 23 = $10 млрд? Z4 = $0 МЛОД? Z4 = $0,1 МЛОД? Z4 = $1 МЛОД? == Z4 = $2 млод? Z4 = $3 МЛОД? >=. Z4 = $5 млрд? (3, 190°) (3, 300°) (7, 45°) (8, 250°) (12,210°) (11,80°) Рис. 11.4. Логическая нейронная сетъ на базе известных банков - эталонов 11.5. Построение обученной логической нейронной сети на основе интервалов значений показателей Обучение рейтинговой системы с помощью известных рейтингов бан¬ ков, принимаемых за эталон, приводит, как показано выше, к достаточно громоздким логическим нейронным сетям. Ведь они должны развиваться с обретением новых знаний. Следует учесть, однако, высокую степень нагляд¬ 200
Лекция 11. Рейтинговые системы на логических нейронных сетях ности и «дружественный» интерфейс. Несомненно, более точно и оперативно используется накопленный опыт. Можно создавать значительно более простые логические нейронные сети, если известны диапазоны принадлежности значений показателей, в со¬ вокупности определяющие то или иное значение рейтинга. Например, пусть на основе изучения рейтинга приведённых выше бан¬ ков и значительного количества других, оказалось целесообразным выделить по два значимых диапазона возможной принадлежности каждого показателя банка. Пусть z\ определяется отрезками (возможно, полуоткрытыми) значе¬ ний [0, 25) и [25, 50], Z2 - отрезками [0, 10) и [10, 25], z3 - отрезками [0, 5) и [5, 10], z4 - отрезками [0, 2) и [2, 5]. На основе информации экспертов составляется логическое описание системы принятия решений. В соответствии с результатами исследований, отображённых в приведённой литературе, оно должно состоять из исчерпы¬ вающего, непротиворечивого набора логических функций - импликаций. Каждая логическая функция в левой части представляет собой конъюнкцию, в общем случае, дизъюнкций высказываний о принадлежности данных. То есть, в левой части отображается ситуация. В правой части, после знака сле¬ дования, указывается значение рейтинга. Таким образом, правые части отоб¬ ражают приём «размножения решений», способствующий непротиворечиво¬ сти и возможности модификации. При этом для сокращения объёма сети, в левых частях логических функций можно использовать объединение данных одного фактора (показа¬ теля) в дизъюнкции так, чтобы при раскрытии скобок не сформировались си¬ туации, для которых предусмотрено решение, отличное от указанного в пра¬ вой части. Это означает, что при неправильном формировании логического описания одни ситуации могут поглотить другие, требующие отличающегося решения. В то же время, попытки сократить объём логической нейронной сети за счёт объединения ситуаций, требующих одного и того же решения, с помо¬ щью операции дизъюнкции, вполне справедливы. Пусть логическое описание, удовлетворяющее указанным требованиям полноты и непротиворечивости, имеет вид: (zig[25, 50])a(z2e[10, 25])a((z3g[0, 5))v(z3g[5, 10]))a(z4e[2, 5]) —» Q\ = (Рейтинг банка высокий); (zie[0, 25))a(z2g[10, 25])a(z3g[5, 10])a(z4g[2, 5]) -^Qi = (Рейтинг банка средний); (zie[25, 50])a(z2e[10, 25])a((z3e[0, 5))v(z3e[5, 10]))a(z4e[0, 2)) —» Qs = (Рейтинг банка средний); (z\e[25, 50])a(z2e[10, 25])a(z3e[0, 5))a(z4e[2, 5]) —» Q4 = (Рейтинг банка средний) 201
Глава II Нейросетевые методы управления (zie[0, 25))a(z2g[0, 10))a((z3e[0, 5))ѵ( z3e[5, 10]))a(z4e[0, 2)) -» Qs = (Рейтинг банка низкий); Обученная логическая нейронная сеть, напрямую связывающая диапа¬ зоны показателей с рейтингом банка и учитывающая веса связей (0,5 - вес всех связей, исходящих из вершин 5 и 6), показана на рис. 11.5. Рецепторы 1 - 8 возбуждаются в соответствии с достоверностью указанных при них вы¬ сказываний. Легко видеть, что рассмотренные ранее банки - эталоны точно отражены в этой сети. Однако использованная ранее функция активации здесь не подходит, т.к. на некоторых нейронах объединяется не единственная конъюнкция со¬ бытий, а дизъюнкция таких конъюнкций. Целесообразно выбрать следую¬ щую функцию активации: Рейтинг банка высокий Рейтинг банка средний Рейтинг банка средний Рейтинг банка средний Рейтинг банка низкий Рис. 11.5. Логическая нейронная сетъ, связывающая диапазоны значении показателей с рейтингом банка 202
Лекция 11. Рейтинговые системы на логических нейронных сетях если V>h, в противном случае. Здесь, как и прежде, Ѵі - искомая величина возбуждения /-го нейрона, Vj - величина возбуждения у-го нейрона (рецептора), связанного с /-м, щ- - вес этой связи. Если предполагается данную сеть использовать в длинной логической цепочке, где значения возбуждения нейронов тотчас поступают на рецепторы другой логической нейронной сети, то необходимо выполнить нормирование формируемых возбуждений. Тогда значение V следует разделить на макси¬ мально возможное значение возбуждения нейрона. В данном примере это значение равно 3,5. Пример 2. Определим рейтинг банка В, рассмотренного в примере 1, с учётом того, что показатель Z4 (объём прибыли) определён неточно и состав¬ ляет не то $1,5 млрд., не то $4 млрд. Размышляя трезво, аналитик предполо¬ жил, что первая оценка верна на 70%, а вторая, соответственно, на 30%. За¬ дадим возбуждение рецепторов: Ѵі = 1, Ѵз = 1, Ѵ6 = 1, V? = 0,7, Eg = 0,3. (Зна¬ чения отмечены на рисунке.) С помощью функции активации, положив h = 1, находим Vq\ = 1,8, Vq2 = 0, Vq3 = 2,2, Vq4 = 1,3, Vq5 = 2. Так как максимально¬ го возбуждения достигает нейрон <2з, банк В обладает средним рейтингом. Возникает лишь вопрос об отображении полученной сети на экране монитора. 11.6. Отображение и управление рейтинговой системой с помощью матриц связей Существует универсальный способ представления и обработки логиче¬ ских нейронных сетей с помощью матриц связей, отображённых на экране монитора. Однако матрицу связей логической нейронной сети, связывающей диа¬ пазоны значений показателей с рейтингом банка (табл. 11.2), не следует счи¬ тать менее информативным и оперативным средством управления, модифи¬ кации и развития рейтинговой системы. J V =\ і V, 0, 203
Глава 11. Нейросетевые методы управления Матрица связей для примера банков-эталонов я ©•v — — ОС О о я (У) — ы ы — о о Я рс ы VI о о я и» VI о я ы ? Ѵ> О О о W — чо о о Задаваемые значения w о\ а Н (J Н » * ® Ь i я о Я » Ш о g ОЯТ я 1 н о и S — Zi = $1 млрд. — Zi = $10 млрд. — — Zi = $20 млрд. — О X© Zi = $25 млрд. — о — Zi = $45 млрд. — Z2 = $0,5 млрд. — о 00 Z2 = $1 млрд. — — о ы Z2 = $12 млрд. — Z2 = $15 млрд. — Z2 = $25 млрд. О Ъ\ О Ъ\ Z3 = $0 млрд. О Ѵі Z3 = $2 млрд. О Ъ\ Z3 = $5 млрд. О Ъ\ о Ъ\ Z3 = $6 млрд. О Ъ\ о Ъ\ Z3 = $10 млрд. — Z4 = $0 млрд. — Z4 = $0,1 млрд. — Z4 = $1 млрд. — Z4 = $2 млрд. — о Ъ\ Z4 = $3 млрд. — о Ѵі Z4 = $5 млрд. о 0,23 о о 0,46 0,24 Возбуждение нейронов Таблица 11.1. н я ох U Я Я я Я о со м W о Я< U О ч Я — о о я о я< я о о я я о я< о о н я я Я ох Я W о чз о я< н я я ч Я я W я о о Й Е Я ОХ Я Я Я О Я 204
Лекция 11. Рейтинговые системы на логических нейронных сетях Таблица 11.2. Матрица следования логической нейронной сети, связывающая диапазоны значений показателей с рейтингом банка Интервалы показателей банков 1Г) (N С' О иГ к? o' ю ю ш й о4 C' О "ш" іТГ о иГ гз ■ГГ C' о ш й о4 иГ й ГГ С' о иг і?Г uT Возбуж¬ дение нейронов Задаваемые оценки при¬ надлежности 1 1 1 0,7 0,3 R\ = (Рейтинг высокий) 1 1 0,5 0,5 1 1,8 R2 = (Рейтинг средний) 1 1 0,5 1 0 R3 = (Рейтинг средний) 1 1 0,5 0,6 1 2,2 Ra = (Рейтинг средний) 1 1 0,5 1 1,3 Rs = (Рейтинг низкий) 1 1 0,5 0,5 1 2 Ключевые термины Мониторинг - оценка текущего значения рейтинга по ряду финансо¬ вых показателей. Банк-эталон - банк с известными финансовыми показателями, снаб¬ жённый экспертами определенным значением рейтинга из одного из диапа¬ зонов классификации. Банк-аутсайдер - банк, рейтинг которого принадлежит предельно низ¬ кому диапазону. Краткие итоги 1. Логическая нейронная сеть позволяет легко вводить в рассмотрение и исключать из рассмотрения любые количества факторов, влияющих на рейтинг банка. 2. Главным достоинством рассматриваемой системы является её работа по нечётким данным. 3. Обучение рейтинговой системы банковского мониторинга основано на экспертных оценках ряда известных банков по их классификации. Дина- 205
Глава 11. Нейросетевые методы управления мический учёт дрейфа рейтинга банков-эталонов производится оперативно, путём несложных операций перевода их в другую рейтинговую область экрана. 4. Рассмотренная здесь система выполняет «голосование», с получени¬ ем веса, в пользу одного или более близких по рейтингу банков-эталонов, допуская усреднение с помощью этих весов. 5. Унифицированный программный продукт на основе рассмотренных логических нейронных сетей должен быть инвариантным относительно ко¬ личества рецепторов и количества нейронов выходного слоя. Изменение этих параметров и связей пользователем-оператором должно производиться с по¬ мощью матриц следования. 6. Применение логических нейронных сетей в рейтинговых системах весьма результативно в системах приоритетного планирования, управления качеством, оценки результатов трудовой деятельности, в социальных систе¬ мах, в образовании - во всех системах и приложениях, где точная математи¬ ческая интерпретация процессов невозможна или весьма трудоёмка. Вопросы 1. Как на экране следует представлять исходные данные для монито¬ ринга? 2. Как целесообразно отображать результаты мониторинга? 3. В чём преимущества представления результатов мониторинга в сфе¬ рической системе координат по сравнению с декартовой? Лекция 12. Управление качеством при модернизации и развитии сложных систем в условиях финансовых и технологических ограничений Аннотация. Рассматривается сложная система массового обслужива¬ ния, представляющая собой комплекс взаимодействующих объектов, решаю¬ щих общую задачу в соответствии с целевой функцией и с требуемыми зна¬ чениями параметров обслуживания. Для каждого типа объектов, с использо¬ ванием предложений экспертов, строится рейтинговая система на логической нейронной сети. С её помощью по результатам мониторинга определяется текущий рейтинг объекта. Если рейтинг опустился ниже допустимого, объект претендует на ремонт, замену, модернизацию и пр. В условиях финансовых и технологических ограничений оптимальное решение по многим объектам принимается на основе шкалы их важности. Ключевые слова: сложная система, объект, деградация, рейтинг объ¬ екта, рейтинговая система, шкала важности. 206
Лекция 12. Управление качеством при модернизации и развитии сложных системе... Научное определение голода было возложено на ветеринаров и на сельский педагогический персонал. ...решено было начать гидротехнические работы. Создана была особая комиссия по набору техников. Но она ни одно¬ го техника не приняла, так как оказалось: чтобы построить деревенский ко¬ лодезь, техник должен знать всего Карла Маркса. А. Платонов. Город Градов 12.1. Задача управления качеством сложной системы Под сложной системой будем понимать комплекс, как правило, функ¬ ционально различимых средств, объединённых для совместного решения общей задачи в соответствии с оптимизируемой целевой функцией [26, 27]. Как на теоретическом, так и практическом уровне выделяется класс сложных систем, образующих многоканальные системы массового обслуживания: обо¬ ронные, энергетические, транспортные, связи, социальные и пр. В общем случае сложные системы обладают централизованным органом управления и образуют централизованную сеть, узлы которой отображают её объекты. Это представление является условным, так как отдельным объектом, напри¬ мер, справедливо считать комплекс средств связи. Таким образом, понятие «объект» может быть более широким, включающим подсистему средств и даже - рекурсивно - подсистему объектов. Целевая функция отображает конкретное назначение сложной системы с требуемыми значениями основных параметров обслуживания в соответ¬ ствии с техническим заданием (ТЗ) на её разработку. Относительно значений этих параметров может быть задано условие их максимизации или миними¬ зации. Это и имеется в виду, когда говорят о оптимизации целевой функции. Например, требуется создать комбинированную сложную систему связи с минимальным временем и с максимальной вероятностью выполнения заявки, соответственно не выше и не ниже заданных значений. Целевая функция отражает текущие технологические и финансовые возможности. Достижение заданных критериев, обусловленных целевой фун¬ кцией, говорит о максимальном качестве обслуживания сегодня. Тогда оче¬ видно, что перспективное планирование развития сложных систем требует своевременного обоснования финансируемых направлений исследования и разработок. На начальном этапе эксплуатации системы могут приниматься решения на более кардинальном уровне: об уточнении ТЗ, о доработке средств и ме¬ тодик испытаний и пр. Для оптимизации целевой функции целесообразно ввести строго не оп¬ ределяемое понятие текущего качества объекта, как во многом интуитив¬ ную, не измеряемую степень его участия в достижении требуемого максима¬ льного качества функционирования (обслуживания) сложной системы в це¬ 207
Глава 11. Нейросетевые методы управления лом. Такие оценки определяют текущий рейтинг объекта, который находит¬ ся экспертным путём. В общем случае, сложная система обладает конечным жизненным цик¬ лом, в течение которого, в результате её деградации, предоставляемое ею ка¬ чество обслуживания падает до недопустимого уровня. Продление жизни по результатам мониторинга или в соответствии с планом регламентных работ, производится за счёт ремонта и замены отдельных объектов. Однако продле¬ ния жизни недостаточно, и задача ставится шире: о модернизации и развитии системы в соответствии с современными требованиями, уточняющими целе¬ вую функцию, а также с учётом финансовых, технических и технологических возможностей. Модернизация системы противостоит двум основным процес¬ сам деградации: «физическому» старению и старению моральному. Однако в процессе эксплуатации сложной системы могут вскрываться конструктивные недоработки объектов и их средств управления, а также ошибки программно¬ го обеспечения. Таким образом, необходимо управлять поддержанием и развитием ка¬ чества (обслуживания) сложной системы. Идея такого управления заключается в следующем. 1. Организуется периодический контроль объектов сложной системы. 2. Для каждого объекта определяется его текущий рейтинг в системе на основе оценки качества выполнения его функций в соответствии с техни¬ ческими требованиями (ТТ) к системе. 3. Если этот рейтинг опустился ниже допустимого уровня, данный объ¬ ект нуждается в принятии решения о ремонте, замене, смене технологии его изготовления, о изменении алгоритма функционирования системы и др. 4. Однако в условиях ограниченного финансирования и доступности технологий, решение принимается по некоторой стратегии комплексно, по множеству объектов недопустимо низкого рейтинга с учётом шкалы важно¬ сти. При этом, чтобы удовлетворить потребности большего числа «важных» объектов, замена может выполняться по принципу «из того что есть и поде¬ шевле». 12.2. Рейтинг объектов сложной системы В основе определения рейтинга отдельного объекта сложной системы лежит ряд показателей, образующих вектор характеристик качества. Как правило, значение этих характеристик или их ограничения обусловлены тех¬ ническими требованиями (ТТ) или техническим заданием (ТЗ) на разработку системы. К такому уточняемому и расширяемому ряду показателей качества могут относиться: - пропускная способность или реальная производительность объекта; - реальная производительность встроенных вычислительных средств объекта; 208
Лекция 12. Управление качеством при модернизации и развитии сложных системе... - среднее время обслуживания запроса; - вероятность обслуживания; - частота неудачного решения своей частной задачи; - частота или количество ложных срабатываний объекта; - частота отказов объекта с переходом (с требованием перехода) на ре¬ зерв; - теоретический расчёт текущей надёжности объекта, например, при Пуассоновском потоке отказов; - приближение теоретически рассчитанного или объявленного разра¬ ботчиком срока жизненного цикла объекта; - применение в основе разработки объекта зарубежной технологии, ставшей «запрещённой»; - снижение отказоустойчивости; - снижение уровня помехозащищённости; - нарушение безопасности вычислений встроенных вычислительных средств; - неудовлетворительные результаты функционального контроля и др. Для снижения трудоёмкости исследования возможно укрупнение объ¬ ектов - их объединение в сложные объекты или разбиение всей системы на подсистемы, интерпретируемые как отдельные объекты. Это требует введе¬ ния некоторой «рейтинговой» алгебры объединения объектов: 1. Два объекта участвуют в работе сложной системы по схеме «И», ес¬ ли их совместная функция не может быть выполнена ими порознь. Тогда Рейтинг{{объект\) И (объект2)) = тіп {рейтинг(объект 1), рей- тинг(объект2)}. 2. Два объекта участвуют в работе сложной системы по схеме «ИЛИ», если их совместная функция может быть выполнена хотя бы одним из них. Тогда Рейтинг((объект 1) ИЛИ (объект2)) = max {рейтинг(объект 1), рей- тинг(объект2)}. Укрупнение объектов тем более актуально, что характер их взаимодей¬ ствия часто не позволяет чисто механически производить замену одного объ¬ екта более совершенным. Отсутствие сопряжения некоторых характеристик (например, более высокая пропускная способность «нового» объекта) приво¬ дит к дисбалансу и к необходимости перенастройки всей подсистемы. 12.3. Рейтинговая система на основе интервалов значений показателей качества объектов сложной системы Построение рейтинговых систем, как класса систем принятия решений, на основе аппарата логических нейронных сетей показано в Лекции 11. От¬ метим, что все системы принятия решений строятся на однослойных нейрон- 209
Глава 11. Нейросетевые методы управления ных сетях. Их обработка сводится к простейшей обработке легко модифици¬ руемых матриц следования. Рассмотрим пример построения типовой рейтинговой системы. Пусть для данного типа объектов задан вектор характеристик качества {D\, /Л, Db, Ih!. Диапазон изменения каждой характеристики (типа real) на основе экспертных рекомендаций разбит на три интервала (строго математи¬ чески, интервалы - полузакрытые или закрытые), принадлежность которым говорит о неизменном рейтинге по данной характеристике на данном интер¬ вале её значений: Di * [dк) da), [da da), [da da\, i 1, ... ,4. В частности, исходя из смысла, da может быть равно 0 или оо. Интервал [До - da) соответствует диапазону значений характеристики Д (например, производительности), обусловленной ТЗ. Интервал [da - da) соответствует временно допустимому значению этой характеристики. Интер¬ вал [da - Дз] соответствует области значений характеристики Д, где измере¬ ния не проведены, либо их значения ниже допустимых (например, произво¬ дительность снизилась до нуля). Пусть для построенных интервалов, рассматриваемых совместно, как возможные ситуации на основе вектора характеристик, эксперты установили значения рейтинга из некоторого множества значений: рейтинг высокий, рейтинг средний, рейтинг низкий. То есть, каждой возможной ситуации, опи¬ сываемой множеством четырёх интервалов, каждый из которых соответству¬ ет своей характеристике, задано одно из трёх значений рейтинга. Отобразим на схеме (рис. 12.1) пример такого соответствия. При этом все возможные связи воспроизводить не следует, так как низкий рейтинг проявится даже во многих не указанных случаях. От статического описания базы знаний (БЗ), содержащей связи «ситуа¬ ция —> рейтинг» перейдём к динамической модели ассоциативного мышле¬ ния, сформировав логическую нейронную сеть. Для этого предположим, что левый столбец пронумерованных овалов соответствует рецепторам, возбуж¬ даемым извне, а правый - нейронам, возбуждение которых от связанных с ними рецепторов указывает на значение рейтинга. Напомним, что возбуждение рецепторов интерпретируется как досто¬ верность высказываний о принадлежности данных, а нейрон представляет со¬ бой прибор, выполняющий пороговую функцию активации. Ситуация же представляет собой набор в данном случае четырёх зна¬ чений характеристик объекта, принадлежащих соответствующим интерва¬ лам. Для «оживления» модели введём пороговую функцию активации ней¬ рона. Для данного примера такая функция имеет вид: 210
Лекция 12. Управление качеством при модернизации и развитии сложных системе... Значение характерис¬ тики Di принадлежит интервалу [dio - dii), соответствующему ТЗ? Допустимое значение характеристики Di при¬ надлежит интервалу [dii - dn)? Недо пустимое значение характеристики Di при¬ надлежит интервалу [di2 - di3]? Значение характерис¬ тики D2 принадлежит интервалу [d2o - d2i), соответствующему ТЗ? Допустимое значение характеристики D2 при¬ надлежит интервалу [d2i - d22)? Недопустимое значение характеристики D2 при¬ надлежит интервалу [d22 - d23]? Значение характерис¬ тики D3 принадлежит интервалу [d3o - d3i), соответствующему ТЗ? Допустимое значение характеристики D3 при¬ надлежит интервалу [d3i - d32)? Недопустимое значение характеристики D3 при¬ надлежит интервалу [d32 - d33]? Значение характерис¬ тики D4 принадлежит интервалу [d4o - d4i) соответствующему ТЗ? Допустимое значение характеристики D4 при¬ надлежит интервалу [d4i - d42)? Недопустимое значение характеристики D4 при¬ надлежит интервалу [d42 - d43]? Рейтинг вы¬ сокий! Рейтинг высокий, несмотря на ис¬ пользование до¬ пустимого значе¬ ния D4 Рейтинг средний, используется вре¬ менно допустимое значение Di Рейтинг средний, используется вре¬ менно допустимое значение D2 Рейтинг средний, используется вре¬ менно допустимое значение D3 Рейтинг средний, используются вре¬ менно допустимые значение D2 и D4 ■> Рейтинг средний, используются вре¬ менно допустимые значения D3 и D4 ■ ■«> Рейтинг низкий, используется недо¬ пустимое значение Di ■> Рейтинг низкий, используется недо¬ пустимое значение D2 Рейтинг низкий, используется недо¬ пустимое значение D3 Рейтинг низкий, используется недо¬ пустимое значение D4 Рис. 12.1. Логическая нейронная сеть рейтинговой системы 2ii
Глава II. Нейросетевые методы управления V. =\ i S V,- , если эта величинане меньше значения порога h, к=\ Jk О, в противном случае (i = 1,11). Здесь Ѵі - величина возбуждения /-го нейрона, ѵ . , (к = 1, ..., 4, jk e {1, Jk ..., 12}) - величина возбуждения одного из четырёх рецепторов, связанных с /-М нейроном. Порог h выбирается экспериментально в процессе эксплуата¬ ции рейтинговой системы так, чтобы исключить лишние вычисления. Для иллюстрации выберем некоторый объект, то есть, некоторую ситуацию, заданную конкретными значениями характеристик качества. Не вдаваясь в «физический смысл», предположим, что значение dl характеристики D1 принадлежит интервалу [dlO - dl 1). Задаём возбуждение рецептора: ѵі = 1. Пусть точно не определена принадлежность значения d2 характеристики D2, однако есть предположение, что с вероятностью 0,6 это значение принадле¬ жит интервалу [d20 - d21), а с вероятностью 0,4 - интервалу [d21 - d22). Возбуждаем рецепторы: ѵ4 = 0,6, ѵ5 = 0,4. Пусть известно, что значение d3 характеристики D3 принадлежит интервалу [d30 - d31), а значение d4 харак¬ теристики D4 принадлежит интервалу [d40 - d41). Полагаем ѵ7 = vlO = 1. Пусть из соображений трудоёмкости дальнейшего анализа, эксперименталь¬ но, выбран порог h = 0,7. Рассчитаем значение функции активации всех нейронов: VI = 0,9, V2 = ѴЗ = 0, Ѵ4 = 0,85, Ѵ5 = Ѵ6 = Ѵ7 = Ѵ8 = Ѵ9 = Ѵ10 = VII =0. Максимально возбудившийся нейрон 1 формально указывает на вы¬ сокий рейтинг объекта. Однако тревожность ситуации нельзя не заметить по высокому возбуждению нейрона 4, указывающего на средний рейтинг. В рассмотренной рейтинговой системе вместо интервалов могут указы¬ ваться данные типа integer или Boolean - в любой комбинации, могут быть указаны объекты, входящие в состав данного и т.д. Так, например, может учитываться наличие или отсутствие аппаратного контроля вычислительных средств, применение кодов, корректирующих ошибки, наличие и состояние специальных подъездных путей и др. Развитие рейтинговой системы связано с введением весов связей, как степени влияния разных характеристик качества или даже их значений на общий показатель рейтинга объекта. Как правило, эти веса определяются в результате длительной эксплуатации системы. Не желая загромождать рис. 12.1, легко представить на стрелках, наличие которых на рисунке указывает на единичные веса, отличные от нуля веса со . (0 < со . < 1) связей, ведущих Ji Ji оту-го рецептора к /-му нейрону. С учётом весов связей функция активации /- го нейрона имеет вид: 212
Лещгія 12. Управление качеством при модернизации и развитии сложных системе... Н ' 4 4 (У, СО V . )/(/,£>. ), если это отношение не меньше значения порога h, < k=\ Jk Jk k=\ Jk О, в противном случае (i = 1,11). При обработке логической нейронной сети используется матрица свя¬ зей. Для данного примера, но для случая, когда некоторые веса меньше еди¬ ницы (пусть это выяснилось в процессе длительной эксплуатации), такая матрица имеет вид табл. 12.1. Таблица 12.1. Матрица связей, примерный вид Рецепто¬ ры 1 2 3 4 5 6 7 8 9 10 11 12 Решение нейрона 1 1 1 1 1 Решение нейрона 2 1 1 1 1 Решение нейрона 3 1 1 1 1 Решение нейрона 4 1 1 1 0,8 Решение нейрона 5 1 1 1 1 Решение нейрона 6 1 1 1 1 Решение нейрона 7 1 1 1 1 Решение нейрона 8 1 1 1 0,9 Решение нейрона 9 1 1 1 1 Решение нейрона 10 1 1 1 1 Решение нейрона 11 1 1 1 1 12.4. Отображение системы концентрических областей одинакового рейтинга Наглядное отображение рейтинга объекта на экране основано на попа¬ дании точки, соответствующей характеристикам объекта, в некоторую рей¬ тинговую область (рис. 12.2). Однако в этом случае затруднены текстовые комментарии к выводам, объясняющие принимаемые решения о рейтинге, как это показано на рис. 12.1. Для построения системы концентрических рейтинговых областей ис¬ пользуется плоская, «сплющенная» по размеру экрана сферическая система координат, рассмотренная в Лекции 11. Каждая точка характеризуется значе¬ нием радиуса г и угла (р. 213
Глава 11. Нейросетевые методы управления В рейтинговых областях сначала произвольно размещаются точки, ко¬ торым затем ставятся в соответствие условные объекты-эталоны с числен¬ ными значениями показателей качества. Так формируются связи «вектор значений показателей качества - сферические координаты точки на экране». В результате нейросетевой обработки испытываемого объекта с его показа¬ телями качества в соответствующей ему рейтинговой области формируется точка. В Лекции 11 рассмотрен пример возможного банковского мониторинга с помощью концентрических рейтинговых областей. В качестве эталонных банков различного рейтинга там могли использоваться как существующие, так и предполагаемые банки в соответствии с оценкой экспертов. Так как в рассматриваемой постановке задачи не допускается существование действу¬ ющей сложной системы с низким рейтингом, то за эталоны должны прини¬ маться условные объекты, для которых численные характеристики качества входят в интервалы, указанные в разделе 12.3, образуя варианты этих объек¬ тов различного рейтинга. Таким образом, множество эталонных объектов различного рейтинга, соответствующих точкам R\, ..., Ru на экране, строится с помощью логической нейронной сети на рис. 12.1. V Рис. 12.2. Концентрические рейтинговые области 214
Лекция 12. Управление качеством при модернизации и развитии сложных системе... Продолжая рассмотрение примера, предположим, что значения харак¬ теристик ап е [^іо, da), а2\ e [d2о, d21), аЪ\ e [d3о, <Аі), а4\ e [d4о, Аі) опреде¬ ляют эталонный вариант 1 исследуемого объекта, которому на экране соот¬ ветствует точка R\{r\, (pi) в области высокого рейтинга. Предположим, что тем же интервалам принадлежат значения характе¬ ристик а\2, а22, а32, а42, определяющие эталонный вариант 2 исследуемого объекта, которому на экране соответствует точка R2(r2, <р2) в области высоко¬ го рейтинга. То же предположим относительно значений характеристик а33, а23, а33, а43, определяющих эталонный вариант 3 исследуемого объекта, кото¬ рому на экране соответствует точка R3(r3, <р3) в области высокого рейтинга. Для получения точки R4(r4, ср4) предположим, что значение <244 характеристи¬ ки D4 принадлежит интервалу [d41, d42). Аналогично выбираются значения характеристик качества объекта, принадлежащие диапазонам их изменения, определяющим средний рейтинг. Пусть значения а45, а23, а33, а45 соответствуют точке /^(г5, (р5); значения ап, а2%, а3%, а4% соответствуют точке R%(r%, щ). Таким же образом точками объектов-эталонов /^(А, (pd) - Аз(пз, (р\3) наполняется область низкого рейтинга. Точке R9 соответствует набор значе¬ ний ап, а29, а39, а49,..., точке R\3 соответствует набор <2ідз, <22,13, <23,13, <24,13. Построенное соответствие векторов характеристик качества объекта точкам различного рейтинга на экране определило содержимое базы знаний (БЗ). Для формирования логической нейронной сети упорядочим в порядке возрастания все значения <2ц, <212, ..., <21,13 характеристики />і, фигурирующие в выше приведённых построениях. Предположим, что при выборе значений характеристик качества для эталонных точек не допускалось повторение од¬ них и тех же значений. Обозначим в новом порядке полученную возрастаю¬ щую последовательность Ъц, Адз. Выполним такую же операцию над всеми фигурирующими значениями характеристик D2, Аз, D4. Получим воз¬ растающие последовательности Ъ2\, ..., Ъ2дз; Ь31, ..., Ъ3дз; Ъ4\, ..., 64,із. По¬ скольку выбор точек R\, ..., Аз произведён произвольно, по рисунку найдём их приблизительные координаты: R\(2, 60°), R2(S, 15°), R3(7, 210°), /Д(4, 310°), R5(9, 120°), Rei 13, 20°), R7(U, 200°), Д8(12, 320°), R9( 16, 120°), Ao(16, 30°), Ai(16, 330°), A2(15,230°), Аз(17, 170°). За каждым членом совокупной последовательности значений характе¬ ристик качества закрепим рецептор (рис. 12.3). Для данного примера требу¬ ется 52 рецептора. Введём 13 нейронов, каждый из которых своим возбужде¬ нием указывает на соответствующую точку экрана. Соединим рецепторы, определяющие отдельные точки, с нейронами, соответствующими этим точ¬ кам. Тем самым зададим единичные веса связей в полученной логической нейронной сети. 215
Глава 11. Нейросетевые методы управления Так как пример не отражает реальные показатели качества, на рисунке показан лишь возможный вариант связей. Воспользуемся ранее использованной функцией активации для еди¬ ничных весов связей. Однако положим h = О, так как для большей точности попадания в «свою» рейтинговую область, желательно сравнивать ситуацию (Ь\, Ъі, Ьз, Ы), рейтинг которой следует определить, с большим числом точек базы знаний. Алгоритм оценки рейтинга объекта сложной системы 1. Находятся значения показателей качества объекта, представляющие вектор с численными значениями компонентов. 2. Производится возбуждение рецепторов логической нейронной сети. А именно, для данного испытываемого значения Ьі, где / - индекс показателя качества, находится рецептор, закреплённый за этим значением показателя. Если такой рецептор существует, значение его возбуждения принимается равным единице. Возбуждение других рецепторов данного показателя каче¬ ства равно нулю. Если такого рецептора нет, находятся два рецептора, за¬ креплённых за меньшим Ьщ и большим bi(fl+\) значениями относительно bt. «Единица» распределяется обратно пропорционально «расстоянию» bt до данных рецепторов, образуя их значения возбуждения: возбуждение А<>+і) принимается равным (А - Ьщ)/(Ь^+1) - Ьщ), а возбуждение Ьщ дополняет это от¬ ношение до единицы. Возбуждение других рецепторов данного показателя качества остаётся нулевым. Так находится возбуждение рецепторов для всех показателей качества (для всех /'). 3. С помощью функции активации находится возбуждение всех нейро¬ нов, каждый из которых указывает на эталонную точку экрана. 4. Для «возбудившихся» нейронов находится среднее значение радиуса г и угла ср. В качестве весов в формуле нахождения среднего (математическо¬ го ожидания) используются значения возбуждения нейронов. (Благодаря вы¬ бору сферической системы координат, средняя точка не выйдет за пределы рейтинговых областей, которым принадлежат усредняемые точки.) 5. Точка R(r, ср) воспроизводится на экране, попав в некоторую область рейтинга объекта. 216
Лекция 12. Управление качеством при модернизации и развитии сложных системе... 217
Глава 11. Нейросетевые методы управления 12.5. О стратегии повышения качества сложных систем в условиях финансовых и технологических ограничений Тревожное состояние объекта, обусловленное снижением его рейтинга, служит лишь сигналом о необходимости принятия мер по ремонту, замене, модернизации и пр. Меры принимаются комплексно по состоянию всех объ¬ ектов. Для этого существует или подразумевается шкала важности объек¬ тов, определяющая приоритеты при восстановлении или развитии средств сложной системы. Например, предаварийное состояние силового агрегата электростанции требует его ремонта или замены в первую очередь. Однако предаварийное состояние плотины гидроэлектростанции вызывает неотлож¬ ность мер, ибо прорыв плотины ведёт не к аварии, а к катастрофе. Важную роль здесь играет человеческий фактор, неотделимый от поли¬ тических, экономических и военных задач. Не следует забывать о приорите¬ тах научных исследований. Можно сформулировать математическую задачу оптимизации очерёд¬ ности принятия мер по повышению качества на основе важности объектов в условиях финансовых ограничений. Объекты следует выстроить в очередь по важности и по рейтингу и последовательно вычерпывать выделенные финан¬ сы затратами на повышение качества объектов. Однако при этом должна учитываться важность самой сложной системы, и математические выкладки вряд ли произведут впечатление на лицо, принимающее решение (ЛПР). Ведь следует учитывать ущерб, наносимый задержкой или полным отсутствием реакции на сигнал о снижении рейтинга объекта. Таким образом, поиск оптимальной стратегии повышения качества сложной системы после установления рейтинга её объектов превращается в конкретную, но трудно формализуемую задачу высокой сложности. Это за¬ дача о разработке системы принятия решений на основе анализа многих ин¬ формационно трудно совместимых факторов, характеризующихся нечёткими данными. Представляется, что аппарат логических нейронных сетей направ¬ лен именно на разработку таких систем принятия решений. Ключевые термины Сложная система - комплекс взаимодействующих объектов, решаю¬ щих общую задачу в соответствии с целевой функцией и с требуемыми зна¬ чениями параметров обслуживания. Показатель качества - численное значение характеристики объекта сложной системы, обусловленное техническим заданием на его разработку. Рейтинг объекта в составе сложной системы - экспертная оценка по многобальной системе степени положительного участия объекта в выполне¬ нии целевой функции сложной системы. 218
Лекция 12. Управление качеством при модернизации и развитии сложных системе... Краткие итоги 1. Управление качеством сложной системы направлено на своевремен¬ ное принятие мер по сохранению и развитию высоких показателей многока¬ нального обслуживания и, прежде всего, - по удовлетворению высокой про¬ пускной способности и производительности, а также высокой надёжности и безопасности. 2. Большое количество факторов, лежащих в основе функционирования сложных систем, их целевое, технологическое и типовое разнообразие, не полная возможность численных оценок превращают задачу управления каче¬ ством в трудно формализуемую задачу высокой сложности. При решении по¬ добных задач целесообразно применять такие методы и средства искусствен¬ ного интеллекта, как логические нейронные сети, с использованием эксперт¬ ных оценок там, где объективные численные измерения невозможны. 3. Для каждого типа средств, входящих в состав сложной системы, со¬ ставляется своя рейтинговая система на основе логической нейронной сети. При этом используются характеристики, свойственные данному типу средств: вычислительных, оборонных, энергетических, строительных и тран¬ спортных сооружений и т.д. 4. В процессе эксплуатации логической нейронной сети в составе рей¬ тинговой системы эта система (её база знаний) легко развивается, уточняют¬ ся веса связей, а решения модифицируются для большей результативности. 5. По установленным экспертами условным весам средств системы и на основе текущих рейтингов отдельных объектов, по формуле нахождения среднего может быть получен рейтинг сложной системы. Однако он свиде¬ тельствует лишь о качестве работы этой системы, и не может служить абсо¬ лютной мерой качества при сравнении с другими, даже аналогичными систе¬ мами, в том числе, с системой «идеальной». Ведь все системы обладают сво¬ ей целевой функцией! Вопросы 1. В чём заключается идея управления качеством сложной системы? 2. Как составляется рейтинговая система управления качеством объекта сложной системы по интервалам значений его характеристик качества? 3. В чём идея и как составляется наглядная рейтинговая система управ¬ ления качеством объекта сложной системы? 219
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления и принятия решений на логических нейронных сетях Аннотация. Рассматривается применение логических нейронных сетей в ассоциативных «бесформульных» вычислениях трудно формализуемых за¬ дач и задач имитационного моделирования, в медицинских информационно¬ справочных системах, в системах идентификации пользователя, в адаптивной пошаговой маршрутизации беспроводных телекоммуникационных и транс¬ портных сетей, а также в самообучающихся системах управления по нечёт¬ ким данным. Приводятся рекомендации по повышению качества некоторых известных систем принятия решений. Ключевые слова: логическая нейронная сетъ, функция активации, матрица следования, ассоциативные вычисления, информационно-справоч¬ ные системы, самообучающиеся системы управления. Щ о е в... (Углублённо.) Пускай теперь наука трудится, а человек около неё как на курорте. А. Платонов. «Шарманка». 13.1. Аппроксимация опыта и ассоциативные «бесформульные» вычисления Давно известно, что исследователи, использующие современный метод имитационного моделирования сложных систем, прекратили попытки по¬ строения функций аппроксимации для графического представления своих ре¬ зультатов. Большое количество формально несовместимых факторов приво¬ дило бы к формированию большого количества двух- и трёхмерных таблиц для выделенных переменных. Эти таблицы составлялись бы для фиксиро¬ ванных значений других переменных, рассматриваемых в качестве парамет¬ ров, составляющих множество точек в многомерном пространстве. Нагляд¬ ность такого представления при желании получить огромное количество графиков, проблематична. Исследователи формируют базы знаний, представляя свои результаты в виде таблиц, связывающих испытываемые точки факторного пространства (ситуации) с векторами найденных значений результатов - решений по дан¬ ным ситуациям. Наиболее характерно это для полигонных испытаний, ис¬ пользуемых для калибровки моделей. Таким образом, для дальнейших иссле¬ дований предоставляется далеко не полная оценка результатов моделирова¬ ния во всём факторном пространстве. Чтобы превратить эти оценки в количественные на всём факторном пространстве при допущении об отсутствии особых точек, необходимо со¬ здать механизм расширения их на всю испытываемую область. Используется 220
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... метод ассоциативного нахождения «промежуточных» решений, заключаю¬ щийся в определении: «на какую (какие) из известных ситуаций и в какой мере похожа вновь возникшая ситуация и как по базе знаний выбрать или построить соответствующее ей решение». При этом по нескольким «похо¬ жим» ситуациям возможно усреднённое решение. Механизмом, представляющим собой численный метод «бесформуль- ного» ассоциативного вывода, и являются логические нейронные сети. С их помощью реализуются развиваемые информационно-справочные системы, объединяющие опыт и результаты моделирования в конкретной области ис¬ следований. Например, в [7] исследуются результаты моделирования многосервер¬ ной базы данных с циркулирующими сегментами. Для множества точек фак¬ торного пространства - значений векторов {Л (интенсивность потока запро¬ сов), г (длительность такта), (вЫп («чистое» время выполнения запроса), п (ко¬ личество серверов), m (количество циркулирующих сегментов)}, находятся значения вектора (среднее время выполнения запроса, вероятность вы¬ полнения}. Информационной основой построения обученной нейронной сети (рис. 13.1) для информационно-справочной системы являются таблицы, построен¬ ные в процессе моделирования. Значение И простейшей функции активации /-го нейрона находится в результате расчётов: V := — У V.; V := ifV > h then V else 0, (k - количество kj 1 1 (13.1) активных входов нейрона). Здесь V,- - величина возбуждения рецептора, подаваемая на вход нейро¬ на. В нашем случае к = 6. Максимально возбудившийся нейрон указывает на решение. Решением является вектор, состоящий из двух компонент - времени tevm выполнения за¬ проса и вероятности Р его выполнения. Направление синапсических связей на рисунке указано во вставках, а решения обозначены на «телах» нейронов парой искомых чисел. Поскольку исследования многопроцессорных баз данных далеки от за¬ вершения, веса всех синапсических связей на рис. 13.1 приняты равными единице. Пока мы не можем с достаточной уверенностью установить, в какой степени каждый фактор влияет на получаемый результат. Это может быть выявлено в течение длительного опыта эксплуатации. Обработка нейросети основана на её представлении в виде матрицы связей, фрагмент которой показан в табл. 13.1. Она легко обрабатывается с помощью EXEL. 221
Глава 11. Нейросетевые методы управления Например, пусть известны значения факторов создающейся многосер¬ верной базы данных с циркулирующими сегментами: Л = 146, т= 0,075, tehm = 0,007, п = 11 ,т = 12, размер буфера не актуален из-за значительного объёма памяти сервера. Для возбуждения рецепторов (в строке «Пример») разделим для каждо¬ го фактора «единицу» обратно пропорционально расстоянию до двух «близ¬ ких» рецепторов: Ѵю = 0,7, Ѵц = 0,3, Ѵи = Ѵіз = 0,5, Vis = 0,6, Ѵю = 0,4, Ѵѵэ = Vio = 0,5, Ѵц = 1, Via = 1. Считаем функцию активации всех нейронов 1-77 скалярным умноже¬ нием каждой его строки в матрице на строку «Пример». Полученные резуль¬ таты делим на 6, так как каждый нейрон имеет 6 входных связей, и сравнива¬ ем с порогом h. В общем случае порог выбирается экспериментально, чтобы отсечь ма¬ лые значения возбуждения нейронов. В данном случае представляется целе¬ сообразным принять h = 0,6. Чтобы не загромождать пример, в табл. 13.1 от¬ ражены строки матрицы следования, соответствующие лишь некоторым ней¬ ронам, с ожидаемым существенным возбуждением. Полученные значения возбуждения нейронов: Ѵю = Ѵи = Ѵ32 = Ѵзз = 0, V76 = 0,71, Ѵц = 0,65. По другим строкам мат¬ рицы следования возбуждения равны нулю. тт 0,37-0,71 + 0,4-0,65 Находим tehm = - 0,71 + 0,65 = 0,38, i3 = 1. 222
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... 1 = 10? 1= 20? 1= 30? 1= 50? 1= 60? 1= 80? 1, 12, 23, 34, 45, 56, 67 2, 13, 24, 35, 46, 57, 68 3, 14, 25, 36, 47, 58, 69 4, 15, 26, 37, 48, 59, 70 5, 16, 27, 38, 49, 60, 71 6, 17, 28, 39, 50, 61, 72 *вып = 0,02? п = 8? п = 10? п = 12? Буфер ак¬ туален Буфер аКТуа, не уален т = 20? т = 24? 17 18 19 20 21 22 23 24 1 - 11, 12 - 22 1 - 11, 45 - 55 56 - 66 12 - 22, 23 - 33, 34 - 44,67 - 77 1 - 11, 23 - 33, 34 - 44, 45 - 55 12 - 22, 56 - 66, 67 - 77 1 - 11, 12 - 22, 23 - 33, 34 - 44 45 - 55, 56 - 66, 67 - 77 Рис. 13.1. Фрагмент информационно-справочной системы 223
Глава 11. Нейросетевые методы управления Таблица 13.1. Фрагмент матрицы связей для логической нейронной сети, реализующей информационно-справочную систему 13.2. Медицинские информационно-справочные системы Если ассоциативные «бесформульные» вычисления допускают усред¬ нение решения, то в медицинских системах диагностики и лечения результат должен быть вполне определённым, как руководство к действию. В боль¬ шинстве случаев речь идёт о получении чёткого решения по нечётким дан¬ ным. Это подтверждается практикой привлечения консилиума при решении спорных вопросов. Поэтому построение базы знаний на основе опыта высо¬ коквалифицированных специалистов и её организация на базе механизма ас¬ социативного мышления, реализуемого логической нейронной сетью, явля¬ ется чрезвычайно важной задачей. Исключение операции усреднения при использовании логической ней¬ ронной сети говорит о том, что единственный максимально возбудившийся нейрон выходного слоя указывает на предлагаемое решение. Более того, это решение редко является численным - в этом случае усреднение было бы до¬ пустимо. В основном, решение указывает на стратегию или алгоритм лече¬ ния. 224
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... В [15] представлена логическая нейронная сеть, реализующая инфор¬ мационно-справочную систему для лечения хронических заболеваний почек. В основе этой системы лежат клинические практические рекомендации Международной Рабочей группы специалистов. Объём статьи не позволил в рамках одного рисунка поместить сформированную логическую нейронную сеть. Она отражена полностью, но фрагментарно. Матрица связей (табл. 12.2), как аппарат вычислений, там не отражена. Рассмотрим пример запроса. Пусть из-за неточного измерения скоро¬ сти клубковой фильтрации (СКФ)5 с достоверностью 0,6 (по приблизитель¬ ной оценке врача) установлено, что наблюдается 5-я стадия ХЗП - хрониче¬ ского заболевания почек. Предполагаемая достоверность 4-й стадии состав¬ ляет 0,4. Возбуждается рецептор 6 сообщением ему значения 0,6. Рецептору 15 сообщается значение 0,4. Далее, пусть из-за неточного замера уровня фосфора в сыворотке крови рецептору 18 пришлось задать значение возбуж¬ дения 0,8, а рецептору 19 - значение 0,2. Аналогично, с учётом ошибок изме¬ рения интактного ПТГ (паратгармона) формируются значения 0,2, 0,2, 0,6 возбуждения рецепторов 20, 21 и 22 соответственно. Запрос сформирован, возбуждение остальных рецепторов полагаем нулевым. При нулевом значе¬ нии порога максимально, до величины 1,4, возбудится нейрон, соответству¬ ющий решению Yn = (Поддерживать содержание фосфора сыворотки крови на уровне 2,7 мг/дл и выше, но не выше чем 4,6 мг/дл. Следует обеспечить терапию активными стеролами витамина D и т.д.) 5 На рассматриваемом формальном уровне смысл специальных терминов раскрывать нецелесообразно. 225
Глава 11. Нейросетевые методы управления Таблица 13.2. Матрица связей, левая и правая части (Правую часть следует рассматривать в совокупности со столбцом обозначений решений в левой части) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 Y1 1 Y2 1 Y3 1 Y4 1 Y5 1 Y6(1) 1 1 Y6(2) 1 1 Y7(1) 1 1 1 Y7(2) 1 1 Y7(3) 1 1 Y7(4) 1 1 Y8(1) 1 Y 8(2) 1 Y9(1) 1 Y 9(2) 1 1 Y9(3) 1 i Y10(1) 1 1 Y10(2) 1 1 Y10(3) 1 1 Y11(1) 1 1 Y11(2) 1 1 Y12 1 1 Y13(1) 1 Y13(2) 1 Y14 1 1 1 Y15 1 1 1 Y16 1 1 1 Y17(1) 1 1 Y 17(2) 1 1 Y18(1) 1 1 Y18(2) 1 1 Y19 1 1 Y20 1 1 Y21 i i Y 22 1 i Y23(1) 1 1 i i i i Y23(2) 1 1 i i i i Y24(1) 1 1 i i i i Y24(2) 1 1 i i i i Y25(1) 1 1 Y25(2) 1 1 Y26 Y27 Y28 Y29 Y30 Y31 Y32(1) Y32(2) Y32(3) Y33(1) Y33(2) Y34 Y35(1) Y35(2) Y36 Y37 Y38 Y39 Y40 Y41 Y42 Y43 Y44 Y45 1 Y46 1 Y47 Y48 Y49 226
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 і 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 227
Глава 11. Нейросетевые методы управления 13.3. Идентификация пользователя в компьютерной сети по «почерку» Для примера выберем три характеристики почерка пользователя в си¬ стеме «клиент - сервер», образующие его «портрет»: скорость использования клавиш a(key/s), частоту использовании стрелки «<—» возврата b(key/s), ча¬ стоту использования клавиши «delete» c(key/s). В [16] на основе статистического анализа десяти пользователей полу¬ чены оценки данных характеристик (табл. 13.3). Не подвергая их сомнению, рассматривая лишь в качестве примера, используем эти оценки, отображаю¬ щие накопленный опыт, для построения логической нейронной сети. При этом предположим, что в результате длительных испытаний и эксплуатации, установлено неодинаковое влияние выделенных характеристик пользователя на результат распознавания. Таблица 13.3. «Портреты» пользователей» Пользователь Скорость ввода симво¬ лов a(key/sec) Частота ис¬ пользования клавиши «<—» b(key/sec) Частота ис¬ пользования клавиши delete c(key/sec) Ш 3,84 0,21 0,51 U2 3,25 0,56 0,29 из 4,26 0,46 0,18 U4 4,69 0,91 0,13 U5 4,31 0,82 0,55 U6 3,83 0,57 0,12 U7 3,84 0,72 0,77 U8 3,88 0,45 0,53 U9 3,82 0,53 0,15 шо 3,87 0,12 0,92 А именно, пусть в результате оценок оказалось целесообразным учи¬ тывать характеристику b с весом 0,8 (рис. 13.2). 228
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Выберем функцию^ активации /-го нейрона, предварительно рассчитав Е®ѵ/ѵ значение / = -*= . Тогда/ =f если />//, 0-впротивном случае. (13.2) 2>ѵ ѵ Здесь соѵ - вес входной связи, параметр ѵ «пробегает» по всем вход¬ ным связям нейрона. Обозначим высказывания: А1 = (а = 3,25?}, ... СЮ = (с = 0,92?). Мат¬ рица связей представлена в табл. 13.3. Рассмотрим пример. Пусть сервер, периодически контролируя работа¬ ющих пользователей, рассчитал вектор статистических характеристик {а = 3,4, Ъ = 0,51, с = 0,3}. Порог распознавания h = 0,6. Находятся два рецептора группы а, «близких» к значению 3,4, и «еди¬ ница» делится между ними обратно пропорционально «расстоянию». В дан¬ ном случае возбуждение А1 принимается равным 0,75, а А2 - 0,25. Анало¬ гично находятся два рецептора, включающих значение Ъ = 0,54, - В5 и В6. Тогда возбуждение первого полагается равным 0,67, а второго - 0,33. Анало¬ гично, рецептор С5 возбуждается на величину 0,9, а рецептор С6 на величину од. С помощью функции активации найдём величины возбуждения нейро¬ нов выходного слоя. Максимальная из этих величин - величина возбуждения нейрона, указывающего на пользователя U2 и превысившая порог, равна 0,61. 229
Глава 11. Нейросетевые методы управления Рис. 13.2. Логическая нейронная сеть для распознавания пользователя в системе «клиент - сервер» 230
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Таблица 13.3. Матрица связей логической нейронной сети распознавания пользователя Величина возбуждения рецепторов < <N < < ТГ ■Л 40 Г~- «d X 04 и й — а ТГ — ■л — 40 СО r~- СО X CO 04 CO о s G 0 в -T U ІЛ U 40 и r~- U X U 04 и о б В X o'- В X o'- в X o'- -т — X o'- 1л — X o'- 4© — X o'- г¬ — X o'- X — X o'- 04 — X o'- О 3 X o' 231
Глава 11. Нейросетевые методы управления 13.4. Адаптивная пошаговая маршрутизация в беспроводной телекоммуникационной сети Рассмотрим беспроводную телекоммуникационную систему, в которой компьютеры узлов составляют вычислительную сеть [17]. На этой сети зада¬ но отношение смежности. Информационные пакеты движутся к адресату по смежным компьютерам (узлам). Каждый маршрут не формируется весь сра¬ зу, а реализуется динамически, по шагам с учётом приоритетного обращения к смежным узлам (в зависимости от адреса назначения), текущей загрузки этих узлов и текущей оценки качества связи между узлами (в [17] не учиты¬ вается). Лишь в результате такого комплексного анализа может быть оконча¬ тельно выбран узел смещения. Таким образом, одновременно реализуемые маршруты в сети оказывают взаимное влияние, и «разводить» их динамиче¬ ски надо так, чтобы избегать пиковых нагрузок узлов и, в конечном итоге, обеспечить максимальную пропускную способность сети, а также макси¬ мальную вероятность выполнения передачи. На каждом /-м узле есть таблица Ті (табл. 12.4) предпочтительного смещения при передаче данных на все прочие узлы, кроме смежных. Таблица 13.4. Таблица предпочтительного смещения из данного і-го узла для каждого (не смежного) адреса назначения Узел (адрес) иоэиопоиттп Вес смежного узла в направлении пере¬ дачи Ах Ф\\ (DX2 ОХ К Ar (Drx (DR! ORK Здесь R - количество узлов, в которые возможна передача пакетов из данного узла через один из смежных, К - количество смежных узлов. (В об¬ щем случае К - переменная величина.) При выборе весов со учитывается территориальное взаимное располо¬ жение узлов. Так, очевидно, что приоритетной является та передача, при ко¬ торой пакет приближается к узлу назначения, хотя в динамике загрузки сети может оказаться, что «кружной» путь ближе «прямого». Предполагается, что компьютер каждого узла имеет буфер, в котором накапливаются пакеты для дальнейшей отправки. Перегрузка буферов (точ¬ нее, - достижение критической отметки) должна блокировать приём новых пакетов. Возможна блокировка передач по направлениям или в сети в целом. Потери информации не предполагаются, пользователь должен быть инфор¬ мирован об этой перегрузке для повторения запроса позже. 232
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Управление передачей пакетов производится с помощью логической нейронной сети, которая первоначально использует для каждого адреса предпочтительные направления передачи пакетов смежным узлам, найден¬ ные в табл. 13.4. Веса этих смещений используются в качестве весов си- напсических связей. С помощью обратных связей, осуществляемых смежны¬ ми узлами, с отрицательными весами передаются коэффициенты kj загрузки этих узлов, а также (с положительными весами) оценки Гу < 1 (J = 1,..., К) со¬ стояния связи между данным и смежным узлами, которые окончательно вли¬ яют на выбор смежного узла для передачи пакета. (Значение kj следует ин¬ терпретировать, как достоверность высказывания о том, что буфер узла за¬ гружен полностью, а значение Гу - как достоверность высказывания о том, что качество связи между передающим и у-м узлами отличное.) Нейронная сеть фрагментарно распределена между компьютерами всех узлов так, чтобы отражать информацию, связанную только с конкретным узлом. Фрагмент логической нейронной сети, размещённый на одном узле, представлен на рис. 13.3. Здесь (щ - предпочтительные веса смежных узлов при передаче пакета по адресу Аі, kj - коэффициент загрузки буфера смежно¬ го узла, Гу - состояние связи между узлами. Функция активации, по аналогии с(13.1)и(13.2) имеет вид: V/ = Ѵаі щ- - kj + Гу, если эта разность превышает порог h, О, в противном случае. Здесь Ѵаі= 1, если Аі (і = 1, ..., R) - адрес назначения информационного пакета, порог h выбирается экспериментально так, чтобы предпочтение мог¬ ло быть выбрано между не полностью загруженными узлами. Таким образом, в результате обратной связи максимального возбужде¬ ния может достичь совсем не тот смежный узел, которому первоначально было оказано предпочтение. Общим критерием эффективности управления является максимизация пропускной способности сети. Частными критериями являются: 1) минимум среднего времени выполнения запроса на передачу пакета в сети; 2) минимум времени ожидания пользователем возможности выполнения своих запросов. Рассмотренный подход легко распространяется на выбор оптимального множества маршрутов совместного следования объектов в транспортной се¬ ти. 233
Глава 11. Нейросетевые методы управления Передать компьютеру 1 Передать компьютеру K От смежных компьютеров Передать компьютеру 1 Передать компью т ер у 1 Передать компьютеру K Передать компьютеру K 234
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Рис. 13.3. Фрагмент логической нейронной сети, размещённый на одном узле, во взаимодействии со смежными узлами 235
Глава 11. Нейросетевые методы управления 13.5. Некоторые «незаконченные» системы принятия решений 13.5.1. Контроль космического пространства Особую важность применение представленного метода ассоциативных вычислений обретает в системе контроля космического пространства. При трудностях политического характера непрерывное наблюдение всех косми¬ ческих объектов, особенно спутников, затруднительно. Как правило, спутник скрывается за горизонтом от средств обнаружения и сопровождения, а затем появляется вновь. Средства обнаружения производят селекцию и идентифи¬ кацию на основе текущего состояния каталога, представляющего собой базу знаний о космическом пространстве. Новый объект должен быть внесён в ка¬ талог с измеренными параметрами. Каталог строится в виде логической нейронной сети. Для каждого спутника за отдельными рецепторами закрепляются значения шести извест¬ ных параметров орбит. (Если уже существует рецептор, закреплённый за не¬ обходимым значением, он используется повторно.) Связи от этих рецепторов с единичными весами идут на нейрон, «отвечающий» за спутник, обладаю¬ щий этими значениями параметров. Тогда, для вновь возникших из-за горизонта объектов, методом ассоци¬ ативных вычислений с заданной точностью устанавливается совпадение с одним из известных спутников. Если спутник уже отображён в каталоге, то есть, возбуждение некоторого нейрона максимально превысило порог, про¬ должается его сопровождение. Если спутник новый, нейронная сеть допол¬ няется на основе его характеристик, измеренных средствами обнаружения. Таким образом, логическая нейронная сеть, отображающая каталог, постоян¬ но развивается. 13.5.2. Нейросетевое управление перехватом «быстрой» цели Материал данного раздела не лишён элементов фантастики, в очевид¬ ном понимании того, что все крупные проекты рождаются на основе здоро¬ вых фантазий их исполнителей, первоначально исходящих из простейших предположений. Под «быстрыми» целями будем понимать крупные метеориты и другие космические или баллистические (с ограниченным манёвром) объекты. Следовательно, перехватчик должен быть столь же «быстрым». Это пе¬ реносит тяжесть оперативного управления его действиями на этап предстар¬ товой подготовки для движения в точку вывода и захвата цели видео сред¬ ствами, а затем - на этап наведения на цель с помощью изменения силы и направления суммарной тяги двигателей. 236
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Сценарий перехвата Представим подробнее типовой сценарий перехвата. 1. Средства обнаружения целей в соответствии с тактовой частотой ра¬ боты системы передают координаты предполагаемых целей и координаты векторов скорости на вычислительные средства командного пункта (КП). Передача сообщений по каждой цели на КП начинается с момента выполне¬ ния критерия обнаружения. 2. КП производит целераспределение, выбирая для каждой цели бли¬ жайший стрельбовый комплекс и конкретную стартовую позицию с предпо¬ чтительной возможностью встречного сближения с целью. Очевидно, что в динамике боя предпочтения могут не выполняться. Отнесём многочисленные «если» к последующему расширению условий решения задачи. 3. Перехватчику, назначенному для поражения конкретной цели, назначаются время старта, начальные установки его рулевых органов для движения в область точки вывода после вертикального старта, а также ко¬ манды на устройство стабилизации для принятия положения в пространстве в соответствии с понятиями «верх» и «низ», упрощающими управление на этапе наведения. Мы предполагаем, что даже при позиции перехватчика для вертикального старта механический разворот в сторону цели недопустим, так как требует много времени. Поэтому для перехватчика, находящегося на стартовой позиции, «верх» и «низ» могут резко не соответствовать направле¬ нию на цель. Ведь перехватчик даже может оказаться «вверх ногами» к нача¬ лу этапа наведения. 4. При боковой стрельбе по пролетающей цели точка вывода может явиться той упреждающей точкой, в которой осуществляется самоподрыв перехватчика. 5. При «пролёте» цели точка вывода соответствует исходному положе¬ нию для погони. 5. При встречном перехвате или при погоне этап вывода заканчивается визуализацией цели, поступлением сигнала перехватчика «цель вижу». Если перехватчик с помощью своих средств цель «не увидел», команда на подрыв (главная команда) может быть подана с земли. Если перехватчик оборудован средствами виртуальной реальности, он может быть переведён на ручное управление с земли, если позволяют параметры движения. 6. В режиме встречного наведения или погони перехватчик видит цель на мониторе или его невидимом аналоге, например, в области памяти. С по¬ мощью органов управления он стремится совместить точку или образ цели с центром монитора. При максимальном сближении производится самопод¬ рыв, несмотря на возможность столкновения. 237
Глава 11. Нейросетевые методы управления Рис. 13.4. Перехватчик Модель перехватчика Предположим, что перехватчик имеет маршевый двигатель для основ¬ ной тяги и четыре двигателя переменной тяги для смены направления движе¬ ния созданием крутящего момента вокруг центра масс (рис. 13.4). С помо¬ щью маршевого двигателя производится и форсаж. 238
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Перехватчик может иметь один двигатель с размноженными соплами. Четыре из них с помощью условной «ручки» осуществляют переменную тягу для управления движением. Режим форсажа влияет на все сопла. Таким образом, управление направлением движения производится и условно отображается «ручкой», словно управляющей автоматом-перекосом вертолёта. Боковая составляющая движения ручкой означает поворот, про¬ дольная составляющая - изменение высоты. Уточним, что перехватчику, назначенному для поражения цели, сооб¬ щается начальное положение «ручки», чтобы после вертикального старта обеспечить начальные углы движения к точке вывода по оптимальной траек¬ тории. Кроме того, могут сообщаться команды на стабилизаторы для прида¬ ния в полёте вертикального положения. Однако такое положение навстречу цели может быть ему придано (вместе с группой других перехватчиков) за¬ ранее, на этапе предстартовой подготовки в соответствии с направлением обнаруженного налёта. Как ранее указывалось, для обучения управляющих нейронных сетей и имитации хода боевых действий (использование натурных экспериментов желательно, но весьма дорого) необходима достаточно точная математиче¬ ская модель интегрирования движения перехватчика, учитывающая не толь¬ ко силу тяги и гравитацию, но и рулевые эффекты. Вряд ли необходимая «математика» сейчас разработана. Рекомендуем проводить интегрирование движения перехватчика, как неуправляемого снаряда в реальном или псевдореальном (в режиме обучения нейросети) времени приближёнными численными методами. Затем в каждом такте в найденные координаты следует вводить поправки на основе эмпири¬ ческих данных, складывающихся на основе ограниченного опыта «учителя». Эти поправки, найденные экспериментальным путём или на основе опыта и знаний «учителя», таят в себе зависимости от текущего положения объекта по отношению к цели, их векторов скорости, угловой скорости вращения на основе уже установленных рычагов управления, поправок, введённых в предыдущие такты управления и т.д. Представим более подробную «математику», вполне применимую для исследований принципов управления. Пусть А - длительность такта управления перехватом, определяющая шаг интегрирования, /' = 0, 1, ..., - номер такта. Тогда интегрирование в си¬ стеме декартовых координат Oxyz, связанной со стартовой позицией, можно вести по формулам: хт = Хі + у*,- А; Уі+i =уі + 0’я - А&)А; zi \ i zi 1 vzi A. Здесь Vxi, Vyi, vzl - координаты вектора скорости, g - ускорение свобод¬ ного падения. 239
Глава 11. Нейросетевые методы управления Как говорилось выше, при вертикальном старте значение ѵо устанавли¬ вается начальным положением «ручки» с командного пункта. Предположим, что значения координат вектора скорости ѵ*о, ѵуо, Vzo достигаются через не¬ сколько тактов неуправляемого полёта перехватчика после старта. Следова¬ тельно, отсчёт тактов управляемого движения (і = 0) начинается с этого мо¬ мента времени. Результаты интегрирования должны быть скорректированы в соответ¬ ствии с текущим положением «ручки». Здесь-то и срабатывает логическая нейронная сеть, которая по ряду предыдущих и по текущему положению «ручки» находит поправки дхі+1, дут, 8zi+\ к полученным значениям коорди¬ нат перехватчика: •Т/+1 . 1 дх /+ \, Уі+ i '= Уі+і + дуі+і, Zi+1 := Zi+1+ 8zi+1. Находятся новые составляющие вектора скорости: Ѵх(і+1) = (1/А)х(хі+1 — Xj), ѵУ(і+1) = (1/А)х(уш -yi), Vz(i+i) = (l/A)x(z/+i -zi). Уточнённые таким образом параметры движения влияют на последу¬ ющие результаты интегрирования, изменяя траекторию движения перехват¬ чика. Несомненно, необходимые значения поправок дхі+1, дуі+1, dzl+\могут быть найдены строго математически на основе физических законов движе¬ ния, динамически учитывающих управляющие воздействия. Однако научный опыт учит, что всякое «точное» громоздкое математическое описание ис¬ пользует предположения, условия и ограничения. Поэтому элементы строгих математических описаний, эвристические решения и обобщённые результаты эксперимента следует разумно сочетать для сокращения объёма вычислений. Ведь концепции искусственного интеллекта как раз и строятся на не¬ чётких данных! Что бы было, если бы обучение водителя авто строилось на основе строгого математического обоснования его действий? Управляющие логические нейронные сети Таким образом, применяются три системы принятия решений на логи¬ ческих нейронных сетях: 1. Система целераспределения на командном пункте, выдающая коор¬ динаты и вектор скорости в точке вывода, контрольное время полёта, а также положения «ручки» для начального движения назначенного перехватчика в направлении точки вывода. 2. Бортовая система управления полётом, выбирающая положение «ручки» для устранения рассогласования движения перехватчика с уточняе¬ мой точкой вывода. 3. Система управления «ручкой» при визуальном наведении перехват¬ чика на цель. 240
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... 13.5.3. Управление надёжностью Проблема управления надёжностью представляет яркий пример трудно формализуемой задачи, когда известны лишь частные математические зави¬ симости для отдельных объектов и процессов, и то - с серьёзными допуще¬ ниями. Комплексная автоматизация выполнения планов замещения оборудо¬ вания, назначения сроков регламентных работ, и других средств поддержа¬ ния надёжности сложной системы на требуемом уровне достигается в ре¬ зультате математического моделирования и обработки значительного опыта эксплуатации. В результате таких работ может быть создана база знаний на основе логической нейронной сети. Эта БЗ должна вестись опытными иссле¬ дователями и постоянно уточняться. В применении к железнодорожному транспорту, в условиях ограни¬ ченного финансирования, решение такой задачи влияет на порядок ремонта и модернизации объектов. Используется большое число контролируемых фак¬ торов: от прогнозируемой частоты отказов каждого транспортного средства до комплектации пожарных щитов, от срока эксплуатации железнодорожно¬ го перегона до наличия и обеспечения безопасности транспортного переезда и пассажирского перехода. Объединение показателей этих факторов в рамках единого метода ассоциативных вычислений возможно только при сведении их к единой системе измерения - к использованию достоверности высказы¬ ваний о принадлежности данных: о наличии тех или иных объектов, о пред¬ полагаемых или прогнозируемых диапазонах надёжности транспортных средств и т.д. Скорее всего, данная трудно формализуемая задача относится к задачам нахождения рейтинга каждого объекта в общей очереди всех объек¬ тов на обслуживание. Рекомендуемые решения опираются не на строгие чис¬ ленные оценки, которые могли бы быть результатом расчёта функций чис¬ ленных переменных. Они указывают на предпочтительные стратегии разви¬ тия и модернизации, на предпочтительный ряд возможных действий, распре¬ деление объёма финансирования ремонта объектов и т.д. Решение формируется в виде текстов, подобных тем, что выдаются ме¬ дицинской информационно-справочной системой. Данную СПР можно существенно развить, продлив её логическую це¬ почку, введя второй логический уровень. На первом логическом уровне сле¬ дует ограничиться нахождением текущего значения рисков, связанных с дальнейшей эксплуатацией объектов. Полученные данные совместно с дру¬ гими данными, например, отображающими возможности финансирования, а также технологические и организационные возможности, следует использо¬ вать в следующей, однослойной логической нейронной сети - сети второго логического уровня. Эта сеть выдаёт окончательные конкретные рекоменда¬ ции по тактике адресного проведения регламентных или ремонтных работ, по развитию инфраструктуры на основе новых требований, замене средств 241
Глава II Нейросетевые методы управления подвижного состава, прокладке путей и т.д. Примерный вид такой двухуров¬ невой сети показан на рис. 13.5. Реализация такой, всего лишь двухуровневой логической цепочки (дли¬ ны, равной двум) должна послужить высокому уровню автоматизации и ин¬ теллектуализации системы управления, значительному подавлению челове¬ ческого фактора, повышению эффективности этой системы. Рецепторный слой первого логического уровня Выходной слой первого логиче¬ ского уровня - рецепторный слой второго логи¬ ческого уровня Выходной слой двухуровневой логической нейронной сети Ос Ю Ю Ос ю • • • От • • • • • • От Юс Рецепторы до- > полнительных факторов второ- • • • ю ю Рис. 13.5. Примерный вид логической нейронной сети, реализующей логическую це¬ почку с длиной, равной двум 242
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Применение матриц следования позволяет оперативно изменять и до¬ полнять СПР новыми или уточнёнными связями и их весами на основе опыта эксплуатации. Так осуществляется обратная связь, позволяющая на основе эффективности принимаемых решений корректировать эти решения, то есть, неограниченно развивать базу знаний. 13.5.4. Контроль погрузки по дорогам назначения и в затруднённые пункты выгрузки Формализация системы принятия решений Рассматриваемая система принятия решений в факторном пространстве событий учитывает 14 факторов, с их известными значениями. Тогда каждая ситуация представляется вектором значений следующих факторов: {(1) пункт назначения, (2) род груза, (3) дорога отправления, (4) время года, (5) отправитель груза, (6) получатель груза, (7) часть месяца, (8) род по¬ движного состава, (9) действующие приказы, (10) выполнение регулировоч¬ ных заданий, (11) выполнение плана погрузки, (12) выполнение плана вы¬ грузки, (13) наличие гружённых составов на дорогах назначения, (14) соот¬ ношение между планом погрузки предыдущего и последующего месяца). По технологии построения логических нейронных сетей значением каждого фактора является высказывание о принадлежности данных. Пере¬ менные формируются на основе достоверности высказываний о принадлеж¬ ности данных. Каждый фактор имеет несколько значений, в совокупности образующих исчерпывающее множество событий. Ниже указаны значения факторов: (1) - {Х\, X), Х\, X), X,1, Х\), где Х\ - высказывание: «станция водной перевалки», Х\ - высказывание: «припортовая станция», Х\ - высказывание: «пограничная станция», Х\ - высказывание: «дорога регулировочная», Х\ - высказывание: «дорога погрузочная», Х\ - высказывание: «дорога комплектования»; (2) - (Х\,Х\, Х\), где Х\ - высказывание: «груз народнохозяйственного значения», Х\ - высказывание: «груз местного значения», X] - высказывание: «экспортный груз»; (3) - <Xj3, Х23, Х\), где Х\ - высказывание: «дорога регулировочная», Л\3 - высказывание: «дорога погрузочная», 243
Глава II Нейросетевые методы управления Х\ - высказывание: «дорога комплексного регулирования»; (4) -{x;,XUXl,Xt)tTj& X* - высказывание: «зима», Л\4 - высказывание: «весна», ХА - высказывание: «лето», ХА - высказывание: «осень»; (5) ~{ХІ, Х\, Х35 >, где Xj5 - высказывание: «груз народнохозяйственного значения», Х25 - высказывание: «груз местного значения», /з - высказывание: «прочие»; (6) - (Xf, X*, Х^, Х4), где Хгб - высказывание: «стройки», Х\ - высказывание: «груз народнохозяйственного значения», Х\ - высказывание: «груз местного значения», Х64 - высказывание: «прочие»; (7) - (Х4, Х\, ХІ >, где X] - высказывание: «начало», X] - высказывание: «середина», ХІ - высказывание: «конец»; (8) - {ХІ, Х\,Х\,Х\ >, где ХІ - высказывание: «цистерны», Х\ - высказывание: «крытые цистерны», ХІ - высказывание: «полувагоны», Х\ - высказывание: «платформы»; (9) - ( , Х\, Х\, Х4, Х59 >, где ХІ - высказывание: «сократить», Х\ - высказывание: «увеличить», Х\ - высказывание: «запретить», Х\ - высказывание: «контролировать»; Х\ - высказывание: «выполнение указаний извне; (10) где X1° - высказывание: «регулировочные задания выполняются», ХІ° - высказывание: «регулировочные задания не выполняются»; (11) -<Х111,Х“,Х311,ХГ>,где 244
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Х“ - высказывание: «по дорогам назначения», Х“ - высказывание: «в местном сообщении», Х3П - высказывание: «на вывоз», Х“ - высказывание: «сети в адрес данной дороги»; (12) - {X]2, X*2}, где Х\2 - высказывание: «план выгрузки выполняется», X12 - высказывание: «план выгрузки не выполняется»; (13) - <Х,13, Х^3), где X43 - высказывание: «есть гружённые составы», X43 - высказывание: «нет гружённых составов»; (14) - (X,14, X44, X44), где X,14 - высказывание: «соотношение между планом погрузки предыду¬ щего и последующего месяца лежит в диапазоне [0,5,1); X44 - высказывание: «соотношение между планом погрузки предыду¬ щего и последующего месяца равно единице»; Х314 - высказывание: «соотношение между планом погрузки преды¬ дущего и последующего месяца лежит в диапазоне (1,1,5]; На основе данных значений факторов количество N всех возможных ситуаций, без рассмотрения их совместимости, находится: N= 6хЗхЗх4хЗх4хЗх4х5х2х4х2х2хЗ = 14 829 920. Таким образом, каждая ситуация s, требующая решения Fs, характери¬ зуется четырнадцатью значениями факторов. Значения каждого фактора об¬ разуют исчерпывающее множество событий. Каждая ситуация должна обла¬ дать единственным решением. То есть, система принятия решений должна быть полной и непротиворечивой. Практически, нескольким ситуациям может соответствовать одно ре¬ шение. Так что в действительности количество решений R значительно меньше N. На языке математической логики, считая X/булевыми переменными, система принятия решений записывается множеством отношений вида На основе этих отношений строится обученная им логическая нейрон¬ ная сеть, как показано ниже. Однако в рабочем режиме на рецепторный слой подаются не булевы (нуль-единичные) значения, а нечёткие действительные значения, интерпретируемые как достоверность высказывания Х/(ниже бу¬ дем обозначать её так же, как высказывание). s= 1, ...,R<N. 245
Глава 11. Нейросетевые методы управления При формировании ситуации на рецепторном слое не все указанные достоверности могут быть измерены (например, из-за сбоев в линиях связи). В большинстве случаев они определяются лицом, принимающим решение (ЛИР) на основе его богатого опыта и творческой сообразительности. Возбуждение нейронов выходного слоя находится на основе выполне¬ ния функции активации каждого нейрона. Максимально возбудившийся нейрон указывает на связанное с ним решение, выдаваемое в форме текста. Это похоже на «голосование» в пользу предпочтительного решения. При построении логической нейронной сети справедлива попытка со¬ кращения логического описания за счёт объединения ситуаций, которым следует одно и то же решение. Например, может быть известно, что все ситу¬ ации, образуемые на основе выражения (Х\ ѵ Х\) л (Х2ѵХ2) aX33a Х24л ... aJ314 (13.4) приводят к одному решению. Конкретно это означает, что ситуации Х\ аХ22аХ2а ... л1314, Х\аХіаХъха ... АІ314, Х\аХ22аХъха ... лі‘4, І|л132л Х\ а ... л/14 приводят к этому решению. Если же хотя бы одна из этих четы¬ рёх ситуаций должна приводить к другому решению, то данное сложное вы¬ ражение неправильно. Обобщённый эталон [5, 6, 7] Х\ &Х4 &Х;2& Х32& X2 &Х4& ... &X]4 на его основе, определяющий данное решение, не является верным, так как он вобрал в себя ситуацию, приводящую к другому реше¬ нию. Если при раскрытии скобок ситуаций, приводящих к другому решению, нет, то, как будет видно далее, в логической нейронной сети проводятся свя¬ зи (стрелки) от всех нейронов, составляющих обобщённый эталон, к нейрону, указывающему на решение. Построение логической нейронной сети Таким образом, логическая нейронная сеть (рис. 13.6) использует на входе нечёткие данные в диапазоне [0, 1] (высказывание и значение его до¬ стоверности будем обозначать одинаково). Сеть является однослойной. Ко¬ личество рецепторов определяется суммарным количеством элементов всех исчерпывающих множеств событий. Рекомендуемая в данном случае функция активации к-го нейрона (единственного, выходного слоя) имеет вид: Л = / 14?Л если / >h, О-в противном случае. (13.5) Здесь ѵ индексирует номера рецепторов, связанных с к-м нейроном. 246
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Сеть на рис. 13.5 следует рассматривать как примерную, так как систе¬ ма, значительно более развитая, чем спроектированная, не может быть по¬ строена без участия специалиста-управленца. Пусть в рамках десяти решений СПР произведено объединение ситуа¬ ций в обобщённые эталоны. Чтобы не загромождать рисунок, покажем толь¬ ко два эталона. Соответствующие им связи показаны на рисунке. х,1 &х\ 8lx\&х;&хі&х4&х; &х4&х62&х7&х72&х*2 &х48 & X,9 & Х59 &х;<] &Х" &ХІх & X'2 &х;з& X'4 & X'4 -> Решение 1; Х\&Х'6 &Х2 &Х3 &Х3 &Х4 &Х4 &Х3&Х53 8lX\8lX\&Х7&Х72 & Х\ & XI &Х\° & Х'° & X'1 &X’1 &Xх2 &Xх3 &Ххг4 Решение 10. Обработка нейронной сети производится с помощью матрицы связей, показанной табл. 13.4. Таблица 13.4. Матрица связей ^Факторы Решения к Х\ Xх4 Xх4 Решение 1 1 1 i 1 Решение 10 1 1 Покажем, как вводятся нечёткие данные. Пусть ЛПР по неопытности затрудняется определить, является станция припортовой, или станцией водной перевалки. Он рассуждает так: «Пример¬ но на 80% я бы отнёс эту станцию к припортовой, ибо не знаю, куда далее пойдёт груз. Так что остальные 20% я отнесу к тому, что это станция водной перевалки». Он делит «единицу» обратно пропорционально «расстоянию» до ближайших рецепторов и полагает X,1 = 0,2, Х\ = 0,8. Точно так же, зная, что соотношение между планом погрузки преды¬ дущего и последующего месяца составляет 1,2, ЛПР полагает Xх4 =0,6, Xх4 =0,4. Если ЛПР не знает о наличии гружённых составов на пути следования, он справедливо решает этот вопрос по принципу «фифти-фифти» и полагает Xх3 = Xх3 =0,5. 247
Глава 11. Нейросетевые методы управления х ; х 2б Х 3 Х 6 х; Х 2 Рис. 13.6. Логическая нейронная сеть 248
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Развитие Известно, что при проектировании системы рассматривались всего три возможных решения: сократить погрузку, запретить погрузку, контролиро¬ вать погрузку (?). В случае применения логических нейронных сетей, число однозначно принимаемых решений ограничено лишь количеством возможных ситуаций. Решения выдаются в виде текстов - приказов или рекомендаций. Они могут содержать любые разъяснения и примечания. Применение логических нейронных сетей позволяет ввести веса, с ко¬ торыми учитываются факторы и их отдельные значения. Эти веса со могут быть проставлены на стрелках рис. 13.6 и указаны в матрице связей вместо единиц. Введение весов синапсических связей приводит к применению другой функции активации нейрона: Л = 2>ѵ/ѵ / = , если f > /2, 2>„ (13.6) О-в противном случае. Здесь ѵ индексирует номера рецепторов, связанных с к-м нейроном. Порог h выбирается экспериментально так, чтобы, с одной стороны, не отклонить решение, принимаемое по ситуации, достаточно «близкой» к изу¬ ченной, а с другой стороны, чтобы исключить из анализа большую часть не¬ адекватных решений. Специалисты в области управления железнодорожным транспортом должны довести изложенные здесь предложения до практической реализа¬ ции, исследовав эффективность ограниченного набора возможных решений, соответствующих ситуациям, и роль в них каждого фактора. 13.6. Самообучающиеся системы управления Рассмотрим, по-видимому, единственный человеческий опыт построе¬ ния самообучающейся системы управления на основе Правил стрельбы на¬ земной артиллерии времён Великой Отечественной Войны (рис. 13.7). Для расчёта начальных установок при стрельбе батареей с закрытой огневой позиции стреляющий пользовался Таблицами стрельбы, составлен¬ ными для каждого типа орудий при полигонных испытаниях. Такая таблица может служить прообразом базы знаний, реализуемой логической нейронной сетью. 249
Глава 11. Нейросетевые методы управления Рис. 13.7. Объект самообучения Затем по цели или реперу следовала пристрелка одним орудием, при которой объект захватывался в широкую вилку, на границах которой наблю¬ дались перелёт и недолёт. Эта вилка «половинилась» до достижения узкой вилки. Если объект был целью, на середине этой вилки давалась команда всем орудиям батареи на поражение. После поражения цели или пристрелки репера следовала замечательная команда: «Стой! Записать...», по которой первый номер на щите орудия запи¬ сывал пристрелянные установки по цели или реперу. Это делалось для того чтобы в последующем по близким (к поражённым) целям не производить трудоёмкие расчёты и пристрелку в полном объёме, а использовать принцип ассоциативных вычислений для переноса огня, изменяя известные «близкие» установки. Так обеспечивалась возможность с большой вероятностью захва¬ тывать новую цель сразу в узкую вилку. Таким образом, на деле реализовалась самообучающаяся система уп¬ равления «стреляющий + батарея», позволяющая накапливать и оперативно использовать знания по всей местности, на всём доступном пространстве ве¬ дения боя - для переноса огня от поражённых целей или пристрелянных ре¬ перов. Рассмотренный пример лежит в основе обобщения и построения разви¬ ваемой логической нейронной сети в составе самообучающейся системы уп¬ равления и принятия решений. Подробно возможности и принципы построе¬ ния самообучающихся систем управления изложены в [6 - 9]. Обобщим схе¬ 250
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... му работы такой системы (рис. 13.8) в режиме обучения (подобно пристрелке реперов при занятии боевых позиций). Вход Выхол Рис. 13.8. Схема самообучения Работа многих сложных систем, особенно систем военного назначения, предполагает режим функционального контроля, когда система свободна от выполнения своих основных функций. В этом режиме и целесообразно раз¬ вивать её базу знаний - до полного насыщения. 251
Глава 11. Нейросетевые методы управления Очевидно, что база знаний для рассматриваемого применения по форме не отличается от базы знаний информационно-справочной системы и боль¬ шинства СПР. Поэтому логическая нейронная сеть имеет вид, представлен¬ ный на рис. 13.1, 13.2, 13.5, и 13.6, и использует те же функции активации нейронов. Возможно включение обратных связей, как на рис. 13.3, а также формирование «длинных» логических цепочек дедуктивного вывода, как на рис. 13.5. 13.7. Динамический выбор оптимальной стратегии распараллеливания в многопроцессорной вычислительной системе Рассмотрим обобщённую адаптивную схему динамического оптимизи¬ рованного распределения потока задач между процессорами в многопроцес¬ сорной вычислительной системе или в сегменте вычислительной сети (рис. 13.9). Такая обработка характерна для Центра (7/?Ю-технологий [15]. Крите¬ рием оптимизации является достижение максимальной загрузки процессоров или выделенных сетевых ресурсов, служащей максимальной пропускной способности используемых вычислительных средств. В основе диспетчера, распределяющего поток запросов на решение задач, лежат несколько эври¬ стических решающих правил, каждое из которых реализует некоторую стра¬ тегию распараллеливания. Решающие правила различаются по скорости реа¬ лизации и по достигаемому эффекту в части статистических оценок обеспе¬ чения высокой пропускной способности. Выбор решающего правила и лока¬ лизация его применения во времени зависят от характеристик потока запро¬ сов: от переменной плотности, от их типового состава, приоритета задач, ча¬ стичной упорядоченности, директивных сроков решения. Организация динамического распараллеливания вычислений - диспет¬ чирование является основным трудоёмким и ответственным элементом по¬ строения управляемого вычислительного процесса в многопроцессорных вы¬ числительных системах и вычислительных комплексах на основе сегментов ЛВС. Поэтому, на данном этапе исследований, предположим, что динамиче¬ ское распределение работ касается только потока задач виртуального управления сложными системами в реальном масштабе времени. Такие за¬ дачи образуют частично-упорядоченные множества и обладают наивыс¬ шим (первым) приоритетом. В этом случае задача диспетчирования становится трудно формализуе¬ мой. Оперативное управление текущим выбором стратегии необходимо про¬ изводить с помощью логической нейронной сети, на рецепторный слой кото¬ рой подаются текущие и пролонгированные характеристики потока запросов, а также текущие параметры состояния системы обслуживания. Нейроны вы¬ ходного слоя максимальным возбуждением указывают на решающее прави¬ ло, которым следует пользоваться в дальнейшем. То есть, максимально воз¬ 252
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... буждённый нейрон выходного слоя инициирует запуск соответствующей процедуры распределения в составе диспетчера. Адаптация обеспечивается возможностью перезакрепления решающих правил за нейронами и вводом в рассмотрение новых правил - по статисти¬ ческим оценкам эффективности распределения (распараллеливания). Состояние вычислительной системы Рис. 13.9. Схема адаптивного обслуживания потока задач Рассмотренная схема легко развивается, модифицируется и специали¬ зируется. Выделение неизменного состава характеристик, участвующих в приня¬ тии каждого решения, служит основой построения простейших по структуре однослойных логических нейронных сетей, где функция активации является аналогом конъюнкции и производит суммирование значений входных сигна¬ лов. На деле реализуется простейшая схема «голосования» в пользу той стра¬ тегии, которая в наибольшей степени адекватна сложившейся ситуации - те¬ кущим характеристикам потока запросов и состоянию системы обслужива¬ ния. При этом основная трудность диспетчирования заключается в частич¬ ной упорядоченности (во времени выполнения) работ, которая присуща си¬ стемам управления в реальном времени. Диспетчер распараллеливания входит в состав операционной системы компьютера и сам по себе увеличивает «накладные расходы» производитель- 253
Глава II Нейросетевые методы управления ности на собственную реализацию во времени. Поэтому быстродействие дис¬ петчера представляет важнейшее требование к нему. Другим требованием, предъявляемым к диспетчеру распараллеливания, является достаточная близость формируемых им планов к точным оптималь¬ ным, полученным на основе решения задачи распараллеливания в адекватной постановке. Дело в том, что решаемая диспетчером задача относится к важному классу задач исследования операций [15] - к классу задач параллельного программирования. Это задачи экспоненциальной сложности (ТѴР-сложные задачи). Решение таких задач для множеств частично упорядоченных работ весьма трудоёмко и никак не может быть положено в основу программ опе¬ рационной системы компьютера. Поэтому прибегают к эвристическим мето¬ дам полиномиальной сложности (Р-сложность) для оперативного, динамиче¬ ского распараллеливания. В основе таких методов можно выделить одно или более решающих правил, погружённых в алгоритм распараллеливания и обу¬ словленных предпочтительным выбором альтернативы в ключевых ситуаци¬ ях. Применение каждого решающего правила при распараллеливании вле¬ чёт различный объём вычислений - накладных расходов. Однако, как прави¬ ло, увеличение сложности алгоритмов распараллеливания обусловлено по¬ пытками приблизить результаты планирования к точным оптимальным. По¬ этому, по результатам достаточного опыта, можно считать, что более трудо¬ ёмкий диспетчер статистически обеспечивает планы параллельного выпол¬ нения работ, более близкие к оптимальным. При практическом решении задач распараллеливания ограничиваются однородными системами выделяемых средств (однородными вычислитель¬ ными системами [15]), а различные подходы к диспетчированию отличаются вариантами единственного решающего правила. По трудоёмкости, а, следовательно, «по оптимальности», варианты ре¬ шающего правила можно упорядочить: 1. Из множества работ, выполнение которых может начаться в текущий момент времени, назначение на свободные процессоры следует производить произвольно (по сложившемуся порядку номеров, первую в списке, случайно ит.д.). 2. Из множества работ, выполнение которых может начаться в текущий момент времени, назначение на свободные процессоры следует производить в порядке не возрастания времени выполнения работ (в первую очередь назначать работу с максимальной оценкой времени выполнения). 3. Из множества работ, выполнение которых может начаться в текущий момент времени, в первую очередь на свободный компьютер (процессор) назначать работу, предшествующую максимальному объёму непосредствен¬ но или транзитивно следующих ей работ, включая её саму. 254
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... 4. При известном директивном сроке выполнения комплекса работ (в том числе - в системе реального времени), из множества работ, выполнение которых может начаться в текущий момент времени, назначать на свободный компьютер (процессор) работу, обладающую минимальным значением позд¬ него срока окончания выполнения. 5. В дополнение к 4: При равных минимальных значениях позднего срока окончания выполнения в первую очередь назначить работу в соответ¬ ствии с правилом 3. В различных случаях применения эффективно используются и другие комбинации решающих правил 2, 3, 4. Первое и второе решающие правила используются в динамических диспетчерах, предполагающих выполнение назначенных работ одновременно с дальнейшим планированием. Третье и последующие решающие правила предполагают работу дис¬ петчера вне времени выполнения назначенных работ: диспетчер разрабаты¬ вает план выполнения этих работ, затем этот план реализуется без включения диспетчера. Это обеспечивает плотную загрузку процессоров при выполне¬ нии работ и, следовательно, их скорейшее освобождение - переход в свобод¬ ный ресурс. Очевидно, что чем большим ресурсом времени обладает диспетчер в связи с «разреженным» потоком высокоприоритетных заданий при заданных директивных сроках выполнения, тем больше искушение использовать ре¬ шающие правила для распределения этих заданий, приближающие результа¬ ты планирования к оптимальным. Ведь при этом достигается минимальное время выполнения совокупности взаимозависимых работ, плотно загружают¬ ся процессоры, выделяется время для фонового выполнения запросов с меньшим приоритетом. Это справедливо, если одновременное увеличение накладных расходов на планирование в совокупности с разработанным планом всё же служит оп¬ тимизации параллельного вычислительного процесса, то есть, минимизации времени выполнения комплекса работ высокого приоритета. С другой стороны, очевидно, что при плотном потоке заданий высоко¬ го приоритета требование их оперативного распределения между вычисли¬ тельными средствами заслоняет собой все другие требования к оптимизации вычислительного процесса. Становится не до оптимизации: ведь плотная за¬ грузка всех средств и так гарантирована! В этом случае достаточно исполь¬ зовать простейшее решающее правило. Таким образом, только на основе моделирования и опытных исследо¬ ваний, для достаточного числа точек факторного пространства - характери¬ стик потоков заданий, их временных характеристик, директивных сроков их выполнения, требуемых ресурсов и состояния загрузки вычислительных средств, - можно получить ряд рекомендаций по применению решающих правил в диспетчере распараллеливания. 255
Глава 11. Нейросетевые методы управления Общий вид логической нейронной сети, реализующей диспетчер, пред¬ ставлен на рис. 13.10. Директивный срок Т определяется, как длина отрезка времени, через которое распределяемое множество частично упорядоченных работ должно быть выполнено обязательно. Например, Т - длительность такта системы управления. Ресурс директивного срока при планировании распараллелива¬ ния определяется как разность, 1 m АТ = Т У t , где п - число выделенных процессоров, m - количество пi 7 распределяемых работ, I,- - время решения задачи. На рисунке: М-(1) - усреднённое по серии последних запросов время между запро¬ сами высшего, 1-го приоритета; dfV = А/,(|) - А/,_і(І) - аналог первой производной. Таким образом, на рецепторном слое указывается вероятность принад¬ лежности характеристик интервалам 8\ s, ij, (р значений или значениям. Мак¬ симальное возбуждение нейрона выходного слоя (при высоком пороге) ука¬ зывает на необходимость автоматического включения соответствующего ре¬ шающего правила в диспетчер. Возможность оптимизации совместной реализации запросов на выпол¬ нение нескольких частично упорядоченных работ предполагает частичное или полное накопление этих запросов (работ) в некотором «окне просмотра» диспетчера. Диспетчер с высокой частотой анализирует содержимое «окна просмотра», пытаясь «уложить» выполнение этих работ за минимальное время, не превышающее директивный срок Т. Время выполнения запросов, а также время работы диспетчера, измеряется условными единицами. Времен¬ ные оценки известны заранее. Пример. Пусть для выполнения работ выделены два процессора супер¬ компьютера. Диспетчер реализован на управляющем HOST-процессоре. В «окне просмотра» накопились работы, порядок следования которых можно описать информационным графом (рис. 13.11). Пусть диспетчер использует решающее правило 1. Время его одно¬ кратного выполнения составляет 1 у.е., Т= 13 у.е. Тогда временная диаграм¬ ма выполнения комплекса работ представлена на рисунке 13.12. Для диспетчера, использующего решающее правило 2, временная диа¬ грамма выполнения того же комплекса работ на двух процессорах представ¬ лена на рисунке 13.13. 256
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Рис. 13.10. Примерный вид логической нейронной сети диспетчера 257
Глава 11. Нейросетевые методы управления 3 Рис. 13.11. Информационный граф Процессор Процессор HOST ]_І IS 1 3 5 ■ ■ ■ -► t T- Рис. 13.12. Временная диаграмма выполнения работ с решающим правилом 1 Рис. 13.13. Временная диаграмма выполнения работ с решающим правилом 2 Для диспетчера, реализующего решающее правило 4, при том же ди¬ рективном сроке окончания выполнения, временная диаграмма представлена на рис. 13.14. Время однократной работы диспетчера для двух выделенных процессоров выбрано равным 3 у.е. t Рис. 13.14. Временная диаграмма выполнения работ c решающим правилом 4 258
Лекция 13. Обучаемые и самообучающиеся системы распознавания, управления... Ключевые термины «Бесформульные» вычисления - вычисления, совершаемые не на ос¬ нове счёта значений арифметических выражений, а на основе ассоциативной выборки из базы знаний с возможностью усреднения близких результатов выборки. Самообучение - самостоятельное пополнение базы знаний новыми от¬ ношениями вида «если - то», получаемыми из опыта. Ситуационное управление - управление объектами или сложными системами с помощью условных таблиц, в строках которых указаны вектора возможных ситуаций и соответствующие им вектора значений необходимых воздействий. Решающее правило - основное правило действий, лежащее в основе эвристического алгоритма оперативного планирования, предпринимаемое в случае не единственной альтернативы выбора решения на локальном уровне. Краткие итоги 1. Может показаться, что предлагаемый здесь способ «бесформульных» вычислений представляет собой лишь сложную интерпретацию табличного метода. Однако применение логических нейронных сетей позволяет осуще¬ ствить: • Переход к нечётким, то есть к недостоверным данным; • Совместное использование данных и объектов разных типов и свойств; • Выполнение интерполяции (экстраполяции) на основе нахождения среднего, допускающей рассмотрение большого числа решений, на которые указывают нейроны, возбуждение которых превысило порог; • Любое увеличение длины исследуемых векторов без существенного влияния на вычислительную нагрузку. При увеличении размерности задачи возрастает лишь объём базы знаний; 2. Схема ситуационного управления легко трансформируется в схему «бесформульных» вычислений. Включение в неё точной модели управляемо¬ го процесса (при невозможности натурных экспериментов) позволяет полу¬ чить самообучающуюся систему управления. Нейросетевое воплощение обеспечивает малую сложность алгоритмов управления и высокую реальную производительность вычислительных средств в рабочем режиме. 3. Не ищите способы непосредственного получения расписания исполь¬ зования ресурсов методами, позволяющими производить лишь оценки. Рас¬ писания, в том числе оптимальные, получаются лишь при численном реше¬ нии задач планирования. Выбор решающих правил, лежащих в основе при¬ ближённых, эвристических алгоритмов планирования, может производиться динамически на основе оценки складывающейся обстановки и её прогнози- 259
Глава 11. Нейросетевые методы управления рования. Логическая нейронная сеть при этом способна быть хорошим по¬ мощником. Вопросы 1. На чём основана идея «бесформульных» вычислений и как она реа¬ лизуется с помощью логической нейронной сети? 2. Как осуществляется ситуационное управление? 3. Как идеи ситуационного управления развиваются для построения самообучающихся систем управления? 4. Как реализуется самообучающаяся система управления с помощью логической нейронной сети? 5. В чём заключается способ учёта текущих и прогнозируемых харак¬ теристик потока запросов при выборе оптимального плана их параллельного (многоканального) обслуживания? 6. Как производится настройка (адаптация) диспетчера оптимального распараллеливания по текущим и прогнозируемым характеристикам потока запросов? Лекция 14. Нейросетевой метод ускоренного принятия решений операционной системой суперкомпьютера ЕТѴС-архитектуры Аннотация. Предлагается реализация систем принятия решений (СПР) в ОС суперкомпьютера ЕРІС-архитектуры, то есть, управляемого в каждом такте, с помощью однослойных логических нейронных сетей (ЛНС), допус¬ кающих распараллеливание и конвейеризацию действий при отсутствии вет¬ вления. Используется принцип «зацепления» конвейеров для реализации ос¬ новной операции - скалярного умножения векторов. Ключевые слова: суперкомпьютер, ЕРІС-архитектура, логическая нейронная сетъ, матрица связей, нейрокомпьютер, «зацепление» конвейеров. ...внутреннее стремление и постоянная тенденция капитала состоит в повышении производительности труда с целью удешевить товары, а посред¬ ством этого удешевить и самого рабочего К. Маркс. Капитал 14.1. Выбор моделей логической нейронной сети EPIC-архитектура {Explicitly Parallel Instruction Computing) компьюте¬ ра, как правило, в составе многопроцессорной ВС, использует принцип про¬ граммного управления каждым тактом машины [14, 22]. Суперкомпьютер такой архитектуры, используемый для управления в реальном времени, при¬ 260
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... зван удовлетворять требованиям сверхвысокой производительности. Его ос¬ новные особенности: 1. Распараллеливание на уровне выполнения команд в многофункцио¬ нальном арифметическо-логическом устройстве (АЛУ), состоящем из кон¬ вейерных исполнительных устройств (ИУ). 2. Возможность параллельного ветвления при обработке конвейера ко¬ манд в двух случаях: при обработке команд условного перехода и при вы¬ полнении конструкций вида if-then-else в составе арифметических операто¬ ров. Чтобы снизить влияние эффекта остановки конвейера команд, в ЕРІС- архитектуре по предварительной команде за несколько тактов до ветвления запускается дополнительный конвейер. Конвейеры начинают работать в си- мулятивном режиме, не допуская «порчи» данных. Интенсивное ветвление выполняемой программы способно привести к лавинообразному запуску до¬ полнительных, аппаратно поддержанных конвейеров. Очевидно, количество таких конвейеров ограничено. Поэтому оптимально то программирование, при котором предпочтение отдаётся параллельному выполнению условных арифметических операторов (допускающих рекурсию), хотя это и приводит к избыточности оборудова¬ ния, используемого при вычислениях. С помощью условных переходов сле¬ дует поддерживать общую структуру программы, для обеспечения взаимо¬ действия достаточно крупных работ. Следует также широко применять цик¬ лы типа «арифметическая прогрессия», где направление единственного пере¬ хода (выхода) предсказуемо заранее. Ведь целью оптимизации программиро¬ вания суперкомпьютера является достижение минимального времени выпол¬ нения программы. Таким образом, складывается культура программирования суперком¬ пьютера EPIC -архитектуры. Управление ресурсами суперкомпьютера и многопроцессорной ВС, представляющее основу функций ОС, в общем случае сводится к анализу не¬ которой ситуации - вектора измеренных или ожидаемых характеристик уст¬ ройств или вычислительного процесса и к выработке решений по планирова¬ нию дальнейшей эксплуатации вычислительных ресурсов, по управлению вычислительным процессом, по устранению неисправностей, по визуализа¬ ции и т.д. В суперкомпьютерах широко используются модули ассоциативной па¬ мяти (АП) для кодирования и быстрой выборки отношений «причина - след¬ ствие». АП эффективна при организации виртуальной памяти, при обработке «глобалов», для хранения меток перехода, в системах контроля, в арбитрах коммутаторов, при решении конфликтов многоканального обмена и пр. Од¬ нако применение АП ограничено из-за существенных недостатков: 1) они не работают по нечётким данным; 2) они не используют взвешенные данные. 261
Глава 11. Нейросетевые методы управления Любая система принятия решений (СПР) является универсальной и полной, если она предполагает нечёткие исходные данные и способна в про¬ цессе модернизации и развития учитывать различные факторы, и даже их значения, со своим весом. Можно выделить ряд задач, решаемых ОС и являющихся основой со¬ здания многих СПР: 1. Принятие решения о реконфигурации вычислительной системы на основе вектора состояния её средств. 2. Выбор оптимальной стратегии обслуживания очереди «к процессо¬ ру» на основе текущего вектора характеристик этой очереди. 3. Выбор оптимальной стратегии управления многоканальным обслу¬ живанием многопользовательского режима на основе A-характеристик, прио¬ ритетного ряда и других показателей потоков заявок. 4. Обработка результатов контроля и диагностики вычислительных средств. 5. Разрешение конфликта при обмене по внутренним магистралям и в компьютерной сети в целом. 6. Адаптивный выбор пошагового смещения информационных пакетов в компьютерной сети. 7. Принятие решений по статистической оценке динамики загрузки мо¬ дулей. 8. Экспертное управление надёжностью средств системы, включающей разнородные устройства и объекты, оперирующих объектами разных типов, измерений и т.д. 9. Выбор оптимальной стратегии распараллеливания на основе харак¬ теристик потока заданий и данных и многие другие задачи. Все указанные задачи, при попытке найти точное оптимальное реше¬ ние, относятся к классу трудно формализуемых задач большой сложности, опирающихся на перебор. Практически используются эвристические методы решения, в основу которых берутся достаточно нетрудоёмкие решающие правила. С конца 70-х - начала 80-х годов особые надежды стали возлагать на применение методов искусственного интеллекта (ИИ) и, прежде всего, на нейросетевые технологии. В значительной степени это было связано с пред¬ полагаемой возможностью получить «быстрые» алгоритмы решения некото¬ рых задач. Появилось понятие «эквивалентной» производительности при ре¬ шении таких задач по сравнению с производительностью реальной. Однако полную универсальность нейросетевые технологии обрели с построением и развитием логических нейронных сетей (ЛНС). ЛНС - универ¬ сальный аппарат моделирования ассоциативного мышления человека, опре¬ деливший класс численных методов решения информационно-логических задач и задач управления. В применении к ОС целесообразно выделить два основных типа ЛНС, отличающихся организацией рецепторного слоя. 262
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... На рис. 14.1 дан пример ЛНС, где за рецепторами закреплены интерва¬ лы (закрытые или полузакрытые) значений факторов. Присутствуют некото¬ рые веса связей. Если вес на стрелке не указан, то он равен единице. Практически, веса, отличные от единичных, становятся известны в ре¬ зультате длительной эксплуатации СПР. Ведь это - вопрос о том, какие фак¬ торы и насколько влияют на достоверность результата применения ЛНС, и целесообразно ли это учитывать. На начальном этапе разработки СПР, как правило, все веса принимаются равными единице, если нет очевидных огра¬ ничений. Второй тип ЛНС, отражающий результат экспериментальных исследо¬ ваний, моделирования или экспертных оценок, представлен на рис. 14.2. Введение весов синапсических связей приводит к применению функ¬ ции активации нейрона: 2>ѵ/ѵ V если f>h, (14.1) О — в противном случае. Здесь ѵ индексирует номера рецепторов, связанных с к-м нейроном. Для компьютерной обработки однослойная ЛНС на рис. 14.2 представ¬ ляется матрицей связей (табл. 14.1). Табличное представление делает весьма удобными модификацию и развитие ЛНС в процессе обучения: добавление новых факторов или их зна¬ чений, изменение связей, весов, уточнение решений, текст или процедуры которых хранятся отдельно. По таблице же находится указатель на принима¬ емое решение по максимально возбудившемуся нейрону. 263
Фактор Z Фактор Y Фактор Х Глава 11. Нейросетевые методы управления xe [ai, ai) xe[a2, a3) , 2 xe[a3, a4) , 3 xe [a4, a5] , 4 ye[bi, bi)( 5 ye[bi, Ьз), 6 уе[Ьз, b4] ' 7 ze[ci, ci) 8 ze[d, сз) 9 ге[сз, C4] 10 Решение 1 Решение 2 Решение i Решение 3 Решение 4 Решение 5 Рис. 14.1. Закрепление рецепторов за интервалами значений факторов 264
Фактор Z Фактор Y Фактор Х Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... Хі Х2 Х3 Х4 У1 У2 Уз zi Z2 Z3 Z4 Решение i Решение 2 Решение 2 Решение 3 Решение 4 Решение 5 Решение 6 Решение 6 Рис. 14.2. Логическая нейронная сеть, составленная на основе экспериментов, мо¬ делирования или экспертных оценок 265
Глава 11. Нейросетевые методы управления Матрица связей Таблица 14.1. Рецепто¬ ры 1 Хі 2 хг 3 *3 4 Ха 5 У\ 6 У2 7 Уз 8 Z\ 9 10 ^3 11 Z4 1/(сум¬ ма ве¬ сов) Указа¬ тель на решение Р - вектор значений возбужде¬ ния ре- цеп-торов 0,5 0,5 0,66 0,33 0,8 0,2 Нейрон 1, вектор ве¬ сов Wi 1 0,8 1 0,36 Проце¬ дура Решение 1 Нейрон 2, вектор ве¬ сов Wl 1 1 0,8 1 0,26 Проце¬ дура Решение 2 Нейрон 3, вектор ве¬ сов т 1 0,8 1 0,36 Проце¬ дура Решение 2 Нейрон 4, вектор ве¬ сов Wt 1 1 0,7 1 0,27 Проце¬ дура Решение 3 Нейрон 5, вектор ве¬ сов Ws 1 0,8 1 0,36 Проце¬ дура Решение 4 Нейрон 6, вектор ве¬ сов We 1 0,7 1 0,37 Проце¬ дура Решение 5 Нейрон 7, вектор ве¬ сов Wi 1 0,8 1 1 0,26 Проце¬ дура Решение 6 Нейрон 8, вектор ве¬ сов Ws 1 0,7 1 1 0,27 Проце¬ дура Решение 6 14.2. Возбуждение рецепторов 1. Если значения факторов заданы интервалами вида [d, е), значение р (индекс опущен) величины возбуждения соответствующего рецептора, при 266
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... анализе измеренного или предполагаемого значения g, находится как резуль¬ тат счёта логического арифметического оператора: Р := Шё > d) л (g < е)) then 1. (14.2) Если интервал имеет вид [d, е\, знак «<» в (2) меняется на < 2. Если интервал принадлежности испытываемого значения фактора определён нечётко, «единица» делится на количество предполагаемых ин¬ тервалов принадлежности, что определяет значение р для каждого такого ин¬ тервала. Однако такие действия характерны при требовании полной автома¬ тизации. Реально же значения р возбуждения рецепторов, закреплённых за предполагаемыми интервалами, следует задавать в диалоговом режиме на основе экспертных оценок или предположений оператора-пользователя. 3. Если измеренное или предполагаемое численное значение g является промежуточным, не совпадающим ни с каким значением, которому соответ¬ ствует рецептор, находятся два ближайших (меньшее d и большее е) значе¬ ния фактора, за которыми закреплены рецепторы («ближайшие рецепторы»), и «единица» распределяется обратно пропорционально «расстоянию» до этих рецепторов: pd\=(e-g)/(e-d); pe:=(g-d)/(e-d). (14.3) Предлагается параллельный счёт значений pd и ре (ведь ре= 1 - pd). Ре¬ комендуется значения вида 1/(е d) рассчитывать заранее и хранить до мо¬ дификации ЛНС. Счёт обратной величины на этапе формирования (обуче¬ ния) ЛНС предпочтителен, так как конвейер деления значительно «длиннее» конвейера умножения, оперативно используемого в рабочем режиме. 4. Если значение g находится вне диапазона значений, представленных рецепторами, то есть, для него можно указать лишь одно значение d или е, за которым закреплён рецептор, то вместо разности (е - d), используемой в (14.3), можно взять среднее «расстояние» 8 между рецепторами сети и вы¬ полнить один из операторов: Pd := if(g<d) then (1 - {d g)IS); (14.4) Pe := if (g > e) then (1 - (g - e)/8). 5. Если фактор предполагает нечисловые значения, возбуждение ре¬ цепторов задаёт пользователь в диалоговом режиме. Например, пусть в ЛНС СПР, обслуживающей охотников (рис. 14.1), рецептор х\ фактора X соответствует высказыванию «рысь», а рецептор хг - высказыванию «дикая кошка». Никто из охотников не смог с полной уверен¬ ностью определить, следы принадлежат рыси или дикой кошке? Они полага¬ ют значение возбуждения рецепторов 1 и 2 равными 0,5 (р\ =р2 = 0,5). Пусть 267
Глава 11. Нейросетевые методы управления фактор Y отражает количество охотников. Их оказалось шесть человек. Ре¬ цептора, закреплённого за таким количеством, нет. Однако «ближайшими» рецепторами являются jy, отвечающий за 5 человек, и уз, отвечающий за 8 человек. Возбуждаем эти рецепторы распределением «единицы» обратно пропорционально «расстоянию» исследуемого значения 6 до них: рв = 0,66, рі = 0,33. Пусть на основе подобных рассуждений заполнены клетки фактора Zв табл. \\р9 = 0,8,/?ю = 0,2. На больших ЛНС с помощью рецепторов можно имитировать любой закон распределения вероятностей, в том числе, - нормальный. Таким образом, ЛНС работает с нечёткими данными, что составляет основной смысл ассоциативного мышления. 14.3. Схема поиска решения Общая схема нахождения оптимального решения с помощью ЛНС по¬ казана на рис. 14.3. В процедуру НЕЙРОКОМПЬЮТЕР выделены блоки, ко¬ торые реализуют собственно нейрокомпьютер. Процедура может быть ис¬ пользована в различных приложениях, не обязательно только в составе ОС. Легко видеть, что самой трудоёмкой операцией здесь является нахож¬ дение скалярного произведения вектора значений возбуждения рецепторов и вектора, образуемого строкой весов связей нейрона. Затем значение найден¬ ного произведения умножается на соответствующий элемент последнего столбца матрицы связей и сравнивается с порогом h для получения неотри¬ цательного значения функции активации. Попутно фиксируется нейрон с максимальным значением возбуждения, указывающий на рекомендуемое или автоматически выполняемое решение - по завершении анализа всех нейро¬ нов. Порог h выбирается экспериментально так, чтобы сократить анализ лишних, заведомо отвергнутых вариантов решения. Если величина возбуждения ни одного нейрона не превысила порог, следует, изучив ситуацию, либо повысить порог, либо «научить» ЛНС новой для неё ситуации. Таким образом, с помощью ЛНС производится «голосование» в пользу «наиболее возбудившегося» решения. Однако если находятся численные значения, например, значение рейтинга объекта, то на основе величины воз¬ буждения нескольких нейронов, преодолевших порог, может быть найдено среднее значение искомой величины по той же формуле, что лежит в основе функции активации. Тогда величины возбуждения нейронов используются в качестве весов решений, на которые эти нейроны указывают. Например, пусть в некоторой, здесь не приведённой ЛНС значение возбуждения нейрона 1, указывающего на ответ «необходимо 40 человек», равно 0,5. Значение возбуждения нейрона 2, указывающего на ответ «необ¬ ходимо 50 человек», равно 0,8, а значение возбуждения нейрона 3, указыва- 268
Процедура НЕЙРОКОМПЬЮТЕР Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... ющее на 60 человек, равно 0,6. Возбуждение других нейронов нулевое. Тогда среднее количество людей, рекомендуемых ЛНС, составляет: 40x0,5 + 50x0,8 + 60x0,6 _А = 50,5 человек. 0,5 + 0,8 + 0.6 Вход Возбуждение рецепторов - формирование век|_!_ тора/* > Запуск процедуры обработки ситуации (принятие решения) по указателю 7 Выход Рис. 14.3. Схема принятия решения, включающая процедуру НЕЙРОКОМПЬЮТЕР 269
Глава 11. Нейросетевые методы управления Примеры говорят об универсальности ЛНС, их применимости при со¬ вокупном, одновременном рассмотрении объектов разной природы, разных типов данных, измерений и др. Это адекватно воспроизводит аппарат логиче¬ ского мышления человека. Закончим рассмотрение примера. Пусть обосновано значение h = 0,4. По рис. 14.2 и по табл. 14.1 рассчитаем значения возбуждения всех нейронов, оказавшиеся равными 0, кроме значения^ = 0,5. Как максимальное возбуж¬ дение нейронов, это значение указывает на Решение 2. 14.4. Оптимизация скалярного умножения векторов при счёте значения функции активации Рассмотрим возможность оптимизации (по времени выполнения) ска¬ лярного умножения векторов Ри W(индекс опускаем), отражённого в блоке 4 на рис. 14.3. Оптимизация достигается применением двух методов: 1. «Зацеплением» двух векторных конвейеров умножения с векторным конвейером сложения; 2. Сложением всех результатов умножения с помощью операции «свёр¬ тки» массива [15] по схеме «двоичного дерева», что обеспечивает непреры¬ ваемый счёт на векторном конвейере сложения с окончательным получением суммы в корневой ячейке дерева. Схема счёта по табл. 14.1 показана на рис. 14.4. Итак, пусть даны два вектора Р= {р\, ...,ри} и W= {©і, Ghi} (N = 11). Пусть один конвейер умножения обрабатывает нечётные пары элемен¬ тов, а второй - чётные пары элементов. (Обычно используется индексация с нуля; индексация с единицы более наглядно отождествляется с порядком действий.) Рабочий массив А содержит 21 регистр, А = (щ, ап] ((2N - 1) регистров). Конвейеры умножения заполняют первые N регистров. Конвейер сложения запускается тотчас по получении первой пары произведений и син¬ хронно с умножением выполняет сложение по двоично-древесной схеме, как показано на рисунке. Схема регулярных действий конвейера сложения при обработке рабо¬ чего массива регистров показана на рис. 14.5. Для краткости используются только индексы (номера) регистров. При отсутствии в АЛУ векторных конвейеров со специальной аппарат¬ ной поддержкой, схеме этой обработки соответствует цикл типа «арифмети¬ ческая прогрессия»: / := 1; для j = 1 до N- 1 выполнять: begin cin+j := cti + а,+\; і := / + 2; end. (Производя «набросок» программы, мы не следуем канонам какого- либо языка.) На рис. 14.6 показана синхронная работа векторных конвейеров при управлении каждым тактом машины. 270
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... Конвейер умножения 1 Конвейер умножения 2 PiCth , і нечётное рі(ді, і чётное 1Г ▼ 1 г І i ' ▼ 1 г ▼ т Рис. 14.4. Схема двоично-древесной обработки буфера Рис. 14.5. Схема обработки буфера векторным конвейером сложения 271
Глава 11. Нейросетевые методы управления Пх - длина кон¬ вейера умноже¬ ния п+ - длина кон¬ вейера сложе¬ ния Рис. 14.6. Последовательность запуска векторных конвейеров 14.5. Распараллеливание скалярного умножения векторов Если АЛУ содержит достаточное количество конвейерных ИУ, воз¬ можности распараллеливания могут быть расширены. Это относится к ска¬ лярному умножению векторов, как основной операции нейрокомпьютера. На рис. 14.7 показано использование четырёх векторных конвейеров умножения и двух векторных конвейеров сложения для ранее рассмотренной нейросети. В представленных случаях управления в каждом такте синхронизация использования данных не требуется, если: 1) количество рецепторов в нейронной сети не менее чем вдвое превышает количество уровней конвейе¬ ра сложения; 2) в качестве буфера не используется оперативная память (ОП). В первом случае возникает опасность считывания данных до их формирова¬ ния. Во втором случае ОП, вследствие конфликтов при обращении, вносит элемент нестабильности в режим управления каждым тактом компьютера. Большой объём ЛНС может привести к активному использованию ОП, если объёма сверхоперативного запоминающего устройства (СОЗУ) станет недо¬ статочно. Тогда в обоих случаях синхронизация может быть выполнена с по¬ мощью закрытия адресов по считыванию, которые открываются по оконча¬ нии записи по ним. В процессорах «Эльбрус» такой синхронизации служат биты значимости [23]. 272
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... Рис. 14.7. «Зацепление» четырёх конвейеров умножения с двумя конвейерами сложения Рекомендация. Анализ многих примеров показывает, что вектора, участвующие в операции скалярного умножения, являются сильно разрежен¬ ными, т.е. содержащими много нулевых элементов. Ведь на каждый нейрон 273
Глава 11. Нейросетевые методы управления подаётся возбуждение весьма малого количества рецепторов по сравнению с их общим числом. Целесообразно в дополнение матрицы связи указывать для каждого нейрона только те рецепторы (и задавать значения их возбуждения), с которыми он связан с учётом весов. Тогда в скалярном умножении, являю¬ щемся главной составляющей счёта функции активации, будут участвовать вектора минимальной длины. Время работы конвейеров будет минимальным. Ключевые термины £7ѴС-архитектура - использует принцип явного командного управле¬ ния каждым тактом компьютера. Конвейер выполнения операций - реализует последовательное вы¬ полнение этапов операций над парами операндов с помощью специализиро¬ ванных устройств или программ; пары операндов поступают на обработку в каждом такте. Скалярное умножение векторов - нахождение суммы попарных умножений элементов. Зацепление конвейеров - организация такого их взаимодействия, ко¬ гда первый же результат выполнения на одном конвейере тотчас поступает на обработку другим конвейером, без промежуточного накопления в памяти. Краткие итоги 1. Независимо от типа логической нейронной сети, основой функции активации является скалярное умножение векторов, требующее минимиза¬ ции времени выполнения. 2. Операция зацепления векторов является основой такой минимиза¬ ции. 3. Практически наблюдаемая разреженность векторов, обусловленная тем, что каждый нейрон связан со сравнительно небольшим количеством ре¬ цепторов, требует задания дополнительной информации о действительных связях каждого нейрона. Это способствует достижению минимального вре¬ мени счёта функции активации. Вопросы 1. К каким д вум типам сводятся логические нейронные сети? 2. Что представляет собой общая часть всех возможных функций акти¬ вации, трудоёмкость выполнения которой представляет основную проблему нейрокомпьютера? 274
Лекция 14. Нейросетевой метод ускоренного принятия решений операционной... 3. Как с помощью зацепления конвейеров умножения и сложения ми¬ нимизировать время выполнения операции скалярного умножения векторов? 4. Какую дополнительную информацию следует задать, чтобы добиться минимального времени счёта значения функции активации? Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации и тактических игр Аннотация. Рассматривается применение логических нейронных сетей при построении транспортных моделей с пошаговой маршрутизацией, учи¬ тывающей динамику конфликтов при прохождении узлов и путей. Общность подхода при решении класса задач пошаговой оптимизации демонстрируется на возможном применении в моделях тактических игр. Ключевые слова: пошаговое принятие решений, транспортная сетъ, маршрутизация, транспортная модель, тактическая игра, «нейросетевой» подсказчик. Будут игры беспредельные, В упоительности цельные... К. Бальмонт. «Будут игры беспредельные...» 15.1. Логическая нейронная сеть — средство пошагового принятия решений Задачи пошаговой оптимизации составляют широкий класс задач ис¬ следования операций. Это — многочисленные задачи нахождения оптималь¬ ных стратегий управления, таких, как вывод космического объекта в задан¬ ную точку, минимизация длины пути следования в транспортной сети и др. Однако высокая сложность задач указанного типа выдвигает проблему запоминания и использования опыта, т.е. применения элементов обучения. При решении задач оперативного управления и планирования, по- видимому, нецелесообразно каждый раз, например, прокладывать маршрут следования груза по железной дороге с учётом огромного числа динамически возникающих факторов. Конечно, пользуются простыми эвристическими ал¬ горитмами управления, достаточно детализированными и децентрализован¬ ными для возможности учёта постоянно изменяющихся условий и обстанов¬ ки. В то же время, пошаговая оптимизация примитивно вырождается в по¬ следовательно принимаемое решение вида: «я нахожусь в состоянии X; куда двигаться (что делать) дальше для достижения минимума (максимума) целе¬ вой функции?» Такая простая схема движения к оптимуму и порождает воз- 275
Глава 11. Нейросетевые методы управления можность априорного расчёта оптимальных стратегий пошагового изменения состояния системы для того, чтобы в рабочем режиме по функции цели и по текущему состоянию системы находить запомнившийся предпочтительный переход в соседнее состояние, уменьшающий значение этой функции. Такая схема соответствует и идее ситуационного управления, и рас¬ смотренной ранее схеме нейросетевой реализации управления. К стратегии пошаговой оптимизации следует отнести и тактические игры, заключающиеся в последовательном выполнении противниками (пре¬ имущественно, двумя) действий, приводящих к минимизации некоторой це¬ левой функции, например, функции потерь. Здесь перед отдельным игроком стоит проблема выбора наилучшего хода для сложившейся ситуации. Для этого, несомненно, могут каждый раз рассчитываться все возмож¬ ные варианты ходов с возможными ответными ходами. Может быть исполь¬ зован и теоретический опыт. Однако такой анализ требует огромной произ¬ водительности вычислительных средств. Он недостаточно оперативен. Здесь решение находится на основе анализа действий опытного игрока, помнящего эффективный выход из множества сложившихся ситуаций и экс¬ плуатирующего свои способности ассоциативного мышления. Используется и коллективный опыт, теоретически обобщённый. Автоматизация подобного анализа может быть произведена на основе разработки «подсказчика», хранящего в памяти большое количество ситуа¬ ций и рекомендующего следующий ход в соответствии с опытом экспертов, с историей и с теоретическим анализом. Всё сказанное выше определяет целесообразность реализации с помо¬ щью логической нейронной сети. 15.2. Нейро сетевая транспортная модель динамической маршрутизации — Вперёд! — скомандовал сам себе бравый солдат Швейк. — Долг зо¬ вёт. Я должен попасть в Будейовицы. Но по несчастной случайности, вместо того чтобы идти от Противина на юг — к Будейовицам, стопы Швейка направились на север — к Писеку. Я. Гашек. Похождения бравого солдата Швейка Транспортная сеть представляет собой конечное множество пунктов (узлов), соединённых между собой линиями связи. Ограничения на тополо¬ гию связей отсутствуют. Случайным образом или по некоторому закону (например, по расписа¬ нию) в сети возникают заявки на транспортное перемещение, на передачу со¬ общений или, в общем случае, — на движение объекта из пункта отправле¬ ния к пункту назначения. Такими пунктами может быть любая пара пунктов сети. Заявки требуют прокладки маршрутов следования. Маршрут может 276
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... предполагать как непосредственное перемещение из пункта отправления в пункт назначения (если существует связь), так и транзитное перемещение че¬ рез промежуточные пункты. При моделировании целесообразно наблюдать единичный акт переме¬ щения по каждому маршруту: из одного пункта в другой. Это позволяет при¬ менять динамическое управление реализацией маршрута и, в зависимости от меняющейся обстановки, адаптивно изменять маршрут при движении от пункта отправления к пункту назначения. Модель ориентирована на решение задачи «проникновения» из пункта отправления в пункт назначения кратчайшим или менее загруженным до¬ ступным путём, т.е. за минимально возможное время, а также на повышение пропускной способности сети и вероятности успешного завершения маршру¬ та. Решение этой задачи характерно для маршрутизации в компьютерной се¬ ти, включая Интернет, для почтовой связи, оптимизации грузовых перевозок всех видов, нефтяных и газовых магистралей и др. В то же время с помощью этой модели может быть составлено оптимальное транспортное расписание, например, движения поездов. Рассмотрим «большие» транспортные сети, покрывающие значитель¬ ные территории крупных государств или их ассоциаций. Для проекции сети на плоскость введём систему координат (х, у), позволяющую однозначно идентифицировать (адресовать) не только каждый из N пунктов сети, но и приблизительное направление движения. Координаты могут быть декарто¬ выми, географическими и др. Координаты достаточно определять приблизи¬ тельно. Следующие построения произведём для каждого пункта сети, на кото¬ ром решается задача смещения транспорта, находящегося в этом пункте, в смежный пункт для достижения конечной цели. Пусть Ах — разность координаты jc пункта назначения и пункта теку¬ щего нахождения транспорта, из которого следует произвести шаг переме¬ щения — смещение; Ау — аналогичная разность координаты у. Для нахождения пункта смещения достаточно использовать однослой¬ ную логическую нейронную сеть (рис. 15.1). Она строится следующим обра¬ зом. Разобьём весь интервал изменения Ах для данной транспортной сети на отрезки аі, ..., ат. За каждым отрезком закрепим нейрон рецепторного слоя. Возбуждение этого нейрона определяется достоверностью принадлежности найденного текущего значения Ах соответствующему отрезку. Весь интервал возможного изменения Ау также разобьём на отрезки Ъ\, ..., Ъп. За каждым отрезком закрепим нейрон-рецептор. Его возбуждение определяется достоверностью того, что текущее значение Ау принадлежит соответствующему отрезку. 277
Глава II Нейросетевые методы управления Закрепим N рецепторов за пунктами сети. Возбуждение этих рецепто¬ ров определяет пункт нахождения (отправления) или промежуточный пункт, из которого следует произвести смещение. Выходной слой состоит из N нейронов. Их возбуждение определяет пункты, в которые необходимо или возможно произвести смещение. Номер рекоменду¬ емого пункта смещения для данных Ах, Лу и Номер рекоменду¬ емого пункта смещения для данных Ах, Ау и Рис. 15.1. Нейросеть для пошаговой маршрутизации Рекомендация по смещению не обязательно однозначна. Могут выда¬ ваться варианты смещения, которые подлежат дополнительному анализу с учётом различных динамических факторов. Синапсические связи вводятся так, чтобы каждое единичное возбужде¬ ние рецепторов всех элементов тройки {аь Zy, k-й пункт нахождения>} приводил к максимальному возбуждению нейрона выходного слоя, называ¬ ющего пункт дальнейшего смещения. 278
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... Целесообразно выбрать следующую функцию активации /-го нейрона: 'YjCOjly -h , где знаком £ обозначают замену отрицательных зна- V і ) \ z, при z > О, чений нулём, т.е. £00 = [0, при z < 0. Таким образом, первоначально по разностям координат х и у пункта отправления и пункта назначения отыскивается промежуточный пункт сме¬ щения. Для продолжения имитации движения возбуждается рецептор, соот¬ ветствующий найденному пункту смещения, для которого вновь определя¬ ются Ах и Ау по отношению к пункту назначения. Возбуждаются соответ¬ ствующие этим разностям рецепторы, и для данного пункта нахождения вновь по максимальному возбуждению нейрона выходного слоя определяет¬ ся следующий пункт смещения и т.д. Здесь предполагается, что весь маршрут сопровождается с некоторого центрального пункта, где находится логическая нейронная сеть. Однако упрощённая нейронная сеть может быть составлена для каждого узла от¬ дельно. Тогда, при нахождении пункта смещения, используется подобная ло¬ гическая нейронная сеть, находящаяся на нём. Таким образом, пункты «пере¬ дают» друг другу движущийся транспорт, пока он не достигнет пункта назначения. Применение координат целесообразно для «больших» транспортных сетей, содержащих тысячи и десятки тысяч пунктов, например, для террито¬ рии России. Тогда координаты могут указывать на некоторый условный центр подсети, объединяющей несколько пунктов. Например, поездка осу¬ ществляется в район Архангельска, в район Бухары и т.д. При небольшом количестве пунктов в транспортной сети логическая нейронная сеть может быть построена способом, рассмотренным в следую¬ щем примере. Пример. Пусть транспортная сеть представлена на рис. 15.2. 279
Глава 11. Нейросетевые методы управления Тогда логическая нейронная сеть, с помощью которой производится имитация движения транспорта, имеет вид на рис. 15.3. Ниже будет рассмотрена возможность введения обратных связей, поз¬ воляющих ввести элементы адаптивного динамического управления движе¬ нием, подобно рассмотренным для беспроводных телекоммуникационных сетей. 280
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... 15.3. Движение транспорта с выбором альтернативного пункта смещения Итак, мы рассматриваем случай, когда любой маршрут следования из пункта отправления к пункту назначения осуществляется с помощью после¬ довательности смещений между смежными пунктами. Так что маршрут не формируется весь заранее, а реализуется динамически с учётом приоритетно¬ го обращения к смежным пунктам и загрузки этих пунктов. Это позволяет производить адаптацию реального маршрута к текущей загрузке транспорт¬ ной сети так же, как это было рассмотрено для сети телекоммуникационной. Предположим, что для каждого пункта назначения на каждом пункте хранятся приоритетные веса смежных пунктов смещения для достижения це¬ ли с максимальным качеством - минимум расстояния, минимум времени, минимум опасности циклического движения и др. Для всех возможных пунк¬ тов назначения данная информация объединяется в таблицу. Пусть смежными для данного пункта являются пункты і?і, Bn. То¬ гда для отдельного адреса назначения А указанная информация может иметь вид строки в таблице: Пункт (адрес) назначения Предпочтительный вес смежного узла в направлении движения А (Оаі СдА2 (Dan Если в строке указан не единственный вес, отличный от нуля, то этим определяется возможность альтернативного смещения. В этом случае общую маршрутизацию, осуществляемую в сети, следует назвать свободной. Если в строке декларируется единственная единица, то альтернативы не существует. Маршрутизацию, где все смещения для достижения пунктов назначения определены однозначно, следует назвать жёсткой. Например, при движении из пункта 1 (рис. 15.2) в пункт 5 и при обос¬ нованном назначении весов смещения, подобная строка может иметь следу¬ ющий вид: Пункт (адрес) назначения Предпочтительный вес смежного узла в направлении движения 5 02 = 0,8 0з = О,2 04 = 0,8 С учётом альтернативных смещений и их весов, логическая нейронная сеть для рассматриваемого примера может быть приведена к виду, представ¬ ленному на рис. 15.4. Единичные веса связей не обозначены, а альтернатив- 281
Глава II Нейросетевые методы управления ные веса выбраны примерно. Чтобы не загружать рисунок, представлены не все возможные альтернативные решения. Рис. 15.4. Логическая нейронная сетъ для альтернативного выбора смещений 282
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... Альтернативное смещение в смежный пункт реализует элемент само¬ управления, адаптации на основе обратной связи, ведущей от смежных пунк¬ тов к пункту текущего нахождения транспорта. Каждый пункт (узел) сети характеризуется своей максимальной про¬ пускной способностью и её текущим резервом - для нахождения пункта смещения. Тогда, логическая нейронная сеть, находящаяся на каждом пунк¬ те, имеет отрицательные веса связей, ведущих от буферов смежных узлов. На рисунке 15.5 представлен фрагмент логической нейронной сети, находящейся на каждом узле, в котором отображён выбор смежного пункта смещения при следовании объекта в пункт А. Буферы смежных ПУНКТОВ Рис. 15.5. Фрагмент логической нейронной сети, размещённой на узле Функция активации: V = , если эта сумма больше h, 0 - в противном случае. І В данном случае эта функция имеет вид: Ѵі = Ѵа щ - kj, если эта разность превышает порог /г, 0 в противном случае. Здесь kj - коэффициент загрузки /-го пункта смещения. Порог И выбирается экспериментально так, чтобы предпочтение могло быть выбрано между не полностью загруженными узлами. В построенной обобщённой модели движения в транспортной сети бу¬ фер отображает пропускную способность узла. Конкретно это может быть: количество путей железнодорожной станции, количество взлётно-посадоч¬ ных полос, максимальное использование радио каналов и т.д. В рамках тео¬ рии логических нейронных сетей значение коэффициента загрузки буфера 283
Глава 11. Нейросетевые методы управления можно интерпретировать как достоверность высказывания о том, что буфер заполнен полностью. Принятую дисциплину использования загрузки буфера для разрешения движения в сторону узла также следует считать достаточно общей: ведь если мы узнаём, что на некотором участке дороги создалась «пробка», то разумно не надеяться на то, что к нашему приезду она рассосётся. Следует изменить маршрут. Такова практика организации полётов и передачи информацион¬ ных пакетов. Ведь следует учесть, что прогнозирование ситуации на узле на тот момент, когда поезд до него доберётся, требует согласованного анализа многих маршрутов. Это значительно усложняет динамическое управление движением. Проще запретить движение в сторону перегруженного узла. Моделирование совместного движения множества объектов в транс¬ портной сети по испытываемым сценариям необходимо, прежде всего, для выделения маршрутов (поездов, самолётов, информационных пакетов и др.) при поиске оптимальных расписаний движения. В частности, такое модели¬ рование предполагается в рамках общей методики оптимального обслужива¬ ния пассажиропотоков. 15.4. Нейросетевой «подсказчик» в тактической игре Остан ... подошёл к одноглазому, сидевшему за первой доской, и передвинул королевскую пешку с клетки е2 на клетку е4. И. Ильф, Е. Петров. Двенадцать стульев Схема пошаговой оптимизации наилучшим образом ложится на схему игры, где последовательные действия одного или нескольких игроков приво¬ дят к успеху, обусловленному правилами. Единичное действие, чаще всего называемое ходом, должно либо ста¬ тистически, либо комбинационно приводить к увеличению «качества» или к уменьшению «штрафа» на пути к победе (или к поражению). И здесь боль¬ шое значение имеет не только длительный анализ всех возможных продолже¬ ний, грозящий цейтнотом, но и огромный опыт и фактические знания, пере¬ родившиеся в интуицию и позволяющие действовать механически в услови¬ ях блиц-турнира. Следовательно, должны быть реализованы механизмы запо¬ минания и извлечения опыта и знаний в пошаговых действиях. Основным средством такой реализации является нейросеть — как природная, так и ис¬ кусственная. Рассмотрим игру в шахматы. Аналогом пункта в транспортной сети здесь является позиция на шахматной доске, состоящей из 64 клеток. Каждая клетка может быть пустой или иметь значение символа занимаемой фигуры. То есть, каждая клетка і может принимать значение из множества {0, пешка белая, ладья белая, конъ белый, слон белый, ферзь белый, король белый, 284
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... пешка чёрная, ладья чёрная, конъ чёрный, слон чёрный, ферзь чёрный, король чёрный). При этом позиции являются симметричными относительно цвета фигур. Игроку, прибегающему к услугам «подсказчика», главное — указать: «фигуры мои — фигуры противника». Играть можно «самому с собой», как бы поворачивая доску после очередного хода. (Если «подсказчик» играет сам с собой, логично предположить, что такая игра всегда будет сводиться к ни¬ чьей?) Тогда рецепторный слой однослойной логической нейронной сети должен состоять (рис. 15.6) из 64 групп нейронов. Каждая группа закреплена за одной клеткой и, в свою очередь, состоит из 13 нейронов-рецепторов. Каждый рецептор закреплён за одним из воз¬ можных значений клетки. Ясно, что в подавляющем числе случаев значение клетки достаточно задавать с помощью единичного значения возбуждения единственного ре¬ цептора из тринадцати, соответствующих этой клетке. Так можно задавать позицию для нахождения следующего хода. Однако можно предусмотреть и неполную, предполагаемую с некоторой достоверностью информацию о зна¬ чении клетки. Это справедливо, например, для случая игры «вслепую», тем более в сеансе одновременной игры, когда детали ситуации на отдельной доске могут быть забыты. Целесообразно использовать приведённую в разделе 6.2 функцию ак¬ тивации с единичными синапсическими весами. Значения порогов несуще¬ ственны; они могут быть положены равными нулю. Комбинации возбуждения рецепторов должны приводить, в соответ¬ ствии с непосредственными связями, к максимальному значению возбужде¬ ния того нейрона выходного слоя, с которым связан текст — рекомендация следующего хода. Текст может включать исторические ссылки, коммента¬ рии, мультимедийные эффекты и др. Как говорилось, возможно попеременное обращение игроков к нейро- сети-«подсказчику». Тогда все нечётные обращения соответствуют белым, чёрные — чёрным. Однако интереснее игра живого шахматиста с компьюте¬ ром. Конечно, анализ колоссального опыта гроссмейстеров и литературы по теории шахмат не способен по всем возможным ситуациям и для белых, и (симметрично) для чёрных определить абсолютно правильные ходы. Да и объём информации колоссален! Некоторые шахматные позиции останутся без рекомендаций. Здесь необходимо исследовать, насколько ука¬ зание нейрона, наиболее возбудившегося, может быть принято в качестве со¬ вета, — то есть, насколько это хотя бы статистически соответствует правиль¬ ному решению или, по крайней мере, не приводит к снижению качества. Сле¬ дует ли «учить» нейросеть решению по данной комбинации или достаточно использовать её способности ассоциативного мышления? 285
Глава 11. Нейросетевые методы управления 3 Ы Н V 4 а V 3 3 <и 3 es т ѵо 3 Sd н <D tu tu 3 es 3 PO Пустая? • Пешка? О Ладья? о Конъ? о Слон? о Ферзь? о Король? о Пешка? • Ладья? • Конъ? • Слон? • Ферзь? • Король? • 4 Рекомендую ход e2 - e4 Рекомендую ход bl - c3 r/' W\ n Рекомендую ход f4 - c7, приведший к победе Алёхи¬ на в матче с Капабланкой в 1913 году Л Рекомендую сдаться! Рис. 15.6. Нейросетевой «подсказчик» при игре в шахматы На этом пути может производиться совершенствование «подсказчика», что повышает интерес игры человека с машиной. В перспективе своих самостоятельных исследований составьте модель программы игры в «крестики - нолики», первоначально ограничившись по¬ пыткой сведения игры «в ничью». Начните разработку модели с анализа воз¬ 286
Лекция 15. Нейросетевые модели пошаговой оптимизации, маршрутизации... можных ходов противника и с выбора предпочтительного ответа. Для этого заведите три строки, каждая из которых содержит три позиции. В текущем состоянии игры позиция может содержать «крестик» (противника), «нолик» (Ваш) или быть свободной. Несомненно, «традиционный» программный, по¬ следовательный анализ каждой позиции всех строк трудоёмок и долог. Ассо¬ циативный принцип «работы» нейронной сети (рис. 15.7) позволяет прибли¬ зить его к ассоциативному мышлению игрока и сделать игровую нейроком¬ пьютерную приставку к персональному компьютеру. Рис. 15.7. примерный вид нейросети для игры в «крестики - нолики» Ключевые термины Пошаговая оптимизация - последовательные, потактовые, цикличе¬ ские действия по максимизации (минимизации) целевой функции. Динамическая (пошаговая) маршрутизация - нахождение целесооб¬ разного пункта смещения в транспортной сети, при условии совместного 287
Глава 11. Нейросетевые методы управления движения многих транспортных средств, для достижения конечного пункта назначения за минимальное время и с максимальной вероятностью. Подсказчик (в тактической игре) рекомендует очередной ход, мак¬ симизирующий целевую функцию на основе текущей ситуации. Краткие итоги 1. В условиях динамически меняющейся ситуации решение по миними¬ зации некоторой целевой функции приходится принимать по шагам. Это ха¬ рактерно для задач оперативного планирования, при организации движения многих объектов в транспортной сети (при разделении её ресурсов), при мно¬ гонаправленной одновременной передаче информационных пакетов, в такти¬ ческих игровых задачах и др. 2. При выборе стратегии поведения на каждом шаге целесообразно ис¬ пользовать опыт, зафиксированный в базе знаний и записанный в виде логи¬ ческой нейронной сети. 3. В транспортных задачах целесообразно находить смещение в смеж¬ ный узел по разности координат пункта назначения и пункта текущего нахождения. 4. Возможна организация альтернативного смещения в зависимости от загрузки смежных узлов. 5. Моделирование движения в сети необходимо для составления опти¬ мальных расписаний движения поездов, полётов и пр.. 6. На основе логических нейронных сетей могут строиться подсказчики в тактических играх. Вопросы 1. Когда возникает необходимость в пошаговом принятии решений? 2. Какие факторы порождают неопределённость при совместном дви¬ жении многих объектов в транспортной сети? 3. Как строится логическая нейронная сеть для нахождения пункта смещения при следовании объекта к конечному пункту? 4. Как производится альтернативное смещение в смежный узел в зави¬ симости от текущей загрузки этих узлов? 5. В чём заключается идея подсказчика в тактической игре? Лекция 16. Основы трёхмерного «живого» моделирования Аннотация. Исследуются проблемы разработки реагирующих объек¬ тов «живого» моделирования для дополнительного, наглядного мониторинга сложных управляющих систем, служащего минимизации влияния «человече- 288
Лекция 16. Основы трёхмерного «живого» моделирования ского фактора». Компьютерная графика для «живого» моделирования долж¬ на учитывать возможность динамического управления объектами с помощью «мышц» и «костей». Объёмный экран может строиться на основе пакета про¬ зрачных мониторов, реализующих срезы трёхмерного изображения. Рассмат¬ ривается возможность применения реагирующих объектов для публичной демонстрации прогноза погоды. Ключевые слова: «живое» моделирование, реагирующий объект, логи¬ ческая нейронная сетъ, прозрачный монитор, объёмный экран. Вид его странен. Шерсть осталась только на голове, на подбородке и на груди. В остальном он лыс, с дрябловатой кожей. В области половых ор¬ ганов - формирующийся мужчина. Череп увеличился значительно, лоб ско¬ шен и низок. М.А. Булгаков. Собачье сердце 16.1. Какую задачу мы хотим решить? Работа многих автоматизированных сложных систем в производстве, энергетике, авиации и т.д. контролируется диспетчерами и операторами с помощью пультов, мониторов и других средств визуализации. По сложив¬ шейся ситуации они принимают решение. Для подавления «человеческого фактора» могут быть использованы ре¬ агирующие объекты. На них выводятся основные параметры состояния сложной системы, а также тенденция (дрейф) их изменения. Своим поведе¬ нием, отображающим реакцию на ситуацию, реагирующий объект может не только предупредить о нештатной ситуации, но и произвести предваритель¬ ную диагностику. Таким образом, он является посредником между системой и диспетчером, помогая ему своевременно принять решение. Во всех предыдущих лекциях в качестве примеров возможного приме¬ нения обсуждается построение систем с элементами искусственного интел¬ лекта, которые можно отнести к области искусства и развлечений. Фантазия легко связывает создание монстров, объектов компьютерных игр, имитацию их реакции на внешнюю среду или другие предлагаемые им объекты и ситу¬ ации с такими «мероприятиями», как парк фантасмагорий, Disney-lend, цирк марионеток, распознавание «свой - чужой», сетевые зрелищно-рекламные демонстрации и т.д. Такие системы могут представлять как искусство, так и бизнес. Существуют два направления реализации указанных систем ИИ: натурное и компьютерное. В современном парке (культуры и отдыха) можно в натуральном виде встретить не одно существо, мало отличающееся от живого и совершающее действия и движения по заложенной программе. Технологии их построения можно считать отработанными, имитация движений, включая работу «мы- 289
Глава II Нейросетевые методы управления шечного» аппарата, вполне совершенна. Отсутствие элементов ИИ, предпо¬ лагающих непредсказуемость реакции, — основной недостаток таких объек¬ тов. Компьютерная реализация сегодня ограничена мультимедийными сред¬ ствами двумерной и трёхмерной графики. Возможности создаваемых этими средствами систем и образов огромны. Однако основной недостаток всех из¬ вестных систем кроется в априорном знании возможных сцен, сглаживание перехода через которые в реальном времени имитирует движение. Это по¬ добно табличному заданию огромного количества значений функции многих переменных при игнорировании непосредственного расчёта. Непредсказуемость сцен, возникающая при имитации реакции модели¬ руемого объекта на внешние воздействия, может потребовать огромного, практически нереализуемого, числа предполагаемых возможных сцен. Ос¬ новная сложность при создании таких объектов заключается в том, что управляться они должны, т.е. принимать решение о производимых движени¬ ях и действиях, в реальном масштабе времени! В этом случае желательно при построении объекта (монстра, человека и др.) снабжать его управляемыми органами движения (модификации, де¬ формации, имитирующей улыбку, движение руки и т.д.), подобными мыш¬ цам и костям. Их необходимо соединить с управляющим элементом - про¬ граммой. Такая программа должна производить анализ ситуации или внеш¬ них воздействий. Это уже напрямую требует применения аппарата логиче¬ ских нейронных сетей, одновременно и в разной степени реализующих ряд отношений вида «если - то», что наиболее близко к поведению живого суще¬ ства. Таким образом, построение реального объекта в памяти компьютера, а не его математического образа, задание ряда рычагов - «мышц» и «костей», которые способны деформировать или видоизменять объект в соответствии с формируемыми извне командами, использующими коэффициент сжатия, позволяют имитировать любое, в том числе непредсказуемое, движение объ¬ екта. (Ниже будет отмечена необходимость механизмов перемещения и вра¬ щения.) Видны новые широкие возможности создания кинофильмов, сцениче¬ ских постановок и других видео сценариев. Построение реальных объектов требует имитации объёмной, трёхмер¬ ной памяти и введения основных процедур её преобразования. Заметим, что проблемы компьютерной реализации «живого» модели¬ рования целиком исключают проблемы натурного моделирования, оставляя ему лишь проблемы химического, технологического и электротехнического (возврат к релейно-контактным схемам?) свойства, что, как сказано выше, сейчас успешно решается. 290
Лекция 16. Основы трёхмерного «живого» моделирования Основной задачей современной компьютерной графики, предназначен¬ ной для анимации, является отображение объёмных объектов на плоском эк¬ ране. Применяемые эффекты создают впечатление с ограниченного ракурса: решаются проблемы видимости и скрытости элементов изображения, демон¬ страции перспективы и освещения. Как правило, анимация использует зара¬ нее известные сцены, весьма ограничивая альтернативное развитие сюжета, и практически не допускает динамического, оперативного вторжения в разви¬ тие сценария. Поэтому, как указывалось выше, когда ставится задача создания средств поддержки «живого» моделирования, то первой и главной задачей является возможность сопряжения моделируемых объектов со средствами оперативного влияния на их поведение, на их адекватную реакцию. Однако не менее важной задачей является визуализация. Если смело поставить задачу объёмной визуализации, визуализации в трёх измерениях, то немедленно возникнет необходимость создания объектов в памяти ком¬ пьютера в трёх измерениях, т.е. в модели трёхмерной памяти. Объёмная ви¬ зуализация существенно продвинула бы применение компьютерной графики не только в области «живого» моделирования и производственного отобра¬ жения с первичной диагностикой, но и в областях сценических действий, культурно-исторических реконструкций, электронного зодчества и ваяния, бизнеса туризма и развлечений и др. Предложения по созданию динамически управляемых с помощью ло¬ гической нейронной сети трёхмерных компьютерных объектов «живого» мо¬ делирования представлены в [19, 20, 21]. 16.2. Создание графических объектов в модели трёхмерной памяти Модель трёхмерной памяти. При построении объекта (монстра, чело¬ века и др.) необходимо снабжать его управляемыми органами движения (мо¬ дификации, деформации, имитирующей улыбку, движение руки и т.д.), по¬ добными мышцам и костям. Их необходимо соединить с управляющим эле¬ ментом - программой. Программа должна производить анализ внешней (для объекта) ситуации или внешних воздействий. Это требует применения аппа¬ рата логических нейронных сетей, одновременно и в разной степени реали¬ зующих ряд отношений вида «если - то», что наиболее близко к поведению живого существа. Таким образом, построение реального управляемого объекта, а не его математического образа, в памяти компьютера позволяют имитировать лю¬ бое, в том числе непредсказуемое, движение объекта. Такое представление упрощает визуализацию при наличии трёхмерного экрана. Назовём ячейку, занятую минимальным элементом объекта, точкой этого объекта. Точка должна содержать информацию о цвете (пиксель) и ко¬ эффициент освещённости. 291
Глава 11. Нейросетевые методы управления X У г rn N-, гп N-, 0 , —] [0 , —] 0 ’ V 3 3 3 J —V N Рис. 16.1. Преобразование линейного адреса в трёхмерный Пусть адресное пространство компьютера, отведённое для модели трёхмерной памяти, при сквозной линейной адресации ячеек с нуля опреде¬ ляется N разрядами. Адрес разбивается на три части (рис. 16.1). Здесь х, у, z — координаты точки в трёхмерной памяти. Трёхмерная память (в данном случае - кубическая) в виртуальной ли¬ нейной памяти компьютера задаётся массивом M[0.N; О:N; 0:7Ѵ] переменных т[х, у, z]. Линейный адрес точки объекта находится: < т[х, у, z]> = С + х+ yN + zN2, где С - базовый адрес массива. Тогда задача имитации движения - деформации или перемещения объ¬ ектов - превращается в задачу нахождения новых значений индексов- коор¬ динат для каждой переменной, являющейся точкой объекта. Процедуры преобразования. Создание реальных объектов требует введения основных процедур преобразования трёхмерной памяти. Такие процедуры создаются на основе следующих построений. Пусть объект в трёхмерном пространстве задан своей оболочкой. Каж¬ дый элемент оболочки является точкой. Оболочка формируется при создании объекта. В общем случае, объект может быть заполнен значащей информаци¬ ей и внутри, если его вид в разрезе интересует пользователя. Пользователем - разработчиком задаются «мышцы» (далее кавычки опустим) как рычаги управления деформацией объекта в центральной систе¬ ме координат. Мышца задаётся координатами начала и конца, а также точ¬ кой неподвижности, относительно которой возможно сокращение мышцы. Точка неподвижности может совпадать с началом или концом мышцы. По умолчанию точка неподвижности является серединой мышцы. Мышца не обязательно связывает точки оболочки. В общем случае она может распола¬ гаться внутри и даже вне объекта, принадлежа ему и влияя на его деформа¬ цию. Мышцы объекта являются невидимыми, входящими в список мышц данного объекта и допускающими реакцию на приказы извне. 292
Лекция 16. Основы трёхмерного «живого» моделирования Взаимодействие мышцы с объектом осуществляется с учётом его свойств. Ведь сокращаясь, мышца должна увлекать точки объекта или только его оболочку, имитируя сокращение всего объекта. Сокращение твёрдого тела определяется коэффициентом сжатия (рас¬ тяжения) объекта. Вязкое тело, внутри которого сокращается мышца, характеризуется «затуханием» величины смещения точки объекта с увеличением её расстоя¬ ния до мышцы. Сокращение вязкой и упругой среды, такой, как резина, губка, упитан¬ ные щёки и др., обычно сопровождается явлением, которое можно назвать попыткой сохранения объёма в результате выпучивания. При сокращении мышцы это означает, что перенос клеток объекта вдоль мышцы обретает перпендикулярную составляющую, тем меньшую, чем больше расстояние до мышцы. Для имитации вращательных движений используются шарниры. Коор¬ динаты шарнира задаются точкой внутри объекта. Задаётся мышца, связыва¬ ющая лучи (элементы скелета), исходящие из центра шарнира. Сокращение мышцы должно вызывать видимость движений, характерных при ходьбе, движении рук и т.д. Это требует таких деформаций объектов, при которых его клетки, облегающие эти лучи, или только клетки оболочки, несущие в се¬ бе данные лучи, сближаются вместе с лучами, не приводя к дополнительной деформации. Взаимодействие многих объектов требует наличия центральной систе¬ мы координат, в которой происходят все перемещения объектов относитель¬ но друг друга, и систем координат, связанных с каждым объектом - объекто¬ вых систем координат. Объект создаётся в его объектовой системе коорди¬ нат. Его движения «относительно себя» — сокращение мышц, повороты, вращение - удобнее наблюдать в связанной с ним объектовой системе коор¬ динат. Таким образом, центральная система координат должна быть связана со многими объектовыми системами матрицами пересчёта. Внешнее воздействие. Необходимость внешнего воздействия на объ¬ ект обусловлена не только взаимодействием различных объектов, но и созда¬ нием инструментов формирования, «ваяния» объекта. Идея такого ваяния за¬ ключается в следующем. Первоначально формируется некоторая заготовка, имеющая наиболее близкую форму для желаемого объекта. (Например, шар, — для формирова¬ ния головы.) Приближая к заготовке объект-«инструмент», например, моло¬ ток, необходимо потребовать, чтобы при угрозе прикосновения к объекту, ближайшие его клетки отступали, и оболочка, продавливаясь, принимала форму проникающего инструмента. Эта операция напоминает ковку или штамповку. Таким многократным воздействием с разных сторон можно до¬ биться любой формы объекта. 293
Глава II. Нейросетевые методы управления Можно допустить не только вдавливание инструмента в объект, но и вытягивания близлежащей области, подобно нарыву. В этом случае после соприкосновения с объектом следует отводить инструмент от него. Близкая область оболочки должна вытягиваться вслед за инструментом. Если не деформировать оболочку, а позволить инструменту проникать в объект, то подобное действие сравнимо с действием ножа. Так от объекта могут отсекаться части, — для последующего уничтожения или для создания новых объектов. Построение объектов. Для построения объектов целесообразно вос¬ пользоваться тремя координатными проекциями, подобно 3D-MAX. Сначала в одной из проекций рисуется пока неточный, предполагаемый разрез объек¬ та. На других проекциях автоматически сформируются отрезки - боковые проекции этого разреза. На разрезе определяется точка для дальнейшей де¬ формации объекта в двух других проекциях. Проекция этой точки высвечи¬ вается на двух других проекциях. Подведя мышь к одной из проекций точки, следует повести её (мышь) вверх или вниз, формируя выпуклость вслед за этим движением так, чтобы первоначально заданная плоская поверхность образовала выпуклость. Так сформируется объёмное изображение. Если при этом придерживать клавишу control (или другим способом), плоская поверхность сохранится для замкну¬ тости объёма или для последующей аналогичной деформации в ту или дру¬ гую сторону. Повороты получившейся объёмной фигуры позволяют производить указанным способом различные деформации. Командно-программное управление объектами. Необходимо пом¬ нить, что объекты в трёхмерной памяти создаются для их визуального вос¬ приятия. Система визуализации может базироваться на проецировании ви¬ димой поверхности всех объектов, включая фон, на плоскость z = zmax в цен¬ тральной системе координат. Эта плоскость и представляет экран. Значит, каждая прямая, исходящая из точки fa, уі, zmax ) и перпендикулярная экрану, продолжается (здесь рассматриваем только прозрачную среду) до первого пересечения с одним из объектов или с фоном. Полученная точка обеспечи¬ вает изображение в данной текущей точке экрана. Для получения различных (томографических) срезов экран может фор¬ мироваться и в других плоскостях вида z = а > 0. Введение мышц, шарниров, объектовых систем координат позволяет программировать действия объектов и их взаимное расположение. Програм¬ ма создаётся на базе командного языка, содержащего инструкции вида: <сократить мышцу т с I 0,8>; <повернуть объект Р по матрице преобразования S>; <приблизить объект Р>; <перенести объект Р>; <показать срез z = 5> и т.д. 294
Лекция 16. Основы трёхмерного «живого» моделирования Таким образом, могут планироваться и исполняться сцены, основанные на имитации движения объектов, их мимики, преобразования и т.д. При программировании поведения объектов учитывается длительность выполнения действий, их инерционность, предшествующие команды управ¬ ления. Все построения для трёхмерной управляемой анимации, в упрощенном варианте пригодны и для «плоской» анимации. Связанные с этим проблемы также рассмотрены в [16]. На рис. 16.2 показано возможное выделение мышц для некоторых простых движений как «плоского», так и объёмного объекта. Вне объекта обозначены невидимые мышцы. На рис. 16.3 показан достаточ¬ ный набор мышц для эмоциональных выражений на «плоском» лице. Рис. 16.2. Выделение мышц и шарниров для имитации взмаха руками Рис. 16.3. Выделение мышц для выражения эмоций на «плоском» лице (разрез ограничива¬ ет облаетъ деформации нижней губы) 295
Глава 11. Нейросетевые методы управления 16.3. Логические нейронные сети в основе управления трёхмерными компьютерными объектами Занимаясь «живым» моделированием на основе компьютерных и ин¬ формационных технологий, следует быть приверженным точным наукам, в которых любые построения начинаются с исчерпывающих, непротиворечи¬ вых определений. Что есть жизнь? Какое существо можно назвать живым? 1. Живое существо адекватно реагирует на внешние раздражители. 2. Адекватность реакции живого существа подчиняется критерию «хо¬ рошо - плохо». В качестве комментариев отметим, что даже внутренние болезни име¬ ют внешние причины: экологические, политические, наследственные, бакте¬ риологические и т.д. В то же время философски уместно говорить о жизни существа не в абсолютном аспекте, а в аспекте моделирования: вся жизнь представляет собой игровую модель, а задачей любого моделирования явля¬ ется минимизация целевой функции, в конечном итоге отделяющей понятие «хорошо» от понятия «плохо». К сожалению, для каждого индивидуума эти понятия различны и на нейросетевом (мозговом) уровне обусловлены обуче¬ нием - генетическим или практическим. Посчитаем достаточными положения 1 и 2 для настоящего уровня ре¬ шения задачи «живого» моделирования. Однако мы понимаем, что достичь такого уровня обучения, когда система сама начинает осознавать, что хоро¬ шо, а что плохо, на основе индуктивного и дедуктивного мышления, вряд ли сейчас возможно практически. Мы вынуждены решать задачу-минимум, тре¬ буя, в основном для культурно-развлекательных целей, адекватности реак¬ ции. Степень этой адекватности в соответствии с означенным критерием мы уж предусмотрим сами. Например, можно научить объект улыбаться, если он видит картинку с преобладанием розовых тонов, но гневаться, если на картинке превалирует коричневый цвет и т.д. Таким образом, ближайшей практической задачей является закладка инструментальных основ. Позволим проблеме развиваться на базе нейросе- тевых технологий более глобально в дальнейшем. Пусть сотворённый объект (рис. 16.2, 16.3) в компьютерном или мате¬ риальном воплощении наделён некоторым фоновым поведением, реализуе¬ мым программно. Например, такое поведение может быть аналогичным по¬ ведению зверя в клетке, нервно дефилирующего вдоль решётки. Целесооб¬ разно в программе использовать и элементы случайности на основе ДСЧ - датчика случайных чисел. Это может ввести разнообразие в фоновое поведе¬ ние объекта: внезапный поворот головы, смена направления движения и т.д. Такое поведение уже само по себе является занимательным для зрителя. 296
Лекция 16. Основы трёхмерного «живого» моделирования Однако представим себе, что фоновая программа предусматривает пе¬ риодическое прерывание для включения «внимания» объекта к внешней об¬ становке - к «картинке», циклически вводимой в его память с помощью ви¬ део ввода. Включается программа анализа «картинки», питающая рецепторный слой нейросети. Алгоритмы такого анализа, как подготовительного этапа решения задачи распознавания, представляют собой отдельное направление исследований. На этом этапе «картинка» отображается в пространстве при¬ знаков, обоснованных для распознавания и принятия решений. На самом простом практическом уровне может производиться подсчёт различных от¬ тенков цветов в элементарном квадрате «картинки», обнаружение резких цветовых границ, наличие линий, кругов определённого цвета и т.д. Ограничиваясь только цветом, можно, в терминах алгебры высказыва¬ ний, представить следующий пример алгоритма реакции объекта. «В квадрате i, j преобладает зелёный цвет» л «отсутствуют резкие переходы в оттенках» —> «Запустить программу умиротворения»; «В квадрате i, j преобладает зелёный цвет» л «наблюдаются резкие переходы в оттенках» —> «Запуститъ программу тоски по лесным далям»; «В квадрате i, j преобладает голубой цвет» л «наблюдаются тёмные вкрапления» —> «Запуститъ программу приветствия»; «В квадрате i,j преобладает красный цвет» —> «Запустить программу повторного обзора квадрата» /\ «Запуститъ программу гнева»; «В квадрате i, j обнаружен круг с преобладанием телесного цвета» —> «Запуститъ программу приветствия»; «В квадрате i, j преобладает коричневый цвет» —> «Запуститъ про¬ грамму презрения»; «В квадрате i,j преобладает жёлто-оранжевый цвет» —> «Запустить программу радостного возбуждения» и т.д. Тогда обученная для реализации данного алгоритма однослойная логи¬ ческая нейронная сеть представлена на рис. 16.4. Логическая нейронная сеть составлена по методике, обоснованной ранее. Это определило единичные значения весов синапсических связей, не указанных на рисунке. Здесь нейрон-рецептор 1 принимает значение достоверности высказы¬ вания «В квадрате преобладает зелёный цвет» как величину возбуждения. Рецептору 2 сообщается значение достоверности высказывания «От¬ сутствуют резкие переходы в оттенках». Рецептор 3 принимает значение достоверности высказывания «Наблю¬ даются резкие переходы в оттенках». Рецептор 4 возбуждается на величину достоверности высказывания «В квадрате преобладает голубой цвет». Рецептор 5 принимает значение достоверности высказывания о похо¬ жести на полёт птиц. Рецептор 6 возбуждается на преобладание красного цвета. 297
Глава II Нейросетевые методы управления Рецептор 7 возбуждается на величину достоверности обнаружения кру¬ га телесного цвета. Рецептор 8 принимает значение достоверности преобладания коричне¬ вого цвета. Рецептор 9 принимает значение достоверности преобладания жёлто¬ оранжевого цвета. Программа « Уми¬ ротворение» с па¬ раметром Ѵвыхі Программа «Тоска» с параметром ѴвЫх2 Программа «При¬ ветствие» с пара¬ метром ѴвыхЗ Программа «Повто¬ рение обзора», программа «Гнев» с параметром Ѵвых4 Программа «Пре¬ зрение» с парамет¬ ром Ѵвых 5 Программа «Ра¬ дость» с парамет¬ ром Ѵвыхб Рис. 16.4. Логическая нейронная сетъ для обучения «живого» объекта 298
Лекция 16. Основы трёхмерного «живого» моделирования И так далее, - по расширяемому на основе бесконечного совершен¬ ствования количеству используемых факторов. Нейросеть строится обученной. При её построении и в процессе её раз¬ вития с добавлением новых рецепторов и нейронов выходного слоя, ответ¬ ственных за реакцию, вводятся связи на основе эталонных ситуаций. Это означает, что возбуждение связываемых при этом рецепторов равно единице. Иначе говоря, в логическом описании создаваемой системы исходные выска¬ зывания имеют значение ИСТИНА. Переход от булевых переменных к дей¬ ствительным (к достоверности высказываний) соответствует модели ассоци¬ ативного мышления. Практически за эту достоверность можно принимать частоту появления или «удельный вес» определённого цвета (соответствующих пикселей) в ана¬ лизируемом квадрате. Подавая значения достоверности на рецепторный слой, с помощью функции активации находим величины возбуждения нейро¬ нов выходного слоя. Эти величины служат параметрами запускаемых про¬ грамм. Рекомендуемая функция активации имеет вид Порог h целесообразно выбрать достаточно высоким, например, поло¬ жим h = 0,5, чтобы объект не выглядел слишком «нервным», возбуждаясь понапрасну из-за малой причины возбуждения. Таким образом, «живое» моделирование - это экспериментальное нап¬ равление, позволяющее проверить и осуществить все достижения на пути развития технологий искусственного интеллекта. Это реальный путь вопло¬ щения новых направлений в искусстве, в шоу-бизнесе, в учебной, игровой и развлекательной деятельности. 16.4. Создание стереоэффекта с помощью системы прозрачных мониторов Проектирование объёмного изображения на плоский экран для визуа¬ лизации осуществляется «на всю толщину» изображения, то есть на весь диапазон изменения z, 0 < z < zmax. А что, если [19] «нарезать» отображаемый объект или всё пространство по оси z, направленной на зрителя, на слои «толщиной» Аz (рис. 15.5), и каждый такой слой проектировать на свой «пе¬ редний» срез, как на отдельный экран, а экраны расположить друг за другом, как показано на рис. 15.6? Ведь прозрачные мониторы уже поступили в про¬ дажу! ( s, при s > 0,^ 0 при s < 0 V 299
Глава 11. Нейросетевые методы управления Рис. 16.5. «Нарезка» изображения на экранизируемые слои Рис. 16.6. Отображение объёмного изображения на нескольких прозрачных мониторах 300
Леющя 16. Основы трёхмерного «живого» моделирования Изображения на разных экранах, в зависимости от угла наблюдения, оказываются смещёнными относительно общей требуемой картины: с одной стороны образуются пустые зазоры, с другой изображения наползают друг на друга. Для получения стереоэффекта зрителю необходимо находиться строго напротив экранов, как показано на рисунке. На рис. 16.7 отображена попытка экспериментального воспроизведения объёмного экрана с помощью бытовой полихлорвиниловой плёнки. Рисунок назван «Всплывающая черепаха», так как недостаточная прозрачность плён¬ ки, уложенной в 18 слоёв, не позволяет разглядеть концы лап на дне водоёма. В то же время такое замутнение свидетельствует о наличии объёма в данном эксперименте. К сожалению, при ручной работе видна некоторая нестыковка слоёв, а также видны границы между послойным разрезом бумажного изоб¬ ражения. Становятся очевидными задачи дальнейших исследований в обла¬ сти «прозрачных» мониторов: достижение максимальной прозрачности при минимальной толщине плёнок - для возможности их сборки в достаточно «толстые» пакеты. Рис. 16.7. Всплывающая черепаха 301
Глава 11. Нейросетевые методы управления А если потребовать условного выполнения требования zb —» 0? Техни¬ чески и технологически это требует значительного роста количества исполь¬ зуемых прозрачных экранов на основе достижений «прозрачной электрони¬ ки». Становится оправданной разработка экранных плёнок с предельной тол¬ щиной «в одну точку», чтобы «нарезка» выродилась в представление множе¬ ства срезов. Собранные (склеенные) на их основе пакеты должны представ¬ лять объёмное (трёхмерное) экранное пространство. В многочисленных сообщениях о достижениях в области «прозрачной электроники» пока нет ссылок на исчерпывающие научные публикации. Следует привести лишь факт результативности проводимых исследований. 16.5. Прямоугольное экранное пространство Современные плоские экраны используются с весьма ограниченным ракурсом. Поэтому мы и размещаем телевизор где-то в сторонке, в углу. Возможно, что и столь дорогое кубическое или прямоугольное экранное про¬ странство обречено на ограниченный угол обзора для создания должного впечатления. В этом случае прямоугольный трёхмерный экран также достоин размещения где-то в углу помещения (рис. 16.8). Рис. 16.8. Прямоугольный трёхмерный экран 302
Лекция 16. Основы трёхмерного «живого» моделирования Следует отметить, что экранное пространство образует некоторую сре¬ ду, в которой действуют законы оптики. Например, не оказывается ли демон¬ стрируемый объект погружённым в сосуд с жидкостью, подобно рыбке в ак¬ вариуме? Более того, возможно, что взгляд сбоку, со стороны торцов экранных плёнок, может встретиться с эффектом существенного отличия изображения от получаемого при взгляде спереди. Это также может ограничить применение экрана на основе пакета плоских плёнок. Однако его применение может быть вполне оправдано и да¬ же целесообразно в случае создания реагирующего объекта для интеллекту¬ ального отображения производственного процесса, предсказания погоды или социального напряжения, для сценических постановок. 16.6. Сферическое экранное пространство Даже при бытовом применении объёмного экрана возникает желание кругового обзора с одинаковым качеством изображения. Необходимо рас¬ смотреть возможность экранизации в сферической системе координат. В ней каждая точка характеризуется расстоянием г и двумя углами: азимутом (р и углом места Ѳ. Пересчёт из декартовой системы производится по формулам І~2 2 2 X „ .У г = ^х + у + z , (р = arctg—, О = arcsin—. Z г Применение сферической системы координат определяет форму объ¬ ёмного экрана: он становится полусферой (рис. 15.9). Центр системы коор¬ динат совпадает с центром основания прямоугольника. Однако важным отличием является то, что сами экранные плёнки должны быть сферическими. Вместо нарезки на Hz, становится актуальной нарезка на Лг. Центр полусферы также выродится в сферическую плёнку «на одну точку». В компьютерной модели трёхмерной памяти весь обозримый объём представляет собой прямоугольник, а, скорее всего, - куб. При преобразова¬ нии в сферическую систему координат возникает вопрос: вписать этот куб в полусферу или вписать полусферу в куб? В первом случае нет потери ин¬ формации, что важно, например, при отображении сценических действий. Однако при этом не используется существенная часть экранного простран¬ ства. Во втором случае теряется информация, но увеличивается масштаб представляемого объекта при его центральном размещении. Это важно при построении реагирующих объектов для интеллектуальных систем отображе¬ ния работы предприятий. 303
Глава 11. Нейросетевые методы управления Рис. 16.9. Сферический экран Заметим, что в первом случае «лишнюю» часть сферического экрана можно просто срезать. Получится экран - куб, со сферическим расположени¬ ем экранных плёнок, использующий сферическую систему координат. Тор¬ цевой эффект, если такой существует, будет значительно снижен. При круговом обзоре экранного пространства важно не допустить, что¬ бы свечение внешней поверхности экранной плёнки было видно с другой её стороны. Это испортило бы общее впечатление. По-видимому, следует зате¬ нять с другой стороны каждую светящуюся точку. Это может потребовать перемежения экранных и затеняющих плёнок или нанесения двух слоёв «прозрачной электроники» на каждую экранную плёнку. И то и другое, несомненно, будет отрицательно влиять на прозрачность и разрешающую способность сферического объёмного экрана. Теоретически возможно выполнение модели трёхмерной компьютер¬ ной памяти в сферической системе координат. Однако «математика» анима¬ ции представляется весьма сложной. Вряд ли это следует считать целесооб¬ разным. Ведь со временем экранные пространства, вбирающие лавинные до¬ 304
Лекция 16. Основы трёхмерного «живого» моделирования стижения нано-технологий, будут дешеветь. Да и в массовом применении вряд ли привычная сцена превратится в полусферу. Применение сферических экранных плёнок позволяет не только созда¬ вать экранные пространства для внешнего наблюдения, но и для «внутренне¬ го» расположения зрителей, для которых этот экран становится «внешним», как показано на рис. 16.10. Можно легко себе представить разнообразные применения такого экрана в области туризма и развлечений. Рис. 16.10. Внешнее экранное пространство 305
Глава 11. Нейросетевые методы управления 16.7. Цилиндрическое экранное пространство Технология изготовления сферического экрана представляется весьма сложной. Во многих случаях не только достаточен, но даже целесообразен лишь круговой обзор моделируемого объекта. В этом случае можно исполь¬ зовать цилиндрическую систему координат Orcph. Пересчет в неё из декарто¬ вой системы производится по формулам г = л/т2 + z2 , <р = arctg— ,h = у. z На рис. 16.11 показано примерное изображение кувшина (слева) в ци¬ линдрическом объёмном экране, составленном всего лишь из шести вложен¬ ных прозрачных мониторов. Попытка натурного воспроизведения с помо¬ щью плёнки натолкнулась на столь высокое замутнение, что шейка кувшина погрузилась в туман. Другая технология изготовления, например, с помощью плотно вложенных хрустальных цилиндров с наклеенными срезами изобра¬ жения на тончайшей бумаге, дорога и недоступна. Для возможности кругового обзора цилиндры-мониторы должны быть двусторонними - для показа «обратной» стороны некоторых элементов. Для исключения искажений при наложении двух разных изображений каждый слой должен содержать изображение только с одной стороны. Это учтено на рисунке некоторым разворотом кувшина так, чтобы показать внутренний вид достаточно «толстой» ручки. На рисунке слева пронумерованы разрезы, справа пронумерованы соответствующие им слои - цилиндры экрана. Рис. 16.11. Кувшин в цилиндрическом объёмном экране 306
Лекция 16. Основы трёхмерного «живого» моделирования Следует предположить возможность предельного перехода изображе¬ ния кувшина справа к изображению слева при «бесконечном» возрастании количества слоёв объёмного экрана. Достаточно большое количество слоёв должно обеспечить стерео эффект. 16.8. Вычислительные средства управления объёмным экраном Очевидно, что лишь высокопараллельная архитектура, подобная мозгу, может эффективно исполнять функции видео-нейрокомпьютера. Актуальна постановка задачи разработки специальной параллельной приставки к персо¬ нальному компьютеру (рабочей станции) - видео-нейрокомпьютера, «вре¬ занного» в современные популярные операционные системы. Наконец, ши¬ рокое привлечение сетевых технологий позволит создавать значительные распределённые сюжеты с коллективным участием многих взаимно влияю¬ щих «живых» объектов. Реализация трёхмерной памяти, при которой моделируемые объекты оказываются воплощёнными не с помощью своего математического образа, а пространственно, также ставит новые технические задачи. Одна из них за¬ ключается в отображении содержимого памяти в некоторой экранной трёх¬ мерной среде. Это явилось бы новым решением задачи формирования сте¬ реоизображений. Возникает проблема обеспечения высокой производитель¬ ности вычислительных средств, управляющих работой объёмного экрана. Ведь каждый слой управляется отдельным процессором. Процессоры рабо¬ тают синхронно (рис. 16.12), каждый обрабатывает свой срез изображения. То есть, процессоры выполняют копии одной программы, независимо обра¬ батывая свои данные. Такая обработка в многопроцессорной вычислительной системе (ВС) соответствует SPA^D-технологии, Single Program - Multiple Data [15]. Рис. 16.12. SPMD-технология в основе ВС, управляющей объёмным экраном 307
Глава 11. Нейросетевые методы управления Смежные процессоры обладают каналами быстрого обмена для обес¬ печения преемственности данных при движении объекта. 16.9. Возможность применения реагирующего объекта для прогноза погоды Работа реагирующего объекта, как и каждой управляющей системы, тактируется. Поведение объекта (например, танцора) делится на циклы, в те¬ чение которых он совершает действия и возвращается в некоторое состояние, адекватное ситуации. Поскольку ситуация динамически меняется, то и ука¬ занное состояние меняется. При программировании такое действо выражает¬ ся термином «цикл в цикле». Пусть визуальная, красивая и радостная система прогноза погоды, вы¬ ставленная на центральной площади населённого пункта, реализована в виде робота (рис. 16.13, слева) или с помощью объёмного цилиндрического экрана (на том же рисунке справа). Периодически, скажем, через каждые полчаса, из Гидрометцентра по¬ ступают уточнённые данные об ожидаемой погоде: температура, давление, влажность, направление и сила ветра, вероятность дождя, штормовое преду¬ преждение и пр. С помощью логической нейронной сети объекту указывают¬ ся его циклические действия, соответствующие сложившемуся вектору - си¬ туации. Например, при резкой смене ситуации он может даже на мгновение исчезнуть и появиться вновь в галошах и с зонтиком, он может вместе со срывающимся зонтиком поворачиваться и отклоняться, он может дрожать от холода и т.д. Цикл его действий может заканчиваться некоторым успокоени¬ ем для данной ситуации и начинаться вновь. Так - до нового уточнения дан¬ ных Гидрометцентра, по которым производится резкий или плавный переход к новым действиям. Видны значительные возможности объёмного экранирования по срав¬ нению с возможностями робототехники. Ведь робот может просто свалиться с пьедестала при попытке совершить столь сложные движения. Возникает вопрос об уточнении данных Гидрометцентра с требуемой частотой. Мы уже упоминали, что впечатляет та система дифференциальных и интегральных уравнений, которую необходимо оперативно решать. Здесь-то как раз и следует воспользоваться методом ассоциативных вычислений. Для большого количества векторов - значений факторов фак¬ торного пространства по точным алгоритмам рассчитываются вектора - ре¬ зультаты. Так для большого количества экспериментов создаётся база (опыт¬ ных) знаний, для активизации которой формируется логическая нейронная сеть. Рецепторный слой строится на основе ранее использованных значений факторов. Рецепторы связываются с нейронами единственного выходного слоя, реализуя отношения вида (известная ситуация) —» (известное реше- 308
Лекция 16. Основы трёхмерного «живого» моделирования ние). Связи могут обладать весами в соответствии со значимостью фактора или его значения, определяемой опытом эксплуатации. Рис. 16.13. Реагирующие объекты предупреждают об урагане с ливнем Выборка по логической нейронной сети производится ассоциативно (голосованием) с помощью рассмотренной выше несложной пороговой функ¬ ции активации. Результат определяется максимально возбудившимся нейро¬ ном, однако он может получаться на основе усреднения величины возбужде¬ ния нескольких нейронов. Задание текущей ситуации, т.е. достоверность вы¬ сказывания о принадлежности данных, на рецепторах для каждого фактора задаётся отдельно, обратно пропорциональным «расстоянию» распределени¬ ем единицы между двумя «близкими» рецепторами, как было указано ранее. Напомним, что логическая нейронная сеть представляется матрицей связей. Она легко расширяется, уточняется, модифицируется. Это делается вне рабочего режима - в автоматическом режиме самообучения, если суще¬ ствует обратная связь на основе оперативной оценки точности прогноза. Та¬ ким образом, в рабочем режиме прогнозирование производится с помощью «быстрых» ассоциативных вычислений по базе знаний, что может быть вполне достаточно для наглядного информирования населения. В заключение отметим, что приведённые рассуждения напоминают фантастический сюжет. Однако даже наивная фантастика всегда предшество¬ вала серьёзным разработкам. Фантастика ставит задачи. Их реальность осно¬ вана на текущем уровне знаний. Технология прозрачных мониторов и гибких прозрачных электронных схем подсказывает реализуемый, в сегодняшнем представлении, путь создания средств объёмного отображения. Предстоят 309
Глава 11. Нейросетевые методы управления ещё значительные усилия по достижению достаточной прозрачности пакета экранных плёнок, и объекты могут казаться, словно выплывающими из мра¬ ка. Не следует забывать о создаваемой при этом особой оптической среды со специфическими свойствами и т.д. Так что вполне возможно, что объёмный экран на основе пакета экран¬ ных плёнок может оказаться временным достижением. Временным, - до отк¬ рытия той среды, по координатам точек которой будут доставляться кванты энергии, несущие пиксели свечения. «Живое» моделирование - воссоздание объектов, адекватно реагиру¬ ющих на внешнее воздействие. Реагирующие объекты - объекты наглядного отображения ситуации, складывающейся в сложной управляющей, производственной, игровой и др. системе, способные своим поведением предупредить об угрозе или отклоне¬ нии производственного процесса от нормы и произвести первичную диагно¬ стику. Трёхмерная память - память компьютера, адресуемая тремя коорди¬ натами. Позволяет имитировать графически расположение моделируемого объекта в пространстве. «Мышцы» и «кости» - реализуют механизм воздействия и управле¬ ния, посредством преобразования координат точек объекта, при имитации деформаций и движения в трёхмерном пространстве. Прозрачный монитор - выполняется на основе «прозрачного» экрана с размещёнными на нём электронными схемами для отображения видимой части объектов. Эти схемы выполняются на основе нано-технологий так, что вне зоны видимого изображения экран остаётся прозрачным. Экранный пакет - формируется на базе наложения друг на друга про¬ зрачных экранных плёнок, каждая из которых отображает видимый срез де¬ монстрируемого объекта в трёхмерной памяти. В результате этого в толще пакета создаётся стереоэффект. Сферическая система координат - отражает координаты нахождения точки по расстоянию от центра и по двум углам - азимут и угол места. Цилиндрическая система координат - отражает координаты нахож¬ дения точки по расстоянию до оси вращения, по азимуту и высоте. 1. Большое количество показателей современных управляющих и про¬ изводственных систем затрудняет оперативный мониторинг, проводимый Ключевые термины Декартова система координат - отражает угол ; между осями. Краткие итоги 310
Лекция 16. Основы трёхмерного «живого» моделирования операторами-диспетчерами. Для снижения отрицательной роли человеческо¬ го фактора требуется создание автоматического посредника, осуществляю¬ щего своевременную реакцию на результаты контроля текущего состояния системы. Такая реакция может учитывать первичную диагностику. 2. Компьютерные технологии мониторинга требуют воплощения реа¬ гирующих объектов на базе графического «живого» моделирования. 3. Объёмное воплощение и отображение требуют преобразования ли¬ нейной адресуемой памяти компьютера в трёхмерное отображение. 4. Для объектов, размещённых в трёхмерной памяти, формируются «мышечные» и «костные» процедуры деформации и движения. Выполнение этих процедур сопрягается с органами управления вне моделируемого объек¬ та. 5. Управление трёхмерным объектом осуществляется с помощью логи¬ ческой нейронной сети. Она воспринимает «ситуацию» и преобразует её в приказы по параметризованному запуску процедур движения для адекватной реакции объекта. 6. На основе применения сферических пакетов экранных плёнок воз¬ можно создание объёмных экранов как для внешнего, так и для внутреннего расположения зрителя. Вопросы 1. Что понимается под термином «жизнь» в информационно-техничес¬ ком аспекте? 2. Как строится модель адресуемой трёхмерной памяти? 3. Каковы принципы построения трёхмерной графики в модели трёх¬ мерной памяти? 4. Как, на принципиальном уровне, формируются процедуры переме¬ щения точек в трёхмерной памяти, имитирующие деформации, движения и повороты? 5. Как логическая нейронная сеть осуществляет реагирование на теку¬ щие значения параметров сложной системы? Возможна ли при этом первич¬ ная диагностика? 6. Как осуществляется трёхмерная экранизация «живых» моделей на основе достижений «прозрачной» электроники? Лекция 17. Перспективные нейросетевые технологии Аннотация: Читателю предлагается пофантазировать и наметить для себя пути применения логических нейронных сетей в задачах обеспечения безопасности, защиты информации, в индустрии развлечений и др. 311
Глава 11. Нейросетевые методы управления Ключевые слова: Логические нейронные сети, служба безопасности, тестирование, человечек КОМП И, Сивилла-Прорицательница. — А теперь действовать, действовать и действовать! - сказал Остап, понизив голос до степени полной нелегальности. И.Ильф, Е.Петров. Двенадцать стульев. 17.1. Служба безопасности После долгого бдения и дележа средств в Международном Фонде Вос- помоществования Семьям Жертв Российской Науки Прошлого Века (МФВСЖРНПВ), утомлённый и удовлетворённый, Вы возвращаетесь среди ночи домой. Тихо, крадучись, Вы открываете дверь квартиры и включаете свет в прихожей. Но Вы совсем забыли о той встрече, которая ждёт Вас с Не¬ симпатичным Искусственным Существом (рис. 17.1), включённым в элек¬ тросеть и выставленным для охраны Ваших близких от непрошеных ночных гостей-грабителей! «Здравствуй, папа! — произносит мощный железный го¬ лос. — А почему у тебя на лице губная помада?!» Основой логической деятельности Существа, конечно же, является ней¬ росеть (хотя обработка видеовхода может оказаться гораздо сложнее). Представим себе многоуровневую нейросеть, первый логический уро¬ вень которой подбирает «словесный портрет» на основе признаков изобра¬ жения, поступившего на его экран. Не следует удивляться приёмам кримина¬ листики, в совершенстве овладевшей подходом к идентификации преступни¬ ка. В результате анализа, возможно, с двух точек — анфас и в профиль, на этом уровне может быть установлено: 1. волосы присутствуют, чёрные, шевелюра пышная, на 5 баллов; 2. лоб высокий, залысины есть, поперечные морщины есть; 3. брови густые, с разлётом, сросшиеся на переносице, №8; 4. нос орлиный, №4 и т.д. Конечно, баллы и номера не выставляются. Они означают только, ка¬ кой нейрон промежуточного выходного слоя возбудится максимально. Да и это нам знать ни к чему. Просто произойдёт какое-то распределение возбуж¬ дений между нейронами промежуточного выходного слоя той части нейросе¬ ти, что обучена распознаванию признаков. Возбуждение этих нейронов, как нейронов входного слоя второй части нейросети, второго логического уров¬ ня, должно в результате обучения привести к существенному отличию «па¬ пы» от «слесаря дяди Юры», приходившего днём проверить не текущий кран. То есть, должно привести к идентификации — кто это (или это «свой», или «чужой»). Можно предусмотреть и побочные признаки: чрезмерно крас¬ ный нос, подозрительные красные пятна на овале лица вне носа и др. При формировании составного ответа голосом (на третьем логическом уровне?) могут быть учтены и эти дополнительные признаки, как это мы и предполо¬ жили вначале. 312
Лекция 17. Перспективные нейросетевые технологии Рис. 17.1. Охрана 17.2. Парк фантасмагорий Представим себе парк развлечений, в который мы заходим, желательно, — группой под руководством гида-экскурсовода. Намотавшись по аттракци¬ онам и желая, наконец, протянуть отёкшие ноги, мы вступаем (по приглаше- 313
Глава 11. Нейросетевые методы управления нию коварного гида!) в дивный тенисто-прохладный, ласково журчащий уго¬ лок с причудливым ландшафтом. И вдруг!.. ... Выползают (рис. 17.2) из-за трепещущих кустов и камней монстры- крокодилы, вздымаются головы ящеров и тянутся к нам. Лохматый неандер¬ талец ладит каменное орудие, привязанное жилой к сучковатой палке. Поды¬ мается на свои курьи лапы избушка. Гигантской головой оживает скала, покрытая нежными незабудками. Деревья и кусты трясут ветками — радуясь или возмущаясь. Фонтаны воды преследуют нас... Наше замешательство, паническое движение вызывают ответную реакцию: «население» смеётся, сердится, радуется, угрожает. Явно проявляются симпатии и антипатии... Рассмотрим возможный принцип действия отдельного «объекта» (рис. 17.3). Объект контролирует сектор обзора. Электронно-оптическое устрой¬ ство «зрения» может быть не обязательно расположено в глазах, а упрятано в более неподвижных «органах», например, на груди. Весь сектор обзора разбит на элементарные сегменты, образованные телесными углами в 1 - 2 градуса. До последующих усовершенствований, первоначально, должна быть предусмотрена реакция только на преобладающий цвет в элементарном сег¬ менте обзора, на это — «Каждый Охотник Желает Знать, Где Сидят Фазаны». Например, красный цвет должен приводить к запуску комплекса программ обращения в ярость и к повторному обзору строки, чтобы усилить эту ярость при последующем раздражении. (— Женщина в красной кофте! Отойдите от крокодила немедленно!..) Жёлтый цвет может вызывать кокетство и эротическое возбуждение. Зелёный — умиротворение. Коричневый — ритмичный шаг и салютование головой. Голубой — благочинное умиление с возведёнными глазами и т.д. Обзор сегментов совершается по строкам, с частотой обзора, согласу¬ ющейся со скоростью обработки компьютером. Эта обработка обусловлена прохождением входного сигнала через нейросеть и различной степенью воз¬ буждения нейронов выходного слоя, запуском программ движения, связан¬ ных с нейронами выходного слоя, — с параметрами, определяемыми величи¬ нами возбуждения, инерционностью такой сложной системы. Итого, из каких элементарных движений складывается поведение объ¬ екта? Расширение-сужение глаз, открывание-закрывание рта, растягивание его в улыбку, покачивание головы, поднятие-опускание рук (если они есть), угрожающий шаг ноги (если вес позволяет), вертикальное-горизонтальное помахивание хвостом, привлекающее движение тазобедренным суставом и др. 314
sie ппсіогѵіѵэѵшнѵф xdvjj 'Z'£ [ 'эщ nmoiroHXdiu дічээшдэосіпдн эічнтітэиэсідц -ц нпітэц'
Глава II Нейросетевые методы управления В квадрате (4.2) преобладание красного Квадрат (4.3) Добавить в свирепость: Квадрат (4.2) Квадрат (2.4) г Убрать из сви-*\. репости, добавить ѵ в кокетство У квадрате (2.3) преобладание розового Добавить s' радость, веселье, I приветствие \ В квадрате ^ (4.3) преобла¬ дание голубого Добавить в умиление В квадрате (2.4) преобладание в ) иие Добавить в умиротворение Рис. 17.3. Действия «объекта» D одном такте могут запускаться несколько программ, инициирующих движения «от текущего» состояния. Это должно имитировать суммарную сложную реакцию на ситуацию в секторе обзора с его изменением, обеспечи¬ вать её непредсказуемость, неожиданность и восторг публики. А если пред¬ ставить себе, что таким свойством реакции наделены деревья, скалы, воды и ветры, то такой фантасмагорический фейерверк получится!.. 17.3. Компьютерный человечек КОМПИ Представим себе отрока, поздним утром вставшего в солнечный день весенних каникул и, слегка протерев заспанные глаза, уже включающего компьютер. В «окне» появляется милая, упитанная мордашка (рис. 17.4). Тут же, в углу экрана, «мышкой» или «джойстиком» наш «хорошист» с английским уклоном не очень твёрдо, но вполне узнаваемо, рисует ананас. Мордашка, в которой мы узнаём КОМПИ — популярного (пока неизвестного) героя ком¬ пьютерного монитора, приходит в неописуемый восторг и радость. Все мышцы его лица, ведающие мимикой и жестами соответствующего мораль¬ но-психологического состояния, приходят в движение. Тогда наш юный джентльмен стирает рисунок. КОМПИ постепенно успокаивается, приходя в состояние недоумённого ожидания. И вот, после некоторых размышлений, художник изображает ... велосипед. «Что это такое?» — вопрошает КОМПИ. 316
Лекция 17. Перспективные нейросетевые технологии Рис. 17.4. КОМПИ «Это — велосипед, на нём катаются», — следует ответ. Дальнейшая пауза свидетельствует о том, что происходит обучение нейросети. Ситуация, которая введена на нейроны входного слоя, образую¬ щие экран для рисования, связывается с нейроном выходного слоя. Этот нейрон будет теперь соответствовать эталону — велосипеду. Этот же нейрон, в свою очередь, должен определить возбуждение нейрона, ведающего дей¬ ствием «то, на чём катаются». Запускаются программы, имитирующие дей¬ ствия КОМПИ, и он неуклюже, конечно же, неправильно и смешно, — как его учили, например, обращаться с осликом, - подминает под себя копию введённого изображения — велосипед. Возникает потребность расширения возможности игры, введя специ¬ альные программы имитации красивого велосипеда (распознанного по коря¬ вому эталону) и всех действий КОМПИ по езде на нём. 317
Глава 11. Нейросетевые методы управления 17.4. Диагностика Представляется, что диагностика - самое прямое назначение рассмат¬ риваемых логических нейросетей. Действительно, именно в этой области не¬ посредственно проявляется принцип логического мышления на основе при¬ чинно-следственных связей вида «если - то». Это относится как к техническим, так и к медицинским системам. Бо¬ лее того, практически всегда отсутствующая полнота информации, зачастую её противоречивость, нечёткость проявлений, «зашумлённость», приводят к актуальности принципа ассоциативного мышления, основанного на опыте коллектива экспертов (в медицине - консилиума). В Лекции 13 и в [16] достаточно полно рассмотрена медицинская ин¬ формационно-справочная система. Однако некоторые дополнения с точки зрения обобщения и развития следует произвести. Рассмотрим фрагмент проекта системы диагностики (рис. 17.5). Рецепторный слой отображает жалобы больного, симптомы и результа¬ ты анализов. Нейроны выходного слоя связаны с высказываниями (текста¬ ми), определяющими диагноз или рекомендации дальнейших действий по его уточнению. 318
Лекция 17. Перспективные нейросетевые технологии Рассмотрим жалобу {болит голова, болит живот, болит левый указа¬ тельный пальчик). По-видимому, этой информации недостаточно для вынесения пригово¬ ра. Должны быть рекомендованы дальнейшие действия медицинского персо¬ нала по уточнению диагноза. Такие действия связаны с максимальным воз¬ буждением нейронов выходного слоя из области рекомендаций. При выпол¬ нении этих рекомендаций, т.е. при возбуждении рецепторов, их отображаю¬ щих (например, рецепторов, соответствующих результатам анализа мочи), использованное возбуждение нейронов выходного слоя, выдавших рекомен¬ дации, снижается с помощью связей с отрицательными весами. Таким обра¬ зом, реализуется стратегия поиска диагноза. Окончательный диагноз опреде¬ ляется тогда, когда максимально возбудится нейрон выходного слоя из соот¬ ветствующей области. Данный пример свидетельствует о той грандиозной и только коллек¬ тивной, технически оснащённой глубине познаний человечества, воплощён¬ ной в столь несложной обученной нейронной сети. 17.5. Тестирование в сфере образовательных услуг Работникам высшего образования хорошо известны насущные пробле¬ мы в условиях их деятельности: - общественно низкая значимость труда, выражающаяся в презритель¬ ной кличке «бюджетник»; - отсутствие непосредственного влияния уровня образования на надеж¬ ды, связанные с будущим жизненным успехом студента; - профанация идеи платного образования, поставившего преподавателя в зависимость от милости студента-«платника» (рис. 17.6); - предельное повышение нагрузки и т.д. и т.п. В этих условиях «головная боль» не покидает несчастного преподава¬ теля весь день такой его благородной, творческой и гуманистической дея¬ тельности. Понимая преходящий характер исторических трудностей, мы спешим на помощь. Мы хотим хоть как-то снизить психологическую нагрузку доцен- та-профессора, дать ему простой и ясный механизм для формализованного, единственно верного принятия разнообразных решений. Помочь хотя бы при проведении тестирования, в том числе — в период экзаменационной сессии. Ограничим факторное пространство для создания базы знаний следу¬ ющими исчерпывающими множествами событий: А = { список студентов группы}; В = {студент-«бюджетник», студент-«целевик», студент-«плат- ник»}; С = {множество тестов, упорядоченных по невозрастанию сложно¬ сти) 319
Глава 11. Нейросетевые методы управления Рис. 17.6. В защиту платного образования D = {множество баллов, полученных студентами при предыдущем тестировании (по списку)}. 320
Лекция 17. Перспективные нейросетевые технологии Сформируем множество принимаемых решений в процессе тестирова¬ ния студента: • Какой по сложности тест предложить студенту (в заданной точке факторного пространства) первым? • Что делать, если он: а) ответил правильно, б) ответил неправильно? Какую стратегию опроса продолжать далее? Здесь три возможности: а) закончить тестирование; б) продолжить тестирование в сторону повышения сложности тестов; в) продолжить тестирование в сторону понижения трудности тестов. • Какая оценка должна быть зафиксирована в зависимости от обраба¬ тываемой точки факторного пространства и от результата тестирования? Представляется, что адекватная логическая нейронная сеть является однослойной. Однако длительный процесс тестирования диктует необходи¬ мость обратных связей (подобно системе диагностики). Действительно, если Вы нечаянно задали студенту-«платнику» трудный тест, Вам на это необхо¬ димо мягко, но непреклонно указать. Система может с помощью обратной связи снизить допустимую сложность теста на входе, потребовать смены те¬ ста. Аналогично, в этом же случае она должна ограничить Ваше рьяное стремление докопаться до истины и оценить знания по заслугам. Несомненно, стратегия тестирования успевающего студента должна отличаться от стратегии тестирования «середнячка». И т.д., и т.д. Как видим, подобная СПР не только позволяет скрыть за формальной оболочкой наши вынужденные неправедные действия, но и значительно под¬ нять настроение философским отношением к действительности. 17.6. Печать рукописи Ясно, что только ассоциативное мышление способно восстановить ру¬ кописный текст. Поэтому автоматизация воспроизведения написанного явля¬ ется актуальной задачей. В первом классе обращается внимание на «признаковое» определение букв: а — кружочек с палочкой справа, заканчивающейся хвостиком вправо, б — кружочек с хвостиком сверху, вверх и вправо, ц — палочка с хвостиком вправо, к нему примыкает палочка, а к ней, справа внизу, странный специфи¬ ческий крючок, позволяющий сказать: «что-то странное, но обязательно су¬ ществующее», и т.д. Представим себе «окно просмотра», сканирующее текст (рис. 17.7). Оно «наложено» на входной слой нейросети. Связи нейронов входного слоя — рецепторов соединяют их (скорее всего, на следующем же слое) с нейронами промежуточного выходного слоя, закреплёнными за признаками. Это соединение выполнено так, чтобы «захватить» случайно (в зависимости от почерка) отклонённую от эталона (в букваре) букву и выявить в ней от¬ 321
Глава 11. Нейросетевые методы управления дельные признаки. Комбинации выявленных признаков на следующем (сле¬ дующих) выходном слое окончательно определяет распознаваемую букву. Нейрон,! о твечающий букву "б" Нейрон, отвечающий за "хвостик вверх и вправо Нейрон, отвечающий за "кружок” Рис. 17.7. Распознавание буквы по признакам Возможно, что при наложении очередной буквы, ожидаемой в сложной вязи письма, нам понадобится процедура разглядывания: увеличение-умень¬ шение, наклон влево-вправо, — до тех пор, пока при некоторой фиксации об¬ раза не начнётся их действительное распознавание. Поэтому, в дополнение к попытке «захвата», изображение располагается в «окне просмотра» так, что его «центр тяжести» совмещается с центром окна. Далее, изображение растя¬ гивается или сжимается, наклоняется влево или вправо так, чтобы макси¬ мально совпасть по размеру и углу наклона с размером и углом наклона эта¬ лонов, подававшихся в процессе обучения. Для выявления всех признаков и их относительного положения «окно просмотра» необходимо разбить на сектора, определяющие понятия слева, справа, вверху, внизу, внизу справа и т.д. Определённую трудность представляют пропуски и пробелы. Поэтому целесообразно наряду с позитивным изображением элементов букв анализи¬ ровать их негативное изображение. Тогда пустота в соответствии с эталоном будет «кричать» о себе, возбуждать рецепторы, обретёт активность. Конечно, распознавания одних лишь букв недостаточно. Не поняв ни¬ чего на уровне разглядывания букв, мы поднимаемся на уровень распознава¬ ния слов, включаем в работу контекст. Только таким комплексным методом 322
Лекция 17. Перспективные нейросетевые технологии мы восстанавливаем смысл написанного, и это сулит неограниченные воз¬ можности развития и совершенствования нейросетевой технологии прочте¬ ния. 17.7. Экстренное торможение локомотива На прямолинейном участке движения (а именно здесь скорость макси¬ мальна!) локомотив «видит» перед собой одну и ту же картинку: сходящиеся в бесконечности рельсы. Всякое нарушение этого однообразия требует если не экстренного торможения, то хотя бы снижения скорости. Если на пути возникает преграда, то картинка напоминает букву А. При этом задача облегчается тем, что картинка строго привязана в простран¬ стве, буква А отцентрирована и отмасштабирована, т.е. фокусировка уже произведена. Представим себе некоторый экран (рис. 17.8), образованный рецепто¬ рами нейронной сети, подобно рассмотренной выше задаче распознавания текста. Рецепторы, возбуждение которых необходимо выделить, связаны с нейроном выходного слоя. Функция активации основана на простом голосо¬ вании: величины возбуждения складываются, и если образующаяся сумма превышает порог, формируется сигнал тревоги, по которому включается тормозная система. Принцип крайне прост, однако упирается в хорошее «зрение». Требу¬ ется обеспечение высокой контрастности изображения как рельсов, так и препятствия. Что, если препятствие настолько светлое, что значение возбуж¬ дения выходного нейрона, наоборот, снижается? Следует поставить «ловуш¬ ки» как для превышения суммарного сигнала, так и для низкого значения этого сигнала, т.е. ввести два порога, что может быть учтено при выборе функции активации. Видимая картинка разбивается на области «захвата», в которых пред¬ полагается нахождение интересующего объекта. Это используется для анали¬ за сигналов семафора, для детального распознавания типа препятствия, для обслуживания поворота и т.д. Области захвата должны быть достаточно «тесными», в идеале включающими, например, только рельсы с незначитель¬ ным отклонением. 323
Глава 11. Нейросетевые методы управления Область захвата семафора Зелёный Красный захвата препятствия Рис. 17.8. Система экстренного торможения 17.8. Интеллектуальное протезирование конечностей Наряду с использованием сигналов от живых мышц культи, привлекает внимание идея использования сигналов, приходящих от головного мозга. Распознавание этих сигналов на усечённых нервных окончаниях и их преоб¬ разование в команды адекватного движения искусственных механизмов сле¬ дует считать главной задачей интеллектуального протезирования. При этом сам протез реализует недостающую часть тела: он является как косметиче¬ ским, так и функциональным дополнением, а не роботом, управляемым на расстоянии. Ниже разрабатываются предположения о возможности примене¬ 324
Лекция 17. Перспективные нейросетевые технологии ния искусственных логических нейронных сетей для реализации ограничен¬ ного автономного управления протезом по усиленной (при необходимости) совокупности сигналов, образующихся на нервных окончаниях культи. Однако на деле следует предположить нарушение управляющих связей, искажение той картины управляющих воздействий, которая способна привес¬ ти к адекватному сценарию действий протеза. Ведь не следует забывать о, в основном, травматическом происхождении проблемы. В головном мозге пре¬ дусмотрена достаточная избыточность: повреждение целых областей мозга после длительных тренировок приводит к нахождению обходных путей расп¬ ространения возбуждений и даже к новому формированию логических связей с помощью здоровых нейронов. В конечностях такое резервирование отсутст¬ вует. Ведь нервы, ведущие к органу тела, являются аксонами некоторых ней¬ ронов, находящихся в головном мозге. Конечности не располагают средст¬ вами автономного управления, т.е. не располагают фрагментами нейронной сети. Таким образом, следует исходить из того, что усечённые нервные окон¬ чания обеспечивают нечёткие исходные данные, которые требуют расшиф¬ ровки для адекватного реагирования протеза. Необходима интеллектуализа¬ ция протеза, протез следует обучить адекватному восприятию искажённых управляющих сигналов. То есть, протез должен обладать интеллектуальными средствами автономного управления. С другой стороны, человек в результате длительных тренировок и само¬ обучения также должен приспособиться к управлению протезом. Напомним, что нейрон, или нейроподобный элемент, независимо от технологии воплощения, является прибором, выполняющим пороговую функ¬ цию активации вида Г к і если это значение не ниже h, О в противном случае. Здесь V - значение возбуждения нейрона, Ѵі - значение возбуждения рецептора, связанного с данным нейроном и пришедшее на его /-й вход, ап - вес /-Й связи (/-го входа), К - количество связей (входов) нейрона, h - порог (выбирается экспериментально, для устранения излишней «нервозности»). Нейроны, как и вся ЛНС, могут быть реализованы как аппаратно, так и программно. Второй вариант предпочтителен, так как может базироваться на применении встроенного нейрокомпьютера, роль которого может выполнять любой достаточно миниатюрный сигнальный микропроцессор, используе¬ мый в бытовой технике. Кроме того, программная реализация нейросети 325
Глава 11. Нейросетевые методы управления позволяет без ограничений производить переобучение, развитие, оператив¬ ный экспериментальный и индивидуальный подбор связей и других парамет¬ ров. Веса Рис. 17.9. Примерный вио логический нейронной сети для протеза кисти руки При программном исполнении нейрону соответствует стандартная про¬ цедура, выполняющая функцию активации, а связи нейронов с рецепторами отражаются в рассмотренной ниже матрице следования, что способствует ма¬ лой сложности и высокой скорости расчётов значений возбуждения нейронов. На рис. 17.9 представлен примерный вид ЛНС для протеза кисти руки. На рецепторный слой ЛНС должны подаваться сигналы с сохранивших¬ ся «живых» нервных окончаний культи. При необходимости, эти сигналы должны быть усилены (вряд ли ослаблены). Веса {си}, определяющие степень участия каждого нерва в совершении конкретного движения, определяются 326
Лекция 17. Перспективные нейросетевые технологии экспериментально. При этом нулевое значение связи указывает на разрыв ис¬ пытываемой связи рецептора с нейроном. (На рисунке веса не распределены по стрелкам, а выделены в одно не индексируемое множество.) Связи рецепторов с нейронами на рисунке показаны условно. Они вы¬ бираются во многом индивидуально в соответствии с влиянием возбуждения рецептора на требуемую реакцию. Например, - как частично показано на ри¬ сунке. Так строится обученная ЛНС. Одновременное использование одним нейроном значений возбуждения нескольких рецепторов позволяет осуществлять результирующий комплекс движений, подобно «живому» управлению. В то же время, должна быть пре¬ дусмотрена возможность «комплексного» приказа: «захват карандаша», «зах¬ ват молотка» и др. Напомним, что в «живой» нейронной сети - мозге - функция актива¬ ции, подобная математической модели, реализуется биохимически па основе примерно 240 химических реакций. Веса связей реализуются с помощью си¬ напсов, по сути представляющих собой переменные сопротивления. Синапсы на стыках разделяют ветви аксонов (здесь - выходы нейронов-рецепторов, возбуждаемых извне) и дендриты (входы) нейронов, принимающих возбуж¬ дение соответствующих рецепторов. Их значение устанавливается в резуль¬ тате обучения, для направленного прохождения сигналов в сети. Поэтому связи между нейронами называются синапсическими. В результате обучения, вследствие направленного распространения сигналов на основе попутной «подкрутки» синапсов, образуются связки-отношения вида «посылка - следс¬ твие», «если - то». Эти отношения являются основой мышления человека, реализуя жизненные функции ассоциативной памяти, логического вывода, распознавания, принятия решений и управления движением органов. Необходимо помнить, что функционирование человека и его мозга, как и всякой системы автоматического управления, тактируется. Импульсы-сиг¬ налы, например, для сокращения мышцы, вырабатываются в каждом такте (уставшая мышца дрожит). Это и позволяет динамически, во времени, менять поведение. Для микропрограммного выполнения достаточно несложных расчётов, матрица связей ЛНС исчерпывающим образом представляется таблицей (табл. 17.1). В приведённой таблице отражены связи в логической нейронной сети на рис. 17.9. Возбуждение каждого нейрона (значение функции активации) находит¬ ся в результате скалярного умножения строки возбуждения рецепторов на строку, определяющую соответствующее (этому нейрону) движение. Резуль¬ тат делится на сумму весов в данной строке и корректируется при сравнении с порогом. 327
Глава 11. Нейросетевые методы управления ТаблицаП.І. Матрица связей однослойной логической нейронной сети Рецепто¬ ры 1 2 пг Значения возбуждения рецепторов нервами Ѵі ѵ2 Ѵт Движение 1 Сд (i-и) Од (2—>і) Движение 2 Сд (1-»2) Од (2—>2) Од (/я—>2) Движение п Сд (//!—» и) Значение возбуждения нейрона является значением параметра, опреде¬ ляющего силу или интенсивность выполнения соответствующего движения в совокупности или одновременно с другими движениями протеза. Т.е. «физи¬ ческий смысл» каждого параметра заключается в коэффициенте усилия, с ко¬ торым действует данное движение. Ведь каждое сложное, составное движе¬ ние определяется совокупностью сигналов на сокращение определённых мышц с разной силой. В случае протеза - на усилия определённых тяг, про¬ порциональные уровню сигнала. По множеству усилий отдельных решений складывается составное движение как результат композиции принимаемых решений. Адекватность движений регулируется экспериментальным подбо¬ ром связей он Возможная компоновка интеллектуального протеза кисти руки показа¬ на на рис. 17.10. На этом этапе не рассматривается возможность обратной связи, т.е. передачи в мозг дактильных сигналов. Поэтому основными эле¬ ментами управления являются: датчик сигналов нервных окончаний, нейро¬ компьютер, блок питания и дисплей, используемый для настройки и кон¬ троля работы протеза. Предполагается, что кристалл микропроцессора обладает достаточным объёмом сверхоперативной памяти, необходимой для микропрограммирова¬ ния. Работа с дисплеем может производиться с помощью «мышки». Механи¬ ческая часть протеза комплексно отрабатывает команды нейронной сети, по¬ ступившие в такте управления в соответствии со значением их параметров. Существуют сигнальные микропроцессорные вычислительные систе¬ мы, где на одном кристалле выполнены несколько параллельно работающих процессоров. Там же расположена и сверхоперативная память достаточного объёма. Тогда обработка логической нейронной сети может распараллели¬ ваться, подобно работе мозга, что резко увеличивает её быстродействие. 328
Лекция 17. Перспективные нейросетевые технологии Механика Приёмник-усилитель сигналов Манжета Нейрокомпьютер и блок питания Рис. 17.10. Возможная компоновка интеллектуального протеза кисти руки 17.9. Сивилла-прорицательница В век всеобщей информатизации мы, нетерпеливо пропуская конкрети¬ ку и детали, жадно ловим правду «между строк», ассоциативно формируя предвидение и прогноз: что будет с нами завтра, каковы тенденции и что предпринять? Формализация обработки огромных потоков информации, в основном, в СМИ (а это — оперативная информация), всё более привлекает специали¬ стов по прогнозу. Здесь огромные возможности для шарлатанов, и кажется удивительным, как незамеченными остаются «прогнозы» авторитетных, не сходящих с телеэкрана, «предсказателей», данные ими несколько лет назад и не заставляющие их покраснеть сегодня. Основой прогнозирования является состав и частота появления слов и выражений, характеризующих политический этап или целый исторический период. Далее следует анализ исторического опыта, определяющий, к чему это приводило в прошлом и к чему может привести впредь... ... История помнит замечательные, навязчиво мелькающие, «новые» слова и выражения. Например, — «конвергенция», выражающее сомнение и крах режима, «интернациональный долг» — саморазрушающая агрессия, «консенсус» — псевдодемократический, криминальный обвал, «экстради¬ ция» — мировой процесс очистительной ловли тараканов, «суверенитет» — 329
Глава II Нейросетевые методы управления самостоятельный выход из окружения. А что дальше? - говорят слова «нар¬ комания», «терроризм», «сепаратизм», «курс доллара», «приватизация», «прожиточный минимум», «коррупция», «кризис», «Олимпиада», «санкции» ит.д. ...Или массового исхода на Канар¬ ские острова Рис. 17.11. Предвидение Комбинации и частота следования слов (рис. 17.11), а также зависи¬ мость этих показателей от времени, образовывали критическую массу для неотвратимой цепной реакции... Ключевые термины Служба безопасности (здесь) - средство надзора за моральной чисто¬ той семейных отношений. 330
Лекция 17. Перспективные нейросетевые технологии Парк фантасмагорий - парк развлечений, наполненный объектами «живого» натурного моделирования. компи - детский компьютерный игровой объект «живого» модели¬ рования, допускающий диалог. Диагностика - установление места неисправности в технике или уста¬ новление диагноза болезни. Тестирование - действия по выявлению уровня знаний в процессе диалога «учитель - ученик». Прорицание - судьбоносное предсказание на основе изучения теку¬ щей частоты использования слов в средствах массовой информации. Краткие итоги 1. Приведённые соображения по созданию систем принятия решений различного применения иллюстрируют универсальность подхода к построе¬ нию логических нейронных сетей. 2. Как можно установить на основе попыток реализации идей, доста¬ точными для их воплощения являются однослойные логические нейронные сети, даже в случае необходимости обратных связей. Вопросы 1. Как реализуются идеи «живого» моделирования при организации службы безопасности? 2. Какие фантазии обуревают нас при получении заказа (а главное, - средств) на создание в пойме Москвы-реки Парка Фантасмагорий - для раз¬ вития туристического бизнеса и развлекательной индустрии? 3. Какие идеи лежат в основе создания лучшего друга детей - компью¬ терного человечка КОМПИ? 4. Как на основе логических нейронных сетей реализуется техническая и медицинская диагностика? 5. Как промежуточные результаты тестирования влияют на его про¬ должение? 6. Какие идеи лежат в основе распознавания рукописного (нечёткого) текста? 7. Как работает система экстренного торможения локомотива на базе логической нейронной сети? 8. Какие идеи лежат в основе интеллектуального протезирования ко¬ нечностей? 9. Как осуществляется предвидение по частоте вхождения в тексты определённых слов и на основе исторического опыта? 331
ЗАКЛЮЧЕНИЕ Человек стремится каким-то адекватным способом создать в себе про¬ стую и ясную картину мира; и не только для того, чтобы преодолеть мир, в котором он живёт, но и для того, чтобы в известной мере попытаться заме¬ нить этот мир созданной им картиной. A. Эйнштейн. К 60-летию Макса Планка На тело, погружённое в жидкость, действует сила, равная весу вытес¬ ненной жидкости. Закон Архимеда Говорил, ломая руки, Краснобай и баламут Про бессилие науки Перед тайною Бермуд... B. Высоцкий. Письмо в редакцию телевизионной передачи «Очевидное - невероятное» из сумасшедшего дома с Канатчиковой дачи Мы осторожно погружаемся в проблемы интеллекта, чувствуя, что пы¬ таемся «объять необъятное», созданное «по образу и подобию»... Мы ссыла¬ емся на авторитеты, словно перекладывая на них вину... Существует философско-математическое определение: «Бог есть Оли¬ цетворённая Бесконечность Непознанного!» Из этого следует: «На всякий случай поступай праведно - ведь мы ни¬ чего не знаем!» И хотя ни один негодяй не ушёл от суда истории, это всего лишь гипотеза на пути недостижимого установления истинности тезиса «Правда всегда побеждает!» Ещё недавно мы наслаждались загадками Бермудского Треугольника. Теперь каждый школьник знает, что облако сланцевого газа, прорываясь со дна океана, способно не только погубить экономику слаборазвитой страны, но, растворяясь в воде и вторгаясь в атмосферу, - потопить корабль или взо¬ рвать двигатель самолёта. А потому, долой мистические страхи! Там не убудет! И если воссо¬ здать технически аппарат мышления (вот он, действует! и даже легко пощу¬ пать!), то его можно будет наполнять и наполнять до бесконечности... Надо только начать!.. 332
ОБЩИЙ ГЛОССАРИЙ Исчерпывающее множество событий - образуют события, объеди¬ нённые по смыслу так, что сумма вероятностей их наступления равна едини¬ це. Дерево логических возможностей - формируется на основе компози¬ ции исчерпывающих множеств событий. Позволяет упорядочить эти множе¬ ства на основе последовательного ввода их в рассмотрение при предположе¬ нии о выполнении ранее рассмотренных. Применяется при изучении вариан¬ тов совместного выполнения событий. Факторное пространство событий - образуется всеми рассматривае¬ мыми исчерпывающими множествами событий. Достоверность высказываний о событиях - предполагаемая вероят¬ ность наступления события. Ассоциативное мышление - выбор эталона, на который более всего похож исследуемый объект. Часто этот выбор производится методом усред¬ нения о нескольких эталонах, на которые этот объект похож с некоторыми весами. Размножение решений - результат разбиения логического выражения на отдельные конъюнкции (до того объединённые операцией дизъюнкции), определяющие одно и то же решение. Однослойная логическая нейронная сеть - отображает только связи вида (конъюнкция высказываний о событиях) —» (решение). Силлогистика (Аристотеля) - одна из первых наук о законах логиче¬ ского мышления человека. Сущность - объект высказывания. Дедукция - рассуждения от общего к частному. Индукция - рассуждения от частному к общему. Гипотеза - индуктивный вывод, достоверность которого подлежит подтверждению практикой. Базовые высказывания (в силлогистике) - высказывания по схеме, использующие кванторы всякий и некоторый; представляют восемь аксиом. Жергоновые отношения - теоретико-множественная интерпретация базовых высказываний в силлогистике. Законы силлогистики - закон тождества, закон противоречия, закон исключённого третьего. Силлогизм (Аристотеля) - вывод, который можно сделать на основа¬ нии истинности двух посылок. Модус - один из четырёх типов силлогизма. Софистика - наука о ведении спора, при котором необходимо убедить оппонента любыми средствами, несмотря на истинность или ложность ис¬ ходной посылки или промежуточных выводов. 333
Общий глоссарий Совершенная дизъюнктивная нормальная форма - каноническое представление логической функции в виде дизъюнкции конъюнкций; в каж¬ дой конъюнкции представлены все булевы переменные, где во всех комбина¬ циях часть из них входит со знаком отрицания, а остальные - без этого знака. Конъюнкция присутствует в формуле только в том случае, если логическая функция от соответствующей комбинации переменных и их отрицаний имеет значение 1 (ИСТИНА). Тождественная истинность высказывания - равенство 1 при всех возможных наборов значений переменных. Аксиомы (правила вывода) - полный и непротиворечивый набор простейших тождественно истинных формул, позволяющих производить эк¬ вивалентные преобразования. Содержательный подход к определению тождественно истинных вы¬ сказываний основан на переборе значений всех переменных. Формальный подход к определению тождественно истинных выска¬ зываний основан на формальном преобразовании исходной формулы на ос¬ нове аксиом - к приведению её к значению 1 (ИСТИНА). Предикат - логическая функция, заданная на предметной области. Квантор общности (V) - аналогичен высказыванию «для всех х ис¬ тинно Р(х)». Квантор существования (3) - аналогичен высказыванию «существует х, для которого истинно Р(х)». Узкое исчисление предикатов - допускает использование кванторами лишь предметных переменных. Исчисление предикатов второй ступени - допускает применение предикатных кванторов. Коллизия переменных - возникает тогда, когда в разных логических функциях, участвующих в сложной формуле, используются одни и те же обозначения общих предметных переменных. Выполнимая формула - та, для которой может быть определена предметная область и уточнены смысловые значения предикатов. Предварённая форма - получается в результате эквивалентных пре¬ образований формулы, где кванторы сосредоточены в начале записи. Нормальная форма Сколема - отличается от предварённой формы тем дополнением, что все кванторы существования предшествуют всем кван¬ торам общности. Дерево вывода - схема последовательного доказательства истинности цепочки рассуждений, ведущая к истинному заключению. Логическая сеть - как и дерево вывода, определяет логическую взаи¬ мосвязь частных утверждений для нахождения пути доказательства истинно¬ сти утверждения, соответствующего целевой вершине. Эмпирическая истина - истинность высказывания, определённая опытным путём. 334
Общий глоссарий Теоретическая истина - доказывается аналитически эквивалентными преобразованиями формулы для приведения её к тождественно истинной. ДСМ-метод - признанный и сегодня метод индуктивного мышления Д.С. Милля. Нечёткое множество - множество, составленное из элементов, входя¬ щих в него с некоторой степенью уверенности (вероятности). База знаний - база данных, обладающая возможностью логического вывода. Продукция - процедура, реализующая предикат вида «если - то». Продукционная система - композиция продукций. Фронт готовых продукций - образуют продукции, для которых удо¬ влетворяются условия выполнения. Метапродукции - продукции, управляющие выполнением других продукций, погружённых в них. Семантическая сеть - связывает вершины, соответствующие смысло¬ вым объектам, с их отношениями. Аргументация - поиск тех фактов, из которых вытекает данный факт и которые могут обосновать проявление интересующего нас факта. Часто выражается в споре, в котором одна из сторон пытается изменить систему аксиом у собеседника. Нейрон (нейроподобный элемент) - электронное, биохимическое или программное средство выполнения функции активации. Функция активации нейрона - монотонно возрастающая по каждому переменному, в области преодоления порога, пороговая функция возбужде¬ ния нейрона. Переменные - величины возбуждения нейронов, связанных с данным, и раздельно подаваемые на его входы. При простейшем техниче¬ ском (не биологическом) исполнении эти значения умножаются на веса вхо¬ дов (синапсических связей), складываются и, возможно, умножаются на нор¬ мирующий коэффициент, образуя величину возбуждения нейрона в случае преодоления порога. Вес синапсической связи - вес входа нейрона. Нейронная сеть - причудливо связанная сеть нейронов посредством многих входов (дендритов - в биологии) каждого нейрона и его единственно¬ го ветвящегося выхода (в биологии - аксона), по которому возбуждение мо¬ жет передаваться другим нейронам. Обладает входным (рецепторным) и вы¬ ходным слоями нейронов. Входной (рецепторный) слой - множество нейронов нейронной сети, получающих возбуждение вне сети или по обратным связям. Выходной слой - множество нейронов нейронной сети, возбуждение которых указывает на решение задачи или логический вывод, чаще всего окончательно определяемые по максимально возбуждённому нейрону. Логическая нейронная сеть - нейронная сеть, на рецепторы которой подаётся сигнальная информация, интерпретируемая как достоверность при¬ 335
Общий глоссарий надлежности соответствующих данных. Возбуждение нейронов выходного слоя указывает на решение. Формируется на основе логического описания систем распознавания, управления и принятия решений. Адекватно отобра¬ жает механизмы мозга. Режим обучения - формирование причинно-следственных связей между рецепторами и нейронами выходного слоя нейронной сети посред¬ ством выбора направлений и весов связей для распространения возбуждения. Режим распознавания (рабочий режим) - имитация ассоциативного мышления: определение того, какое решение более всего соответствует ситу¬ ации, заданной на рецепторах. «Схемотехническая» модель - схема реализации системы логических функций подобно электронному устройству с помощью логических элемен¬ тов - конъюнкторов и дизъюнкторов. Матрица связей - отображает матричное описание логической ней¬ ронной сети. Представляет удобный аппарат формальных преобразований для облегчения расчётов и развития. ЛѴИШ-технологин {Single Program - Multiple Data) - одновременная работа многих процессоров (компьютеров), выполняющих копии одной про¬ граммы по распределённым данным. Технология в максимальной степени адекватна распределённой обработке нейронов на параллельном нейроком¬ пьютере. Структурированная логическая нейронная сеть - характеризуется скобочной структурой логического описания системы принятия решений. Длина конъюнкции - количество переменных, объединённых опера¬ цией И. «Бесформульные» вычисления - вычисления, совершаемые не на ос¬ нове счёта значений арифметических выражений, а на основе ассоциативной выборки из базы знаний с возможностью усреднения близких результатов выборки. Самообучение - производится самостоятельно в результате пополне¬ ния базы знаний новыми отношениями вида «если - то», получаемыми из опыта или по результатам моделирования. Ситуационное управление - управление объектами или сложными системами с помощью таблиц, в строках которых указаны вектора возмож¬ ных ситуаций и соответствующие им вектора значений необходимых воздей¬ ствий. Решающее правило - основное правило действий, лежащее в основе эвристического алгоритма оперативного планирования, предпринимаемое в случае не единственной альтернативы выбора решения на локальном уровне. Обратная связь - связь (дуга) в графе, отображающем нейронную сеть, порождающая цикл. В матрице связей приводит к появлению отличных от нуля элементов выше главной диагонали. В однослойной нейронной сети 336
Общий глоссарий - временная или постоянная связь, ведущая от нейрона к одному или многим рецепторам. Правдоподобная аргументация - обусловлена нечёткими данными, которые использует интеллектуальная система. Проблема оправдания - проблема объединения нескольких баз зна¬ ний, где конкретные знания могут пониматься по-разному. Объяснение (здесь) - снабжение выводов интеллектуальной системы информацией типа «как» и «почему». Релевантные знания - знания, адекватные запросу. Понимание текстов - выражается в адекватной реакции на них. Синтез текстов - составление общего текста на основе единства темы и смысла. Когнитивная графика - продукт образного мышления, графическое условное представление объектов или их взаимодействия, а также объект «живого» моделирования. Многоагентная система - составляется на основе нескольких интел¬ лектуальных взаимодействующих систем. Сетевые модели - представляют наложение проблем искусственного интеллекта на компьютерную сеть. Метазнания - знания о знаниях, определили создание интеллектуаль¬ ных обучающих систем. Правила (вывода) - именованные абстрактные связи между фактами в описании БЗ на языке ПРОЛОГ. Дедуктивный вывод - процедура выделения всех фактов, удовлетво¬ ряющих цели вывода на языке ПРОЛОГ. Цель - выделение всех наборов фактов, удовлетворяющих требуемой связи между ними на языке ПРОЛОГ. Индуктивный вывод (ПРОЛОГ) - формирование новых правил на ос¬ нове выделения из всех возможных логических цепочек абстрагированных связных структур, которым присваиваются имена, и которые затем дополня¬ ют правила базы знаний. Связывание переменных - подстановка значений переменных в пра¬ вила, образующие логическую цепочку. Унификация - проверка непротиворечивости варианта связывания пе¬ ременных. Бэктрекинг (backtracking) - поступательно-возвратная стратегия свя¬ зывания переменных в сочетании с унификацией. Диалектика - свод основных законов устройства и развития мира. Ле¬ жит в основе получения новых знаний. Закон отрицания отрицания - один из основных законов диалектики, гласящий, что правда лежит «где-то посредине». Схоластические знания - знания, принимаемые к действию «на веру», без критического осмысливания. 337
Общий глоссарий «Крыша» поехала - идиоматическое выражение, отражающее сума¬ сшествие. Мониторинг (здесь): оценка текущего значения рейтинга по ряду фи¬ нансовых показателей. Банк-эталон - банк с известными финансовыми показателями, снаб¬ жённый экспертами определенным значением рейтинга из одного из диапа¬ зонов классификации. Банк-аутсайдер - банк, рейтинг которого принадлежит предельно низ¬ кому диапазону. Пошаговая оптимизация - последовательные, потактовые, цикличе¬ ские действия по максимизации (минимизации) целевой функции. Динамическая (пошаговая) маршрутизация - нахождение целесооб¬ разного пункта смещения в транспортной сети для достижения конечного пункта назначения в условиях массового движения. Подсказчик (в тактической игре) - рекомендует очередной ход, мак¬ симизирующий целевую функцию на основе текущей ситуации. Система принятия решений в медицине - позволяет по измеренным значениям характеристик и анализов больного ставить диагноз и выбирать целесообразную стратегию или алгоритм лечения на основе ассоциативной выборки из базы знаний, заменяющей консилиум. «Живое» моделирование - воссоздание объектов, адекватно реаги¬ рующих на внешнее воздействие. Реагирующие объекты - объекты наглядного отображения ситуации, складывающейся в сложной управляющей, производственной, игровой и др. системе, способные своим поведением предупредить об угрозе или отклоне¬ нии производственного процесса от нормы и произвести первичную диагно¬ стику. Трёхмерная память - память компьютера, адресуемая тремя коорди¬ натами. Позволяет имитировать графически расположение моделируемого объекта в пространстве. «Мышцы» и «кости» - реализуют механизм воздействия и управле¬ ния, посредством преобразования координат точек объекта, при имитации деформаций и движения в трёхмерном пространстве. Прозрачный монитор - выполняется на основе «прозрачного» экрана с размещёнными на нём электронными схемами для отображения видимой части объектов. Эти схемы выполняются на основе нано-технологий так, что вне зоны видимого изображения экран остаётся прозрачным. Экранный пакет - формируется на базе наложения друг на друга про¬ зрачных экранных плёнок, каждая из которых отображает видимый срез де¬ монстрируемого объекта в трёхмерной памяти. В результате этого в толще пакета создаётся стереоэффект. Декартова система координат - отражает угол ; между осями. 338
Общий глоссарий Сферическая система координат - отражает координаты нахождения точки по расстоянию от центра и по двум углам - азимут и угол места. Цилиндрическая система координат - отражает координаты нахож¬ дения точки по расстоянию до оси вращения, по азимуту и высоте. Парк фантасмагорий - парк развлечений, наполненный объектами «живого» натурного моделирования. компи - детский компьютерный игровой объект «живого» модели¬ рования, допускающий диалог. Тестирование - действия по установлению уровня знаний в процессе диалога «учитель - ученик». Прорицание - предсказание на основе изучения текущей частоты ис¬ пользования слов средствами массовой информации. 339
ЛИТЕРАТУРА Основная 1. Амосов Н.М., Байдык Т.Н., Гольцов А.Г. и др. Нейрокомпьютеры и интеллектуальные роботы. - Киев: Наукова думка, 1991. -271 с. 2. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мысли¬ тельных актов. - М.: Радио и связь, 1989. - 184 с. 3. Поспелов Д.А. Десять «горячих точек» в исследованиях по искус¬ ственному интеллекту // Интеллектуальные системы (МГУ). Т. 1. Вып. 1-4. 1996. С. 47-56. 4. Новиков П.С. Элементы математической логики. - М.: Государ¬ ственное издательство физико-математической литературы, 1959. - 400 с. 5. Глушков В.М. Введение в кибернетику. - Киев: Изд-во АН УССР, 1964.-324 с. 6. Барский А.Б. Нейронные сети: Распознавание, управление, принятие решений. - М.: Финансы и статистика. 2004. - 175 с. 7. Барский А.Б. Нейросетевые методы оптимизации решений. Учебное пособие. - СПб.: ИЦ «Интермедия», 2016. - 400 с. 8. Барский А.Б. Математическая логика событий и логические нейрон¬ ные сети. //Информационные технологии. 2007. № 7. Приложение. - 32 с. Дополнительная 9. Галушкин А.И. Нейронные сети: основы теории. М.: «Горячая линия - Телеком», 2010, - 496 с. 10. Rosenblatt F. Perceptual generalization over transformation groups. Self- Organizing Systems, Pros. Interdisciplinary Conf., 5-6 May, 1959, 63 - 100. Русский перевод: Ф. Розенблат. Обобщение восприятий по группам преобра¬ зований. Кибернетический сборник, 1962. 11. Кемени Дж., Снелл Дж., Томпсон Дж. Введение в конечную мате¬ матику. Пер. с англ. - М.: Издательство иностранной литературы, 1963. - 486 с. 12. Ярушкина Н.Г. Основы теории нечётких и гибридных систем. - М.: Финансы и статистика, 2004. - 320 с. 13. Поспелов Д.А. Ситуационное управление. Теория и практика. - М.: Наука, Гл. ред. Физ.-мат. Лит., 1986. - 288 с. 14. Барский А.Б. Параллельные информационные технологии. . - М.: ИНТУИТ; БИНОМ. Лаборатория знаний. 2007. - 503 с. 15. Барский А.Б., Дмитриев А.А., Барская О.А. Медицинские информа¬ ционно-справочные системы на логических нейронных сетях //Информационные технологии. 2010. № 1. Приложение. - 32 с. 340
Общий глоссарий 16. Чжо Вин Латт. Логическая нейронная сеть в основе идентификации пользователя в системе «клиент - сервер» на базе трёх характеристик «по¬ черка». // Естественные и технические науки, 2010. № 3. 17. Барский А.Б., Саид Мохаммед М.Н. Выбор смещения при пошаго¬ вой маршрутизации в беспроводной сети // Мир Транспорта, 2013, №2. С. 30 - 37. 18. Барский А.Б., Милютин Л.Б., Тимофеев А.Е. Реагирующие объекты для систем интеллектуального отображения // Информационные технологии. 2007. №2. С. 2-11. 19. Вахромцев Е.М. Применение методов «живого» моделирования для производственного мониторинга // Информационные технологии. 2010. № 7. С. 10-15. 20. Агеева У.О., Агеева В.Г., Барский А.Б. Бионическое интеллектуаль¬ ное протезирование конечностей и логические нейронные сети // Информа¬ ционные технологии. 2016. № 5, Том 22. С. 379 - 386. 21. Барский А.Б. Трёхмерная экранизация компьютерных объектов «живого» моделирования //Информационные технологии. 2010. № 9. С. 2 - 6. 22. Deboek G., Kohonen Т. Visual Exploration in Finance with Self- Organizing Maps. Springer-Verlag, 1998. 23. Бабаян Б.А., Бочаров A.B., Волин В.С. и др. Многопроцессорные ЭВМ и методы их проектирования. - М.: Высшая школа, 1990. - 142 с. 24. Форсайт Д., Понс Ж. Компьютерное зрение. Современный подход. - М.: Издательский дом «Вильямс». - 2004. - 928 с. 25. Братко И. Программирование на языке ПРОЛОГ для искусственно¬ го интеллекта. Пер. с англ. - М.: «Мир», 1990. - 560 с. 26. Бусленко Н.П. Моделирование сложных систем. - М.: Наука, 1978. -400 с. 27. Шаракшанэ А.С., Железнов И.Г., Ивницкий В.А. Сложные системы. - М.: Высшая школа, 1977. - 246 с. 28. Барский А.Б., Мельник Д.И., Решетников А.В. Нейросетевые моде¬ ли управления качеством при модернизации и развитии сложных систем в условиях финансовых и технологических ограничений // Информационные технологии. 2019. (В печати) 341
ДЛЯ ЗАМЕТОК 342
ДЛЯ ЗАМЕТОК 343
ДЛЯ ЗАМЕТОК 344
ДЛЯ ЗАМЕТОК 345
ДЛЯ ЗАМЕТОК 346
ДЛЯ ЗАМЕТОК 347
ДЛЯ ЗАМЕТОК 348
ДЛЯ ЗАМЕТОК 349
ДЛЯ ЗАМЕТОК 350
ДЛЯ ЗАМЕТОК 351
ДЛЯ ЗАМЕТОК 352
ДЛЯ ЗАМЕТОК 353
ДЛЯ ЗАМЕТОК 354
ДЛЯ ЗАМЕТОК 355
ДЛЯ ЗАМЕТОК 356
ДЛЯ ЗАМЕТОК 357
ДЛЯ ЗАМЕТОК 358
ДЛЯ ЗАМЕТОК 359
ДЛЯ ЗАМЕТОК 360