Text
                    ПРОБЛЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА
Л.А. ПОСПЕЛОВ
СИТУАЦИОННОЕ
УПРАВЛЕНИЕ
ТЕОРИЯ И ПРАКТИКА
Алтайскяй
!-«..-тч- .т
МОСКВА «НАУКА»
ГЛАВНАЯ РЕДАКЦИЯ
ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ
1986


ББК 32.81 П62 УДК 51971 Поспелов Д. А. Ситуационное управление: теория и практика.— М.: Наука.—Гл. ред. физ.-мат. лит., 1986.— 288 с. Ситуационное управление — метод управления сложными техническими и организационными системами, основанный на идеях теории искусственного интеллекта: представление знаний об объекте управления и способах управления им на уровне логико-лингвистических моделей, использование обучения и обобщения в качестве основных процедур при построении процедур управления по текущим ситуациям, использование дедуктивных систем для" построения многошаговых решений. Излагается методология ситуационного управления, его теоретические основы и приводятся примеры его конкретных применений. Для специалистов в области теории управления и систем искусственного интеллекта. Табл. 42. Ил. 97. Библиогр. 186 иазв. Рецензент кандидат физико-математических наук В. Л, Стефанюк ''с) Издательство «Наука » 1504000000—033 Главная редакция о 150-86 физико-матемитическоГ! 053 (02)-86 ^^^О'^ литературы. 1986
ОГЛАВЛЕНИЕ Предисловие 3- Г vT а в а 1. Принципы ситуационного управления 9 §1.1. Традиционная схема управления 9 §1.2. Нетрадиционные объекты управления 11 § 1.3. Психологические предпосылки 17 § 1.4. В чем состоит ситуационное управление? 25 § 1.5. Семиотические модели * 32 § 1.6. Данные и знания ■ 39 § 1.7. План дальнейшего изложения 42 Глава 2. Языки для описания объекта и ситуаций 43 §2.1. Вступительные замечания 43 § 2.2. Роли и отношения 45 § 2.3. Естественный язык и теория управления 46 § 2.4. Язык ситуационного управления (ЯСУ) 55 §2.5. Формирование лексики ЯСУ** 57 § 2.6. Формальная модель синтаксиса ЯСУ * 61 § 2.7. Дискретные ситуационные сети (ДСС) 63 § 2.8. Другие языки описания ситуаций * 67 §2.9. Языки представления знаний** 71 §2.10. Переход от текстов на естественном языке к внутреннему представлению ** 83 §2.11. Формализация качественных характеристик* 87 Глава 3, Пополнение описаний ситуаций 96 §3.1. Постановка задачи 96 § 3.2. Сценарии 99 §3.3. Сценарии и фреймы** 102 §3.4. Псевдофизические логики* 106 §3.5. Временная логика** 111 §3.6. Пространственная логика** 125 §3.7. Каузальная логика* 136 §3.8. Неполнота и «абсурдность» знаний 156 Глава 4. Обобщение и классификация ситуаций 159 §4.1. Суть проблемы 159 §4.2, Обобщение понятий и классификация у человека 162 §4.3. Обобщение по признакам* 167 §4.4. Обобщение по структурам * 182 §4.5. «Слоеный пи.рог» 203 §4.6. Некоторые сведения о классифицирующих системах** , . . 206 §4.7. Дополнительные замечания 212 1*
4 ОГЛАВЛЕНИЕ Глава 5. Формирование решений по управлению 216 §5.1. Цели, ситуации и планы 216 § 5.2. Стратегии планирования 220 §5.3. Использование метода резолюции при планировании ** ... 227 § 5.4. Функциональные модели для планирования 234 § 5.5. Сценарии и логики действий * 238 § 5.6. Экстраполяция решений 243 § 5.7. Особенности рассуждений у человека 249 Заключительные замечания 252 Приложение. Исторический очерк развития ситуациониого управления 254 Комментарии 259 Список литературы 270 Именной указатель 279 * Предметный указатель 280
ПРЕДИСЛОВИЕ Когда я задумал написать эту книгу и обдумывал способ, как наилучшим образом это сделать, мне пришло в голову воспоминание о Боробудуре. Боробудур — знаменитый храмовый буддийский комплекс, расположенный в центре Явы, в широкой долине, окруженной горами, часть из которых — действуюш^ие вулканы. Когда путник подхо* дит к Боробудуру, он видит перед собой огромное сооружение, поднимаюш^ееся вверх террасами-уступами. Каждая такая ступень снаружи сплошь покрыта каменными рельефами, там и сям в пе- ш^ерах-углублениях сидят будды и бодисатвы. Многие километры каменной книги, в которой причудливо переплетаются мифологические и сказочные сюжеты, сцены из жизни Будды и бодисатв. Поднимаясь вверх по галереям, опоясываюш^им Боробудур, путник постепенно теряет ош.уш,ение реальности среди тысяч скульптур и каменных рельефов. Но наступает момент, и он выходит на очередной уступ — каменную плош^адку, с которой открывается удивительный вид на долину и горы. Каменный хаос фантомов остался внизу. А здесь, наверху, только природа в своей первозданной красе и величии. Но эта терраса еш,е не последняя. Поднимаясь все выше и выше, путник достигает высшей точки Бо- робудура, где воздвигнута гигантская ступа — непременный атрибут буддийского сооружения. И отсюда уже не видно тех нижних ярусов, в которых застыла каменная летопись реального и фантастического миров. Двигаясь так, трудно уловить оби;ую идею Боробудура, его скрытый смысл, воплош,енный неизвестными строителями в VHI или IX веках в камне. Но XX век дал новую возможность для проникновения в тайну этого древнего сооружения. С sepTOvieTa его можно увидеть сразу, в единстве всех его ярусов, интегрально. И тогда возникает четкий план сооружения. Эта громоздкая пирамида в своем стремлении ввысь отражает три мира: мир чувственных образов, мир идей-представлений и мир абстрактных идей. То, что путник, движуш,ийся вверх по галереям храма, должен был вычленить из пестрой мозаики своих впечатлений, вид с воздуха выявляет сразу. Описывая некоторую область науки, можно также идти двумя путями. Можно вести путника-читателя по длинным галереям,
б ПРЕДИСЛОВИИ наполненным отдельными фактами, cocтaвляюIди^uI все вместе нечто целое, объединенное общими идеями и принципами. А можно описать эту область «с высоты птичьего полета», сразу сформулировав эти основные идеи и принципы, отбросив все детали, даже если каждая из них удивительна и интересна. Но можно попытаться соединить оба пути: аналитический и синтетический. В настоящей книге реализован именно этот замысел. Насколько хорошо — судить не мне, а читателю. Во всяком случае, книга состоит как бы из четырех уровней. На первом дается концептуальный взгляд на те вопросы, которые составляют суть ситуационного управления. Для чтения этих параграфов не требуется никаких знаний более низкого уровня. И весь первый уровень, как мне представляется, дает читателю, интересующемуся лишь сутью ситуационного управления, его идеями и возможностями практического применения, достаточно полную картину. На втором уровне (относящиеся к нему параграфы книги помечены звездочкой) излагаются методы и процедуры, используемые в ситуационном управлении. Эти методы могут оказаться полезными не только для тех, кто захочет применять метод ситуационного управления. Они могут пригодиться и в иных случаях. Поэтому второй уровень рассчитан на достаточно широкие круги специалистов, интересующихся бурно развивающимися методами решения задач, опирающимися на логико-лингвистические модели. Для понимания параграфов, входящих в этот уровень, требуется прочитать и разделы, образующие верхний уровень. Третий уровень (его параграфы отмечены двумя звездочкалш) рассчитан на специалистов, которые захотят практически применить метод ситуационного управления для решения собственных задач. В нем сосредоточены методические и методологические рекомендации и советы по построению подобных систем. До чтения параграфов третьего уровня желательно прочитать и те, которые относятся к первым двум. Но, вообще говоря, в большинстве случаев ^южнo обойтись только теми сведениями, которые имеются на первом уровне. Четвертый уровень — вспомогательный. Поэтому он выделен в тексте книги петитом. В его разделах комментируются некоторые положения и методы, описанные на предшествующих уровнях, и дается обзор литературы. В текстах основных трех уровней нет прямых ссылок на литературу. Они отвлекают читателя и засоряют текст. Поэтому на четвертом уровне есть полный обзор использованных при написании книги источников и тех работ, которые близко примыкают по своим идеям к тому, что говорится в книге. Четвертый уровень завершается историческим очерком развития ситуационного управления. И еще две особенности книги. В ней довольно ^шoгo всяких историй, литературных цитат и анекдотов, вкрапленных в текст,
ПРЕДИСЛОВИЕ 7 особенно на первом уровне. Я придаю им важное значение, хотя читатели-пуристы могут посчитать, что они неуместны в научной монографии. Введены они для того, чтобы вызвать у читателя нужные мне ассоциации. И это все, что я могу сказать здесь в свое оправдание. Второе — это примеры. В них нередко содержатся утверждения, важные для понимания того или иного положения данного уровня, которое они иллюстрируют. Поэтому их желательно не опускать при чтении. Теперь надо сказать несколько слов о том, почему эта книга выходит в серии книг «Проблемы искусственного интеллекта», чья эмблема украшает обложку книги. Идеи ситуационного управления, как узнает об этом читатель из исторического очерка, помещенного в Приложении, возникли куда раньше того момента, когда на горизонте исследователей появилась новая наука — теория искусственного интеллекта. Но логика рождения новых научных направлений такова, что они никогда не зарождаются на пустом месте, не возникают, как феникс, из ничего. Новое зреет и зарождается в недрах «старых», признанных наук. Только тогда, когда это созревание достигнет определенного уровня, происходит рождение новой науки или новой научной парадигмы. Искусственный интеллект, этот кумир сегодняшнего дня, конечно, не был исключением. То, что потом вошло в него, возникало в недрах кибернетики и лингвистики, психологии и программирования. Если очень сжато (и поэтому неточно с позиций пуриста) определить, что сегодня понимают под теорией искусственного интеллекта, то можно сказать, что это наука о знаниях, о том, как их добывать, представлять в искусственных системах, перерабатывать внутри системы и использовать для решения практических задач. Другими словами, системы, изучаемые в рамках искусственного интеллекта и создаваемые в русле этой науки, это системы, работа которых опирается на знания, отражаюш,ие семантику и прагматику того внешнего мира, в котором действуют интеллектуальные системы. При таком понимании области исследований, относяш,ихся к искусственному интеллекту, работы в области ситуационного управления, без всякой натяжки, к ней принадлежат. Зародившись в недрах теории управления большими системами, ситуационное управление с самого начала было ориентировано на использование знаний об объекте управления и способах управления им, которые не могут быть строго формализованы, и на активный диалог с управленцем на языке, максимально приближенном к его профессиональному языку. А это значит, что включение этой книги в серию книг по искусственному интеллекту полностью оправдано. Завершая предисловие, мне хотелось бы отметить, что основные положения этой книги формировались и окончательно оформились в течение многолетних контактов со всеми активными участниками
8 ПРЕДИСЛОВИЕ ТОГО, ЧТО МОЖНО было бы назвать «ситуационным движением» (термин Г. П. Щедровицкого). Я глубоко благодарен всем моим товарищам и коллегам по этому «движению». Многочисленные конференции, симпозиумы, школы и семинары по ситуационному управлению сплотили нас, позволили выработать общую терминологию и сформулировать концептуальные модели, лежащие в основе метода ситуационного управления. И вряд ли можно теперь точно определить, «кто первый сказал А», и я не хотел бы, чтобы из текста книги читатель мог бы предположить, что ее автор придерживается известного правила: «Автор не тот, кто первый сказал А, а тот — кто первый сказал Я».
ГЛАВА 1 ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ У народов обыкновенно много слов для обозначения того, что их больше всего интересует. Э. Ренан § 1.1. Традиционная схема управления Традиционная теория автоматического управления техническими объектами, выросшая на суш^ествовавшей ранее теории автоматического регулирования, имеет дело с такими объектами, для которых процедура управления в самом обш^ем виде представляется так, как показано на рис. 1.1. На управляемый объект воздействуют {п+г) входов, причем значение входов Xt можно оценить в каждый момент времени, а для входов Wj такая возможность отсутствует. Ча- ш,е всего это происходит. из-за отсутствия необходи- ■ мых датчиков. Но бывает, - что измерение входов Wj физически невозможно или слишком дорого обходится. В идеальном случае входов Wj нет. Объект имеет т выходов. Предполагается, что между входным вектором <Х, Wy и выходным У есть некоторая связь Г=/(X, W). Эта связь мо- Уг Ут ■ Объект ^2 ... ' Система управления ЛПР\ Рис. 1.1 жет иметь самые разные характеры: она может быть функциональной,. статистической, в виде неоднозначного отображения и т. п. Важно лишь то, что изменения в X и как-то сказываются на значениях F. Значения Y небезразличны некоторому лицу, которое мы в дальнейшем будем условно называть лицо, принимающее реиление (ЛИР), как принято в современной теории исследования операций. Для ЛПР важно добиться получения определенных значений Y при любых значениях X и На векторы X и оно влиять не может. Поэтому оно строит систему управления так, чтобы получить от объекта интересуюш^ие его значения Y. Это делается с помош,ью специальных управляющих воздействий W/, подаваемых от системы управления на объект. Подобно векторам X и W, значения вектора воздействий U влияют на значения вектора У. Другими словами, вместо соотношения Y=f{X, W) возникает соотношение y=f(X, (У, W). Задача ЛПР — сделать систему управления такой, чтобы при наличии информации о текущих значениях X (ин-
10 1-1. 1. ПРИНЦИПЫ CUTN'AUllOHIlorc) У! 11>Л l£l И I>I формация о значениях W системе управления, естественно, недоступна) добиться таких значений К, которые устраивают ЛПР. Это означает, что система управления реализует некоторую зави- cи^юcть вида (7-^([)(Х, F), с пo^ющью которой она находит необходимые управляющие воздействия на объект. Если ЛПР не удовлетворено своим детищем, то оно ^южeт внести коррективы в его функционирование. На рис. 1.1 эта возможность показана в виде подачи на систему управления корректирующего вектора Z. Если же коррекция не приводит к цели или невозможна, то ЛПР может сменить систему управления. Не будем вдаваться в дальнейшее расслютрение приведенной схемы. Для нас важно следующее: для того чтобы ЛПР смогло построить удовлетворяющую его систему управления, оно должно знать две вещи: множество предпочтительных векторов Y и как задано отображение /. Отображение / описывает функционирование объекта управления, а знание предпочтительных значений Y говорит о понимании цели его функционирования. Итак, ЛПР нeoбxoди^ю знать описание объекта (т. е. его структуры и функционирования), которым он собирается управлять, и цели существования этого объекта. Зная это, он ^южeт сформулировать критерий управления, в котором воплощаются требования к системе управления. Отображение Ф па рис. 1.1 воплощает в себе критерий управления объектом. Он может быть различным: максимизация или минимизация каких-то значений вектора К, их поддержание в некоторых заданных пределах, недопущение некоторых комбинаций этих значений или запрещение появления определенных временных последовательностей значений вектора К и т. п. Но именно наличие критерия управления позволяет ЛПР ставить и решать традиционную задачу управления объектом. Так возникает цепочка: описание объекта управления — описание целей существования объекта управления — формирование критерия управления им — проектирование и создание системы управления. Следовало бы ожидать, что теория управления уделит одинаковое внимание всем элементам цепочки. Однако исторически этого не произошло. Как правило, специалисты в области управления прилагали усилия лишь к поиску процедуры управления объектом, когда и сам объект, и критерий управления им были уже описаны в точных терминах. Оптимизация управления была центральной проблемой традиционной теории автоматического управления. И лишь на последнем этапе ее развития внимание специалистов переместилось на проблему идентификации объекта управления и на проблему выявления критериев управления им. Но здесь возник ряд трудностей, связанных с тем, что объек- тa^иI управления стали системы, для которых привычные, наработанные десятилетиями приемы оказались HenpHMennMbiNHi. Какова же была их природа?
§1.2. ИНТРЛДПЦИОПП ЫЕ ОБ'ЬЕКТЫ УПРЛПЛЕМИЯ П § 1.2. Нетрадиционные объекты управления Их называют по-разному: плохо определенные или слабоструктурированные, организационные или обладающие «свободой воли». Но независилю от названия эти новые объекты обладают рядом неожиданных для традиционного управленца свойств, отличающих их от привычных объектов прошлого. Перечислим основные их свойства. 1. Уникальность. Каждый объект обладает, такой структурой и функционирует так, что система управления им должна строиться с учетом всех его качеств и к нему нельзя применить какую- либо-типовую стандартную процедуру управления. Если, например, удалось спроектировать систему управления движением для aвтo^юбиля ВАЗ 2103, то она пригодна для любого конкретного автомобиля такой ^юдeли. Если же спроектирована система управления для министерства здравоохранения некоторой союзной республики, то ее нельзя перенести без изменений для того же министерства другой республики. При переносе надо учесть все индивидуальные особенности нового объекта управления. Это обстоятельство резко удорожает процедуру построения системы управления, ибо фактически нужно создавать столько систем управления, сколько объектов мы хотим автоматизировать. 2. Отсутствие формализуемой цели существования. Для старых, привычных для теории автоматического управления объектов всегда было ясно, зачем был создан тот объект, управление которым мы строим. Как правило, управленцы имели дело с объектами искусственного происхождения, созданными людьми для достижения понятных им целей. Станок должен был производить определенную обработку заготовок, самолет должен был перевозить по воздуху пассажиров и грузы. Но не для всех объектов (даже созданных человеком) можно так же четко сформулировать цель их существования. Сейчас, когда мы хотим управлять городами, отраслями народного хозяйства, регионами, экосистемами, мы попадаем в весьма затруднительное положение при попытке четко сформулировать цель существования этих объектов. Даже созданные людьми, они возникли не по чьему-то плану, для решения какой-то конкретной задачи, а развились постепенно в силу определенных социально-экономических и исторических причин. Каковы, например, цели существования сверхгородов? Или для чего возникла экосистема Азово-Черноморского бассейна? На такие вопросы практически нeвoз^южнo ответить, А это приводит к весьма большим сложностям в формировании критерия управления. Ибо критерий управления в традиционных системах управления был теснейшим образом связан с целью существования объекта. Критерий управления самолетом был основан на достижении им своей цели существования — перевозки людей и грузов по воздуху, управления производством синтети-
12 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ческого каучука — на соображениях повышения качества продукта. Именно поэтому в различных автоматизированных системах управления, создаваемых для объектов нового класса, очень часто можно наблюдать реализацию различных критериев управления. 3. Отсутствие оптимальности. Следствием того, о чем говорилось в предшествующ,их двух пунктах, является неправомочность постановки для объектов новой природы классической задачи оптимизации. Из-за отсутствия цели сущ,ествования (в рамках теории управления) для рассматриваемых объектов нельзя построить объективный критерий управления. Критерий управления становится субъективным, целиком зависяш.им от ЛПР. Эту чрезвычайно важную для дальнейшего мысль можно проиллюстрировать следующ,им примером, стояи;им, правда, несколько в стороне от собственно задачи управления. Пусть с помои;ью людей-экспертов мы хотим измерить размер какого-либо предмета. Например, длину автомашины ВАЗ 2105. Каждый специалист называет некоторое число, которое, по его мнению, означает длину автомобиля. ЛПР (которое также может прикинуть длину автомобиля) анализирует показания экспертов. Если находится эксперт, оценивающий длину автомобиля в 10 м или в 50 см, то ЛПР вправе усомниться в его квалификации как эксперта. Отбросив такие аномальные предложения, ЛПР может просуммировать остальные числа и найти среднее арифметическое от полученного результата. Такое усреднение как бы объективизирует результат. Если экспертов было много и они обладали неплохим глазомером, то результат экспертизы будет близок к истинной длине автомобиля. Отметим две особенности описанной нами процедуры. Во-первых, если экспертов уже много, то появление некоторого нового эксперта не внесет особых изменений в результат, полученный ЛПР. Другими словами, такая экспертиза обладает свойством устойчивости. Во-вторых, можно проверить качество экспертизы, взяв какое-либо измерительное приспособление, точность которого удовлетворяет ЛПР, и провести измерение. Та или иная близость данных измерения к результату, полученному с помощью экспертов, будет характеризовать качество экспертизы. А это позволяет ставить, например, задачу оптимизации формирования коллектива экспертов по их количеству или каким-либо социальным или физиологическим особенностям. Теперь рассмотрим пример другой экспертизы. Группа людей заблудилась в пещере. После долгого блуждания они оказались на площадке, с которой путь, приведший их на нее, разветвляется. Влево и вправо уходят подземные коридоры. Требуется решить: куда идти? Руководитель группы (ЛПР) устраивает опрос. Сторонники движения по левому коридору высказывают свои соображения, их противники — другие. Для ЛПР доводы тех и других не кажутся слишком убедительными, и оно проводит простое
§1.2. НЕТРАДИЦИОННЫЕ ОБЪЕКТЫ УПРАВЛЕНИЯ 13 голосование. Предположим, что большинство участников этой экспертизы высказалось за движение по левому коридору. Группа пошла по нему. После нескольких дней, ослабевшие от голода и жажды, они выбрались на поверхность. И с тех пор ЛПР мучает вопрос: правильно ли оно приняло решение? Ясно, что ответа на этот вопрос нет. Он был бы, если бы группа прошла и правым коридором. Возможно, что он сразу бы вывел их на поверхность, но весьма вероятно, что они могли бы навсегда остаться под землей. Оценить правильность выбора, его целесообразность, оптимальность в этом случае можно, только имея план пещ,еры, а значит, «пройдя» по всем ее коридорам. В отличие от ситуации с измерением длины автомобиля, здесь нет возможности оценить качество принятого решения, если альтернативные решения не проверялись. Кроме того, экспертиза второго типа не обладает устойчивостью, характерной для предшествуюн;его примера. Если бы после принятия решения о движении по левому коридору подавляющ,им большинством экспертов на площ,адку, где стоит группа, выбрался бы из левого коридора человек, тоже блуждаюш,ий в поисках выхода, и сказал бы, что этот путь ведет в тупик, то весь результат опроса рухнул бы. И дальнейшее движение было бы продолжено по правому коридору. Ситуация, аналогичная поиску пути в пеи;ере, складывается весьма часто. При решении о выборе тех или иных характеристик будущ,его изделия, при принятии тех или иных решений по структуре и методам функционирования автоматизированной системы управления, при всяком «волевом» решении (хотя и подкрепленным рядом соображений самого ЛПР и других экспертов) всегда возникает ситуация, описанная нами. Отсюда следует, что в этих случаях невозможно говорить об оптимальности получаемых решений. Нельзя, например, требовать, чтобы проектировщ.ики создали оптимальную АСУ отраслью или городом. Такая постановка некорректна и неправомочна. Качество созданной системы для управления объектами новой природы может оцениваться только субъективно самим ЛПР или их коллективом. Поэтому здесь уместнее говорить о целесообразности результата управления, а не об его оптимальности. Важно только, чтобы ЛПР в нужных случаях не боялось принимать решения. В одноактной пьесе Славомира Мрожека, которая называется «Стриптиз», описана как раз такая ситуация, при которой одно из ЛПР увиливает от принятия решений. Два человека, не знакомых между собой, оказываются некоторым непостижимым для них образом перенесенными в помеи;ение, из которого имеется выход через открытую дверь. Им надо принять решение: что делать? Происходит следующ,ий диалог: Первый. Что такое свобода? Это возможность выбирать. Пока я нахожусь здесь, я знаю, что могу выйти в эти двери, до тех пор я свободен. Зато в тот момент, когда я встану и выйду отсюда,
14 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ я тем самым произведу выбор, т. е. ограничу возможность моего поведения и утрачу свободу. Я стану рабом своего ухода. Второй. Но, оставаясь на месте и никуда не выходя, вы тоже производите выбор. Вы избираете сидение и невыход. Первый. Неправда. Я сижу, но я могу выйти. Выйдя, я исключаю возможность сидения. 4. Динамичность. В каком-то смысле объекты, с которыми сейчас сталкивается теория управления, подобны жавым системам. С течением времени изменяется их структура и функционирование. Объекты как бы эволюционируют во времени. На предприятии строят новые цеха, возникают новые производства, хменяет- ся технология. Сеть ЭВМ растет, отдельные сети начинают соединяться между собой, стремясь к общемировой сети обработки данных. Меняется структура отрасли, города расширяют свои границы, меняется их застройка, смещаются транспортные и людские потоки. И эта динамичность должна быть учтена в системах управления подобными объектами. Они поневоле должны быть адаптивными, готовыми к изменению своего функционирования. 5. Неполнота описания. Как правило, никакой коллектив экспертов, знающих объект управления, не в состоянии сразу же обеспечить информацию, которой бы заведомо хватило для создания системы управления объектом. Существует несколько причин, почему это происходит. Описывая объект управления старого типа, управленец всегда знал о тех допущениях, которые он принял, строя описание. Он мог предполагать, что передаточная функция объекта имеет тот или иной вид, что запаздывание не играет в его функционировании большой роли, что влияние параметров Wj незначительно и им можно пренебречь и т. п. И если созданная им система управления оказывалась не слишком хорошей, то он знал, от каких допущений надо отказываться. Но при работе с объектами новой природы эти допущения нельзя сформулировать столь ясно и просто. Управленец в этом случае почти целиком полагается на экспертов, знающих объект управления. И тот или иной уровень допущений фактически предлагают они. Но, не будучи специалистами по системам управления, эксперты не ^югyт оценить тот уровень полноты описания, который нужен специалисту по управлению. Ведь само описание, вычленение в нем тех или иных аспектов и особенностей тесно связано с задачей управления. И это не всегда может уловить человек, смотрящий на объект управления другими глазши — глазами технолога. Проиллюстрирую свою мысль примером разговора двух управленцев, двух превосходных летчиков Антуана де Сент Экзюпери и его друга Гийоме. Гийоме объясняет своему коллеге, как летать над Испанией из Франции в Африку: «Странный то был урок географии! Гийоме не преподносил мне сведений об Испании, он дарил мне ее дружбу. Он не говорил о водных бассейнах, о численности населения и поголовье скота. Он гово-
§ 1.2. НЕТРАДИЦИОННЫЕ ОБЪЕКТЫ УПРАВЛЕНИЯ 15 рил не о Гуадисе, но о трех апельсиновых деревьях, что растут на краю поля неподалеку от Гуадиса. «Берегись, отметь их на карте...» И с того часа эти три дерева занимали на ^юeй карте больше места, чем Сьерра-Невада. Он говорил не о Лорке, но о маленькой ферме возле Лорки. О жизни этой фермы. О ее хозяине. И о хозяйке. И эта чета, затерявшаяся на земных просторах за тысячу с лишним километров от нас, безмерно вырастала в моих глазах. Их дом стоял на горном склоне, их окна светили издалека, словно звезды,— подобно смотрителям маяка эти двое всегда были готовы помочь людям своим огнем... Так понемногу Испания на моей карте, под лампой Гийоме, становилась какой-то сказочной страной. Я отмечал крестиками посадочные плош,адки и опасные ловушки. Отметил фермера на горе и ручеек на лугу. Старательно нанес на карту пастушку с тридцатью баранами...» («Планета людей»). Это образец того, как один профессионал описывает объект другому профессионалу. Тут важно все: о чем говорится, с каким уровнем детализации, на каком языке. При работе управленца со сложным объектом самые большие сложности возникают при контактах с технологами, знающими данный объект. Несходство их взглядов на него иногда приводит к полному непониманию друг друга, в результате чего возникает неполнота описания, которым руководствуется проектировщик системы управления. Другая немаловажная причина неполноты описания объекта — незнание некоторых сторон функционирования его самим технологом. Некоторые ситуации, никогда не встречавшиеся им ранее, естественно, нельзя сообщить и проектировщику системы управления. Чаще всего это всевозможные аварийные ситуации. Для иллюстрации возможных последствий аварий вспомним катастрофу с энергетической системой США, происшедшую несколько десятилетий назад. Развал системы возник по вине системы управления. Автоматическое отключение линий и источников энергии при перегрузках привело к тому, что значительная часть страны лишилась электроэнергии, а это привело к огромным потерям. Другим примером может служить система управления большой ЭВМ, ее операционная система. Когда специалисты по ее проектированию в шестидесятых годах создавали мультипрограммные операционные системы с развитыми системами прерываний и приоритетов, то они вовсе не рассчитывали на ситуации, в которых система управления блокировала бы сама себя из-за невозможности выйти из прерываний. И в том, и в другом случае управленцев подвела неполнота описания функционирования объекта и влияния сигналов Ui на это функционирование. Третья причина неполноты описания — отсутствие у самого технолога четкого понимания функционирования объекта. Выдавая управлешху большое количество информации, он тем не менее не сообщает ему c.a^юй главной, по которой сам принимает penie- нпе о функционировании объекта. Делает он это не сознательно,
16 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ибо «самая главная информация» может учитываться им только на уровне собственной интуиции. Мне вспоминается следующий случай, свидетелем которого я был. Всемирная организация здравоохранения (ВОЗ) распространила в ряде стран истории болезни нескольких больных из скандинавских стран. И попросила ведущих психиатров различных стран дать заочный диагноз заболевания на основании историй болезни. В СССР последние были размножены и разосланы значительному количеству специалистов. Через некоторое время они собрались все вместе в Москве для обсуждения своих диагнозов. Была составлена и вывешена для всеобщего обозрения сводная таблица, в которой для всех больных были указаны диагнозы. Это была удивительная таблица! Почти для каждого случая имелся разброс диагноза от «практически здоров» до «заболевание X в самой тяжелой форме». Авторы диагнозов выходили на трибуну и обосновывали свою точку зрения. Самым интересным было то, что, привлекая одни и те же данные из истории болезни, они приходили к почти противоположным выводам. Например, из того, что больной отказался входить в контакт с близкими и врачом, в одном случае следовал вывод о стремлении к изоляции, неконтактности, а в другом — о вполне адекватной данной ситуации форме поведения. Споры фактически прекратились после выступления одной очень уважаемой пожилой специалистки в области психиатрии. Она сказала, буквально, следующее: «Коллеги, о чем мы спорим? Ведь мы все знаем, что как только к нам на прием придет пациент, мы в первую же секунду определим — болен он или нет. Только мы не можем сказать, как это у нас получается». И все согласились с выступавшей. И, наконец, еще одна причина, приводящая к неполноте описания сложных объектов. Эта причина состоит в том, что многие особенности функционирования объекта, а иногда и его структуры не могут быть описаны количественно. Они допускают лишь качественное, словесное описание. Переход от качественных описаний к некоторым формальным представлениям должен производиться управленцем, который не всегда в состоянии решить такую сложную проблему. 6. Наличие свободы воли. Во многих объектах управления люди являются элементами их структуры. Это так называемые организационные системы. В отличие от всех других элементов, образующих объекты, люди функционируют в нем с учетом своих личных интересов и целей. Их интересы и цели могут значительно отличаться от того, что они должны делать с точки зрения ЛПР. Их индивидуальное поведение практически невозможно учесть при создании системы управления, и требуются специальные приемы для нейтрализации их воздействия на функционирование объекта управления. Иначе могут возникнуть ситуации вроде той, которая описана в следующем анекдоте.
§1.3. ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 17 § 1.3. Психологические предпосылки Психологи много внимания уделяли проблеме исследования поведения человека при решении возникающих перед ним задач. Было создано немало концептуальных схем, объясняющих особенности его поведения при решении различных по своему характеру задач. Рассмотрим три такие схемы, получившие наиболее широкое распространение и представляющие для нас интерес в рамках нашей книги. Самая грубая схема носит название стымульно-реактивной теории. В ее основе лежит представление об объекте управления как о «черном ящике». Внутренняя структура объекта непостижима для ЛПР. Наблюдению доступны лишь внешние входные сигналы, поступающие на объект (стимулы), и выходные сигналы объекта (реакции). Задача ЛПР состоит в том, чтобы, меняя значения входных сигналов и наблюдая за возникающим при этом изменением выходных сигналов, сказать что-то о Д т. е. об описании функционирования объекта. В психологии такой подход к изучению поведения человека носит название бихевиоризма. Он справедливо подвергся критике, ибо сводит весь процесс решения проблемы к методу проб и ошибок с постепенным накоплением вероятностной информации о целесообразном поведении в данной ситуации. Тем ие менее ряд систем управления может быть построен на основе этой весьма грубой теории. Ограничимся для иллюстрации этого утверждения всего одним примером. Пример 1.1. Рассмотрим объект, имеющий выходной канал и два входных канала и х.^. На входы х^ и х^_ могут подаваться сигналы двух типов 1 и О, что соответствует возбуждению и невозбуждению соответствующих входов. На выходе также могут появиться два сигнала О и 1, что соответствует невозбуждеиию и возбуждению выхода объекта. При фиксированном возбужденном входе случай, когда оба входа возбуждены, исключается; значение сигнала на выходе определяется распределением (р/; 1—р/), где i—1, 2. Другими словами, с вероятностью р/ на выходе объекта при возбужденном входе лг/ появляется сигнал О, а с вероятностью 1—pi — сигнал 1. Задача ЛПР состоит в проектировании такой системы управления, которая минимизировала бы случаи невозбуждения выхода объекта. Если бы значения р/ были ЛПР известны, то дело обстояло бы весьма просто. Пусть, например, для Xi распределение имеет вид (0,9; 0,1), а для х^ — вид (0,01; 0,99). Тогда совершенно ясно, что необходимо всегда возбуждать вход х^ и только его. При этом случаи невозбуждения объекта будут сведены к минимуму. Но в случае «черного ящика» информация о распределениях (р/; 1—р/) априорно неизвестна. Надо суметь построить такую систему управления, которая бы при любых заранее неизвестных распределениях добивалась бы успеха, минимизируя число невозбуждений объекта. Как это сделать, показано на схеме, приведенной на Некто Ху большой начальник, говорит подчиненным: «Я считаю, что должность А должен занять генерал в отставке в возрасте около 60 лет». Один из подчиненных радостно восклицает, что он знает такого человека. Но X явно недоволен. «Идиот,—■ шепчет на ухо выступившему его сосед,— он просто хочет посадить на это место своего приятеля». Суи;ествует еш.е несколько особенностей объектов нового типа, с которыми теория управления начала сталкиваться с конца пятидесятых годов нашего столетия. Но и сказанного, по-видимому, вполне достаточно для того, чтобы оценить необходимость в новом подходе к объекту управления при попытке создать систему, управляющую им. Но прежде чем мы перейдем к описанию, возможных путей решения этой проблемы, нам нужно совершить экскурс в психологию мышления.
18 ГЛ, I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ рис. 1.2. в качестве системы управления использован конечный автомат вероят- ностносО пита. Он работает следующим образом. Во всех состояниях левой группы автомат выдает на объект сигнал x-i, а во всех состояниях правой группы — сигнал х.у. Смена состояний автомата происходит с помощью анализа сигнала, jToCTynHBuiero от объекта после подачи на него того или иного входного сигнала. Если этот сигнал равен О, то происходит смена текущего состояния автомата по стрелке, приведенной на рисунке штриховой линией, или сохранение текущего состояния, что показано петлеобразной штриховой дугой. Выбор того или другого Анализатор Рис. 1.2 происходит равновероятно. Если выходной сигнал от объекта равен 1, то всегда происходит смена текущего состояния автомата в соответствии со сплошной стрелкой. Можно строго доказать, что подобный автомат с увеличением глубины памяти п будет, по мнению ЛПР, асимптотически стремиться к наилучшему функционированию. Но и без строгого доказательства это видно из структуры автомата. Пусть, например, объект описывается распределениями, приведенными выше: (0^9; ОД) и (0,01; 0,99). И пусть в начальный момент наш автомат находится в состоянии 2 левой группы. Он выдает на объект сигнал х^. С вероятностью 0,9 в ответ будет получен сигнал о том, что объект не возбудился. Тогда с вероятностью 0,5 автомат останется в состоянии 2 левой группы, а с вероятностью 0,5 перейдет в состояние / той же группы. Таким образом, с вероятностью 0,45 сохранится состояние 2 в левой группе, с такой же вероятностью возникает состояние / в левой группе и лишь с вероятностью 0,1 — состояние 3 в левой группе. На следующем такте работы автомат опять выдаст сигнал и снова с вероятностью 0,9 получит сигнал о невозбуждении объекта. Если он находился в состоянии / левой группы, то с вероятностью 0,45 это состояние сохранится, а с вероятностью 0,45 произойдет переход автомата в состояние / правой группы. Рассужде[1ия относительно остальных состояний левой группы, в которых мог находиться автомат, аналогичны. После двух тактов работы из начального состояния (состояние 2 левой группы) его очередным состоянием будет с вероятностью 0,2025 состояние I правой группы, с вероятностью 0,405 — состояние / левой группы, с вероятностью 0,2025 — состояние 2 левой группы, с вероятностью 0,09 — состояние 3 левой группы и с вероятностью 0,01 — состояние 4 левой группы. Легко посчитать, что с течением времени вероятность уйти в глубь левой группы будет все время падать, а вероятность перейти в правую группу — возрастать. Но как только автомат перейдет в правую группу и начнет выдавать сигнал х.-^г положение резко изменится. Теперь с вероятностью 0,99 на каждом такте работы он будет переходить в глубь состояний этой группы и лишь с вероятностями 0,005 сохранять свое текун^ее состояние или менять его, переходя влево. Очевидно, что с течением времени автомат обязательно попадет в правую группу состояний и практически при большом п никогда ее не покинет. Тем самым он найдет иравиль-
§1.3. ПСПХОЛОГИЧРХКИЕ ПРЕДПОСЫЛКИ 19 ный способ управления об1>ектом лишь на основании знания его выходных сигналов, ничего априорно не зная о внутренней структуре объекта. Несмотря на столь эффектный пример, следует все-таки отметить, что стн- мульно-реактнвная теория слишком слаба как для объяснения сложных форм поведения человека при решении задач, так и для использования подобного подхода в системах управления сложными объектами. Даже там, где поначалу казалось, что модели такого типа могут привести к успеху, в теории опознавания образов (наиболее популярная модель стимульно-реактивного типа в этой области — персептрон), оказалось, что отсутствие структурирования задачи (объекта) неминуемо приводит к непреодолимым трудностям. Научив, например, персептрон устойчиво отличать букву А от буквы Б и показав-ему сочетание АБ, мы поставим его полностью в тупик. Ибо сочетание АБ он не может расчленить на известные ему А и Б. Это сочетание выступает для него как абсолютно новый образ, никак не связанный с ранее усвоенными. Другая концепция, получившая значительное развитие в моделях решения задач человеком и оказавшая существенное влияние на развитие эвристического программирования для ЭВЛ\, носит название лабиринтной теории. Согласно этой теории перед человеком, принимающ.им решение, находится как бы лабиринт возможных путей. Используя некоторые локальные критерии, он выбирает то или иное продолжение движения в лабиринте возможностей. Особенность лабиринтной модели состоит в том, что человек видит лабиринт не целиком, а только в некоторой фиксированной окрестности площадки, где он находится. Иллюстрацией этого могут служить ситуации, складывающиеся в различных позиционных играх. Пусть разыгрывается некоторая шахматная партия. Любая позиция, сложившаяся в процессе игры на доске, есть площадка некоего лаби- зинта, коридорами которого являются все возможные ходы, допустимые в игре. >1так, мы находимся на некоторой площадке. Игрок, собирающийся сделать очередной ход, имеет возможность выбора любого хода (коридора лабиринта), допустимого в данной позиции. Если бы он видел лабиринт с высоты птичьего полета, то он мог бы наметить последовательность ходов, ведущую к матовой позиции или к ничьей. Но для человека это исключено. Он может мысленно экстраполировать развитие партии только на несколько ходов вперед, учитывая возможные ответные ходы противника. А это означает, что он может проанализировать лишь некоторую часть лабиринта, некоторую окрестность той площадки, где он сейчас находится. И он должен сделать выбор на основе этой локальной информации. Поэтому правила, которыми игрок руководствуется при выборе хода, неточны, эвристичны. Его выбор не обязательно приведет его к положению, которое приближает для него победу в игре. Он может допустить ошибку, чего-то не учесть вне анализируемой окрестности лабиринта. Точное решение в лабиринтной модели достигается только тогда, когда удается проанализировать весь лабиринт. Пример такого положения — игра в крестики- нолики на поле 3x3. Недаром ею увлекаются малыши. Они еще не сообразили, что можно априорно проанализировать все пути развития игры и всегда выигрывать, если противник допускает ошибку. При безошибочной игре крестики-нолики всегда заканчиваются ничьей. Л\алые конечные лабиринты приводят к модели решения задачи, имитируемой конечными автоматами. Любая площадка лабиринта соответствует некоторому состоянию автомата, а коридоры — переходам автомата из состояния в состояние под воздействием входного сигнала и с учетом того состояния (той площадки лабиринта), где автомат сейчас находится. Входной сигнал имитирует те решения, которые принимает ЛПР при выборе коридора лабиринта. При этом ЛПР может создать систему управления объектом также в виде некоторого конечного (детерминированного или вероятностного) автомата. Подобная схема управления показана на рис. 1.3. На нем V и V" отражают обратные связи, характеризующие память автоматов, имитирующих объект управления и систему управления. Если ЛПР структ\ра автомата, имитирующего объект, полностью известна (т.е. известен автоматный граф смены состояний п формирования выходных сигналов), то обратная связь от объекта к системе управления не нужна. Поэтому она показана штриховой линией.
20 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИ51 г Объект и Необходимость в ней возникает только тогда, когда в процессе работы нужно производить «настройку» автомата, имитирующего систему управления, из-за неполного априорного знания об объекте управления. По сравнению со схемой на рис. 1.1 здесь нет входов, характеризуемых вектором Это соответствует тому, что в лабиринтной теории поведения предполагается, что влияние этих не поддающихся измерению параметров можно описать некоторой вероятностной схемой связи между вектором (X, U^) и вектором У. Пример 1.2. Проиллюстрируем схему, показанную на рис. 1.3, для конкретного примера. Для этого выберем простейшую схему условного рефлекса с двумя раздражителями: безусловным и условным х.2. Как известно, при поступлении на вход схемы безусловного раздражителя должна быть выдана некоторая фиксированная реакция — сигнал у. При подаче на вход схемы только условного раздражителя необученная схема сигнала у выдавать не должна. Пусть в течение некоторого числа тактов (некоторого времени) на вход схемы подаются одновременно два сигнала: и Xg. Тогда через опредаченное время должен возникнуть условный рефлекс. Он заключается в том, что при подаче на вход схемы только сигнала дг^ он^ все-таки выдает сигнал у, т. е. реагирует на условный раздражитель, как собака в опытах И. П. Павлова, которая после долгого кормления одновременно со звонком начинает выделять желудочный сок при наличии звонка. Если теперь некоторое число тактов на вход схемы подается только сигнал х^_, то возникает явление угасания условного рефлекса. Через какое-то число тактов рефлекс должен исчезнуть и наступит такой момент, что подача х^^ на вход схемы не вызовет сигнала у на ее выходе. На рис. 1.4 показана схема вероятностного конечного автомата, которая имитирует^ описанный процесс. Автомат состоит из трех блоков: логического L Cucmeria управления h \ : Рис. 1.3 Датчик Рис. 1.4 блока ЛБ, магазинной памяти и датчика, на выходе которого появляется си1нал \, принимающий с вероятностями ^/з значения —1,0, 1. Автомат работает следующим образом. В начальный момент память-магазин пуста. Пусть глубина магазина есть п. Если на вход автомата поступает только сигнал х^, то на выходе ЛБ по-
§ 1.3, ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 21 является сигнал у и содержимое магазина не меняется. Датчик при наличии только не срабатывает. Если на вход автомата поступили два сигнала х^ и Х2, то ЛБ выдает сигнал у. Кроме того, в магазин передается сигнал s^, вызывающий появление единицы на самом нижнем уровне магазина. При повторении комбинации сигналов дг^ и х.^ сигнал Si сдвигает эту единицу каждый раз на одну ячейку магазина вверх. При комбинации сигналов Xi и Х2 срабатывает и датчик случайных сигналов. При ^=0 он не оказывает никакого действия на запись в магазине. При 1 он выдает сигнал, заставляющий единицу в магазине сдвинуться еще на одну ячейку вверх. Наконец, при ^ — — 1 сигнал от датчика заставляет единицу в магазине сдвинуться на одну ячейку вниз или исчезнуть из магазина, если единица находилась на самом нижнем его уровне. При поступлении на вход автомата только сигнала Х2 происходит следующее. Если единица в магазине находится выше некоторого уровня /п, то магазин вырабатывает сигнал q, который формирует на выходе ЛБ сигнал у. Если же уровень т в магазине не достигнут, то сигнал q не выдается и на выходе автомата нет сигнала у. Кроме того, при наличии только л'з ЛБ выдает в магазин сигнал s^, заставляющий единицу в магазине опуститься на одну ячейку вниз. Датчик при наличии только Х2 работает так же, как и при наличии Xi и х^. Таким образом, положение единицы в магазине характеризует степень обу- чениости автомата условному рефлексу. Уровень т есть порог рефлекса. Меняя его, можно имитировать различные предрасположенности системы к установлению рефлекса. Датчик вносит необходимую вероятностную компоненту. Но так как математическое ожидание ^ равно нулю, то он не вносит в процесс систематических искажений. Как следует из рис. 1.3, мы предполагаем, что имитирующий автомат и объект описываются одинаковыми (с точностью до вероятностных реализаций) процессами функционирования. Другими словами, схема эта как бы обратима. И подопытное животное может рассматривать себя в качестве экспериментатора, устанавливающего условный рефлекс у истинного экспериментатора (ЛПР). Ситуация эта хорошо отражена в следующем анекдоте. В клетке находятся две подопытные обезьяны. В комнату входит научный сотрудник, экспериментирующий с обезьянами. В этот момент одна обезьяна говорит другой: «Посмотри, чему я научилась. Сейчас я дерну за веревку, зазвенит колокольчик, и этот чудак даст мне банан. Правда, получилось это не сразу. Пришлось с ним поработать.» Однако в большинстве практически интересных случаев ЛПР не стремится к тому, чтобы система управления имитировала объект управления. В этом нет никакой необходимости. Как правило, систему управления можно сделать проще объекта, которым она управляет. Например, нетрудно показать, что с усложнением объекта имитации — с переходом от простейшей схемы условного рефлекса к цепочкам таких рефлексов и сетям условных рефлексов, способным моделировать весьма сложные поведенческие акты,— система управления, воспроизводящая их особенности, останется таким же конечным автоматом, который был использован в примере 1.2. Но что де.аать, если лабиринт оказывается слишком большим? Или вообще бесконечным. Например, мы играем в крестики-нолики на неограниченном поле с условием, что / одинаковых крестиков или ноликов (/ выбирается по договоренности) в горизонтальных или вертикальных рядах или на диагонали приводят к выигрышу. Такой лабиринт нельзя отобразить в схему конечного автомата, В этом с^1учае можно воспользоваться гипотетическим устройством, легко имитируемым на ЭВМ, которое носит название «Общий решатель задач-» (ОРЗ). Его функционирование протекает следующим образом. Пусть мы имеем некоторую начальную площадку лабиринта. Эту площадку (текущую ситуацию) можно как-то описать. Если снова привлечь в качестве примера шахматную игру, то описание начальной площадки может заключаться, например, в том, что в нем будут перечислены все фигуры, имеющиеся на доске, с указанием полей, на которых они находятся. А описание конечной площадки также будет описанием некоторой позиции на шахматной доске. И цель состоит в поиске такой последовательности ходов, которая постепенно преобразует исходное описание в желаемое (целевое). Для
/ 22 гл. i. ПРИНЦИПЫ ГИТУАЦНОПНОГО УПРАВЛЕНИЯ преобразования описаний используются специальные операторы из некоторого фиксированного списка, хранящегося в ОРЗ. Условие их применения формируется на основе системы различий и приоритетов различий. Каждые два несовпадающих описания в чем-то различаются между собой. Это фиксируется в ОРЗ в виде некоторого типового различия. Например, в шахматной игре одна позиция от другой может отличаться набором фигур на доске или их положением на игровых полях. Приоритет различий задает локальные правила выбора. Они определяют, какие различия требуется устранить в первую очередь. Такая приоритетность различий позволяет ОРЗ на каждом шаге его работы выбирать для применения те операторы (выбирать коридоры в лабиринте), которые устраняют наиболее приоритетные различия. При нескольких операторах, способных устранить определенное различие, в ОРЗ может быть задан и набор приоритетов для операторов. Проиллюстрируем работу ОРЗ на примере, который понадобится нам и в дальнейшем. Пример 1.3. Игра в 5 есть усеченный вариант игры в 15, которой, наверное, увлекались многие читатели. Игра Рис. 1.5 происходит на поле 2x3 (рис. 1.5), на котором расположено пять фишек с цифрами от / до 5. Одно иоле остается свободным. Требуется перевести фишки из начального расположения (например, показанного на рис. 1.5) в некоторое заранее заданное положение (например, в положение, при котором все фишки стоят по порядку, а правая нижняя клетка свободна). Введем теперь различия между позициями этой игры и операторы устранения различий. Можно, например, считать, что позиции имеют элементарное различие, если в соответствующих клетках поля стоят разные фишки, а различием двух позиций считать сумму элементарных различий, которыми они характеризуются. Тогда позиция, показанная на рис. 1.5, будет отличаться от целевой позиции на 4 единицы, так как фишки с номерами 4и 5 уже стоят на тех местах, которые требуются для целевой позиции. Но такое определение различий не слишком удобно для решения поставленной задачи. Если, например, в позиции на рис. 1.5 поменять местами фишки с номерами 3 и 2, то различие сохранится, но нет уверенности, что исходная позиция и вновь полученная ('одинаково далеки» (в смысле числа необходимых преобразований) от целевой позиции. Более удобно ввести различие через суммарное число транспозиций, необходимых для перевода текущей ситуации в целевую. (Транспозиция — это перестановка двух соседних фишек или сдвиг фишки на пустое поле.) Например, для того чтобы фишка с номером 2 стояла там где надо, требуется одна транспозиция — передвижка ее на одно поле вправо. Для фишки с номером / требуется две транспозиции, а для фишки с номером 3 — одна. Как уже говорилось, фишки с номерами 4 и 5 уже стоят на своих местах. Тогда суммарное отличие начальной позиции от целевой будет равно 4 единицам. Но если фишки с номерами 2 и 3 поменять местами, то различие в транспозициях будет другим (в отличие от того, что было при другом определении различия, приведенном ранее). При таком изменении различие будет равняться 6 единицам. Другими словами, вновь полученная позиция будет отстоять от целевой на большее расстояние, чем исходная. Для устранения различий в рассматриваемой игре можно использовать операторы четырех типов: сдвинуть на свободное поле нижнюю, верхнюю, левую, правую фишки. В конкретной позиции можно использовать не все операторы. При свободном иоле в середине — три из четырех, а при свободном угловом поле — два из четырех. Выбор того или иного оператора определяется их приоритетностью. Приоритетность, в свою очередь, определяется тем, насколько данный оператор уменьшает различие. Например, в той позиции, которая изображена на рис. 1.0, нет смысла двигать фишку с номером 5 (применять оператор «сдвинуть на свободное поле нижнюю фишку»), так как это приведет к увеличению различия. Применение же операторов: «сдвинуть на свободнее поле левую фишку» и «сдвинуть на свободное поле правую фишку» здесь равноправно. Применение любого из них vMeiibOjaeT отличие данной пози1Ши от целевой на одну единицу. Пример 1.3 демонстрирует одну важную особенность ОРЗ. Планы решения, которые строит ОРЗ, обладают свойством монотонности. На каждом шаге рсшс-
§1.3. ПСИХОЛОГИЧЕСКИЕ ПРЕДПОСЫЛКИ 23 ПИЯ долж[[о ириисходить улу'шюггис, приближение к цели. Именно это своГгство и оказалось роковым дли ОРЗ и подобных ему программ и систем. Можно привести следующую аналогию из математики. ЛАетод градиента позволяет находить экстремум функции только при условии, что эта функция имеет один экстремум. Тогда возможно монотонное движение к экстремальной точке. Но в большинстве случаев экстремумов у функции несколько. Тогда метод градиента, последовательно «улучшающий» значения функции, может завести нас в любой локальный экстремум, который окажется для нас ловушкой. Куда бы мы ни двигались из данной точки с заданным шагом градиента, везде нас ожидает неудача, ибо значения функции во всей доступной нам окрестности «хуже» того, которое соответствует точке, в которой мы находимся. Для поиска глобального экстремума в теории оптимизации придумано немало приемов: изменение градиентного шага, движение «вдоль оврага» и т. п. В системах типа ОРЗ также построены некоторые приемы улучшения планов решения. Например, переход от исходного лабиринта к более простому, более грубому. Планирование движения сначала по нему, а потом уточнение этого плана на исходном лабиринте, причем при монотонности грубого плана уточненный план может стать немонотонным. Но, к сожалению, пока не удалось найти хорошие процедуры для построения грубых планов. А пока это не сделано, нельзя надеяться на построение хороших моделей принятия решений. Но у лабиринтной теории есть куда более важный недостаток, чем свойство монотонности, присущее практически всем процедурам движения по лабиринту. Этот недостаток заключается в априорной задаиности лабиринта или способа его построения. Но откуда берутся эти сведения? В терминах, принятых в п. 1,1, это •означает, что ЛПР знает / и ему нужно лишь построить процедуру управления. Но мы уже говорили, что создание описания объекта управления — задача не только более сложная, чем нахождение самой процедуры управления, но и не имеющая пока каких-либо стандартных приемов решения. При решении различных задач, при принятии решений мы всегда сталкиваемся с двумя случаями. Либо перед нами задача, которую, в принципе, мы умеем решать "и надо только найти решение данной конкретной задачи, либо мы сталкиваемся с совершенно неясной для пас проблемой, для которой даже неизвестно, с чего начать. Вот ребенок пробует сложить из кубиков то, что нарисовано на картинке. Если в коробке всего шесть кубиков, на сторонах которых что-то нарисовано, то его лабиринт весьма велик — можно сложить более 48 тысяч комбинаций. Но маленький ребенок справляется с таким громадным лабиринтом. Ибо он не складывает кубики хаотично, а соотносит их с концевой площадкой лабиринта, выбирая для каждого кубика одну верную грань из шести. В этой задаче лабиринт налицо. Раз научившись что-либо складывать, ребенок уверенно выполняет аналогичную работу для других кубиков, даже если число их значительно больше шести. Но вот перед ним другая задача. Обратимся к рис. 1.6. На нем изображена карта острова. На ней отмечены города и связывающие их железные дороги. Мистер Браун живет в городе А, находящемся на севере острова. Во время отпуска он поставил перед собой следующую задачу: не пользуясь шоссейными дорогами и автомобилем, проехать из города Л в I ород Я, посетив по пути все города, отмеченные на карте, ровно по одному разу. Разрешима ли эта задача? Лабиринт перед вами. Остается только пробовать. Прежде чем читать дальше, попробуйте. Теперь вам стало ясно, что решение, по-видимому, не существует, но мистер Браун рецикл поставленную перед собой задачу. Как он это сделал? По-видимому, он кое-что слышал о лабт^ринтной и модельной теориях мышления, а скорее всего, обошелся без них, не зная, что он «говорит прозой». Он знал, что задача разрешима. Для этого достаточно воспользоваться тем, что между городами В и Щ можно проехать морским путем, на который нет запрета в условии задачи. Тогда поставленная задача разрешима. Если вы сами догадались о подобном решении, то вы испытали инсайт (озарение), чувстио радостного изумления от найденного решения. При этом от лабиринта, навязанного чертежом, приведенным на рис. 1.6, вы сумели перейти к новому лабиринту, построенному вами.
24 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ В рассмотренной задаче подсказка о новом лабиринте содержалась в чертеже. Города В \\ Щ стоят на море. Но подобная подсказка может и отсутствовать. Такое положение имеется в весьма популярной в психологических экспериментах головоломке «не ломая и не сгибая спичек, сложить из шести спичек четыре одинаковых равносторонних треугольника». В эксперименте все шесть спичек кладутся перед испытуемым на стол, что задает лабиринт всевозможных положений шести спнчек на плоскости стола. Испытуемые делятся на две группы. Те, кто относится к первой группе, подвигав спички и убедившись, что задача не решается (в данном лабиринте!), отказываются от ее решения, считая, что их попросту надули. Испытуемые второй группы начинают пытаться выяснить условия, при которых решение задачи возможно. И вознаграждаются за усилия тем, что строят новый лабиринт возможностей — пространственный. В нем легко решают поставленную экспериментальную задачу, сооружая правильную треугольную пирамиду. Можно считать, что в какой-то мере лабиринтная модель описывает поведение человека при решении задач, когда им используется стандартная шаблонная модель, найденная ранее им самим, или сообщенная ему учителем, или почерпнутая им из книг и учебников. Итак, кроме поиска по лабиринту возможностей для человека при решении нетривиальных проблем весьма важна процедура поиска самого лабиринта (или его части), в котором можно найти необходимое решение. В процессе решения задачи он должен сформировать этот лабиринт, а затем уже искать решение. Именно нахождение такого лабиринта вызывает у человека поток положительных эмоций, «радость открытия». Сформулированное нами положение о двухэтапности решения любой задачи является краеугольным камнем третьей психологической теории решения задач — модельной теории. В рамках этой теории всякое решение некоторой проблемы состоит из последовательности нескольких шагов: описание исходной позиции задачи, описа- ние целевой позиции задачи, установление гомоморфизма между этими описаниями или сведение их к одинаковому языку описания, установление системы преобразований описаний, поиск последовательности преобразований, ведущих от начальной позиции к целевой. Лишь последний шаг отражен в лабиринтной модели решения задач, первые четыре шага в ней считаются уже реализованными. Рассмотрим суть первых четырех этапов. На этапе описания исходной позиции можно поступать по-разному. Для иллюстрации этого опять обратимся к шахматам. В некоторой шахматной позиции можно, как уже говорилось, описать положение каждой фигуры на игровом поле. И это описание будет полным и исчерпывающим. Но шахматист вряд ли использует его для поиска своего хода. Оно для него слишком далеко от способа описания целевой йозиции. В самом деле, окончательная позиция в шахматной игре не описана в терминах расположения конкретных фигур на полях доски. Она описана в других терминах, типа «Король противника находится под ударом, не может покинуть клетку, где он находится, так, чтобы перейти на клетку, не находящуюся под ударом, и не может другими фигурами ликвидировать угрозу взятия короля». Это означает, что описание ис- Рис. 1.6
§ 1.4. В ЧЕМ СОСТОИТ СИТУАЦИОННОЕ УПРАВЛЕНИЕ? 25 ходной позиции, которое мы приняли, и описание конечной позиции (описание патовой позиции производится в тех же терминах, что и описание мата) не гомоморфны друг другу. Они не лежат в пределах одного лабиринта. И именно в этом состоит психологическая трудность решения шахматных задач для неопытных шахматистов. Опытные же шахматисты описывают исходную позицию на языке того же уровня, что и язык, использованный для описания заключительной позиции. Так вместо отдельных фигур и ходов появляются связки, вилки, сдвоенные и проходные пешки, форсированные ходы и многое другое. В шахматах нет нужды искать систему преобразовании описаний. Она определена правилами игры. Но во многих случаях это необходимо делать. На соревнованиях кондитеров, которые должны приготовить торт из заданного для всех одинакового набора исходных компонент, каждый участник соревнования формирует свою систему «преобразования позиций». И насколько успешно он это сделает, настолько успешен будет результат его работы. Заканчивая этот экскурс в пcиxOv^oгию решения задач человеком, остановимся еще на одном важном для нас вопросе. До сих пор мы рассматривали решение задач человеком в статике, вне времени и пространства. Но для реальных объектов управления такое ограничение вряд ли возможно. Как правило, решения по управлению принимаются с учетом динамики функционирования объекта управления. Что по этому поводу может сказать нам психология? При наблюдении за поведением людей, занятых управлением динамическими объектами, психологи выявили определенные принципы, которыми люди руководствуются при принятии своих решений. И основной вывод заключается в том, что при решении управленческих задач, в которых учитывается динамика процессов в объекте, человек строит их динамическую модель. Они как бы протекают у него в уме, сохраняя относительный временной масштаб частей процессов. В зависимости от «удаленности» управленца от процесса управления динамическая модель может быть различной. Если дежурный на железнодорожной сортировочной горке, который управляет перемещением локомотивов и вагонов с помощью стрелок, видит всю пространственную картину перемещений непосредственно, то дежурный по станции воспринимает ее с помощью мнемосхемы, а поездной диспетчер — лишь по графику движения поездов, вычерчиваемому по дискретным сообщениям, поступающим к нему. Таким образом, динамическая модель процесса на сортировочной горке не требует от дежурного специальных способов отображения кроме тех, которые связаны с непосредственным наблюдением за реальным положением вещей. Дежурный по станции непосредственно наблюдать и оценивать может только то, что видно из окна помещения, где он находится. Остальная информация является опосредованной, она отражена на мнемосхеме. Поэтому развитие процессов частично происходит как бы в его голове. Он вынужден интерполировать и экстраполировать это развитие. В наибольшей степени интерполяция и экстраполяция процессов происходит в голове поездного диспетчера или дежурного по отделению железной дороги. В его голове как бы отражается в реальном масштабе времени процесс перемещения поездов на участке, которым он управляет. У опытных дежурных и диспетчеров такое протекание процессов на объекте управления отражается как бы «само собой», вне активного сознания. Поступающие к диспетчеру или дежурному словесные сообщения перекодируются им на уровень представлений, характерных для имитационной модели, работающей в его голове. § 1.4. В чем состоит ситуационное управление? Итак, при работе с объектами, с которыми столкнулась сейчас теория управления, по-видимому, не приходится надеяться на возможность использования для управления ими традиционных методов и приемов. Как уже выяснилось, проблема состоит в самом описании уникального объекта управления, учета в этом описании
26 ГЛ. 1. ПРИНЦИПЫ СИТУЛЦИОШЮГО ^-ПРАВЛЕНИЯ не только его специфической структуры и функционирования, но и поведения людей, и возможностей эволюции объекта во времени. Требуется создать такой подход, который на едином языке давал бы возможность описывать как объект управления и его функционирование, так и процедуру управления им. Рассмотрим сначала постановку задачи управления, в схему которой укладываются все известные сегодня задачи управления сложными объектами. Определение 1.1. Будем называть текущей ситуацией на объекте управления совокупность всех сведений о структуре объекта управления и его функционировании в данный момент времени. Определение 1.2. Будем называть полной ситуацией совокупность, состоящую из текущей ситуации, знаний о состоянии системы управления в данный момент и знаний о технологии управления. В этих двух определениях многое нуждается в уточнении. Но на концептуальном уровне изложения, по-видимому, достаточно того их понимания, которое было дано выше. Будем обозначать полные ситуации через Si (i есть отличительный номер ситуации), а текущие ситуации — через Qj (j есть отличительный номер ситуации). Пусть в распоряжении системы управления имеется п различных способов воздействия на объект управления (одноша- говых реилений). Каждое такое решение мы будем обозначать как {k есть отличительный номер воздействия). Элементарный акт управления можно представить в следующем виде: Смысл этого соотношения заключается в следующем. Если на объекте управления сложилась ситуация Qj и состояние системы управления и технологическая схема управления, определяемые Si, допускают использование Еоздействия t/^, то оно применяется, и текущая ситуация Qj превращается в новую ситуацию Q/. Подобные правила преобразования в дальнейшем называются логико- трансформационными правилами (ЛТП) или корреляционными правилами. Полный список ЛТП задает еозможности системы управления Еоздействовать на процессы, протекающие в объекте. Очевидно, что в силу конечности числа различных воздействий все множество возможных полных ситуаций как-то распадается на п классов, каждому из которых будет соответствовать одно из возможных воздействий на объект управления. Другими словами, должны существовать такие процедуры, которые позволили бы классифицировать полные ситуации так, чтобы из них можно было образовать столько классов, сколько различных одношаговых решений есть в распоряжении системы управления. Эти процедуры можно назвать процедурами классификации. Если для не-
§ i.l. в ЧЕМ СОСТОИТ СНТУЛЦИОИНОН УПРАВЛЕНИЕ? 27 текущрй Анализатор Класси(рикатор Норрелртор J Smok с/гу^аишго выбора которых полных ситуаций невозможно в силу не слишком хорошего знания как объекта, так и влияния воздействий на него, указать единственное одношаговое решение, то можно пока включить эту ситуацию в несколько классов. Но из-за такого пересечения классов возникнет задача выбора того или иного решения из числа возможных для данной полной ситуации. Для осуи;ествления подобного выбора нужны специальные процедуры экстраполяции последствий принятия того или иного решения. С их помощью можно на основании знаний об объекте управления и его функционировании заранее оценить результаты применения выбранного воздействия и сравнить полученные прогнозы для всех возможных для данной полной ситуации воздействий. Если все указанные процедуры оказалось возможным построить, то об- ш,ая схема решения задачи управления выглядела бы так, как показано на рис. 1.7. Описание текуш^ей ситуации, сложившейся на объекте управления, дается на вход Анализатора. Его задача состоит в оценке сообш^ения и определения необходимости вмен1ательства системы управления в процесс, протекаюи;ий в объекте управления. Если текущая ситуация не требует такого вмешательства, то Анализатор не передает ее на дальнейшую обработку. В противном случае описание текущей ситуации поступает в Классификатор, Используя информацию, хранящуюся в нем. Классификатор относит текущую ситуацию к одному или нескольким классам, которым соответствуют одношаговые решения. Эта информация передается в Коррелятор, в котором хранятся все ЛТП. Коррелятор определяет то ЛТП, которое должно быть использовано. Если такое правило единственное, то оно выдается для исполнения. Если же таких правил несколько, то выбор лучшего из них производится после обработки предварительных решений в Экстраполяторе, после чего Коррелятор выдает решение о воздействии на объект. Если Коррелятор или Классификатор не могут принять решения по поступившему описанию текущей ситуации, то срабатывает Блок случайного выбора и выбирается одно из воздействий, оказывающих не слишком большое влияние на объект, или же система отказывается от какого-либо воздействия на объект. Это говорит Возд(?йстбие на одъект Рис. 1.7
28 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ о том, что система управления не располагает необходимой информацией о своем поведении в данной ситуации. Фактически из-за сложности объектов управления, которыми мы занимаемся, нет надежды на то, что исходные знания о них и способах управления ими будут достаточно полны. Поэтому система управления подобного типа принципиально должна быть открытой системой. Она должна иметь возможность корректировать свои знания об объекте и методах управления им. В работе такой системы управления имеется как бы два этапа: этап обучения и настройки и этап работы. В начальный период, когда система управления только еще создается, собираются многочисленные сведения от технологов, хорошо знающих объект управления. С их помощью формируются классы ситуаций и ЛТП. Они определяют целесообразность использования тех или иных воздействий на объект управления в той или иной ситуации. При этом мнения экспертов могут не совпадать, что и приводит к попаданию одной и той же ситуации в различные классы по управлению. С помощью экспертов формируются и процедуры экстраполяции, способы оценки ситуаций, исходящие из желаемого функционирования объекта управления. Это означает, что на первом этапе в проект системы закладывается значительное количество субъективной информации об объекте управления и процедурах управления им. Это как бы коллективный опыт тех людей, которые — хорошо или плохо — справлялись со своими обязанностями при управлении объектом. Здесь важно, что при проектировании системы желательно учитывать самые, на первый взгляд, незначительные сведения об объекте. Зачастую оказывается, что именно такие побочные знания играют большую роль в принятии решений по управлению объектом. После этапа накопления знаний и формирования процедур в блоках, показанных на рис. 1.7, система может начинать работать. Но в процессе своей эксплуатации, особенно на первых порах, она будет довольно часто принимать неверные решения из-за неполноты информации и неточности процедур. Во всех этих случаях необходим! этап дообучения системы управления. Отметим одну важную особенность рассматриваемого класса систем. Число различных полных ситуаций обычно весьма велико. Возможно, что их заранее и нельзя перечислить. А число решений конечно и невелико. Другими словами, чаще всего где, как всегда, \А\ означает число элементов, входящих в множество А. Находясь за рулем автомобиля, водитель воспринимает огромное число полных ситуаций, определяемых внешней обстановкой на пути движения и состоянием автомобиля. А число принимаемых им одношаговых решений невелико. Регулировщик на перекрестке сводит все множество ситуаций в окрестности перекрестка к двум одношаговым решениям по переключению сигнала
§ {.А. В ЧЕМ СОСТОИТ СИТУАЦИОННОЕ УПРАВЛЕНИЕ? 29^ светофора в некотором фиксированном направлении. Секретарь, находящийся в приемной большого начальника, мгновенно оценивает полную ситуацию и принимает одно из трех решений, выражаемых, обычно в стандартных словах «Проходите, пожалуйста», «Подождите, сейчас он занят», «К сожалению, Его нет и сегодня не будет». Чем больше число возможных ситуаций и чем меньше число допустимых одношаговых решений, тем эффективнее выглядит работа схемы управления, которую мы показали на рис. 1.7. Но и тогда, когда ^ можно применить подобную схему. Хотя ее эффективность в таком случае и не будет очень высока, но, возможно, что это единственный путь управления объектом. Метод управления, который в обш,их чертах мы описали, основан на введении понятия ситуации, классификации ситуаций и их преобразовании. Естественно поэтому назвать его методом ситуационного управления, ибо, в противовес к эпиграфу данной главы, в русском языке слово, определяюш,ее суть описываемого подхода, фактически единственное. И лишь большой интерес к методам управления подобного типа породил в последнее время ряд названий методов, частично более широких, а частично и более узких по сравнению с тем, что вкладывается в понятие метода ситуационного управления (семиотическое моделирование, семиотическое управление, логико-лингвистические методы управления и т. п.). Сформулируем теперь ряд особенностей, присущ^их методу ситуационного управления. 1. Ситуационное управление требует больших затрат на создание предварительной базы сведений об объекте управления, его функционировании и способах управления им. Эти затраты оправданы только тогда, когда традиционные пути формализации описания объекта управления и процедуры управления реализовать невозможно. Другими словами, если объект управления таков, что адекватно описывается, например, системой линейных дифференциальных уравнений первой степени с постоянными коэффициентами, то нет никакой нужды использовать метод ситуационного управления. Это оправдано лишь тогда, когда традиционная формализация приводит к задаче такой размерности, что ее практическое решение известными методами невозможно — например в случае, когда число уравнений в системе составляет несколько десятков тысяч. 2. Описание ситуаций, складывающихся на объекте управления (текущих ситуаций), должно быть произведено на таком языке, в котором отражались бы все основные параметры и связи, необходимые для классификации этого описания и сопоставления ему одношагового решения по управлению. При этом необходимо правильно выбрать уровень описания, который не должен быть
3(1 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРЛВЛЕРП^Я tin слишком подробным, ни слишком грубым. При слишком подробном описании возникает «шумовой эффект», частности и несу- ш,ественные для управления факты и явления могут сильно усложнить понимание сути функционирования объекта и сделать построение системы управления невозможным. Этот случай можно проиллюстрировать следуюи;им примером. Некто, никогда не видевший игры в футбол описывает свои впечатления от игры другому лицу, также не имеюш,ему представления об этой игре, следуюи;им образом: «двадцать два человека, одиннадцать из которых одеты в одну форму с номерами на спине, а одиннадцать других — в другую форму, также с номерами на спине, перемещаются по полю, которое имеет следующие особенности (следует точное и подробное описание поля и его разметки). Каждый из играющих может перемещаться по следующим, по-видимому, связанным с его номерами траекториями (следует формальное описание динамики перемещения игроков по полю). Иногда вместе с перемещением игроков перемещается круглый предмет (следует описание мяча), но с некоторой вероятностью осуществляется передача этого предмета от одного играющего к другому или вывод его из поля игры (следует описание вероятностного процесса передачи мяча). В последнем случае специальные игроки возвращают мяч на поле по некоторым траекториям (следует описание динамики вбрасывания мяча). И т. д.». Возникает вопрос: сможет ли слушающий уловить в этом научном изложении, достаточно точно описывающем наблюдавшийся матч, суть игры в футбол? Думаю, что это весьма затруднительно. А если бы футбольный матч был описан на уровне языка статистической физики (что тоже принципиально возможно), то что тогда можно было извлечь из этого описания? 3. Язык описания ситуаций должен позволять отражать в нем не только количественные факты и соотношения, характеризующие объект управления, но и качественные знания, которые не могут быть формализованы в обычном математическом смысле. Ведь большинство сведений, которые управленец будет получать от технолога, будут иметь примерно такой вид: «в большинстве случаев я думаю, что надо делать X, если имеет место К»; «мне кажется, что в ситуации X хорошо было бы сделать Z», «когда X растет, то, как правило, Y убывает, но не очень сильно» и т. п. И надо научиться отражать эти качественные высказывания на языке описания ситуаций. Следует также учитывать, что высказывания человека об объекте и способах управления им неполны. Нужны специальные приемы для получения от него всей той информации, которая нужна для принятия решений по управлению (вспомним случай с диагностикой психических заболеваний, когда на самом деле истории болезней не содержали информации). Известная детская задача: «в движущемся поезде, состоящем из 40 вагонов, три из которых пассажирские, а остальные товарные, имеется три
§1.1. в ЧE^\ состоит ситуационное управление? 31 проводника и один охранник; требуется узнать сколько лет машинисту» — иллюстрирует сказанное. 4. Классификация ситуаций, объединение их в классы при использовании одношаговых решений происходит на субъективной основе, ибо первоначальная информация о соответствии той или иной текуш,ей ситуации тому или иному решению получается от экспертов. Система как бы суммирует знания отдельных экспертов и становится носительницей коллективного опыта людей. Однако процедуры классификации должны быть построены таким образом, чтобы сама классификация годилась бы для тех текуш,их ситуаций,, о которых система не получила информации от экспертов. Это приводит к тому, что задача классификации становится аналогичной задаче формирования понятий на основе обучаюи;их последовательностей. Система, сформировав некоторое понятие, обладает уже большими знаниями, чем те, которые были заложены в нее вначале эксперталш, хотя эти дополнительные знания могут оказаться и неверными, что может выявиться в процессе ее эксплуатации. Таким образом, в системе могут появляться «предрассудки», неверные представления и неправомерные обоби;ения. Она может вести себя, как жени;ина, которая говорит в разговоре: «знаю я вас. Все мужчины лгут». А на ехидный вопрос «вы что же, имели дело со всеми мужчинами?», простодушно отвечает: «да, была знакома с одним вроде вас...». 5. Аналогичные слова можно сказать и о формировании ЛТП. Они первоначально также получаются с помош,ью информации, сооби;аемой экспертами. Уточнение этих правил, уничтожение противоречий в них и формирование новых ЛТП происходят уже в процессе эксплуатации системы. Все это верно и для правил экстраполяции и для оценки тех или иных текуи;их ситуаций. 6. Из двух последних пунктов вытекает принципиальный вывод о том, что системы ситуационного управления не могут оптимизировать сам процесс управления. Они ориентированы лишь на такое управление, когда достигнутые результаты будут не хуже лучи]их результатов, которые ^юг бы получить человек. Однако, как 1Ю- казала практика применения систем подобного типа, чаш,е всего результаты, выдаваемые систе]\юй, лучше человеческих. Это происходит по ряду причин. В частности, на систему не влияют элю- ции человека-управленца и в стрессовых ситуациях она принимает решения так же, как и в обычных; система ничего не забывает и не упускает решений, которые для человека апостериори «сами собою разумеюш,иеся», но не пришли ему вовремя в голову. Помните, как в известном рассказе А. П. Чехова: «Было б >ше козьей ножкой!». Таким образом, метод ситуационного управления можно считать эвристическим. 7. На самом деле- для ашогих реальных объектов управления одношаговые решения не определяют стратегии управления. В таких объектах необходимо формировать в качестве решений цепочки
^2 ГЛ. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ ИЗ одношаговых решений. Для этого в системе экстраполяции должны быть предусмотрены специальные процедуры «склейки» одношаговых решений. С их помощью формируются более сложные решения по управлению. Указанные особенности учтены в процедурах и методах, описанных в последующих главах. Надо помнить, что эти методы не единственно возможные. И любой специалист вправе придумывать и предлагать свои подходы к решению задач, вытекающих из сути метода ситуационного управления. И последнее замечание. Как следует из Исторического очерка развития ситуационного управления, приведенного в конце книги, оно возникло много раньше, чем сформировалось активно развивающееся сейчас научное направление, называемое теорией ис- куссшенного интеллекта. У ситуационного управления много общего с методами, характерными для исследований в области искусственного интеллекта. По ходу изложения эти аналогии мы будем отмечать, что поможет читателю использовать из арсенала теории искусственного интеллекта не только терминологию, но и те результаты, которые там получены, для обогащения своих систем управления сложными объектами. § 1.5. Семиотические модели * Цель настоящего параграфа — уточнить понятие семиотической модели, лежащее в основе метода ситуационного управления и вообще методов семиотического управления. В том, что в таких методах используется именно данная модель, состоит главное отличие от традиционных методов теории управления, в основе которых лежит некая формальная (в логическом смысле) модель. Начнем с определения формальной модели. Определение 1.3. Формальной моделью называется четверка Л1 = <Г, Р, Л, П>, где Т — множество базовых элементов, Р — синтаксические правила, А — система аксиом, П — семантические правила. Поясним суть элементов, образующих формальную модель. Множество Т состоит из конечного или счетного множества элементов любой природы. Это как бы алфавит формальной системы, набор элементов, из которых будут строиться все остальные ее элементы. На элементы формальной системы не накладывается никаких ограничений. Важно только, чтобы любые два элемента из Т чем-то отличались друг от друга. Иными словами, должна существовать такая конструктивная (завершающаяся через конечное число шагов) процедура п^, что ее применение к элементам множества Т дает ответ на вопрос: одинаковы ли два сравниваемых элемента или нет. Важность этой процедуры аюжно проиллюстри-
§ 1.5. СЕМИОТИЧЕСКИЕ МОДЕЛИ 33 ровать на примере множества Г, состоящего из букв русского алфавита. Отождествление различных написаний буквы А, например, дело не такое простое. А иногда, особенно в скорописи, бывает довольно трудно идентифицировать в слове ту или иную букву. кроме того, должна существовать конструктивная процедура Яа, которая дает ответ на вопрос: принадлежит ли данный элемент к Т или не принадлежит. Для того же иллюстративного примера это соответствует ответу на вопрос о принадлежности некоторой графемы к списку букв русского алфавита. Синтаксические правила Р используются для того, чтобы из базовых элементов строить такие их совокупности, которые в рамках данной формальной системы считаются синтаксически правильными совокупностями. На множество синтаксических правил нет особых ограничений. Требуется только наличие конструктивной процедуры Лд, которая давала бы однозначный ответ на вопрос: является ли данная совокупность базовых элементов синтаксически правильной или нет. Систему аксиом А образует любое множество синтаксически правильных совокупностей. На это множество не накладывается никаких специальных ограничений. В частности, оно может совпадать со всем множеством синтаксически правильных совокупностей. Наконец, семантические правила П (по-другому они называются правилами вывода) расширяют, если это возможно, лиюжество аксиом, добавляя к ним новые синтаксически правильные совокупности. Множество, получаемое после применения семантических правил к аксиомам, носит название ^шoжecтвa семантически правильных совокупностей. На рис. 1.8 условно показан результат работы формальной системы, которая выступает как автономный генератор. Процедуры порождения множества синтаксически правильных совокупностей, основанные на произвольном применении правил Я, и процедуры порождения множества семантически правильных д. л. Поспелов
34 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ совокупностей, основанные на применении правил П, работают независимо. Определение 1.4. Формальная модель, для которой существуют конструктивные процедуры Лх, л2 и Яд, называется конструктивной формальной моделью. Определение 1.5. Конструктивная формальная модель, для которой существует конструктивная процедура Я4, дающая однозначный ответ на вопрос — принадлежит ли данная синтаксически правильная совокупность множеству семантически правильных совокупностей, называется разрешимой формальной моделью. Приведем несколько иллюстративных примеров. Пример 1.4. Вернемся снова к коробке детских кубиков, содержащей всего шесть кубиков. Каждый кубик есть базовый элемент. Легко убедиться, что существуют и Яз, позволяющие отличать один кубик от другого (по несовпадающему рисунку хотя бы на одной грани двух сравниваемых кубиков) и отличать кубики из других наборов (например, по несовпадению концевых точек линий или границ между цветами на всех шести гранях данного кубика со всеми другими кубиками набора, если нет более простого признака типа другого размера кубика). Система синтаксических правил такова, что она считает синтаксически правильными любые совокупности кубиков, в которых все шесть кубиков выложены в виде прямоугольника 2x3 или 3x2. Ясно, что существует конструктивная процедура Яд. Система аксиом совпадает с такой совокупностью кубиков, которая соответствует одной из приложенных к коробке картинок (эта картинка как бы фиксируется в виде начальной позиции). Правила П дают возможность получать из исходной картинки новые картинки (думаю, что читатели в детстве сами строили эти правила). И, наконец, ясно, что существует конструктивная процедура Я4, ибо определение всех семантически правильных совокупностей содержится в наборе шести картинок, приложенных к набору. Следовательно, мы имеем дело с разрешимой формальной моделью. Пример 1.5. Рассмотрим классическое исчисление высказываний. В качестве элементов Т будем использовать малые латинские буквы без индексов и с нижними индексами, а также символы "|, &, V и В качестве Р возьмем следующий набор правил: 1. Каждый базовый элемент есть синтаксически правильная совокупность. 2. Если а — синтаксически правильная совокупность (формула), то "Iа также есть формула. 3. Если а и |3 — формулы, то (ot\/|3), (а&Р), (а-->|3) — также формулы. Здесь а и |3 — метасимволы, не входящие в Т. Процедура Яд явно существует. РассАютрим, например, совокупность базовых элементов вида ("|^Vb). Это, конечно, формула, ибо а w Ь — формулы согласно первому правилу из Я, "^а — формула согласно второму правилу из Р^ а ("|а\/Ь) — формула по третьему правилу из Р. В противопо-
§ 1.5. СЕМИОТИЧЕСКИЕ МОДЕЛИ 35 2* ложность предыдущей совокупности совокупность С] У а) не есть формула, ибо в Р нет правил, последовательное применение которых привело бы к ее построению. Явное выражение процедуры Яз не приводится, чтобы доставить читателю удовольствие самому написать ее. Система аксиом имеет следующий вид: (1) (а^(р^а)); (2) ((а ^ (р -> у)) ^ ((а ^ р) ^ (а у)); (3) ((а&Р)--а); (4) ((а&Р)^р); (5) ((а ^ Р) ((а Y) _ (а ^ (Р & у)))); (6) (а-.(а VP)); (7) (p^(aVP)); (8) ((a--v)->((P-^Y)^((aVP)->Y))); (9) ((а_р)_(-1Р_ la)); (10) (cc-^l la); (11) (1 "Icc-^cc). Конечно, аксиом многовато и непривычному к логической символике читателю трудно их охватить единым взглядом. Но это и не нужно. Надо смотреть на них, как на множество произвольно выбранных из правильных совокупностей элементов. Наконец, правила П в классическом исчислении высказываний в той его форме, как она рассматривается в данном примере, имеют вид: 1. Если а — семантически правильная совокупность (выводимая формула), то при замене в а любого базового элемента (везде, где он входит в а) любой формулой вновь получается выводимая •формула; 2. Если (а-^^Р) и а — выводимые формулы, то р также выводимая формула. Вопрос о существовании конструктивной процедуры Я4, которая позволяла бы для любой формулы исчисления высказываний определять выводима она или нет, пока остается открытым. Но в рассуждениях, которые будут следовать после определения 1.6, мы дадим на этот вопрос положительный ответ. И тогда читателю станет ясно, почему в данном примере выбрана именно такая система аксиом. Приведенных примеров, по-видимому, достаточно. Отметим только, что исчисление предикатов и формальные грамматики, широко используемые в языках программирования, суть конструктивные формальные системы. Но в общем случае они не являются разрешимыми формальными системами. Рассмотрим теперь модель вида L = <Z, D, Я, V>. Здесь Z — некое ^шoжecтвo, которое мы будем называть множеством интерпретируемых значений. Правила D, называемые правилами отображения, устанавливают возможность отображения T^Z, которое является Nmoro3Ha4HbiM в обе стороны. Эти правила при некоторой конкретной реализации дают отображение T-^Z, од-
36 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ позначное в одну сторону, т. е, приписывают каждому элементу, из Т некоторое интерпретирующее значение. Та или иная реализация отображения задается Я — правилами отображения или задается извне. Наконец, правила интерпретации V позволяют приписывать любой синтаксически правильной совокупности базовых элементов некоторое интерпретирующее значение, если заданы интерпретирующие значения для всех базовых элементов, входящих в эту совокупность. Определение 1.6. Формальная модель М, для которой задана модель L, называется интерпретированной форлшльной моделью. Пример 1.6. Для исчисления высказываний, рассмотренного в примере 1.5, можно в качестве модели интерпретации взять модель, в которой Z={Истина, Ложь}, правила отображения задают произвольное отображение любых элементов из 7, кроме "] , &, V и ^ в любой элемент Z, правила Я отсутствуют, а правила V определяются табл. 1.1. Таблица 1.1 а b la а & Ь ау b а b Ложь Ложь Истина Ложь Ложь Истина Ложь Истина Истина Ложь Истина Истина Истина Ложь Ложь Ложь Истина Ложь Истина Истина Ложь Истина Истина Истина Эти правила позволяют для любой синтаксически правильной формулы исчисления высказываний приписать некоторое интерпретирующее значение. Нетрудно проверить, что всем аксиомам, перечисленным в примере 1.5, эти правила при любых интерпретациях входящих в них базовых элементов приписывают значение «Истина». Семантические правила, приведенные в том же примере, не могут изменить значение формул, к которым они применяются. Таким образом, все формулы, которые выводятся из аксиом, также всегда имеют интерпретирующее значение «Истина». Можно доказать, что аксиомы и правила вывода, приведенные нами, обладают свойством полноты в том смысле, что любая формула исчисления высказываний, которая имеет значение «Истина», выводима из этого множества аксиом с помощью имеющихся семантических правил. А это означает, что исчисление высказываний, рассмотренное нами, является разрешимой формальной системой. Процедура Л4 состоит в проверке того, что при любых интерпретациях базовых элементов проверяемой формулы она принимает значение «Истина». Если это не так, то проверяемая формула не пр1И1ад-
§ 1.3. сел\110Т11ЧЕСКИЕ .модели 37 лежит множеству семантически правильных формул (совокупностей). В фор.мальных системах Т. Р. А и П остаются неизменными. Это означает, что если бы формальные системы использовались для создания ситуационных люделей управления, то язык описания ситуаций (он определяется 7 и Я), исходные знания об объекте управления и законах управления (они определяются задан1!ем множества аксиом) и ЛТП (они совпадают с се^лантнческими правилами) оставались бы неизменны>ш и нeзыблeмы^пi. Но это противоречит всему, что мы говорили об объектах управления и самой системе ситуационного управления, ее принципиальной открытости для обучения и дообучения. Система управления, базирующаяся на формальной людели, априорно должна иметь всю информацию, которая остается для нее неизменной в течение всего периода управления. Все утверждения, выведенные в ней в любой момент времени, остаются выведенными навсегда. Ясно, что для объектов управления, отличных от детских кубиков из примера 1.4, такое положение не имеет места. В процессе функционирования системы управления могут корректироваться языки описания ситуаций, изменяться знания об объекте и методах управления им. Это означает, что все элементы, входящие в определение М, могут изменяться в процессе ее функционирования. Рассмотрим в связи с этим людель вида С = <уИ, /у., 7р, хл» Хп>- Здесь Хг, Хл, Ха Хп — соответственно правила изменения Г, Р, Л и П. Определение 1.7. Модель С называется семиотической моделью. Подобное название С связано с тем, что в отличие от формальных моделей, в которых элементы, образующие множество Г, обладают жестким синтаксисом, задаваемым процедурой Л1, жесткой семантикой, определяемой процедурой интерпретации, и жесткой прагматикой (то, как трактует этот элемент ЛПР с точка зрения процесса управления), в ^юдeли С все эти свойства элементов ii становятся доступными для изменения. Но именно такой особенностью обладают знаки — элементы знаковых, или семиотических, систем, изучаемых в ceNHioTHKe. Такие системы тесно связаны со всей человеческой деятельностью. Именно изменчивость и условность знаков делают эту деятельность эффективной. Поясним сказанное на простом примере. Сигнал звонка ^южeт означать, что кому-то надо поднять телефонную трубку. Но прагматика звонка для меня может быть различной в зaвиcи^юcти от того, жду л\\ я с кем-то разговора или знаю, что трубку должны снять в соседней комнате. Вместо звонка меня >югут позвать к телефону стуком в перегородку. Синтаксис знака изменился, а семантика и прагматика сохранились. И точно такой же звонок >южет означать конец
38 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ зависилюсти от работы, что при неизменном синтаксисе знака дает другую семантику. А в странах, где надо особо платить за каждое соединение абонентов, люди договариваются о том, что если телефон прозвонит четыре раза, то встреча состоится, а если пять — откладывается. Сохраняя синтаксис телефонных звонков, они меняют их семантику и прагматику. Человек окружен знаковыми системами, его деятельность пронизана ими. Он постоянно творит такие системы, договариваясь с другими партнерами о синтаксисе, семантике и прагматике знаков. Правила изменения, введенные нами в модель С, в какой-то мере отражают подобный процесс. Правила Хг и Хя меняют синтаксис базовых элементов и их совокупностей, правила Хл и хп— семантику и прагматику совокупностей. Можно было бы еще изменять модель интерпретации. Тогда бы мы получили модель, подобную знаковым системам человека. Но мы этого делать не будем. Для систем управления вполне достаточно изменения элементов в формальных моделях. Другое название знаковых систем и моделей — семиотические модели. Этого названия мы и будем придерживаться в дальнейшем. Посмотрим, что означают правила изменения в модели С в тep^шнoлoгии системы управления. Начнем с ЛТП. Модель М детерминирована и неизменна. Правила хп Дают возможность отказаться от этого, сделать ЛТП переменными, например адаптивными. Примерами таких ЛТП могут служить ЛТП с вероятностной перенастройкой вида Qy->(Q/., q,\ Qu. q,\ Q/„ ^,). В таком ЛТП текущая ситуация Qj при полной ситуации Si преобразуется не в одну фиксированную текущую ситуацию Qj, как было ранее, а в г различных текущих ситуаций. Выбор того или иного преобразования осуществляется вероятностным механизмом с х'четом того, что qi {i=\, 2, . . ., г) — вероятности реализации соответствующего преобразования \ 2 ^/^ ^ • В удачи или неудачи применения такого ЛТП происходит изменение распределения. Если, например, в полной ситуации Si было применено преобразование Qj^Q^. и оно оказалось удачным (например, с точки зрения ЛПР), то может увеличиться на некоторую величину при условии сохранения нормировки, т. е. при условии соответствующего уменьшения остальных Qj. Такой способ изменения ЛТП позволяет подстраивать семантические правила под тот объект, для которого построена система управления. Вместо пересчета вероятностной схемы можно менять ЛТП и другими cпocoбa^иI, и об этом будет говориться в соответствующем разделе книги.
?j 1.6. ДАННЫЕ 11 ЗНАНИЯ 39 В кажлый текущий момент некоторые утверждения об объекте, его состоянии, а также состоянии системы управления являются истинными, отражают положение вещей. Эти знания можно выразить в виде набора аксиом. Можно считать, что все, составляющее в момент принятия решений описание полной ситуации S^, есть набор таких аксиом. Они служат источником вывода о том решении (У^, которое надо применить в данном случае. Однако в другой момент времени эти знания будут уже другими. И утверждение о том, что станок № 1245 свободен, которое могло выступать как аксиома в предшествующий такт управления, на данном такте может уже оказаться ложным. Система аксиом все время «дышит», меняется. И эти изменения можно явно указывать, например, в правых частях ЛТП, записывая их в виде Si\ Qj=>Qr, h- Здесь li — те изменения, которые необходимо внести в описание полной ситуации St после того, как Qj перешла в Qi. Конечно, возможны и другие способы описания изменений аксиом, задаваемых правилами Хл- Наконец, изменения синтаксических правил могут свидетельствовать, что язык описания ситуаций на объекте управления, полные знания о нем и процедурах управления оказался слишком бедным. В него необходимо ввести новые способы образования функций, отношений типовых сообщений. Функции такого из- рис. 1.9 менения выполняют правила Хр- Правила добавляют в список исходных понятий, отношений или функций новые элементы или исключают из него те, которые оказались ненужными для целей управления. Семиотическую модель можно представить в виде сети, показанной на рис. 1.9. Каждая вершина сети представляет собой некоторую формальную систему, а связи между вершинами определяют переходы от одной формальной системы к другой под влиянием изменений Эти изменения могут совпадать с Хг» Хя' Хл или хп или быть какой-то их комбинацией. За один такт работы семиотической модели в зaвиcи^юcти от coдepжи^югo It ^юдeль либо останется в том же состоянии (в рамках той же формальной системы), что и ранее, либо перейдет в новое состояние. § 1.6. Данные и знания Введенное нами понятие семиотической модели и ее интерпретация, показанная на рис. 1.9, позволяют рассмотреть важную проблему искусственного интеллекта — взаимоотношение данных и знании и логическую противоречивость знаний. Вопрос этот важен и для ситуационного управления. Но прежде чем мы непосредственно перейдем к его обсуждению, отметим, что до последнего времени в
40 гл. 1. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ теории программирования задач для систем искусственного интеллекта оживленно дебатировался вопрос о двух возможных путях построения подобных систем: процедурном и декларативном. В процедурном подходе в центре внимания разработчика находилась процедура, программа, а информация для нее играла второстепенную роль. Программа работала с данными, вызывала их по мере необходимости, уничтожала в памяти. Данные оставались где-то на периферии. Считалось, что основная работа по созданию системы лежит в области создания процедур. Это положение стало меняться, когда данные стали усложняться. Появились сгруктурированные данные — списки, документы, семантические сети, фреймы. О некоторых из них речь еще впереди, они будут играть важную роль на страницах нашей книги. Затем возникли специальные средства для хранения данных — информационные банки и базы, к которым стал добавляться термин интеллектуальный. Это означало, что вместе с хранением данных в базах и банках происходит их элементарная обработка, выполняемая специальными вспомогательными программами. Они осуществляют поиск данных, запись их в отведенное место и ряд других операций. Форма записи данных в хранилище может не совпадать с той их формой, которую использует программа, решающая основную задачу, ибо таких программ много, а хранилище одно. Поэтому сервисные программы стали брать на себя функцию перевода запроса и выдаваемого ответа из одной формы представления в "другую. Информация усложняла свою форму представления, она становилась структурированной, одни порции информации стали связываться с другими некоторыми отношвниями. Процедуры, связанные с ее обработкой, начинали усложняться, становились самодовлеющими. Многие преобразования, 'которые раньшз о:ущзствлялись программами, решающими основную задачу (например, поиск по образцу) стали выполняться вне основной программы. Во многих случаях Рис. 1.10 привычные программы, перерабатывающие информацию за счет ее прямого видоизменения, заменялись специальными процедурами по переработке информации. Так возник декларативный подход, в котором работа с данными (их начинают называть знаниями) выходит на первый план, оттесняя сами процедуры на второй план. В чем же принципиальная разница между данными и знаниями? Традиционное программирование не дает на это ответа. Но в рамках теории семиотических моделей такой ответ можно HaiiTii. Давайте посмотрим на рис. 1.10. На нем очень услоЕно показана лошадь, пасущаяся на лугу, что вызыг.аег в голове видящего
§ 1.6. ДАННЫЕ Л ЗНАНИЯ 41 ее индивида иексторый обобщенный образ оошади, пасущейся на лугу». Этот образ включен в некоторую систему данных о такой ситуации. Индивид может, например, понять, что движения, которые делает лошадь, сводятся к перемещению по лугу, отгону надоедливых слепней и к поглощению травы — пищи для лошади. Он может установить, что это лошадь определенной масти (если он, конечно, знает, что это такое), домашняя и. следовательно, она кому-то принадлежит. По некоторой ассоциации он может себе представить конюшню (не конкретную, где живет данная лошадь, а конюшню вообще), человека, который за лошадью ухаживает, и т. п. Важно, что весь тот информационный комплекс, который возникает у индивида, видящего пасущуюся лошадь, оказывается логически непротиворечивым, ибо он может представить себе конкретную ситуацию (ей в ситуационном управлении соответствует текущая ситуация), в рамках которой все эти сведения могут быть совмещены. И если индивиду задать вопрос: «Лошадь летает?.), то он ответит на него отрицательно. Такие лошади, конечно, не летают. Но индивид может легко представить себе летающую лошадь. Например, Пегаса, если он что-то слышал о нем. В мире греческой мифологии, где действует Пегас, лошадь молсет летать. Но если в мире мифологии задать вопрос: «С помощью чего летает Пегас?», то ответом будет: «С помощью крыльев». Ибо Пегас — крылатая лошадь. А в мире русской народной сказки лошади не надо иметь даже крыльев. Конек-Горбунок умеет летать и без них, перенося героя сказки куда тому нужно. Если эти знания о лошади совместить в рамках одной конкретной ситуации, то получится логически противоречивая система. В ней лошадь летает и не летает, летает только если у нее есть крылья и может летать без крыльев. Получается абсурд. Но подобный абсурд встречается на пути человека постоянно, и он нисколько не страдает от этого. Он вполне спокойно оперирует с такими, например, логически противоречивыми образами: «Началась третья половина игры», «Исполнение всех желаний, у которых нет предела», «Речка движется и не движется, вся из лунного серебра» и т. п. Более того, подобные абсурдные утверждения развлекают человеческий ум, приятны для человека. Это происходит потому, что в голове человека вся такая информация не хранится в рамках одной системы. Тогда бы он был лишен возможности производить над ней логические операции, а следовательно, не смог бы использовать хранимую информацию для своих прагматических целей. Значит, эта логически противоречивая информация так организована в его памяти, чтобы избежать возможных логических противоречий. Одна из возможностей такой организации информации как раз и показана на рис. 1.9. В каждой вершине сети хранится логически непротиворечивая информация, совместимая в рамках одной ситуации, и эта информация может быть отражена в некоторой формальной системе. Относительно нее можно делать логически обоснованные выводы, которые можно использовать при наличии подобной ситуации. Но возможны и другие ситуации, в которых действуют свои аксиомы и семантические правила, своя интерпретация. В этих ситуациях (возможных мирах) может выводиться то, что в другой ситуации оказалось бы бессмысленным. Отметим еще один важный аспект, позволяющий уяснить разницу между данными и знаниями. Любое понятие, используемое человеком, имеет как бы две стороны — экстенсионал и интенсионал. В науке до сих пор продолжаются споры относительно точной нх интерпретации. Поэтому наши дальнейшие рассуждения нельзя рассматривать как способ разрешить эти споры. Понятия <окстенспонал» и «интенсионал» мы будем трактовать прагматически, как принято в теории представления знаний. Под экстенсионалом некоторого понятия мы будем подразумевать набор конкретных фактов, соответствующих данному понятию. Если, например, для некоторой конкретной лаборатории в данном научном учреждении мы рассмотрим понятие «сотрудник», то его экстенсионалом может быть список работающих в этой лаборатории. Экстенсионалом понятия «ателье по ремонту микрокалькуляторов в г. Минске» служит перечень всех таких ателье, имеющихся в данном городе в данный момент времени. Экстенсионал понятия может сыть конечным, как было в приведенных нами примерах, но может быть и бесконечным. В последнем случае, разумеется, его нельзя задать простым перечислением. В этом случае поступают по-иному. Например, задают некоторое характеристическое правило, удовлетворение или неудовлетворение которому определяет принадлежность к
42 гл. I. ПРИНЦИПЫ СИТУАЦИОННОГО УПРАВЛЕНИЯ экстенсионалу данного понятия. Например, опреди^ляя экстснснонал понятия «четное число», мы не можем просто перечислить все четные числа, но можем задать его путем следующего характеристического правила: если при делении на 2 данное число имеет нулевой остаток, то оно принадлежит экстенспоиалу понятия «четное число». Подобное правило можно (что обычно и делается) использовать для определения понятия «четное число». Это определение и будет интенсионалом данного понятия. Между декларативным и процедурным представлением, с одной стороны, и экстенсионалом и интенсионалом, с другой, существует очевидная связь. Экс- тенсионал — это набор конкретных данных, заданных в декларативной форме. Интенсионал же, как правило, задает некоторую процедуру, позволяющую определять принадлежность того или иного конкретного факта к некоторому понятию. Интенсионал выделяет знания, отделяет их от данных, которые всегда задаются экстенсионально. Теперь можно описать разницу между данными и знаниями. Данные есть комплекс информации, совместимый в рамках некоторой формальной системы с учетом всех воз.можных интерпретаций этой системы. В случае ситуационного управления множество данных есть множество текущих ситуаций, которые могут складываться на объекте управления (последний предполагается неизменным), и информация о текущем состоянии объекта и системы управления им. Знания же есть информация, которая хранится во всех возможных мирах вместе с условиями перехода от одного мира к другому. Другими словами, знания — это не только множество всех текущих ситуаций в объектах данного типа, но и способы перехода от одного описания объекта к другому, способы изменения компонент формальной системы, а, следовательно, знания — это то, что воплощается в некоторой семиотической модели. § 1.7. План дальнейшего изложения Прежде чем переходить к изложению основных проблем, связанных с созданием систем ситуационного управления, наметим план изложения. В последующих главах мы прежде всего займемся описанием языка ситуационного управления, с помощью которого будут описываться ситуации. Этот язык допускает согласование с языком описания знаний об объекте управления и управления им, а также с языком, на котором описываются цели управления. Затем мы рассмотрим процедуры классификации, столь важные для ситуационного управления. Опишем методы пополнения описаний ситуаций за счет использования знаний относительно объекта управления и методов управления им, хранящихся в памяти системы. В связи с этим мы обсудим специальные псевдофизические логики, используемые для пополнения описаний и процедуры индуктивного вывода, позволяющие получать в процессе управления новые знания. Наконец мы обсудим различные подходы к проблеме принятия решений по управлению, традиционные для ситуационного управления. Будут описаны как традиционные дедуктивные системы вывода решений, так и нетрадиционные системы, опирающиеся на специфические свойства семиотических моделей.
ГЛАВА 2 ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ Понятие розы так же мало обладает ароматом, как мало ноиятие прыжка прыгает. Г. Фсрстер §2.1. Вступительные замечания В традиционных методах управления объект управления, как правило, заменяется некоторой синтаксической формальной моделью. Поясним, что вкладывается в это название. Пусть мы имеем некоторое дифференциальное уравнение вида л'-г2л' —3^^ = /^ Попробуем задать себе вопрос — какой объект описывается этим уравнением? К сожалению, ответить на него невозлюжно, если не знать,, для описания какого объекта было оно построено. Переход от содержательной задачи управления к ее математическому аналогу исключает семантику исходной задачи, лишает проблему конкретности. Если такой переход совершен, математик берется за дело. Ему нет дела до объекта управления. С него вполне достаточно той математической реальности, которая скрывается за синтаксической ^юделью. Он люжет исследовать самые тонкие оттенки поведения интегральных кривых для этого уравнения, решать проблему об устойчивости его решений, разрабатывать методы решения уравнений подобного типа. Это его епархия, и для владения ею ему совершенно необязательно видеть и знать объект управления. Аналогичная картина возникает при переходе от объекта управления к любой синтаксической (формальной по своей природе) математической модели. При этом обнаруживается сила математики, широкая применимость предлагаемых ею методов. Если математику удалось найти и исследовать решения уравнения, описываюш,его колебание мембраны в телефонной трубке, а колебания крыльев салюлета, приводящие, в конце концов, к их разрушению (флаттер), описываются уравнениями такого же вида, то решения, полученные для колеблюш.ейся мембраны, полностью переносятся на явление флаттера. Или, если лшожества различных задач можно свести к задаче целочисленного линейного программирования, то для всех них, нeзaвиcи^ю от семантики решаемой задачи, математик даст метод нахождения оптимального решения. Но, как уже говорилось в гл. 1, новые объекты не дают такой возможности. Стандартизация методов решений возникающих тут задач практически нeвoз^южнa. Всем памятен призыв, прозвучавший десяток лет тому назад среди специалистов по пресловутым
44 f'^. языки для описания объекта и сит^-ацип автоматизированным системам управления, как они мыслились их первым адептам, призыв к стандартизации блоков этих АСУ. Если бы такие блоки оказалось возможным изготовить, то проблема проектирования АСУ, одна из наиболее актуальных проблем последнего двадцатилетия, существенно упростилась бы, и можно было бы надеяться на возникновение теории АСУ. Но опыт показал, что подобные надежды призрачны. И кроме типового блока расчета заработной платы и некоторых других (кадровая система, система \чета на складе и т. п.), вообще говоря, не удалось создать никаких типовых модулей. Ибо, как уже отмечалось ранее, каждый объект АСУ уникален. Для него требуется разработка ориентированной на него системы управления. И, по-видимому единственное, что можно стандартизовать, это методику проектирования однотипных АСУ, Уникальность объекта управления (а только такие объекты мы и рассматриваем в нашей книге) требует для описания его структуры, функционирования и особенностей управления им специальных семантических и прагматических формальных моделей. Это требует специальных языковых средств для описания таких моделей. Языковые средства должны быть способны отображать семантику и прагматику описываемого явления. К сожалению, классическая математика не позволяет сделать это. Поэтому приходится расширять ее средства. И их расширение легче всего производить в области математической логики, наиболее близко сталкивающейся со способом описания явлений и получения выводов из этих описаний qevioBCKOM. С другой стороны, технологи, которые до автоматизации объекта управления как-то справлялись со своей задачей, ^югyт дать много информации о нем и о своей деятельности по управлению. Но сообщаемая ими информация всегда выражена на естественном языке, весьма далеком от точного языка математики. Что происходит, когда на сложный объект, управление которым еще не автоматизировано, приходит ученик? Что делает опытный технолог-управленец в этом случае? Конечно, он не может сообщить ученику точного алгоритма управления, ибо он его не знает. Но кое-что, находящееся на каком-то интуитивном уровне, он знает. И он начинает объяснять ученику принципы управления объектом. И велит следить ученику за тем, как он реализует процесс управления. И вот через некоторое время наступает чудо. Обыкновенное чудо, происходившее в истории человечества миллионы раз. "^у'ченик гюстроил в своей голове модель объекта и модель управления им и становится сам технологом-управленцем. Ему для этого вполне хватило объяснений учителя, сделанных на обычном естественном языке, и наблюдения за его действиями по управлению. Это позволяет нам выдвинуть следующую естественнонаучную гипотезу.
§ '2.'2. роли и отношения 45 Гипотеза 2.1. Всю информацию об объекте управления и способах управленР1я им аюжно выразить cpeдcтвa^пi обычного естественного языка. Эту гипотезу, конечно, нельзя строго обосновать. Возможно, что для некоторых объектов она просто неверна. Вспомним описанный в гл. 1 случай с диагностикой психических заболеваний. Вряд ли то мгновенное «ощущение» болезни, позволяющее опытным врачам практически безошибочно ставить правильный диагноз, можно записать в виде текста на русском языке. Тогда бы не было проблемы диагностики. Но для многих объектов подобную гипотезу можно принять. А следствием этого является тот интерес к естественному языку и его изобразительным средствам, который характерен для метода ситуационного управления. Но для современных ЭВМ, на базе которых строятся наиболее гибкие системы управления, естественный язык в его полном объеме недоступен. Поэтому возникает проблема сужения текстов на естественном языке, описывающих сам объект управления и опыт по управлению им, до такого уровня, чтобы полученные описания можно было «погрузить» в семиотическую систему. Это приводит к некоторому утверждению, выливающемуся в гипотезу. Гипотеза 2.2. Всякий текст на естественном языке, относящийся к тому, о чем говорится в гипотезе 2.1, можно перевести на формальный язык семиотической модели. Эта гипотеза, как и предыдущая, верна, по-видимому, не всегда. Но практический опыт автора книги и всех разработчиков систем ситуационного управления подтверждает ее справедливость. Таким образом, мы приходим к следующей постановке основной задачи, связанной с описанием ситуаций, а также структуры и функционирования объекта управления: найти такой способ естественно-языкового описания необходимой информации, который позволял бы реализовать основные процедуры ситуационного управления: классификацию, корреляцию (соотнесение с помощью ЛТП описания ситуации с одношаговыми peшeния^п^), экстраполяцию. Этой проблемой мы и будем заниматься в настоящей главе. § 2.2. Роли и отношения Постигая мир, осуществляя свою деятельность в нем, человек должен уметь Иоделировать и описывать окружающий его мир. Однако как он это делает, мы знаем еще очень плохо. Л\ногие детали этого процесса остаются нам неизвестными. Гем не менее в последние десятилетия в психологии, психолингвистике и теории дознания получено немало фактов, на основании которых можно сформулировать следующую гипотезу. Ги потеза 2.3. При отображении внешнего мира, при описании его человек вычленяет в нем конечный набор отношений. Эти отношения связывают между собой отдельные элементы модели внешнего мира. Сами элементы. связа1{иые отношениями, выступают в них как определенные po.ui, семантика которых определяется видом отношения.
46 гл. 2. языки ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИП Эта гипотеза нуждается в некоторых пояснениях. По-видимому, не вызывает сомнений, что человек (возможно, что и все животные, находящиеся на достаточно высокой ступени развития) воспринимает окружающий мир структурированно. Свидетельство этого — человеческий язык, предназначенный, в частности, для описания мира, в котором человек живет. Человек выделяет в этом мире отдельные конкретные факты, предметы, явления, процессы, события и отношения между ними. Язык сохраняет эту структуризацию. Факты, предметы, явления, процессы и события получают в языке свои, присущие им имена, а отношения выражаются либо с помощью специальных имен, либо чисто языковыми синтаксическими средствами. Семантика отношений неразрывно связана с теми ролями, в которых выступают элементы, связанные отношением. Например, отношение начальник — подчиненный связывает двух людей (элементов модели), которым присущи определенные роли, одна из которых называется начальник, а вторая — подчиненный. Во фразе «Иванов — начальник Петрова» Иванов и Петров находятся именно в этих ролях. Постигая роли, человек познает ситуацию реальной действительности и может организовать свою целенаправленную деятельность в ней. Для решения последней задачи он использует роли типа средство — результат, причина — следствие, и ряд других ролей. Согласно гипотезе 2.3 таких ролей существует конечное число, а следовательно, существует и конечное число отношений, выделяемых человеком в реальном мире, ибо каждое такое отношение есть пара взаимосвязанных между собой ролей. Справедливость подобного утверждения вряд ли можно доказать. Но наблюдения над языковыми текстами и методами построения специальных языков для описания действительности, с которыми мы познакомимся в последующих параграфах, как будто подтверждают эту гипотезу. Приведем в заключение данного параграфа список ролей (явно неполный): целое, признак, признак признака (и далее рекурсивно любое число раз), владелец, количество, множество, порядок, сравнение, вышестоящее понятие, мера, приписываемый признак (например, «человек из тех, которых я знаю»), действие, признак действия, лицо, совершающее действие, пособник, средство, объект, информационный объект (например, «Иван получил известие о своих делах»), источник, принимающий, место, время, причина, обстоятельство, цель, результат, заместитель («Он выпил чай вместо меня»). Как мы увидим далее, все эти роли можно отразить в предлагаемых языках описания ситуаций. § 2.3. Естественный язык и теория управления Для представителей разных наук естественный язык видится по-разному. Для лингвиста он есть объект изучения как таковой. Для психолога он выступает как инструмент мышления и коммуникации между людьми, для философа — как модель, с помои;ью которой организуются познавательные процессы. Специалист в теории управления также имеет свою концепцию языка. Для него язык выступает прежде всего как средство описания тех объектов, которыми он собирается управлять, ситуаций, складываюш,ихся на этих объектах, и процедур управления. Высказанные нами гипотезы об использовании естественного языка в ситуационном управлении инициируют поиск тех механизмов, с помои;ью которых естественный язык может выражать понятия, отношения и роли, важные для управленца. И первый шаг на пути нахождения этих механизмов — выделение в лексике языка групп, не- суш.их определенную функциональную нагрузку при описании объектов, ситуаций и процедур управления.
§2.3. естественный язык и теория управления 47 1, Понятия. Сюда входит большая группа лексических единиц языка, которая используется для обозначения однородных групп фактов, событий, явлени!! и других элементов в реальном мире. Примерами понятий могут служить: стол, подъемный кран, фрезерование, конец смены, землетрясение, премия и т. и. Важно здесь то, что слово стол означает не какой-то конкретный предмет реального мира, а стол вооби;е, любой предмет, который можно назвать столом. Аналогично, конец смены также не конкретизирован и событие, описываемое данным словосочетанием, может происходить неизвестно где и неизвестно когда. Это означает, что понятиям соответствует какая-то своя структура, некий набор обязательных характеристик, с помош,ью которых одни понятия отделяются от других, причем конкретные элементы действительности называются этими словами и словосочетаниями. Это, действительно так. И в следуюш,ей главе книги мы специально остановимся на этом вопросе. Пока же будем апел- лир01зать к нашей интуиции, которая должна нам подсказать, что можно отнести к группе понятий. В дальнейшем понятия будут обозначаться латинскими буквами с индексами или без них. Не будут использоваться лишь те буквы, которые мы введем для обозначения других функциональных групп лексики естественного языка. Договоримся также о следуюи;ем обозначении. Когда понятие будет употребляться по отношению к некоторому конкретному элементу действительности, мы будем применять малые, строчные, буквы, а когда оно будет относиться к классу однородных элементов — большие, прописные. Например, для фразы «Стол может быть деревянным, железным или каменным», понятие стол мы будем обозначать какой-либо большой латинской буквой, а во фразе: «Этот стол мне нравится» понятие стол мы будем обозначать малой буквой. Таким образом, величина буквы показывает, имеем ли мы дело с конкретным понятием или понятием-классом. 2. Имена, Практически любые слова и словосочетания могут играть роль имен. Имена служат для конкретизации тех или иных элементов действительности, входяи;их в понятие-класс. Примерами имен могут служить: Петр Петрович Петров, поезд номер 33, вагон номер 7, номер вешалки Театра на Бронной и т. д. Номера не всегда выделяют единственный элемент из класса. Петровых с именем отчеством Петр Петрович суи;ествуют сотни, если не тысячи, поездов с номером 33 и вагонов с номером 7 — десятки > номеров в гардеробе Театра на Бронной — сотни. Поэтому, как и для понятий, мы введем два обозначения для имен. Малыми буквами i с различными индексами мы будем обозначать имена конкретных элементов, а большими буквами / с различными индексами — имена подклассов понятия-класса, всем элементам которого присвоено это имя. Pacc^ютpим фразу «Л\ой дядя Петр Петрович Петров». В этой фразе используется понятие-класс «дядя».
48 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ М От лнглийского слова relation, означающего отношение. В названии этих языков подчеркивается, что именно отношения играют в них основную роль. Его мы обозначим некоторой большой латинской буквой. «Мой дядя» выделяет из этого класса некий подкласс людей, для которых я являюсь племянником. Это как бы имя, которое мы должны были бы обозначить как /i. Наконец, Петр Петрович Петров из этого подкласса выделяет конкретного человека, и, согласно нашей договоренности, его имя нужно обозначить какой-либо малой буквой с индексом, например t'l. Иногда трудно узнать, относится ли имя к конкретному элементу, или речь идет о неком подклассе элементов. Но можно надеяться, что при описании узких проблемных областей, связанных с управлением конкретным объектом, подобная трудность исчезает. 3. Отношения. Отношения фиксируют связи между понятиями и именами, а также между другими функциональными группами языка, о которых речь пойдет ниже. В отличие от других функциональных групп, отношения могут задаваться не только с по- ^ющью лексики языка, но и с помощ,ью грамматических связей, выражаемых средствами языка. В силу большой важности отношений для построения языка ситуационного управления и других языков реляционного типа опишем группы отношений языка более детально. 3.1. Отношения классификации. С помош.ью этих отношений происходит классификация элементов реального мира, образуются классы элементов, устанавливаются отношения между клacca^ш, а также между классами и отдельными элементами. Важнейшее из этих отношений — иметь имя, которое в дальнейшем мы будем обозначать буквой р. Это отношение позволяет выделять из понятия-класса разные по мои;ности подклассы, вплоть до выделения конкретного элемента из класса однородных элементов. Его действие мы продемонстрировали в предшествую- щ,ем разделе, когда говорили об именах. К той же группе отношений принадлежат отношения класс — подкласс и элемент — класс. По сути, эти два отношения выполняют роль, аналогичную отношению иметь имя. Но в языке они могут фиксироваться и без каких-либо применений слов и словосочетаний, относящихся к именам. Например, «Некоторые члены бригады 1», «Часть рабочих сборочного цеха», «Один из автомобилей колонны таксопарка». Близким по духу к этим отношениям являются отношения типа: род —вид, нижестоящее понятие — вышестояцее понятие, Пpимepa^п^ их использования могут служить «В число подъемных кранов входят как стационарные краны, так и передвижные», «Молоток люжет служить примером инструмента». К той же группе отношений принадлежит и отношение часть — целое, суть кото- рого ясна из следующих примеров: «Это окна моего дома», «Токарный станок имеет станину», «Карбюратор двигателя автомобиля
$2.3. ЕСТЕСТВЕННЫП ЯЗЫК И ТЕОРИЯ УПРАВЛЕНИЯ 49 является одной из важных частей системы». Все эти отношения (как и отношения других типов) мы будем в дальнейшем обозначать малыми буквами г с различными индексами. В конце раздела об отношениях мы приведем список некоторых отношений вместе с теми индексами, которые будут присвоены им в рамках данной книги. 3.2. Признаковые отношения. Эти отношения приписывают различные качественные признаки понятиям. Все их можно представить в виде последовательной ко>тозицни двух отношений: иметь признаком и иметь значение признака. Примерами их могут служить «Очередь на шлюзование большая» («Очередь на шлюзование имеет длину. Эта длина — большая»), «Портальный кран», «Ткацкий станок». Эти отношения описывают совокупность атрибутов, присуш,их понятиям, являются их характеристиками. Одни из них имеют для понятий определяюш,ий характер (например, иметь длину d для понятия очередь), а для других это не так, и они характеризуют лишь данный конкретный элемент в данном месте и в данное время (например, «Этот дом белый», но, конечно, в другое время он люжет оказаться перекрашенным). Признаковые отношения тесно связаны с понятиями. Можно считать, что понятия есть некоторый набор определенных атрибутивных признаковых отношений. Понятие есть как бы сумма определяющих его признаков. В понятии сосредоточено то общее, что объединяют отдельные, конкретные элементы в один класс. И это общее как бы колеблется в некоторых пределах изменения значений атрибутивных понятий. К признаковым отношениям относятся и различные отношения, имеющие метафорический смысл (напри.мер «План тяжелый»). 3.3. Количественные отношения. Они выражают квантитативные характеристики понятий. Количественные отношения можно свести к композиции двух отношений иметь меру и иметь значение меры. Примера>и1 фраз, в которых реализованы подобные отношения, могут служить: «В распоряжении диспетчера имеется два свободных автобуса», «Расстояние между пунктами А и В равно десяти километрам». Особую роль играют количественные отношения, в которых вместо конкретного значения меры указано некоторое качественное значение: «Имеется много времени для выполнения этой работы», «Часто станок 7 не работает». Этот случай мы в нашем анализе языка выделим особо и расоют- рим после анализа отношений. 3.4. Отношения сравнения. Эти отношения по какому-то признаковому или количественному отношению сопоставляют две характеристики некоторого понятия или группы понятий. Примерами их могут служить «Это решение эффективнее того, которое принял диспетчер Петров», «Танкер по длине больше
50 Гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ причала», «Рабочий Иванов в два раза быстрее выполняет работу, чем Смирнов». 3.5. Отношения принадлежности. Эти отношения близки к отношениям классификации, но отличаются от них тем, что связывают два элемента внешнего мира, которые связаны лишь ситуативно. Примерами таких отношений могут служить: «Иванов — коллега Петрова, у них одинаковая специальность», «Работы X и Y находятся сейчас в поле зрения диспетчера», «Сидоров — брат Купцова». | 3.6. Временные отношения. К ним принадлежат отношения типа быть одновременно, быть раньше, совпадать по началу, пересекаться во времени и ряд других. Сюда же относятся и отношения, приписывающие элементам некоторое цремя существования или дату: «План будет выполнен в этом году», «Сборка изделия закончилась в 8 ч утра 30 ноября 1983 г.». 3.7. Пространственные отношения. Эти отношения фиксируют место пребывания некоторого элемента реального мира или вазимоотношение элементов между собой в некотором пространстве. Примерами их служат отношения находиться в, быть между, быть слева, касаться и т. п. В следующих фразах реализованы пространственные отношения: «Эти два цеха разделяет стена», «Справа от причала находится судно», «Деталь лежит на станине». 3.8. Каузальные отношения. Это отношения для отражения причинно-следственных связей, а также связей, отражающих цель, мотивацию, предпочтения при принятии решений и действиях. Примерами фраз, в которых проявляются подобные отношения, могут служить: «Передвижка судов от причала позволит разгрузить танкер «Баку»», «Для устранения аварии диспетчер отключил линию Х9 6», «Когда давление поднимается выше нормы, то температура расплава резко возрастает». 3.9. Инструментальные отношения. Эти отношения отражают прагматический аспект деятельности. Самые важные из них — служить для или быть средством для. Сюда же относятся отношения типа быть инструментом, быть вспомогательным средством, способствовать и т. п. Отношения такого типа присутствуют, например, в следующих фразах: «Десятник топором срубил сосну», «Для разгрузки сухогрузов используется причал № 8», «Этот процесс может быть реализован только в ва- к\"уме». 3.10. Информационные отношения. Эта группа отношений описывает различные стороны передачи и получения информации, приказов, просьб и т. п. Примерами могут служить фразы «Иванов передал Сидорову приказ начать бурение скважины», «Министерство не получило в срок отчета о работе предприятия А». 3.11. Порядковые отношения. Они описывают соотнесенность элементов реального мира между собой. Они вы-
§2.3. ЕСТЕСТВЕННЫП ЯЗЫК И ТЕОРИЯ УПРАВЛЕНИЯ 51 ражаются такр1ми, например, словами, как следующий, ближайший, очередной и т. п. Существуют и другие группы отношений (например, отношение замещения: «Бригада Иванова выполнила разгрузку вместо бригады Петрова»), но основные группы отношений, важные для задач управления, мы перечислили. В табл. 2.1 представлены ос- Таблиц а 2.1 п/п Наименование отношения No П/П Наименование отношения 1 Иметь 32 Быть справа 2 Быть элементом класса 33 Быть спереди Быть сзади 3 Быть подклассом класса 34 4 Род — вид 35 Наискосок 5 Нижестоящее — вышестоящее 36 Пересекаться в пространстве (по иерархии) 37 Касаться 6 Часть — целое 38 Быть внутри (в пространстве) 7 Иметь признак 39 Находиться на 8 Признак — значение 40 Быть сверху 9 Признак — мера 41 Быть снизу 10 Мера — значение 42 Быть между И Равно 43 Находиться в 12 Сравнимо 44 П ринадлежать 13 Больше 45 Служить для • 14 Больше или равно 46 Быть средством для 15 Меньше 47 Быть инструментом для 16 Меньше или равно 48 Способствовать 17 Несравнимо 49 Причина—следствие 18 Сравнимость—мера 50 Быть целью 19 Соотноситься 51 Быть мотивом 20 Соотнесенность—значение i 52 Быть отправителем 21 Одновременно 53 Быть получателем 22 Быть раньше 54 Быть источником информации 23 Быть позже 55 Быть следующим 24 Начинаться одновременно 1 56 Быть очередным 25 Кончаться одновременно 1 57 Быть ближайшим 25 Примыкать по времени слеза 58 Быть замещающим 27 Пересекаться во времени 59 Находиться в состоянии 28 Совпадать ео времени 60 Иметь имя (обозначается че29 Быть внутри (во времени) рез р) 30 Совпадать в пространстве 61 Иметь оценку (обозначается 31 Быть слева через е) новные отношения. (Порядковый номер отношения в таблице в дальнейшем будет совпадать с индексом соответствующего г^.) Этот список не есть полное перечисление всех статических отношений русского языка (статических, так как мы еще не рассматривали действия). Кроме того, легко заметить, что не все отношения, приведенные в таблице, взаимозаменяемы. Это обстоятельство мы обсудим несколько далее. Смысл списка, приведенного
52 гл. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАипП В табл. 2.1, скорее иллюстративный. Мы будем использовать отношения, включенные в него, для примеров, которые будут даны в настоящей и последующих главах. 4. Действия. Всю динамику внешнего мирг язык выражает словами и словосочетания\п1, описывающими действия. Эти действия бывают разных типов, и для нас важно выделить из них основные. Д.1Я обозначения действий будем использовать букву d с раз- личны^и^ индeкca^иI. 4.1. Императивы. Входящие сюда действия — это различные приказы и указания на выполнение некоторых действий: включить, выполнить план, снизить давление и т. п. Эти императивы, как правило, задают те решения, которые выдает система управления на управляемый объект. 4.2. Процессы. В эту группу входят лексические единицы, соответствующие названиям технологических процессов, которые могут протекать на yпpaвляe^юм объекте. Часто мы будем называть их дейстзиями-процессами. Примера.\и1 их люгут служить перевалка груза, регулировка клапана, окраска и т. п. 4.3. Состояния. В эту группу входят слова и словосочетания, фиксирующие определенные состояния управляемого объекта и системы управления. Примерами их могут служить неисправный автомобиль, свободный причал и т. п. Состояния мы часто будем называть дейстзиями-состояниями. Читателя не должно смущать наше весьма широкое толкование термина действия. К процессам и состояниям такая терминология I ©-ЧЕ) Рис. 2.1 вполне применима, когда в текстах встречаются выражения типа «Происходит погрузка автомобиля» ил[1 «Причал освобождается». К сожалению, на сегодняшний день не существует полной и удобной для решения прикладных задач классификации действий. Попытки ее создания делались неоднократно. На рис. 2.1 при-
§2.3. естественный 513ык и теория управления 53 ведена одна из таких классификациР!. На нем через С обозначен субъект, совершающий действие, а через О — объект, на который это действие направлено. Верхние индексы соответствуют состояниям субъекта и объекта, нижние — различным субъектам. Сплошные стрелки символизируют активные воздействия, а штриховые — пассивные переходы. Приведем примеры для различных классов действий, показанных на рисунке: 1 — Нагружать судно, 2 — Наблюдать за показанием высотомера, 3 — Послать сигнал ре- гулятэру на изменение давления, 4 — Построить дом [знак Ф, как всегда, означает пустоту), 5 — Включить компмкс программ, управляюи^их стиральной машиной, 6 — Сменить реэшм слежения, 7 — Проверить исправность своих цепей, 8 — Подавать аварийные сигналы. Подобно таблице для статических отношений можно создать таблицу динамических отношений. В нее, кроме тех отношений, которые определяются классами действий, показанных на рис. 2.1, войдут еще отношения, связанные с перемещением предметов во Бремени и пространстве. В табл. 2.2 приведены примеры динa^п^- ческих отношений (нумерация этих отношений продолжает нумерацию табл. 2.1). Таблица 2.2 № Наименование Наименование п/п отношения п/п отношения 62 Двигаться к 70 Быть свободным 63 Опускаться 71 Иметь объектом действия 64 Приближаться 72 Перевести в состояние 65 Стареть 73 Двигаться из-за какого-либо 66 Нагружать предмета 67 Включить 74 Действие—место 68 Забивать 75 Дей ствие—врем я 69 Быть исправным 76 Совершать действие 5. Квантификаторы. Особую группу слов и словосочетаний языка образуют так называемые квантификаторы. Два из них имеют четкий смысл. Один из них, называемый обычно квантором общности и обозначаемый перевернутой буквой А, задает утверждения Еида «Все рабочие получили зарплату», «Каждый автомобиль таксопарка проверен ГАИ». Его смысл сводится к тому, что некая информация распространяется на все без исключения элементы какого-то фиксированного класса. Другой квантификатор, называемый обычно квантором суи^ествования и обозначаемый зеркально отраженной буквой Ё, задает утверждения вида «Среди автомобилей, ждущих погрузки, имеются автомашины ЗИЛ 130», «Эта деталь хранится по крайней мере на одном из складов». Смысл
54 ГЛ. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ квантора существования сводится к тому, что некоторая информация является истинной хотя бы для одного элемента из рассматриваемого класса. Остальные квантификаторы, широко используемые в естественных языках и столь же широко применяемые технологами при описании процессов на объекте управления и способов управления им, такой однозначной семантикой не обладают. Примерами их могут служить: часто, много, вскоре, через большой промежуток времени, только, даже и т. п. Мы специально посвятим этим нечетким квантификаторам несколько параграфов книги как в данной главе, так и в последующих. Сейчас мы только проиллюстрируем сложности, которые здесь возникают. Во фразе «Даже Иванов мог выполнить эту работу» квантификатор даже как бы проецирует всех рабочих на некоторую шкалу по умению выполнить ту работу, о которой говорится во фразе, и Иванов помещается в самом низу этой шкалы. Но во фразе: «Даже Петров не смог выполнить эту работу» тот же самый квантификатор даже фиксирует уже не низ шкалы, а ее верх. Но кроме способности выделять в упорядоченных шкалах крайние значения, этот квантификатор может передавать и совсем другие смысловые оттенки (например, во фразе «Он не мог даже встать»). Столь же трудно выявить все оттенки, которые придает тексту на естественном языке квантификатор только. Приведем ряд примеров: «Кран только что начал работу», «На стройке занято только три студента», «Работа будет выполнена только завтра, а не сегодня», «Работа будет выполнена только завтра, а не послезавтра». Смысл квантификаторов типа много, часто, близко и т. п. представляется более простым, и несколько позже мы опишем процедуры интерпретации подобных нередко встречающихся в практике управления квантификаторов. Квантификаторы мы будем обозначать через >|^-, сохраняя традицию перевернутых букв, идущую от логики. 6. Модификаторы. Эта группа слов и словосочетаний практически входит в группу отношений, устанавливающих признаки элементов. Но по ряду причин нам удобнее рассмотреть их отдельно. К ним относятся такие лексические единицы, как: быстро, осторожно, портовый, грузовой и т. п. Для обозначения модификаторов будем использовать буквы т^-. 7. Модальности. К ним относятся лексические единицы типа: необходимо, желательно, совершенно невозможно, обязательном т. п. Эти единицы языка мы будем обозначать 8. Оценки. К оценкам относятся хорошо, целесообразно, вредно, достижимо и т. п. Для обозначения оценок будем использовать символы Vi. Рассмотренные нами восемь функциональных групп для естественных языков, конечно, не единственно возможные. Можно произвести разделение единиц и по-другому. Но такое деление дает нам возможность построить удобный язык для описания ситуаций, скла-
§2.1, язык ситуационного управления {ЯСУ) 50 дывающихся на объекте управления и в самой системе управления, а также производить над описаниями необходимые процедуры классификации, корреляции и экстраполяции. § 2.4. Язык ситуационного управления (ЯСУ) Здесь мы опишем основы языка ситуационного управления. Это описание будет носить полуформальный характер для того, чтобы не слишком утомлять читателя многоскобочными фopмyлa^ш. В §2.5 мы опишем строгий подход к формированию лексики языка подобного типа на примере ЯСУ, ориентированного на определенную проблемную область, а в § 2.6 дадим формальное определение основных синтаксических структур ЯСУ. После рассмотрения языков, близкич по своей идеологии к ЯСУ, и сравнения их возможностей мы уточним понятие семиотической модели, введенной в гл. 1, и укажем место ЯСУ в этой ^юдeли. Основной единицей ЯСУ является простая ядерная конструкция в виде тройки (xzy). В средней ее позиции находится некоторое отношение или действие. В крайних позициях — понятия. Если в средней позиции стоит отношение иметь имя, то в правой позиции стоит имя, а если отношение в средней части тройки есть отношение иметь оценку, то в правой позиции стоит оценка. Если, наконец, в средней позиции стоит отношение мера — значение, то в левой позиции стоит понятие — мера, а в правой —числовое значение. Пример 2.1. Покажем, как фразы, описывающие некоторую ситуацию, можно представить простыми ядерными конструкциями ЯСУ. Начнем с фразы «Деталь № 1244 обрабатывается на станке». В этой фразе на ЯСУ как бы две фразы: «Деталь имеет имя Кя 1244» и «Деталь обрабатывается на станке». Будем использовать для указания одновременного существования двух фактов знак конъюнкции &,'который везде, где в нем не будет специальной необходимости, будем опускать. Тогда, если ввести обозначения: а — деталь, b — станок, d — обрабатывается (здесь и сейчас), i — № 1244, то сообщение в языке ситуационного управления запишется в виде (apt) (adb). Или в другой эквивалентной форме, не требующей повторения некоторых символов: {{api)db). Другое описание: «Изготовлено 100 автомобилей ВАЗ 2103». Если q — автомобиль, 1^ — ВАЗ 2103, r^g — находится в состоянии^ di — быть готовым, и — мера, ■—• мера — значение, — иметь, v — штука, то это описание примет вид iiiqph) г, {{upv) r,,lOO))r,,d,). Здесь самая левая простая ядерная конструкция говорит о том, что в описании идет речь об автомобилях ВАЗ 2103, конструкция (upv) — о том, что мера имеет имя штука, а присоединенная к ней Гц, 100—100 штук. Тогда все в большой левой скобке соответствует тому, что речь идет о 100 штуках автомобилей ВАЗ 2103. И, наконец.
56 "Л. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ отношенпе находиться в состоянии и состояние быть готовым позволяют получить отображение той информации, которая содержалась в исходном описании. Из приведенного примера видно, что в ЯСУ важное значение имеет операция подстановки вместо левого или правого члена простой ядерной конструкции целой простой ядерной конструкции. И этот процесс можно продолжать рекурсивно. В частности, в последнем описании на ЯСУ слева от Гх такая подстановка произведена один раз, а справа от Гх — два раза. Сложной ядерной конструкцией называется тройка вида >1 ((aix) (а^г) (адг/)). На месте а^- могут стоять некоторые квантификаторы или модификаторы, на месте кроме того, люгут стоять модальные операторы, на месте >| — только квантификаторы. На каждом месте люжет стоять несколько модификаторов. Пример 2.2. Рассмотрим следующее описание: «Часто, когда давление выше нормы, температура также выше нормы». Пусть >]j есть квантификатор часто, h — давление, / — температура, т — модификатор выше нормы. Тогда этому описанию соответствует следующая запись на ЯСУ: yii{{mh)r^^{mt)). Отношение г^э, взятое из табл. 2.1, есть отношение причина — следствие. Вместо него можно было бы использовать и отношение способствовать, так как в исходном описании не утверждается строгая каузальная зависимость повышения температуры от повышения давления. При утверждении такой зависимости описание имело бы вид «Всегда при повышении давления выше нормы тe^шepaтypa также превышает норму». Другое описание: «Автомобиль быстро двигался к складу № 2». Если для понятия автомобиль использовать обозначение а, для склада обозначение с, через г^^ обозначить динамическое отношение двигаться к, а через т — модификатор быстро, то приведенное описание можно представить в виде: {а(тг^^{ср Х2 2)). Заметим, что в этом примере мы вместо символьного имени склада, как и в случае 100 штук ВАЗ 2103, использовали в записи непосредственное значение и.мени. Приведенные примеры дают возлюжность записывать на ЯСУ достаточно произвольные описания ситуаций. При этом фразы описания переводятся в отдельные «фразы» ЯСУ. Пример2.3. Рассмотрим следующее описание ситуации на объекте: «Одновременно с погрузкой состава «Москва — Владивосток» необходимо перевести поезд Лд 126 на шестой путь. Бригаду носильщиков № 1 вызвать на платформу Лд 6. На ту же платформу необходимо вызвать тележку для получения почты из почтового вагона. Желательно из бригады Иванова». Это сложное описание ситуаций можно представить в следующей форме, где арабские цифры, необязательные при использовании ЯСУ в ЭВМ, здесь применяются для большей наглядности записи. Они отделяют одни «предложения» ЯСУ от других (1) {{S9h)rb,e)[in9i,){fA){i9h))>
§ 2.S. ФОРЛ\ИРОВЛНИЕ ЛЕКСИКИ ЯСУ 57 (2) {{bpi,)d,{gpi,)), (3) {{kd, (gpi,)) r,3 /) (//'38 ('"^0) {k (Ш q). Здесь использованы следующие обозначения: s — состав, ii — «Москва — Владивосток», е— погрузка, п — поезд, i.^ — № 126, — перевести, — необходимо, / — путь, — бригада носильщиков, ^3 — ^9 1, ^4 — № 6, g — платформа, k — почтовая тележка, / — почта, — вагон, т — почтовый, /з — желательно, q — бригада Иванова. Отношения, использованные в записи на ЯСУ, взяты из табл. 2.1. Таким образом, мы видим, что достаточно сложные описания ситуаций, складывающихся на объекте управления, можно описывать на языке ситуационного управления. Если читателю идея этого языка уже понятна, то он может перейти к тому, как описывать ситуации на ЯСУ в связи со структурой и функционированием объекта управления. Об этом говорится в § 2.7. Параграфы 2.5 и 2.6 не относятся к первому уровню изложения. § 2.5. Формирование лексики ЯСУ ** При работе с некоторой конкретной проблемной областью возникает первая основная проблема: формирование лексики ЯСУ. Словари базовых понятий, отношений, действий, оценок, квантификаторов, модификаторов, имен и модальных операторов должны быть достаточно полными и отражать все стороны объекта управления и способов управления им, необходимые для создания полноценной системы ситуационного управления. И прежде всего это касается создания трех .словарей: словаря понятий, словаря отношений и словаря действий (операций). Эти три словаря — основные для всех систем ситуационного управления. Ибо остальные словари, кроме словаря имен, универсальны. Они одинаковы для всех систем ситуационного управления и носят универсальный характер. Словарь имен является открытым, и в каждой системе надо просто указать принцип образования имен в данной системе. Аналогичное замечание касается словаря значений меры или мер, используемых в данной проблемной области. Словари понятий и действий целиком определяются семантикой проблемной области. Словарь же отношений носит более широкий характер. Из гипотезы 2.3 ^южнo было бы сделать вывод, что этот словарь (в его базовой части) вообще конечен. Некоторые эксперименты, проведенные для нескольких европейских языков (итальянского, английского, русского), как будто подтверждают эту гипотезу. Эксперименты проводились следующим образом. Брался достаточно большой текст из универсальной области (как правило, текст из художественной литературы). Анализируя последовательно фразу за фразой, фиксировались отношения, встречающиеся в этих фразах. Если вновь фикcиpye^юe отношение уже было включено в
58 гл. 2. ЯЗЫКМ для ОППСЛНМЯ ОГЛ.ЕКТЛ и CUTV.MUm ранее рассматриваемый список, то оно пропускалось, если же нет, то сначала делалась попытка выразить его через комбинацию ранее найденных отношений. Например, в тексте «Когда начался бой, начались и его страдания, страхи за свою жизнь. Но в середине сражения эти страхи куда-то исчезли, как бы пропали навечно»; отношение двух событий «бой» и «страх» можно зафиксировать отношением 4 начинаться одновременно, но ^южнo перейти к событиям — «начало боя и начало страха»», «конец боя и конец страха». Тогда вместо отношения Г24 можно употребить для первых двух новых событий отношение — одновременно, а для двух других новых событий — отношение Г22 — быть раньше. Взяв конъюнкцию двух простых ядерных конструкций, мы получим запись, эквивалентную той, которая использовала отношение Гц. Это послужило бы сигналом Р>1с. 2.2 о невключении отношения начинаться одновременно в базовый список отношений. Если же вновь найденное отношение нельзя свести к комбинации уже включенных в список ранее, то оно вносится в список как базовое. Эти эксперименты, проведенные на достаточно больших объемах текстов, дали для разных языков приблизительно одинаковую картину. Список насыш,ался где-то при 175—185 отношениях и далее не пополнялся, что подтверждает гипотезу 2.3 в отношении описания реального мира. Внутренний мир человека, конечно, описывается целым рядом других отношений, не вошедших в тот список, который формировался в экспериментах. Конечность списка отношений интересна скорее концептуально, чем практически. На практике нет особой нужды сокраи;ать его. Ибо это приводит к ненужному усложнению записей, которые и так плохо обозримы. Поэтому на практике стараются построить достаточно полный список отношений, важных для данного объекта управления и методов управления им. Дадим классификацию отношений, несколько отличную от той, которая была приведена в предшествуюи;ем параграфе. Эта классификация опирается на рис. 2.2. На нем А, В и С обозначают множества элементов, присущих объекту управления или выделяемых в процессе управления им, свойств данных элементов и операций, которые могут реализоваться на нем или в системе управления им. Обозначения Rij соответствуют классам отношений, которые можно установить между вершина.\и1 диаграммы, показанной на рисунке. Смысл этих классов очевиден. Например, отношения, входящие в класс Rii, это отношения типа элемент — элемент, а отношения, образующие класс 7?зь—отношения типа операция — элемент. Аналогично интерпретируются и остальные классы отношений.
§2.5. ФОРМИРОВАНИЕ ЛЕКСИКИ ЯСУ 59 а диаграмма, В табл. 2.3 Если теперь через X обозначить любую из вершин Л, В или С, то для X получим диаграмму, показанную на рис. 2.3. На ней D есть множество мер с различными именами, а ^ — множество значений. Штриховая стрелка на диаграмме соответствует тому, что отношение Гд реализуется только, когда X совпадает с 5, а в качестве значений выступают качественные значения признака. В §2.3 мы выделили 11 классов отношений, показанная на рис. 2.2, фиксирует 9 их типов, показана связь этих разбиений. Крестики поставлены в тех клетках, где пересечение разбиений непусто. Здесь нет признаковых отношений. Они поглощены свойствами. Вместо отношения иметь цвет, например, использовано свойство цвет. Нет и количественных отношений, которые определяются не диаграммой, показанной на рис. 2.2, а диаграммой, показанной на рис. 2.3. Приведем примеры отношений, которые могут характеризовать совокупности, отмеченные в табл 2.3 крестиками. Для типа R-ii отношение классификации — «портальный кран относится к погрузочно-разгрузочным механизмам»; отношение при- Таблица 2.3 Типы Классы 1. Отношения фикации класси- + -г 2. Отношения и и я срзЕне- + 3. Отношения лежности принад- -j- -U + + 4. Временные ния отноше- + 5. Пространственные от+ ношения 6. Каузальные ния отноше- 1 1 -г + 7. Инструментальные отношения 8. Информационные от~р ношения 9. Отношения поридка -f- -г надлежности — «стрела есть часть портального крана»; пространственное отношение — «автомобиль находится правее въезда на
GO гл. языки для ОПИСАНИЯ ОБЪЕКТА И CHTNAUHn МОСТ»; каузальное отношение — «перегрев вызывает пожар»; 1шфор- маиионное отноигение — «директор информировал диспетчера», отношение порядка — «станок обрабатывает следуюш,ую деталь». Для типа Ri-.: отношение принадлежности — «пожарный автомобиль есть красный предмет». Для типа R13 каузальное отношение — «преграда заставляет обойти ее», инструментальное отношение — «гвозди забивают молотком». Для типа R21: отношение принадлежности — «пожарный автомобиль красный», информационное отношение — «красное — сигнал опасности». Для типа 7?22- отношение классификации — «синее часть окрашенных», отношение сравнения — «ВАЗ 2106 мощнее ВАЗ 2103», отношение порядка — «оранжевый цвет в спектре следует за красным». Для типа R^y. инструментальное отношение — «рыхлость грунта требует предварительного укрепления пути». Для типа R^y. отношение принадлежности — «операция сложения входит в систему команд ЭВМ», каузальное отношение — «просека возникла из-за вырубки деревьев», информационное отношение — «включение аварийной сигнализации свидетельствует о нарушении работы объекта». Для типа Rs2'. каузальное отношение — «после полировки поверхность стала гладкой». Для типа Rs3- отношение классификации — «смена масла входит в комплекс работ по техническому обслуживанию автомобиля», отношение сравнения — «операция фрезерования труднее операции точечной сварки», отношение принадлежности — «крепление детали в зажиме — часть операции токарной обработки», временное отношение — «реактор сработал раньше, чем включились насосы», каузальное отношение — «из-за прокладки кабеля было необходимо прекратить выполнение монтажных работ», отношение порядка — «сборка является следующей по порядку операцией». Пример 2.4. Приведем для иллюстрации словарь основных лексических единиц, который был использован при создании системы ситуационного управления, помогающей мастеру участка приборостроительного завода принимать решения по распределению работ на участке. В этом словаре содержалось 17 базовых отношений: быть именем, быть частью, быть классом, быть ранее (во времени), быть равным, быть больше, подчиняться, обеспечивать, подготавливать, субъект — объект, перемеи^аться в пространстве на место.,, (для объекта действия), перемеи^аться в пространстве на место... (для субъекта действия), перемеш^аться во времени на..., находиться в окрестности, быть одновременно, быть местом, быть временем.. В этом списке некоторые отношения по сути — действия, но в описаниях текущих ситуаций они представляют собой как бы застывшие действия. Кроме того, в словаре основной лексики содержалось 158 базовых понятий. Перечислим для примера некоторые из них: инвентарный номер, показатель точности, ремонт, фонд времени, время освобождения от работы, деталь — операция, план, срок, длительность, брак, исправление, смена, сутки, рабочая суббота, комплект.
§ :.g. ФОРЛ\ЛЛЬНЛЯ МОДЕЛЬ спнтлкспсл ясу П1 продукция, вал, расценка, трудоемкость, слесарь, фрезеровщик, токарь, кладовщик, автомобиль, электрокар, линия конвейера, корпус, втулка, заглушка, ключ, развертка, матрица, пуансон, обмотка, трансформатор и т. п. Наконец, словарь содержал 7 операций-решений, которые могла принимать система управления: запустить в производство; снять с производства; получить оснастку, материалы, приспособления; выдать оснастку, материалы, приспособления; отремонтировать оборудование; перевеспш рабочего,., на деталь-операцию...; объявить субботу рабочей. Этот пример еще раз демонстрирует, что словарь базовых отношений зависит от специфики задачи куда меньше, чем словари базовых понятий и операций-решений. Отметим также, что при переходе от описаний, использующих естественный язык, к описаниям на ЯСУ не всегда ^южнo провести четкую границу между понятиями и CBoflcTBaNHi, а также свойствами и операциями. Столь же неформальна и граница между отношениями и операциями и отношениями и cвoйcтвa^ш. Это позволяет проектировщику системы с учетом тех или иных прагматических соображений относить те или иные элементы к нужному виду лексики. § 2.6. Формальная модель синтаксиса ЯСУ * Синтаксис ЯСУ можно задать формальным способом, как делается при задании лшожества базовых элементов и синтаксических правил в формальных системах или при задании синтаксиса языков программирования для ЭВМ. Определение 2.1. Множество X={xi}, где х — любые малые буквы латинского алфавита кроме d, f, i, т, п, о, р, v, а i пробегает натуральный ряд, есть множество базовых понятий ЯСУ, Определение 2.2. Множество l = {ij}, где / пробегает натуральный ряд, называется множеством имен понятий ЯСУ. Определение 2.3. Множество D = {di), где i пробегает натуральный ряд, называется множеством действий {опера- ций) ЯСУ, Определение 2.4. Множество V={vi}, где i пробегает натуральный ряд, называется множеством свойств понятий (объектов) и действий ЯСУ. Определение 2.5. Множество Л1 = (т/}, где / пробегает натуральный ряд, называется множеством модификаторов ЯСУ. Определение 2.6. .Множество '>1^{>^}, где / пробегает натуральный ряд, называется множеством квантификаторов ЯСУ. Определение 2.7. Множество 0={oJ, где i пробегает натуральный ряд, называется множеством оценок ЯСУ. В это лшоже- ство входят, в частности, все действительные чихла. Определение 2.8. Множество F={fi}, где i пробегает натуральный ряд, называется множеством модальностей ЯСУ.
6> гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Определение 2.9. Множество 7? = {г,}и (р, е}, где i пробегает натуральный ряд, называется множеством отношений ЯСУ. Отношения р и е синтаксически отличаются от г,-. Определение 2.10. Множество Х' = {т,л:;}, где g М, а Xj g X, называется множеством модифицированных понятий ЯСУ. О п р е д е л е н и е 2.11. Множество Х"={>|,л:у}, где yit^yi, а Xj^X, называется множеством квантифицированных понятий ЯСУ. Определение 2.12. Множество D' = {m,dy}, где ^УИ, а dj^D, называется множеством модифицированных действий ЯСУ. Определение 2.13. Множество D''={^4j}. где а djeD, называется множеством квантифицированных действий ЯСУ, Определение 2.14. Множество = где а d;€D, называется множеством «модализированных» действий ЯСУ. Определение 2.15. Множество V'^{mtVj}, rjxemj^M, а Vf^V, называется множеством модифицированных свойств ЯСУ. Определение 2.16. Множество V" = {yiiVj}, где ^i^^, а vj^V, называется множеством квантифицированных свойств ЯСУ. Эти определения полностью задают множество базовых элементов формальной системы, соответствуюш,ей синтаксической части ЯСУ. Введем обозначения X=XuX' [)Х'\ D=^D \J D' {} D" {] D"\ V== = V'U V"' и V"• Для задания синтаксиса ЯСУ введем еще три операции: конкатенацию (приписывание символов друг другу), которую никак специально обозначать не будем, конъюнкцию и отрицание с их обычными обозначениями]. При введении синтаксически правильных совокупностей в ЯС^' будем использовать еще круглые скобки. Элементы Л", D и V будем обозначать соответствующими мaлы^ш бук- BaNHi, noMe4eHHbiNm значком тильда. Определение 2.17. Множество простых ядерных конструкций ЯСУ состоит из троек^ bra^ (XirjXh), {Xipjh), (Xi^Oh), (xjrjdk), {xypj), (dir/if,), (dipin), (dt^Oj,), {dirjX^), {dtrf)^), {virpu). i^tn^k)* (Virfdk). Эти конструкции считаются синтаксически правильными. Рис. 2,4 иллюстрирует это определение. Легко yc^ютpeть связь этой диаграммы с диаграмма.\и1, пoкaзaнны^ш на рис. 2.2 и 2.3, а также с табл. 2.3. Подчеркнем, что в данном параграфе речь идет лишь о синтаксической правильности, а не о семантической интерпретации простых ядерных конструкций. В условиях того или иного объекта управления в ЯСУ различные конструкции будут Рис. 2.4
G4 гл. 2, языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ 1'Ь '^2 Теперь охарактеризуем основные элементы ДСС. Определение 2.20. Функционирование истока заключается в порождении в каждый такт функционирования ДСС одного или нескольких объектов с заданными характеристиками в соответствии с законом pix порождения или с законом непорождення никакого объекта в некоторые такты функционирования. Отсюда, в частности, следует, что ДСС функционирует в дискретные такты. Закон порождения объектов в истоках ДСС может быть детерминированным (например, по фиксированному расписанию), либо вероятностным с известным распределением. Определение 2.21. Функционирование стока заключается в устранении из ДСС объектов, попавших в сток. Решатели ДСС делятся на два типа — пассивные и активные. Определение 2.22. Пассивный решатель ДСС представляет собой задержку на определенное число тактов, определяемое типом объекта и этим решателем. Таким образом, пассивный решатель может имитировать в ДСС ожидание в очереди или затраты времени на перемещение между вершинами ДСС, если путь между ними проходит через пассивный решатель. Определение 2.23. Объекты, попавшие в активный решатель, либо меняют свои характеристики, либо для них решается альтернатива о дальнейшем движении по ДСС, либо происходит и то, и другое. Из приведенных определений следует, что истоки не должны иметь входящих связей, а стоки — выходящих связей. Пассивные решатели могут иметь произвольное число входящих связей и одну выходящую связь. Активные решатели имеют по крайней мере одну входящую и одну выходящую связи, но их число может быть и большим. в ряде случаев полезно вводить еще позиции. Их роль состоит в фиксации положения объектов на сети, когда они находятся вне решателей, истоков и стоков. Позиции обычно нумеруются. На рис. 2.5 показана некоторая Р'^^- ДСС. Истоки И на ней изображены квадратиками, пассивные решатели Р — кружками, активные решатели АР — двойными кружками, а стоки С — треугольниками. Позиции отмечены маленькими зачерненными кружками. В графическом представлении ЯСС, конечно, нет особой необходимости, хотя оно и наглядно. ДСС ^южнo задать чисто функцио- .иально, определив законы порождения объектов различного типа
§2.7. ДИСКРЕТНЫЕ СИТУАЦИОННЫЕ СЕТИ (ДСС) 65 В истоках, правила перемещения объектов по ДСС, правила их обслуживания в пассивных и активных решателях. Здесь мы этого не будем делать, а перенесем это в главу, посвященную экстраполяции развития ситуаций. Задача данного параграфа другая. На примерах мы покажем, как ЯСУ ^южнo использовать при описании статических ситуаций, складывающихся в некоторый момент времени на ДСС. Но прежде чем перейти к примерам, введем понятие объекта на ДСС: Здесь первые т характеристик объекта носят временной характер (например, суммарное время, прошедшее с момента появления объекта в ДСС, суммарное время потерь на обслуживание в активных решателях, время ожидания обслуживания в каждом из активных решателей и т. п.), а остальные характеристики могут быть произвольными. Для объектов управления транспортного типа они могут, например, иметь следующее значение: тип объекта, скорость в данный момент, приоритет в перемещении, приоритет в обслуживании, габаритные размеры и вес, конечный пункт перемещения. Для систем другого типа (например, при использовании ДСС для описания системы документопотоков в организационных системах или конвейерного производства) эти характеристики могут быть другими. Пример 2.5. Пусть нам необходимо управлять светофорами на участке города, показанном на рис. 2.6. Он включает в себя два перекрестка с регулируемым движением, соединенных между собой магистралями с односторонним движением. На рисунке эти перекрестки показаны кружками — знаками светофоров. Для описания ситуаций, которые могут сложиться на таком объекте управления, перейдем от конкретного объекта управле}И1я к ДСС. Результирующая ДСС показана на рис. 2.7. Индексы истоков на схеме совпадают с номерами, отмеченными на предшествующем рисунке. Индексы стоков соответствуют римским цифрам на этом рисунке. Верхний перекресток соответствует АР^ нижний ^ ЛР.^. Позиции введены произвольно. Они соответствуют некоторы.м сечениям магистралей, на которых производится учет автомашин. Вместо непрерывного движения автомашин, которое происходит в / t Ж Рис. 2.6 3 д. А. Поспелов
66 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ реальности, на ДСС объекты, соответствующие автомашинам, перемещаются дискретно по позициям и основным вершинам сети. На тех дугах, где позиций нет, перемещение происходит за один такт работы ДСС. Для целей управления исток //^ можно не учитывать, так как он никак не влияет на переключение светофоров на регулируемых перекрестках. Позиции /, 2, 5, 6, 7 можно рассматривать как линии СТОП перед соответствующим перекрестком. Пусть а есть понятие автомашина. Тройка вида (api\) будет пониматься нами как автома- uhiha с государственным номером if^, который и является ее именем. Если b есть позиция, то (bpi'm) означает позицию ДСС с номером 1^,. Тогда запись mh)f39{b9hn)) соответствует тому, что автомашина с номером ij. находится на позиции с номером/^п- Не будем для простоты и удобства описания фиксировать автомашины в вершинах ДСС. Другими словами, все автомашины находятся только на позициях ДСС. Это позволяет нам при описании статических ситуаций (мгновенных фотографий положения) не рассматривать истоки и стоки, а ограничиться только позициями и активными решателями. Активные решатели будем обозначать через h и присваивать им имена 1 и 2. Активные решатели могут находиться в двух состояниях. В первом из них по горизонтальному направлению магистралей (рис. 2.6) горит зеленый сигнал. Во втором состоянии — красный сигнал. Эти состояния мы будем соответственно обозначать kakgi \\g2- Тогда запись ((/гр1) r.^g-o) будет означать, что в горизонтальном направлении магистрали, которая проходит через перекресток, первый светофор находится в таком состоянии, что на нем горит красный сигнал. Введем две характеристики автомобилей: v — скорость, р — тип. Значения скорости будут браться из >шожества (О, 5, 10, 140}, а значения типа — из множества {q^ — специальный, q^ — обычный}. Тогда запись {(oph) гз, фр])) {{api,) г, (vpO)) {{api,} г, (ppq,)) {{hpl) r.^g^) соответствует той ситуации, когда обычный автомобиль с номером стоит на позиции / перед первым светофором, так как в его направлении горит красный сигнал. Такое описание можно выполнить для каждой автомашины, находящейся в этот момент на ДСС. Совокупность подобных описаний и есть полное описание статической ситуации, которая существует в данный момент на объекте управления.
§2.8. другие языки описания ситуации (>7 Пример 2.6. Рассмотрим учреждение, в котором имеются плановый отдел, бухгалтерия, отдел кадров. Между эшып подразделениями существует некоторый документопоток. Имеются стандартные документы нескольких типов и нестандартные документы. В качестве характеристик документов люгут выступать названия атрибутов, имена заполнителей для этих атрибутов и т. п. Каждый документ ^южнo рассматривать как объект на ДСС, в которой есть три истока, три стока и три активных решателя. Другилш словами, каждое подразделение учреждения как бы разделяется на три части: исток, сток и активный решатель (не хотелось бы, чтобы они были пассивными peшaтeля^ш, ибо это означало бы, что документы в некоторых инстанциях не обрабатываются, а «вылеживаются»). Можно ввести позиции, которым, например, будут соответствовать стопки документов, ждущих своей очереди на столе у того или иного работника. При необходимости дюжно развернуть структуру каждого подразделения, сделав каждого его работника, имеющего дело с документами, активным решателем. Но важно, что полученная ДСС принципиально ничем не будет отличаться от ДСС для системы перекрестков, а некоторый объект — документ — от автомобиля. Только смысл его характеристик будет другим и другими законами будет описываться функционирование ДСС. Приведенные примеры иллюстрируют одну важную мысль. Если различные по своей природе объекты управления можно представить в виде некоторой ДСС, то описания текущих ситуаций на этих объектах будут строиться однотипно с использованием универсальных отношений ЯСУ типа н2ходиться в позиции с номером..., иметь имя..., иметь приоритет... и т. п. Это позволяет надеяться на создание универсального по своему составу ЯСУ для описания текущих ситуаций на ДСС. Такая надежда не лишена оснований. В разделе об экстраполяции ситуаций мы еще вернемся к этому вопросу. § 2.8. Другие языки описания ситуаций * Язык ситуационного управления, конечно, не единственный, который можно использовать для описания текущих и полных ситуаций. В настоящем параграфе мы рассмютрим еще три языка, пригодных для этих целей, хотя и обладающих некоторыми недостатками при их использовании для ситуационного управления. Один из них RX-Kod, послуживший исходным прототипом для создания ЯСУ. В языке /?Х-кодов используются лишь понятия и отношения. Каждое понятие, кроме базовых, задается стандартным выражением следующего вида: П-1' /2-1- Графической иллюстрацией этого выражения служит сеть, показанная на рис. 2.8. Из нее вытекает, что понятие как бы определяется через понятия Xi, х.>, x^^_i с помоихью отношений Гь го,
68 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Пример 2.7. Рассмотрим RX-kojx вида х^ = r^iX^r^^X2r2Xs' Если Xi — мощность, Х2 — увеличение, л:., — прибор, а отношения определяются из табл, 2.1 и табл. 2.2, то этот код можно трактовать как определение понятия усилитель мощности. Для RX-код^ов возможна операция подстановки на место х/, отличных от Хп, /?Х-кодов, определяющих эти Xt. Процесс такой подстановки можно продолжать столько раз, сколько нужно. Получающаяся в результате древообразная структура в виде фрагмента показана на рис. 2.9. В отличие от записей на языке ситуационного управления, RX-Kojlhi не позволяют явно указать связи между лг^, используемыми для определения х^. Если Ху^ — код некоторой ситуации, то компоненты л:,-, в.ходя- щие в ее описание, никак не Рис. 2.8 Рис. 2.9 взаимодействуют друг с другом. Если их взаимодействие нужно отразить, то приходится дублировать компоненты в описании. Пример 2.8. Пусть х^естъ код ситуации, которая задается следующим описанием: «К перекрестку приближается санитарный автомобиль, а сзади него движется грузовик». Пусть Xi — санитарный автомобиль, а — грузовик. Описание ситуации Хз с пo^ющью RX-Kojxsi имеет вид •^'з ^64-^1 64-^2^34-^'l)- Рис. 2.10 Графически этой записи соответствует сеть, показанная на рис. 2.10. Мы не будем останавливаться на тех проблемах, которые вызывает необходимость повторения записей в RX-колгх, так как не собираемся особенно ратовать за применение этого языка в ситуационном управлении, хотя у него и были сторонники. Отметим только одну особенность языка RX'KojxoB. С его помощью можно определять Такие понятия.
§2.8. ДРУГИЕ ЯЗЫКИ ОПИСАНИЯ СИТУАЦИЙ 69 которые образуют классы объектов, никак не связанных между собой. Другими словами, 7?Х^коды могут задавать классы путем простого перечисления их элементов. Например, если Xi есть стол, х2 — кровать, Хз — секретер и т. п., то определяет понятие мебель. В ЯСУ такое понятие ввести невозможно, если не использовать операцию дизъюнкции между простыми ядерными конструкциями этого языка. Второй язык для описания ситуаций, который до сих пор пользуется популярностью среди специалистов по ситуационному управлению,— язык исчисления предикатов первого порядка. В этом языке .можно выразить все то, что выразимо и в ЯСУ, если не учитывать модификаторы и все квантификаторы, кроме принятых в исчислении предикатов кванторов V и 3. У исчисления предикатов есть свои преимущества, связанные с наличием развитых процедур вывода. Об этом мы будем говорить в дальнейшем. Предполагая, что большинство читателей знакомо с классическим исчислением предикатов, не будем тратить здесь место для его описания и ограничимся лишь примером. Пример 2.9. Пусть имеется описание следующей ситуации: «Между роботом и складом находится яма, слева от которой расположен экскаватор». Введем двуместный предикат (х, у) со значением х левее у. Введем еще трехместный предикат Ра (л:, У, 2) со значением у находится между х и z. Если х* — экскаватор, у* — яма, а 2* — склад, то конъюнкция Pi{x*, у*)&Р2{х*, у*, z*) описывает исходную словесную ситуацию. Менее известен среди разработчиков систем ситуационного управления третий язык описания ситуаций — универсальный семантический код (УСК).Простой ядерной конструкцией в УСК является тройка вида (SAO), В этой тройке 5 соответствует субъекту, совершающему акцию Л, а О — объекту, на который направлена данная акция. Такой тройке может, например, соответствовать предложение «Кран разгружает судно». В УСК вводится замкнутая система операций, позволяющих из простых ядерных конструкций строить более сложные цепочки. Пример 2.10. Пусть 5^ — самолет, So — бензозаправщик, А^ — совершать посадку, А 2 — двигаться к, О2 — стоянка № 12. Тогда запись на УСК (Si^ lOi)^ 3(52^ 2О2) трактуется следующим образом: «Самолет совершает посадку и одновременно бензозаправщик двигается к стоянке № 12». Черта над Oi означает незамещенность этой позиции, так как акция совершать посадку относится к самому объекту Si. Незамещенность акции Аз трактуется в УСК как отношение одновременности. Если же A3 трактовать как причина — следствие, то з^^писъ (SiA^Oi)Аз{SiAoO^z) будет соответствовать тексту «Бензозаправщик двигается к стоянке № 12 потому, что са]\юлет совершает посадку».
70 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СНТУАЦИП При создании УСК были реализованы следующие принципы. 1. Полная экспликация смысла. Другими словами, любая запись в УСК имеет один соответствующий ей смысл, причем это смысл на некотором метауровне. Например, первой из цепочек, приведенных в примере 2.10, соответствует метасмысл «Субъект X совершает действие, направленное на себя, одновременно с этим субъект Y совершает действие, направленное на объект Z». Конкретизация метасмыс- ла происходит при конкретной интерпретации всех элементов, входящих в цепочку. Требование полной экспликации смысла приводит к необходимости введения в УСК разнообразных средств для уточнения смысла записи. Например, фраза естественного языка «Станки работают» может трактоваться по-разному, иметь разный смысл. Она может рассматриваться как некоторое общее утверждение о станках вообще или как утверждение, касающееся некоторых конкретных станков, как утверждение, относящееся к некоторому моменту времени, а также как утверждение, справедливое всегда. В УСК вводятся для подобных высказываний специальные маркеры, помогающие уточнить тот смысл, который должен быть приписан данному высказыванию. Так возникают следующие четыре цепочки УСК: {S}oA6~ «Эти станки сейчас и здесь работают (работают одновременно)», {S}^ АО — «Эти станки работают (всегда и везде)», {S' }^ Л О — «Некоторые станки работают», {{S}}^ ЛО — «Все станки работают». Интерпретация таких цепочек в терминах станков означает, что S' в цепочках интерпретировано кгк станок, г А — работают. Фигурные скобки в УСК означают множественность. Двойные фигурные скобки соответствуют квантору общности исчисления предикатов, а штрих — квантору существования того же исчисления. Знаки >| и q —специфические для УСК, соответствуют кванторным и дейктическим утверждениям {всегда и везде и здесь и сейчас). Кроме этих средств в УСК используются символы обычного логического отрицания, модальные операторы и еще целый ряд специальных символов. Важным представляется то, что в последних версиях УСК действительно удалось однозначно приписывать смысл любой цепочке, допустимой синтаксисом УСК, если это приписывание происходит на некотором метауровне. 2. УСК реализует принцип независимости от предметной области. При различных интерпретациях символов, входящих в цепочки, можно получать описания, пригодные для любых мыслимых предметных областей. Это обстоятельство носит принципиальный характер. В языке ситуационного управления принцип полной экспликации смысла реализован не полностью, отношения из базового множества как бы «свалены в одну кучу». Они конкретизованы до различного уровня общности, что требует введения модификаторов на отношения. В языках типа языка исчисления предикатов не реализован принцип экспликации смысла. Записи в этих языках не дают возможности сопоставить \\v смысл ни на каком уровне общности.
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ 71 3. Та семантика, которая реализуется в УСК на метауровне, т. е. без интерпретации символов, входящих в цепочку, является недоговоренной. Она жестко задается семантикой простых ядерных конструкций и синтаксисом производной цепочки. Такое свойство УСК также отличает этот язык от языка исчисления предикатов, в котором смысл предикатных формул зависит от той или иной договоренности. Язык ситуационного управления при заданном списке базовых отношений и их интерпретации приближается в этом смысле к возможностям УСК. 4. Как уже говорилось, исчисление предикатов и другие чисто логические исчисления обладают тем преимуществом, что в них часто можно cфop^шpoвaтb процедуры вывода, имеющие целенаправленный характер, позволяющие за конечное число шагов либо получить нужное преобразование, либо показать, что интересующий нас вывод построить невозможно. К сожалению, ЯСУ и в этом отношении уступает языку логических исчислений. УСК обладает набором правил преобразования цепочек друг в друга. Однако пока еще не доказана ни полнота этого набора, ни эффективность процедуры преобразования, oпpeдeляe^юй способностью через конечное число шагов прекратить преобразования, если цель недостижима. Указанные особенности УСК делают его весьма интересным для использования в системах ситуационного управления. Однако необходимо отметить, что структура цепочек УСК (в отличие от ЯСУ) такова, что для человека интерпретация их смысла бывает весьма зат- руднитель а, а хорошего алгоритма перевода текстов на естественном языке в записи на УСК пока еще не существует. §2.9. Языки представления знаний** Описанный нши язык ситуационного управления, а также другие языки, о которых шла речь выше, при работе с ЭВМ преобразуются в специальные языки представления знаний, удобные для организации машинных процедур. В языках представления знаний (ЯПЗ), используемых в настоящее время, основная единица — слот. Слот имеет следующий вид: -|<имя слота); <f,><v,y: </,><^>„>; <^,>; . . .; <q^,y}. Здесь fi — имена атрибутов, характерных для данного слота, Vi — значения этих атрибутов или множества их значений, а qt — различные ссылки на другие слоты. Пример 2.11. {<АВТОМОБИЛЬ>; <НОМЕРНОЙ ЗНАК) <ММГ 06-40, МММ 65-12); чСОСТОЯНИЕ) <ИСПРАВЕН, В РЕМОНТЕ); <ТИП) <ГАЗ-24, ГАЗ-24); <КОЛОННА), <ГАРАЖ), <ВОДИТЕЛЬ>}. Этот слот имеет имя АВТОМОБИЛЬ, В нем хранится информация о двух автомобилях с указанными номерами, один из которых
72 ГЛ. 2. языки ДЛЯ ОПИСАНИЯ ОБЪЕКТА и СИТУАЦИИ находится в ремонте, а второй — в рабочем состоянии. Оба автомобиля имеют одинаковый тип. Некоторые другие сведения, относящиеся к этим объектам, можно найти в слотах с именами КОЛОННА, ГАРАЖ и ВОДИТЕЛЬ. Например, слот ВОДИТЕЛЬ может иметь вид: (<ВОДИТЕЛЬ>; <ФИО> (Иванов Иван Петрович, Сидоров Никанор Степанович); <НОМЕРНОЙ ЗНАК) <ММГ 06-40, ММЛ\ 65-12)}, При переходе от слота АВТОМОБИЛЬ к слоту ВОДИТЕЛЬ можно установить, что Никанор Степанович Сидоров в данный момент не на линии, а в гараже, или в отпуске, или... Конечно, что происходит в данный момент с Никанором Степановичем сказать нельзя, но одно можно утверждать точно. Он является водителем автомашины МММ 65-12, которая в настоящий момент находится в ремонте. Для упорядочивания информации, хранящейся в отдельных слотах, используется более крупная структурная единица — фрейм. Структура фрейма, как правило, имеет следующий вид: {<имя фреймаХимя слота><значение слота) <имя слота)<значение слота) Отметим, что каждый фрейм — это как бы готовая структура, которая при том или ином заполнении слотов значениями превращается в описание конкретного факта, события, явления или процесса. Поэтому можно говорить о фреймах-прототипах и конкретных фреймах. Фреймы-прототипы хранят знания о предметной области, а конкретные фреймы пополняют эти единицы знания реальными данными. Данные и знания во фреймовых структурах начинают то совместное существование, которое было невозможно реализовать прежними средствами. Отметим также, что имена слотов часто называют ролевыми метками или просто ролями. Это подчеркивает ту особенность этих имен, которая легко демонстрируется, например, на структуре фрейма КОМАНДИРОВКА: {(КОМАНДИРОВКА) <КТО> <значение слота) <КУДА> (значение слота) (К0ГДА)<значение слота) (НА КАКОЙ СРОК) (значение слота) (С КЕМ) (значение слота)}. При этом некоторые слоты при переходе к конкретному фрейму должны быть обязательно заполнены, а другие могут оставаться пу.- стыми. Для нашего примера такой необязательной ролью может быть роль с КЕМ. Во фреймовых языках основной операцией является поиск по образцу. Образец представляет собой фрейм, в котором заполнены не все структурные единицы, а только те, по которым среди фреймов, хранящихся в памяти ЭВМ, будут отыскиваться нужные фреймы. Образец может, например, содержать имя фрейма, а также имя некоторого слота во фрейме с указанием значения слота. Такой обра-
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ 73 зец проверяет наличие в памяти ЭВМ фрейма с данным именем и данным значением слота, указанного в образце. Или в образце может быть указано имя некоторого слота и его значение. Тогда процедура поиска по образцу должна обеспечить выборку из памяти ЭВМ всех фреймов, в которых содержится слот с таким именем и таким значением слота, как у образца. Наконец, может быть задана некоторая логическая функция от имени фрейма, каких-то имен слотов и значений слотов, например, {<КТО> <Иванов В. В.> <КУДА> <Минск>у<Киев> <КОГДА> <1.07.83:>\/<10.07.83^}. Такой образец заставит выбрать из памяти все фреймы, в которых имеются слот <КТО> со значением <Иванов В. В.>, слот <КУДА> со значением <Минск> или <Киев>, а также слот <КОГДА> со значением <1.07.83> или <10.07.83>. Имя фрейма, который будет выбираться процедурой поиска по образцу, в данном случае произвольно. В конкретных реализациях фреймовых языков на процедуру поиска по образцу накладываются конкретные ограничения, которые, однако, дают для пользователя достаточно широкий простор для манипулирования знаниями и данными. Другими процедурами, характерными для фреймовых языков, являются процедуры наполнения слотов данными, а также процедуры введения в систему новых фреймов-прототипов (т, е. новых знаний) и введение новых связей между ними. Применение фреймовых языков для задач управления породило желание ввести типологию основных фреймов-прототипов. В одной из них предполагается ввести четыре типа фреймов: фрейм технологии, фрейм конфликтности, фрейм продукции и фрейм показателя. Первый тип фреймов используется при описании знаний и данных, связанных с протеканием процессов в объекте управления и технологическими моделями, применяемыми при управлении процессом в нормальных режимах. Второй тип фреймов служит для классификации конфликтных ситуаций, способов их обнаружения, выявления причин, вызвавших их, и описания способов устранения конфликтных ситуаций. Фреймы, относяш,иеся к третьему типу, описывают причинно-следственные связи, лежаш,ие в основе процесса получения некоторого конечного продукта или результата (ситуации), что является непосредственной целью управления. Наконец, фреймы четвертого типа задают структуру тех показателей, которыми оценивается сам процесс, протекающий в объекте управления, и результаты воздействия на него со стороны системы управления. Пример 2.12. На рис. 2. И показана структура фрейма конфликтности, в котором использованы следующие обозначения фреймов и ссылок между фреймами: F — фрейм-прототип, Fi — конкретный фрейм, в котором хранятся конкретные данные о возникшем конфликте. Эти данные используются во фрейме F для возбуждения тех или иных связей. Множество {Fi} — все те фреймы, которые требуется анализировать при возникновении конфликта, описанного во
74 ГЛ. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОПЪЕКТА И СИТУАЦИИ Рис. 2.11 фрейме Fi. Множество {Fi} содержит фреймы, выступающие в качестве родовых для фрейма F. В них содержится информация, характеризующая тот класс конфликтных ситуаций, к которому принадлежит ситуация, составляющая значение слотов в f i. Фрейм Л — тот фрейм технологии, к которому относится конфликтная ситуация рассматриваемого вида. Множества (f^}, {fj}, {F\} и (Я}— множества фреймов, в которых содержатся процедуры, позволяющие анализировать конфликтность, возникшую, соответственно, при нарушении работы структурных подразделений на объекте управления, при отклонениях показателей для полуфабрикатов и изделий, при отклонении показателей для материальных и энергетических потоков, циркулирующих в объекте управления, при нарушениях в работе обслуживающего персонала. Эти группы фреймов, по сути, формируют основные сведения о способах устранения конфликта. Фрейм f 9 содержит оценки, позволяющие считать причинам!! возникновения конфликтной ситуации, задаваемой fi, те причины, которым соответствуют только что описанные четыре группы фреймов. В том же фрейме F^ может формироваться оценка степени конфликтности возникшей ситуации. Фрейм fio фиксирует динамику развития конфликтной ситуации, хранит те мероприятия, которые уже были применены при уменьшении степени конфликтности ситуации. Наконец, множество фреймов {f ii} соответствует множеству фреймов, где хранится информация, интересная для анализа причин возникновения конфликтной ситуации типа описанной во фрейме F, а ее конкретным представителем является ситуация, описанная во фрейме f ь Движение по всем связям^/, показанным на рисунке, происходит за счет процедуры, которая хранится во фрейме- прототипе F. Такие многосортные системы фреймов оказываются близкими по своей природе к тому, что многие авторы называют семантической сетью. Это понятие в современной литературе не имеет четкого определения. Поэтому мы ограничимся здесь лишь содержательным обсуждением семантических сетей, затрагивая в основном лишь те аспекты, которые важны для их использования в системах ситуационного управления. Рассмотрим прежде всего два возможных типа семантических сетей: экстенсиональные и интенсиональные семантические сети (ЭСС и ИСС). Напомним читателям, которые читают всю книгу без пропусков, что в § 1.6 мы затрагивали проблему экстенсиональных и интенсиональных знаний. Во фреймовых представле-
§2.9 ЯЗЫКИ ПРЕДСТАВЛЕНИЯ 3}-1АИИИ 75 ниях им в известной мере соответствуют конкретный фрейм и фре^'ьм- прототип с его связями. ЭСС отражает знание о некотором конкретном факте или некоторой конкретной ситуации, фиксируемой в системе управления. ЭСС состоит из вершин и связей между ними. Вершинам соответствуют некоторые объекты, присутствующие в данном факте или ситуации и выделенные с помощью индивидуальных имен из классов однотипных объектов, а связям — те конкретные отношения, которые связывали их в описываемой ситуации или факте. Таким образом, ЭСС фиксируют в себе мгновенные снимки реальной действительности. ИСС внешне ничем не отличаются от ЭСС. Но только вершинам ее соответствуют имена классов, а не индивидуальные имена, а связи отражают те отношения, которые всегда присущи этим объектам. Таким образом, в ИСС фиксируются некоторые закономерности, характерные для той или иной проблемной области. Пример 2.13. Рассмотрим пример ЭСС. Пусть имеется группа фактов, относящихся к множеству, состоящему из трех чисел: О, 1,2. Эти факты касаются двух отношений, определенных на множестве Сумма Рис. 2.12 указанных чисел. Первое из них — отношение строгого порядка, второе — отношение, определяемое операцией суммирования. Пусть Фх — имена этих фактов; тогда всю группу фактов мюжно задать, например, табл. 2.4 и 2.5. ЭСС, в которой отражены факты, приведенные в этих таблицах, показана на рис. 2.12.. На нем вершины сети (квадратики) соответствуют элементам базового множества О, 1,2, вершины, показанные кружками,— факты, отраженные в табл. 2.4 и табл. 2.5. Около стоят
76 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ имена аргументов соответствующих отношений. Имена отношений записаны в вершинах сети, обозначенных ромбиками. Связи от фактов к именам отношений для простоты в нашей ЭСС не имеют специальных меток. Отметим, что в нашем примере знание об отношении суммирования не является полным. Мы не знаем, чему равна сумма 2+0 и сумма / + /. Мы не знаем также, что отношение суммирования на нашем базовом множестве не может быть установлено между элементами 2, стоящими в позициях обоих слагаемых, и между элементами 2 и 1, двумя способами, расставленными по первым двум позициям, характеризующим отношение суммирования. Пример 2.14. В качестве примера ИСС рассмотрим сеть, показанную на рис. 2.13. Она определяет понятие КОМАНДИРОВКА в соответствии с тем ролевым фреймом, который мы рассмотрели для этого понятия в начале данного параграфа. На рисунке имена ролей Рис. 2.13 Таблица 2.4 Таблица 2.5 Имена фактов Имя отношения меньше (<) аргументы отношения меньший больший фу 0 1 ф. 1 2 0 2 Имя отношения суммирование { + ) Имена фактов аргументы отношения 1-е слагаемое 2-е слагаемое сумма Ф, 0 0 0 Фъ 0 , 1 1 Фь 1 0 1 0 2 2 выступают в качестве меток на дугах, а вершины сети помечены именами классов объектов, элементы которых могут заполнять в экстен- сионалах эти вершины. Таким образом, в языках представления знаний можно выделить экстенсиональную и интенсиональную составляющие. При этом различные языки отличаются друг от друга теми или иными средствами для представления интенсиональных знаний. В заключение данного параграфа опишем кратко структуру одного из языков представления знаний, получившего название ФРЛ {язык представления фреймов). Этот ЯПЗ пока единственный, для которого имеется реализация на отечественных ЭВМ. Эта реализа-
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИИ 77 (1-й комментарий: сообщение)) (второе данное )) (/-е данное ))) (имя второй ячейки ))) (имя k-u ячейки )))) (имя второго слота )))) (имя /-Г0 слота ))))) В такой структуре могут отсутствовать некоторые уровни. Например, могут отсутствовать комментарии и сообщения к некоторым данным, во фрейме может быть только один слот, а в слоте только одна ячейка, в ячейке может содержаться только одно данное. Для указания местоположения некоторой порции информации во фрейме в ФРЛ используется индикаторный путь. Примером его служит индикаторный путь для поиска сообщения, хранящегося во втором комментарии к третьему данному первой ячейки седьмого слота во фрейме с именем /. Этот путь имеет вид (/; s7; /1; d3; с2). Анализируя его, легко найти нужный «адрес» в структуре фрейма с именем /. В советских реализациях ФРЛ индикаторный путь требует явного указания всех имен частей структуры фрейма. Сделано это для того, чтобы при поиске адреса использовать не счетчики, а стандартную операцию поиска по образцу. ция существует в двух версиях, одна из которых опирается в качестве базового языка на ЛИСП ЕС, а другая — на версию языка РЕФАЛ ЕС. Имеется несколько систем ситуационного управления, использующих ФРЛ для представления знаний и манипулирования ими. В ФРЛ каждый фрейм представляет собой структуру с максимальной степенью вложенности, равной пяти. Эта структура имеет следующий вид: (Имя фрейма (имя первого слота (имя первой ячейки (первое'данное (первый комментарий: сообщение) (второй комментарий: сообщение)
78 гл. 2. языки для ОПИСАНИЯ OBl>riKTA И СИТУАЦИИ Для работы с фреймами в ФРЛ имеется четыре основных оператора FASSERT, FPUT, FGET и FREMOVE. Оператор FASSERT позволяет ввести в базу знаний тот фрейм, который является аргументом этого оператора. Пусть, например, имеется запись FASSERT (КОМАНДИРОВКА (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович))) (КУДА (S VALUE (Ленинград) (Баку) (Ашхабад))) (КОГДА (S VALUE (2.03.84 (CO.MMENT (Распоряжение и. о. директора Сидорова Евгения Степановича)))))) В этом фрейме три слота с именами КТО, КУДА, КОГДА. Каждый слот содержит одну ячейку со стандартным именем S VALUE. Это имя показывает, что в данной ячейке хранятся обычные данные. К данному, хранящемуся в ячейке S VALUE слота КОГДА, добавлен комментарий, говорящий о том, что лицо, направляющееся в командировку 2 июня 1984 г., отправляется в нее в соответствии с распоряжением и. о. директора Сидорова Евгения Степановича. С помощью оператора FASSERT этот фрейм будет занесен в базу знаний системы, допуская вызов по имени КОМАНДИРОВКА. Оператор FPUT добавляет новые данные в некоторое место фрейма. Аргументом этого оператора служит введенный выше индикаторный путь, в конце которого явно выписывается вставляемая часть. Например, FPUT (КОМАНДИРОВКА; КТО; S VALUE; Сидоров Евгений Степанович; COMMENT; распоряжение директора Петрова Ильи Алексеевича) приведет к тому, что фрейм КОМАНДИРОВКА изменит coдepжи^юe первого слота, который теперь будет выглядеть так: (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович) (Сидоров ЕвгеЕ1ИЙ Степанович) (COMMENT (распоряжение директора Петрова Ильи Алексеевича))))
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИИ 79 При необходимости извлечь из фрейма некоторую информацию для работы используется оператор FGET. В качестве его аргумента используется тот же индикаторный путь. Если, например, имеется оператор FGET (КОМАНДИРОВКА; КУДА; SVALUE;), то с его помощью из фрейма КОМАНДИРОВКА будет извлечена информация, хранящаяся в ячейке слота КУДА. Эта информация будет выдана в виде списка ((Ленинград), (Баку), (Ашхабад)). Наконец, оператор FREMOVE, в качестве аргумента которого выступает все тот же индикаторный путь, позволяет исключать из фрейма ненужную информацию. Если, например, к нашему фрейму применить оператор FREMOVE (КОМАНДИРОВКА; КУДА; SVALUE Баку), то в слоте КУДА в соответствующей ячейке исчезнет данное Баку и содержимым этой ячейки будут лишь Ленинград и Ашхабад. При наличии оператора FREMOVE (КОМАНДИРОВКА) фрейм с этим именем убирается из базы знаний. (В некоторых версиях ФРЛ для удаления фрейма используется специальный оператор FERASE.) Так как истинная адресация в памяти ЭВМ прямо никак не связана с той адресацией, которая образует индикаторные пути, то реальное расположение фреймов и их подструктур в памяти пользователю неизвестно. Соотнесение реальных адресов с индикаторными путями при записи и поиске фреймов и их подструктур осуществляется системой управления базой знаний. В этой же системе работает стандартный «мусорщик», который включается в работу или по специальным сигналам в программе, или автоматически после работы операторов типа FREMOVE. В языке ФРЛ, кроме ячеек SVALUE, предусмотрено еще пять типов ячеек, распознающихся системой как специальные. Ячейки первого специального типа имеют имя S DEFAULT. Содержимое таких ячеек используется «по умолчанию». Такое использование информации возникает тогда, когда при поиске в слоте информации, указанной, например, в индикаторном пути оператора FGET, обнаруживается, что такой информации нет. Тогда вместо нее выдается информация, содержащаяся в ячейке S DEFAULT. Если бы первый слот нашего фрейма КОМАНДИРОВКА имел вид (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович)) (S DEFAULT (Приказа на командировку пока нет))), ТО при наличии оператора FGET (КОМАНДИРОВКА; SVALUE; Сидоров Евгений Степанович) индикаторный путь при поиске привел бы к ненахождению нужного данного. При сигнале об этом систе-
80 ГЛ. 2. языки для ОПИСАНИЯ ОБЪЕКТА И С]Л'УАЦИЙ ма автоматически переилла бы к содержимому ячейки S DEFAULT из этого слота и выдала бы информацию о том, что на Сидорова Евгения Степановича приказа на командировку пока нет. Два типа специальных ячеек SIF ADDED и SIF REMOVED используются соответственно 'при работе операторов FPUT и FRE- MOVE. В качестве данных в этих ячейках стоят имена некоторых процедур, по которым они вызываются и выполняются. Сами процедуры написаны на том языке программирования, на который опирается язык ФРЛ. Как уже говорилось, отечественные системы в качестве базового языка используют ЛИСП или РЕФАЛ. Когда оператор FPUT добавляет что-то в ячейку S VALUE данного слота, то автоматически выполняются процедуры, указанные в ячейке SIF ADDED. Эти процедуры в ФРЛ называются присоединенными. Пусть, например, необходимо хранить сведения о числе командируемых. Тогда первый слот фрейма КОМАНДИРОВКА может иметь следующую структуру: (КТО (S VALUE (Иванов Иван Иванович) (Петров Петр Петрович)) (SIF ADDED (A.VIOUNT))) Здесь AMOUNT — имя процедуры, написанной, например, на ЛИСПе. Эта процедура работает следующим образом: к числу, хранимому в определенном месте памяти, добавляется число вновь добавляемых в ячейку S VALUE слота КТО данных. Ячейка SIF REMOVED используется так же, как и ячейка SIF ADDED, но при удалении данных из ячейки S VALUE с по- лющью оператора FPEMOVE. В только что приведенном примере при вычеркивании из списка КТО тех или иных лиц при наличии в структуре этого слова ячейки SIF REMOVED, в которой хранится данное DECREASE, будет включаться процедура, уменьшающая количество командируемых на число данных, указанных в индикаторном пути оператора FREMOVE. В качестве данных ячейки SIF NEEDED также выступают имена процедур. Эти процедуры также являются присоединенными, т. е. выполняются вне языка ФРЛ на базовом языке программирования. Процедуры, хранящиеся в ячейке SIF NEEDED, выполняются тогда, когда в индикаторном пути оператора FGET имеется ссылка на эту ячейку и имя соответствующей процедуры. Если имя процедуры не указано, то выполняются последовательно все процедуры, хранящиеся в ячейке SIF NEEDED.
§2.9. ЯЗЫКИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ SI Присоединенные процедуры позволяют использовать все возможности вычислительного характера, которые доступны системе программирования базового уровня. Последняя специальная ячейка ■— ячейка с именем S REQUIRE, В качестве данных в этой ячейке хранятся имена некоторых предикатов, определенных на значениях данного слота. Такие предикаты принимают истинное или ложное значение в зависимости от тех реальных ячеек и данных, которые хранятся в данный момент в слоте. Это позволяет, например, отвечать на вопросы: «Верно ли, что среди городов, указанных в слоте КУДА, нет Москвы?», «Верно ли, что в мае командировок не было?», «Верно ли, что Иванов Иван Иванович и Петров Петр Петрович единственные, кто уезжал в командировку в июне 1984 г.?» Предикаты, подобно присоединенным процедурам для проверки истинного значения, вызывают соответствующие процедуры, написанные на базовом языке программирования. В качестве ответа на действие, оказываемое оператором FGET, в индикаторном пути которого после имени некоторого слота указана ячейка S REQUIRE, система выдает список истинных значений всех предикатов на тех данных слота, которые в этих предикатах выступают в качестве аргументов. Пока мы рассматривали изолированные фреймы и работу с ними. Но в языке ФРЛ имеется возможность связывать фреймы между собой в единую сеть. Прежде всего, фреймы связываются друг с другом с помощью отношения род — вид. В ФРЛ связи, характеризующие переход от вида к роду, называются АКО-связи (сокращение от а kind of, т. е. один из). Обратные связи носят название INSTAN- СЕ-связи. Они используются для запоминания пути вверх по АКО- связям для возвращения к начальному фрейму. АКО-связи позволяют сокращать объем информации, хранящейся в базе знаний. Информация, общая для нескольких фреймов, собирается в специальный фрейм, в котором она и хранится в единственном экземпляре. Для получения ее (наследования) фреймами более низкого уровня в них создается специальный слот с именем АКО. В качестве данных, хранимых в ячейке S VALUE этого слота, выступают имена фрейлюв, с которыми данный фрейм связан АКО-связями. Пусть, например, в базе знаний, кроме фрейма КОМАНДИРОВКА, хранится еще фрейм СОВМЕСТИТЕЛЬ. По существующим нормам, если человек отбывает в командировку, то необходимо учесть это при оплате его труда по совместительству. Это означает, что во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ слот КТО окажется общим. Для того чтобы не дублировать информацию, можно завести специальный фрейм, присвоив ему имя КОМАНДИРУЕМЫЙ. Этот новый фрейм будет иметь вид: (КОМАНДИРУЕМЫЙ (КТО (S VALUE
82 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ (Иванов Иван Иванович) (Петров Петр Петрович))) (INSTANCE (S VALUE (КОМАНДИРОВКА) (С О В М Е С Т И Т Е Л Ь))) Во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ слота с именем КТО не будет. Вместо него будет стоять слот с именем АКО, в котором в ячейке S VALUE будет стоять в качестве данного КОМАНДИРУЕМЫЙ. При наличии подобных ячеек во фреймах КОМАНДИРОВКА и СОВМЕСТИТЕЛЬ выполнение, например, оператора FGET (КОМАНДИРОВКА; КТО; SVALUE) будет происходить следующим образом. Анализируя индикаторный путь, система найдет фрейм с именем КОМАНДИРОВКА и, просматривая его, не обнаружит слота с именем КТО. Это служит сигналом для автоматического обращения к слоту АКО в этом фрейме. Получив информацию о данных, хранящихся в его ячейке S VALUE,^система переходит к поиску фрейма с именем КОМАНДИРУЕМЫЙ, в котором ищет слот с именем КТО. Найдя этот слот, система выделяет информацию, требование на которую было сформулировано в индикаторном пути. При нахождении фрейма КОМАНДИРУЕМЫЙ оператор FGET записывает в его слот INSTANCE имя того фрейма, от которого осуществлен переход по АКО-связи. Поэтому мы и выделили данные в слоте INSTANCE фрейма КОМАНДИРУЕМЫЙ разрядкой. Фактически, их там нет, пока некоторый оператор не перешел к данному фрейму по АКО-связи. В некоторых системах эти данные уже есть, а оператор, пришедший к данному фрейму по АКО-связи, лишь активизирует то или иное данное с помощью специальной метки. Оператор FGET отказывается от выполнения поставленной перед ним задачи (как и другие операторы ФРЛ), если им будут использованы все возможности поиска, предоставляемые АКО-свя- зями и содержимыми ячеек S DEFAULT. В существующих версиях ФРЛ пока еще слабо развиты процедуры, позволяющие вводить на фреймах отношения, отличные от тех, которые образуют структуру типа дерево {род — вид, целое — часть, класс — элемент и т. п.). Однако в последнее время видны успешные шаги в этом направлении, что сделает ФРЛ еще более перспективным для использования в системах ситуационного управления и других системах, традиционно относимых к сфере искусственного интеллекта. Если в ФРЛ не выделяются специальные типы фреймов, что, как отмечалось выше, удобно для практических систем, то в другом языке представления знаний KRL введено семь различных типов фреймов: базисный фрейм, абстрактный фрейм, фрейм-специализация, индивидуальный фрейм, декларирующий фрейм, фрейм-отношение
§ 2.10. ПЕРЕХОД ОТ ТЕКСТОВ К ВНУТРЕННЕМУ ПРЕДСТАВЛЕНИЮ 83 И фрейм-условие. Увеличено в этом языке по сравнению с ФРЛ и число различных по своему значению ячеек. Однако и в этом языке плохо развиты (по крайней мере в тех версиях, которые работают на ЭВМ) средства для эффективной организации и манипулирования с сетевыми фреймовыми структурами. §2.10. Переход от текстов на естественном языке к внутреннему представлению ** Между описанием ситуаций на естественном языке и внутренними представлениями информации о них в управляющей системе имеется явный разрыв. Поэтому одной из трудных проблем, которые приходится решать при создании систем ситуационного управ ления, является проблема преобразования словесных описаний во внутренние представления. Эта проблема тесно связана с задачей построения диалоговых систем, базирующихся на естественном языке. Однако для ее решения недостаточно воспользоваться готовыми лингвистическими процессорами, обеспечивающилш диалог. Требуется еще получать специфическую информацию, связанную с функционированием Анализатора, показанного на рис. 1.7. Напомним, что его задача состоит в классификации поступившей информации в соответствии с теми задачами, которые должна решать система управления. Эти задачи могут быть трех типов: пополнение системы новой информацией об объекте управления или способах управления, формирование ответа на некоторый запрос на основе информации, уже хранящейся в системе, поиск решения в ситуации, описание которой уже поступило в систему. Первые две задачи — вспомогательные, третья — основная. Но разделение их на три класса нужно производить при преобразовании входного текста во внутренние представления. Именно на этом этапе система должна «понять», что от нее требуется. Поэтому Анализатор может рассматриваться как составная часть лингвистического процессора. На рис. 2.14 показана традиционная структура лингвистического процессора, в котором анализ поступившего на вход текста идет по предложениям в порядке их поступления. Сначала для всех слов, входящих в него, из словаря находят нужные ^юpфoлoгичe- ские и синтаксические характеристики, приписывают род, число, падеж, наклонение и т. п. Затем происходит синтаксический анализ, цель которого состоит в выявлении синтаксической структуры предложения. Она имеет вид дерева и nanoNHiHaeT известные всем деревья, получающиеся в результате школьного разбора предложений. На этом этапе вычленяется сказуемое и именная группа существительного, а также все остальные зависящие от них члены предложения. На этапе семантического анализа строится семантическая структура предложения, происходит процесс его интерпретации в терминах, используемых в языке представления знаний. На этом этапе лингвистический процессор взаимодействует не только с соб-
84 гл. 2. ЯЗЫКИ ДЛЯ ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ ственными словарями, но и с базой данных и базой знаний, отображенных на наилем рисунке в виде блока Модель проблемной области. После этой интерпретации наступает очередь Анализатора, которому в нашей схеме соответствует Блок прагматического анализа. В реальных лингвистических процессорах и диалоговых системах структура, показанная на рис. 2.14, может видоизменяться. Последовательный харак- Входное предло>нение блок морсрологического анализа Блок синтокси^/еского анализа Словарь Блок семантического анализа Модель проблемной области L Блок прагматического анализа Решение на основании текста тер выполнения отдельных этапов анализа может стать последовательно - параллельным, когда некоторые этапы начинают выполняться раньше окончания пред- шествуюи;их. Некоторые этапы (например, этап морфологического анализа) могут вообще отсутствовать. При построении систем, ориентированных на узкие проблемные области, можно вообще отказаться от структуры, показанной на рис. 2.14. Кроме того, большим недостатком существующих лингвистических процессоров является то, что они работают лишь с отдельными предложениями и не улавливают смысла целого текста, что резко сужает возможности таких систем. Особенно это следует учитывать при создании систем управления обсуждаемого здесь типа. Ибо описание ситуации, как правило, носит характер текста, состоящего из ряда предложений. И как тут не вспомнить высказывание выдающегося советского психолога А. Н. Соколянского, создавшего методику обучения языку слепоглухонемых. Он писал: «Основным элементом является текст, но ни в коем случае не отдельное слово и не отдельное предложение. Название закрепляется не за предметом, а за ситуацией, в которой используется предмет» ^). Мы не будем здесь развивать его мысль, поскольку это увело бы нас в сторону от основной темы настоящего параграфа. В комментариях к данной главе читатель найдет сведения о той литературе, где эти вопросы обсуждаются подробно. Мы же перейдем к описанию мето- Рис. 2.14 ^) С о к о л я н с к и й А. Н. Обучение слепоглухонемых языку.— Тезисы конференции по машинному переводу. М.: 1958.
§ 2.10. ПЕРЕХОД от ТЕКСТОВ К ВНУТРЕННЕМУ ПРЕДСТАВЛЕНИЮ 85 дов перехода от текста к представлениям, характерным для языка ситуационного управления. В § 2.3 мы приводили таблицы статических и динамических отношений, которые могут использоваться при описании ситуаций, складывающихся на объекте управления. Мы говорили о том, что число базовых отношений такого рода конечно и включает в себя не более 200 отношений. Некоторые из них приведены в табл. 2.1 и 2.2. В § 2.4 мы привели табл. 2.3, которая показывает, что на множестве отношений можно ввести некоторую иерархию (в данном случае двухуровневую). Пусть теперь выбрана некоторая проблемная область и зафиксирован словарь основных понятий, которые будут использоваться для описания характерных для нее ситуаций. Для перехода от словесных описаний к записям на ЯСУ необходимо научиться находить соответствие между некоторыми частями текста и символами, используемыми в ЯСУ. В § 2.3 мы выделили восемь классов — понятия, имена, отношения, действия, квантификаторы, модификаторы, модальности и оценки. Кроме того, для отношений и действий мы дали более подробную классификацию внутри этих классов. При небольшой проблемной области (в смысле используемого словаря для описания ситуаций и принимаемых решений по управлению) нужное нам соответствие можно задать с помощью специальных таблиц. Пример 2.15. Предположим, что в памяти системы хранится табл. 2.5. Таблица 2.6 Лексическая единица Фрагмент на ЯСУ Лексическая единица Фрагмент на ЯСУ Температура ё Из-за /-73 Давление b Насос а В коллекторе Насоса а Повысилось ds Необходимо fi Снизилось d2 Включить Нормальное d. № 5 9h Остановка di № 8 pi 2 Остановки d. № 9 Из-за /-49 Автокар h Пусть на ход системы поступил следующий текст: «Давление в коллекторе № 5 снизилось из-за остановки насоса № 8. Необходимо включить насос № 8 или насос № 9». Анализируя последовательно этот текст, можно построить соответствующее ему внутреннее представление. Сначала вместо слова давление подставляется b ~ его обозначение во внутреннем языке. Затем находятся фрагменты пред-
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 87 страма Шенди, джентельмена»эта ситуация иллюстрируется следующими словами: «Мать моя... могла употреблять трудное слово 20 лет подряд, а также отвечать на него, если то был глагол, во всех временах и наклонениях, не утруждая себя расспросами о его значении». В комментариях к данной главе читатель найдет указания на литературу, в которой описаны системы, опирающиеся на прямой переход от текстов к внутренним представлениям. В настоящее время практика построения транслирующих блоков для перехода от текстов на естественном языке к внутренним представлениям в системах ситуационного управления такова, что создаются узкоспециализированные трансляторы, полностью ориентированные на те проблемные области, для которых они предназначаются. §2.11. Формализация качественных характеристик* Наиболее трудно формализуются при переходе от естественного языка к ЯСУ квантификаторы, модификаторы, оценки и модальности, которые человек использует чисто качественно. Примерами такого рода описаний, присущих человеку, могут служить «Турбина часто выходит из строя», «Потери от плохой регулировки температуры весьма значительны», «Можно включить дополнительный двигатель, но это опасно». Что скрывается за приведенными фразами? Что значит, что турбина выходит из строя часто? Раз в день, в месяц, в год? Каковы на самом деле потери, которые весьма значительны? Сколько они составляют процентов — 20 или 80? И какая регулировка температуры называется плохой? И, наконец, включать или не включать все-таки дополнительный двигатель, ибо сделать это можно, но 0П2СН0? На эти вопросы нет прямого ответа. Язык человека не оперирует точными значениями слов, выделенных в наших вопросах курсивом, и это понятно, так как эти слова сами по себе, вообще говоря, ничего не обозначают. Их смысл полностью определяется некоторой конкретной действительностью, для описания которой они привлекаются. Поэтому утверждения «Для изделия требуется весьма много крепежных элементов» и «В изготовлении изделия участвует весьма много предприятий» говорят о разных весьма много. В первом случае речь, по-видимому, идет о тысячах или десятках тысяч крепежных элементов, а во втором случае количество предприятий, наверное, исчисляется десятками. Человек для понимания смысла подобных слов и словосочетаний очень часто привлекает понятие нормы, характеризующей данное явление, факт или процесс. Само понятие нормы тоже текуче, ситуативно, зависит от конкретных условий, в которых воспринимается текст или речь. Если в разговоре двух москвичей фраза «Я живу далеко от работы» ассоциируется у собеседника с затратами времени на транспорт порядка часа, то для жителей Академгородка под Новосибирском та же фраза означает куда меньише затраты
88 гл. 2. языки для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИЙ Норма Рис. 2.15 Никогда Очень редко Не часто, нЕ'рвдко Рис. 2.16 Часто 04i часто Ьеда или словосочетаний, входящих в шкалу. Кроме того, испытуемому предъявляется отрезок шкалы, в левом и правом концах которой стоят слова антонимы, замыкающие шкалу (например, никогда и всегда для шкалы частот), а в середине шкалы расположено слово или словосочетание, соответствующее норме для данной шкалы. На шкале нанесены деления, количество которых больше слов образующих ряд-шкалу. Задача испытуемых состоит в указании интервалов, которые, по их мнению, соответствуют словам шкалы. На рис. 2.16 показан результат такого эксперимента, проведенного с одним испытуемым по построению шкалы никогда — всегда, когда времени на дорогу до работы. И это связано с различной нормой затрат у москвичей и жителей Академгородка. Пусть некоторая переменная х принимает значения из отрезка [а, Ь] (рис. 2.15), И пусть наблюдения за значениями х позволили построить гистограмму, показанную на этом рисунке. Тогда норму будут характеризовать те значения х, которые встречались наиболее часто. Человек выде- ляет некоторый интервал значений (х*, x**), внутри которого он готов считать все значения нормальными. Если значения х ъ Значение лежат левее интервала нормы, •2^ то человек склонен их считать меньилими нормы, а когда значения X оказываются правее а'**, то человек интерпретирует их как превосходящие норму. 'icM самым он оперирует с некоторой шкалой, в которой понятие нормы занимает центральное положение. Примером такой шкалы для оценки расстояний служит следующий ряд слов: вплотную; очень близко; близко; не далеко, не близко (норма); далеко; очень далеко. Другим примером может служить шкала для оценки частоты событий или явлений: никогда; почти никогда; очень редко; редко; не часто, не редко (норма); часто; очень часто; почти всегда; всегда. Такого же типа шкалы можно образовать на антонимичных парах слов: большой — маленький, много — мало, сильно — слабо и т. п. Можно провести следующий эксперимент, который действительно неоднократно проводился с испытуемылш разного возраста, социального положения, национальности. Испытуемому предъявляется стопка карточек, на каждой из которых написано одно из слов
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 89 шкала включала следуюш.ие слова: никогда; очень редко; редко; не часто, не редко; часто; очень часто; всегда. С понятиями никогда и всегда испытуемые, как правило, связывают лишь конечные точки отрезка. Остальные слова интерпретируются ими некоторыми отрезками, аналогично тому, как показано на нашем рисунке. Если теперь набрать достаточную статистику на большой группе испытуемых, то можно построить некоторую обобщенную шкалу по группе испытуемых. При этом возникает определенная трудность, так как границы интервалов для слов у разных испытуемых Рис. 2.17 могут оказаться различными, что заставляет переходить к некоторой гистограмме, пример которой показан на рис. 2.17. Пять кривых, показанных на ней (для слов никогда и всегда отклонений, практически, нет) называются функциями принадлежности слов очень редко; редко; не часто, не редко; часто и очень часто. Понятие функции принадлежности, которое возникло у нас в связи с обработкой экспериментального материала, может быть задано вполне строго. Функцией принадмжности для некоторого множества W называется функция \i{w), определенная на всех элементах множества W'^W и принимающая значения из отрезка 10,1]. Смысл этого определения можно интерпретировать следующим образом. Если для некоторого w^W \i{w)=Q, то это означает, что w не принадлежит W\ если для некоторого w^W |л (ii^) =^ 1, то ^ принадлежит Если же для некоторого w 0<|х(^)<1, то это означает, что W принадлежит W с некоторой возможностью, оцениваемой величиной \i{w). Пример 2.16. На рис. 2.18 показан ряд картинок. Относительно левой из них мы не сомневаемся — это человек. Относительно правой сомнения также нет. Это, конечно, кошка. Будем формировать по множеству показанных на рис. 2.18 изображений множество W, интерпретируемое кг^к изображения кошек. Тогда для правого изображения функция принадлежности к этому множеству |х(^) = 1, а для левого — |х(^) = 0. Остальные изображения, по-видимому, нельзя со столь глубокой уверенностью отнести к данному множе-
90 ГЛ. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ Рис. 2.18 дает по каждому изображению свою числовую оценку, можно усреднить ее по всем экспертам и получить для каждого изображения значение функции принадлежности для множества изображения кошек. Интересно отметить, что характер экспертизы во NmoroM зависит, как уже говорилось, от нормы, которой придерживаются эксперты. Если в данном социуме не принято носить усы, то, возможно, все оценки экспертизы сместятся в сторону их увеличения. Еще более наглядно это может быть продемонстрировано на примере образования значений функции принадлежности к такому, например, ^шoжecтвy, как старые люди в зависимости от конкретного возраста людей. В социуме долгожителей возраст 50 лет вряд ли может получить большое значение функции принадлежности к этому множеству. Но в социуме, где продолжительность жизни в среднем невелика, для возраста 50 лет может быть получена весьма высокая степень принадлежности к множеству старые люди. Вернемся к рис. 2.16 и 2.17. Л\ожно ли их связать между собой? Введем уровень отсечки а, где а принимает определенное значение в интервале от О до 1. На рис. 2.17 показано два уровня отсечки с ai>0,5 и а2<;0,5. Эти уровни позволяют выделить две системы заштрихованных отрезков для ai и а.2 на нижних осях. Точки, попавшие в них, соответствуют значениям частоты, которые принадлежат с возможностью, превосходящей данный уровень, к множествам, характеризуемым нашими пятью словами. «Пустые» интервалы значений содержат такие значения частоты, относительно которых с данным уровнем возможности ничего сказать нельзя. Чем меньше а, тем, естественно, большее место занимают заштрихованные от- ству ИЛИ ИСКЛЮЧИТЬ ИЗ него. Значение [i(w) явно возрастает при анализе изображений слева направо. Но возникает проблема, какое численное значение нужно приписать каждому изображению. Ответ на этот вопрос может дать только человеческая экспертиза. Опросив достаточное число людей-экспертов, каждый из которых
§2.11. ФОРМАЛИЗАЦИЯ КАЧНСТВЕННЫХ ХАРАКТЕРИСТИК 91 резки. При некотором значении а* они заполняют всю ось, а при дальнейшем уменьшении а начинают налагаться друг на друга. Это будет означать, что с заданным уровнем возможности некоторое отношение частоты может принадлежать как множеству, определяемому некоторым словом на шкале, так и соседнему с ним множеству. Отсюда вытекает способ выбора а^, обеспечивающий отнесение всех значений на шкале к некоторому единственному множеству. Рассмотрим теперь весьма важную проблему — проблему универсальной шкалы. Пока значения функций принадлежности будут целиком определяться семантикой некоторой конкретной проблемной области, трудно делать какое-либо общее заключение о шкалах или строить процедуры работы с ними. Преобразуем гистограм^ му, показанную на рис. 2.15, следующим образом (рис. 2.19). Отобразим участок кривой, который находится правее экстремальной точки, зеркально вверх, а затем проведем аффинное преобразование полученной кривой так, чтобы точка бывшего максимума получила координаты (0,5; 0,5), а вся кривая вписалась в единичный квадрат таким образом, что Ьг=\^ а=0, f{b) = l и [{а) = =0. Теперь отметим на оси ординат отрезки, соответствующие шкале частоты и полученные экспериментальным путем с некоторым уровнем отсечки а*. Переход на универсальную шкалу происходит следующим образом. Пусть некоторое явление или событие имеет частоту встречи, лежащую в отрезке [ti, ^2!. Спроектируем этот отрезок, используя гистограмму /1 (х), на ось ординат. Ему будет соответствовать отрезок, оцениваемый характеристикой редко. Это означает, что появление события, определяемого гистограммой fi{x) с такой частотой, оценивается как редкое событие. Если мы имеем другое событие или явление со своей гистограммой f-zix), то истинные частоты его появления, оцениваемые как редкие, будут другими. На рис. 2.19 им соответствует отрезок [t|i, TI2], который не совпадает с отрезком [Ei, E2I. Подобно случаю нечеткой шкалы для частот можно построить универсальные шкалы и для других нечетких шкал. Например, для пространственной шкалы по оси абсцисс вначале откладываются расстояния, выраженные в каких-нибудь натуральных единицах Редко ред/<о Частота Рис. 2.19
92 гл. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ измерения расстояний (например в метрах), а по оси ординат размещаются отрезки, соответствующие словам очень далеко, далеко и т. д. Затем происходит перевод всего графика в единичный квадрат при условии, что точка максимума гистограммы попадает в точку (0,5; 0,5). После этого переход от нечеткой пространственной шкалы к универсальной шкале происходит так же, как было сделано для частотной шкалы. Вообще, если имеется некоторая шкала, отражающая некоторый порядок в словесных оценках какого-то явления или факта, и существует способ количественной их оценки, то при наличии гистограммы всегда можно перейти к универсальной шкале, независящей от конкретной семантики данного явления или факта. Опишем теперь иной подход к процессу введения универсальной шкалы. Если объект управления сложен и при описании текущих ситуаций на нем, а также для описания знаний о функционировании объекта и управлении им приходится использовать качественные описания, то ясно, что модель, формируемая-в системе управления, является лишь приближенным описанием объекта и процесса управления им. Но не всякая приближенная модель пригодна для этого, а лишь такая, для которой верно утверждение о согласованности. Смысл нашего утверждения можно проиллюстрировать с помощью рис. 2.20. На нем есть множество состояний w (понимаемых в самом широком смысле) объекта управления. Его можно трактовать как множество всех возможных для объекта точных описаний его состояний. Множество S есть множество описаний полных ситуаций, которые используются системой управления для принятия решений. Отдельные полные ситуации не точно соответствуют истинным описаниям того, что характеризует текущее состояние объекта с учетом его специфики Wi. Поэтому отображение к является нечетким. Вместо четкого однозначного в обе стороны отображения б: Wi<r-^Si мы имеем в обе стороны многозначное отображение X: WiT^Si, где Wi и Si суть подмножества W и S соответственно. При этом отображение б: Wi<r^Si как бы «включается» в отображение X: Wi^^Si, т. е. является одним из отображений этого многозначного отображения к. Пусть О есть некоторый оператор перевода одного полного описания ситуации в другое, а Л — некоторый процесс перехода из состояния Wi объекта управления в состояние Wz- И пусть О имитирует в системе управления переход А. Тогда модель описания будет согласованной, если б: Wi<r-^Si включается в Рис. 2.20
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 93 Я: Wi^Su б: W2<r-^S2 включается в К: й^а^^з и подмножества Wi и W2 таковы, что при данном критерии управления объектом (или соображений о целесообразности, используемых при его управлении) все состояния, попавшие в U^i и W2. требуют одинаковых (с некоторой допустимой точностью) решений по управлению. Другими словами, от X требуется лишь «приблизительная правдивость» передачи того, что происходит на объекте управления, но степень приблизительности не должна превышать некую границу, вне которой решения по управлению, принимаемые в модели, не будут соответствовать необходимым. Это отображение должно быть зеркалом с небольшими искажениями, а не тем «диким зеркалом», о котором в свое время писал В. Набоков: «Одним словом, у вас было такое дикое зеркало и целая коллекция разных неток, т. е. абсолютно нелепых предметов: всякие такие бесформенные, пестрые, шишковатые штуки, вроде каких-то ископаемых,— но зеркало, которое обыкновенные предметы абсолютно искажало, теперь, значит, получало на- стояш,ую пиш,у, т. е. когда вы такой непонятный и уродливый предмет ставили так, что он отражался в непонятном и уродливом зеркале, получалось замечательно; нет на нет дайало да, все восстанавливалось, все было хорошо...» Отображение Я можно задать в виде некоторой матрицы, в которой строкам соответствуют состояния Wi, а столбцам — полные ситуации Si. На пересечении строк и столбцов можно задать число O^m^j^l, которое будет характеризовать возможность замены Wi на Sj или обратной замены. Тогда строки матрицы можно рассматривать как функции принадлежности Wi на множестве полных ситуаций. А столбцы матрицы — как функции принадлежности St на множестве истинных состояний объекта управления. Пример 2.17. Рассмотрим таблицу-матрицу 2.7. Таблица 2.7 Расстояние, Очень близко Близко Не далеко. Да.]еко Очень м не близко далеко 0,5 0,9 0,1 2 0,05 0,65 0,2 20 0,15 0,6 0,05 100 0,05 0,4 0,8 3000 0,05 0,7 0,2 Эта матрица отражает мнение некоторого эксперта и получена в процессе психологического эксперимента. Эксперимент заключался в том, что испытуемые могли ставить свои оценки из отрезка [0,11 с шагом 0,05 в клетках матрицы. Матрица задает пять функций принадлежности значений точной метрической шкалы расстояний к ело-
94 1Л. 2. ЯЗЫКИ для ОПИСАНИЯ ОБЪЕКТА И СИТУАЦИИ весным оценкам расстояний и пять функций принадлежности словесных оценок на нечеткой шкале расстояний к точным метрическим значениям. На рис. 2.21 для иллюстрации приведена функция принадлежности для не далеко, не близко. Ее график состоит из пяти точек, определяемых тре- долено,не бшдко тьим столбцом матрицы. Кусочно-линейная аппроксимация сделана для наглядности. Отображение Л, за- даваедюе матрицей, можно назвать нечетким отношением модели рова- ния. Оно показывает, как моделируется одна четкая или нечеткая шкала некой другой шкалой. И в частности, как происходит переход от словесных оценок некоторых качественных характеристик к их числовым оценкам, что и является целью настоящего параграфа. С нечетким отношением моделирования можно связать диаграмму моделирования А =^ А' 5000 м в' Здесь А \\ А' — состояния некоторой среды, а В и В' — связанные сними состояния модели, отображающей эту среду. Операторам преобразования Т в среде должны согласованно соответствовать операторы преобразования в модели Q. Для успешности моделирования необходимо, чтобы диаграмма моделирования была коммутативной. Пример 2.18. В предшествующем примере испытуемые строили матрицу как бы вне учета семантики. Представляет интерес выявление ее влияния на построение нечеткого отношения моделирования. В одном из проведенных экспериментов испытуемые должны были вписать оценки в матрицы, подобные использованным в предыдущем примере, при попадании в следующие три реальные ситуации: обход ямы со скользкими краями, обход работающей поливальной автомашины и переход дороги перед быстро движущимся транспортом. Результатом эксперимента оказалась практически та же матрица, которая зафиксирована в примере 2.17, но оценки при переходе от одной ситуации к другой как бы сдвигались на один разряд вправо при переходе от более опасной (третьей) ситуации.
§2.11. ФОРМАЛИЗАЦИЯ КАЧЕСТВЕННЫХ ХАРАКТЕРИСТИК 95 которой соответствовала матрица из примера 2.17, к менее опасным второй и первой ситуациям эксперимента. Например, в ситуации с поливальной автомашиной расстояние в 0,5 м со степенью принадлежности 0,85 получило оценку близко, а в ситуации обхода ямы со скользкими краями примерно с той же степенью принадлежности это расстояние было оценено как «не далекое, не близкое». Такой линейный сдвиг, наблюдавшийся в описанном выше примере, позволяет выдвинуть весьма важную гипотезу о том, что изменение семантики ситуаций, в которых производится оценка расстояний, приводит к гомоморфному отображению функции принадлежности. Другими словами, если шкалы, на которых заданы наши функции принадлежности или нечеткие интервалы, преобразовать линейно с помощью функции у=ах^Ь, то функции принадлежности не меняются, а меняется лишь семантика той ситуации, к которой они относятся. Высказанная гипотеза должна найти подтверждение в экспериментах с людьми для различных по интерпретации отношений моделирования (пока она проверялась лишь для отношения расстояния). Если эксперименты подтвердят ее, то работа с качественными описаниями существенно упростится. Перечислим в заключение параграфа те задачи, в решении которых нечеткое отношение моделирования может сыграть важную роль. 1. Вычисление функций принадлежности не полностью заданных нечетких лингвистических шкал с помощью вычисления неполного или полного транзитивного замыкания отношения моделирования, задаваемого матрицей типа рассмотренной нами в примере 2.17. 2. Проведение классификации нечетких понятий для уменьшения размерности пространства модели. 3. Возможность аппроксимации новых нечетких понятий, заданных в виде функций распределения или нечетких интервалов. 4. Построение иерархической системы отношений моделирования, что соответствует построению иерархической системы шкал для определения нечетких понятий с различной степенью обобщения. 5. Построение универсальных шкал, учитывающих конкретную семантику тех или иных ситуаций.
г л А в А 3 ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ До того как что-нибудь было, ничего не было. И. Шток §3.1. Постановка задачи Когда человек воспринимает сообндение в виде текста на естественном языке, то имеет место феномен настолько нам привычный, что мы его просто не замечаем. Он состоит в том, что при восприятии сообщения мы воспринимаем гораздо больший объем информации, чем непосредственно в сообщении содержится. И это обогащение происходит за счет трех причин. Во-первых, само сообщение принимается нами в рамках некой ситуации, которая и обогащает его, ибо воспринимается вместе с языковым сообщением. Например, когда вам говорят: «Включите вон тот рубильник», то вы видите, на какой рубильник указывает говорящий, и правильно выполняете указание. Если бы это сообщение не сопровождалось жестом, то сообщение не было бы понято. В вопросе: «Как же это получилось? Посмотри!» текст остается полностью непонятным вне рамок той реальной ситуации, в которой он был произнесен. Итак, к информации, которая содержалась в тексте, как правило, необходимо еще добавлять информацию о той ситуации, в рамках которой возник данный текст. Во-вторых, автор может использовать текст для достижения каких-то своих целей, которые в тексте явно не выражены. Известное определение понятия «зануда» как человека, который на вопрос: «Как поживаешь?» начинает подробно рассказывать о своей жизни за последнее десятилетие, основывается именно на этом. Целью спрашивающего было вовсе не желание получить подобную информацию. Он использовал текст своего вопроса лишь как специальную метку-сигнал для выражения своего внимания к личности слушающего. К тому же типу дополнительной информации относится интонация говорящего, мимика его лица и многое другое. В-третьих, к информации, которая непосредственно выражена в тексте сообщения, немедленно добавляется информация, связанная с ним и хранящаяся в памяти слушающего. Пусть вы услышали сообщение «Прежде чем мы сели, самолет сделал пять кругов над аэродромом. Потом резко снизился и сел. Только на земле я почувствовал, как дрожат у меня ноги». В этом сообщении между фактами, выраженными первыми двумя предложениями, которые непосредственно следуют друг за другом во времени, и последним фактом имеется логический разрыв. Для слушающего он не имеет большого значения. Всякий человек, знакомый с полетами на ca^юлeтax, по-
§3.1. ПОСТАНОВКА ЗАДАЧИ 97 нимает, что после того как самолет сел, произошел еш,е ряд обязательных для данной ситуации фактов: самолет доехал до стояночной плош.адки, выключил двигатель (или двигатели), дверь открыли, был подан трап или спуш,ена лестница, пассажиры, и среди них говоряш,ий, спустились на землю. И только после этого имел место факт «дрожи в ногах» у говоряш,его. И вся эта дополнительная информация помогает слушающему правильно понимать то, что было сообщено ему непосредственно в тексте. Если речь идет о системе управления, то дополнительная информация, возникающая при общении людей в силу первых двух причин, ей недоступна, если система не снабжена, подобно роботу, специальными рецепторными каналами: зрением, слухом и т. п. Поэтому если для управляющей системы подобная информация необходима, то она должна быть сообщена ей вместе с тем основным сообщением, которое передается. Что же касается обогащения информации за счет сведений, хранящихся в памяти системы, то эта функция может быть возложена на саму систему управления. Такую задачу мы будем называть пополнением описания. В рамках данной книги будет рассматриваться лишь задача пополнения описаний за счет специальных семиотических систем. Другими словами, основная задача, которую мы будем обсуждать, это построение специальной системы, обеспечивающей пополнение описания, поступающего на вход. В самом общем виде нужная нам система может быть задана в виде системы продукций вида У\ а=:>р; б. Здесь у означает некоторое условие, выполнение которого позволяет использовать продукцию. Через а обозначен фрагмент той структуры (описания), которая подвергается преобразованию. Само преобразование заключается в замене фрагмента а на новый фрагмент |5. В рамках решения задачи пополнения описаний фрагмент р должен быть в како1\ьто смысле богаче фрагмента а. Наконец, б есть некоторый модификатор условия- у. После применения продукции этот модификатор меняет условие применимости данного правила или оставляет его неизменным. Разные системы пополнения описаний отличаются друг от друга тем, как организованы продукции и как выглядит стратегия их применения к исходному описанию и получающимся в процессе пополнения промежуточным описаниям. Система продукций, в частности, ^южeт образовывать некоторую логическую систему. Такая система должна отражать закономерности, присущие данной проблемной области и способам построения решений на основании описания ситуаций в ней. При этом можно разделить продукции на три типа: дедуктивные, индуктивные и традуктивные. В продукциях первого типа факт р — частный, вытекающий из выполнения условия у и одновременного наличия факта а в преобразуемом описании. Для индуктивных продукций факт р — более общий чем факт а, 4 д. л. Поспелов
98 гл. 3. ПОГЮЛПГНИЕ ОППСЛППИ СИТУАЦИП удовлетворяющш"! условию Y- Наконец, при традуктнвной продукции факты Р и а имеют одинаковую степень общности. Пример 3.1. Рассмотрим три продукции, в которых модификатор б отсутствует. 1. Накопитель деталей станка пуст. Если накопитель деталей станка пуст, то станок простаивает. 2. Станок простаивает. Если станок простаивает, то накопитель пуст. 3. Накопитель деталей станка пуст. Если станок простаивает, то нeoбxoди^ю принять меры по наполнению накопителя. Эти три продукции иллюстрируют соответственно продукции дедуктивного, индуктивного и традуктивного типов. Системы продукций обладают рядом свойств, делающих их весьма удобным средством описания системы пополнения описаний и ее программной реализации. Во-первых, система продукций обладает свойством автономности. Любая продукция мол^ет быть изъята из нее или добавлена в нее, причем все остальные продукции остаются неизменными. Это свойство делает систему продукций гибкой и легко адаптируемой к любым изменениям проблемной области. Заметим, что адаптация продукций может происходить и за счет изменения у и б, что позволяет, сохраняя продукцию в системе, менять ее действие. Каждая продукция есть некоторый законченный фрагмент сведений о проблемной области, и в этом смысле она не зависит от других продукций. Но при необходимости можно устанавливать связи между отдельными продукциями за счет системы взаимных ссылок. Правда, тогда автономность, которую мы описываем, исчезает. Во-вторых, система продукций представляет процедуры преобразования описаний в асинхронном виде. Продукции естественным способом задают возможность параллельной обработки. Каждая из них может выполняться независимо от других, что, правда^ может привести к неоднозначности результата преобразования. Но либо это несущественно (возможны различные варианты пополнения описания), либо имеются специальные процедуры, разрешающие лишь такие параллелизмы, которые не приводят к нежелательным результатам. В-третьих, системы продукций легко отображаются в системы операторов языков программирования. А некоторые языки программирования (например, отечественный язык РЕФАЛ или такой распространенный язык как ПРОЛОГ) имеют продукции в качестве своих основных операторов. Наконец, модели в виде систем продукций охватывают широкий класс различных порождающих моделей, в который входят такие известные модели, как формальные грамматики, исчисления высказываний и предикатов, сетевые модели и многие другие. Во всех известных на сегодня моделях ситуационного управления для решения задачи пополнения использовались именно продукционные системы.
§ 3.2. СЦЕНАРИИ 99 § 3.2. Сценарии Наиболее часто для пополнения используются сетевые модели получившие в последнее время название сценариев. Сценарий представляется некоторой сетью, вершинам которой соответствуют фак ты, а дугам — связи, описываюш,ие отношения специального типа Эти отношения обладают следующим свойством: если между вер шинами X и у существует множество путей Я1, яз, и наличест вуют оба факта а и /?, отвечающие вершинам х и у, то имеет место по крайней мере, совокупность фактов, соответствующих вершинам на одном из путей, соединяющих х и у. Примерами отношений, обладающих указанным свойством, могут служить отношения типа: причина — следствие, часть — под- часть, цель — подцель и т. п. Пример 3.2. На рис. 3.1 показан сценарий, в котором в качестве отношения выступает отношение причина — следствие. Вершинам в этом сценарии соответствуют следующие факты: / — станок простаивает, 2 — на рабочем месте нет рабочего, 3 — станок неисправен, 4 — нет заготовок, 5 — обеденный перерыв, 6 — рабочий отошел от станка во время работы, 7 — внешний поставщик не обеспечил предприятие заготовками, 8 — вышел из строя станок, производящий заготовки для данного станка. Если в памяти системы хранится подобный сценарий и на вход системы поступил текст «Обеденный перерыв», то система с помощью сценария способна пополнить это описание, добавив к нему факты: «На рабочем месте нет рабочего» и «Станок простаивает». Заметим, что nani сценарий говорит о станке вообще, т. е. применим к любому станку. Пример 3.3. На рис. 3.2 показан еще один пример сценария, в котором вершинам соответствуют следующие факты: / — самолет приближается к аэродрому, 2 — самолет запрашивает разрешение на посадку, 3 — ca^юлeт отправляется на круг ожидания, 4 — ca^ю- лет выполняет полет по кругу ожидания, 5 — самолет получает разрешение на посадку, 6 — самолет совершает посадку, 7 — самолет выруливает на стоянку, 5 — к самолету подается пассажирский трап, 9 — пассажиры сходят на землю, 10 — пассажиры находятся у места выдачи багажа. В этом сценарии, в отличие от того, что мы рассматривали в примере 3.2, дуги характеризуют не причинно-следственное отношение, а операциональное отношение. Порядок реализации состояний, характеризуемых вершинами, это порядок во времени. Строгая Рис. 3.1
100 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТ^^'лциа упорядоченность нарушается лишь альтернативным переходом после вершины 2. В зависимости от реальной ситуации может либо сразу возникнуть состояние, характеризуемое вepuJинoй 5, либо один Рис. 3.2 или несколько раз появятся состояния, характеризуемые последовательностью вершин 2 — 3 — 4 — 2 — 3 — 4 — 2 — . . . — 2, после чего будет осуш.ествлен переход к вершине 5. Если на вход системы поступил факт — самолет совершил посадку, пассажиры ожидают багаж, то сценарий пo^южeт пополнить это описание за счет тех фактов, которые присутствуют в нем и должны были обязательно произойти до появления фактов, соответствуюш.их вершинам 6 и 10. И лишь относительно фактов, соответствуюш,их вершинам 3 и 4, система не может сказать ничего определенного. Пример 3.4. Рассмотрим, наконец, еи;е один сценарий, структура которого показана на рис. 3.3. Дуги на этом сценарии отображают отношение цеуго^ — часть, а вершины интерпретируются следуюш.им образом; / — электропылесос, 2 — верхняя часть, 3 — уплотнитель- ное кольцо с фильтром, 4— нижняя часть, 5 — электродвигатель с вентиляторным устройством, 6 — выключатель, 7 — рассеиватель, 8 — шнур. Сценарий с отношением целое — часть используется при пополнении описаний иначе, чем ранее рассмотренные нами сценарии. Пусть, например, на вход системы поступило описание: «В комнате работал пылесос». За счет имеюш,егося у нас сценария это описание может быть пополнено целой группой фактов типа «Выключатель пылесоса находился в комнате» (имеется в виду та же кo^шaтa, которая упомянута во входном описании), «Шнур пылесоса существовал в момент времени t» (имеется в виду тот момент времени, который соответствовал существованию факта, отраженного в исходном описании). Другими словами, в ряде случаев можно переносить утверждения о нахождении в пространстве и времени, высказанные о некотором предмете, на его составные части. Конечно, это удается не во всех случаях. Если, например, утверждение «Поезд проходит через туннель» перенести на некоторый вагон поезда, то такое перенесение может оказаться и неверным. Данный вагон в этот \юмент времени может еще и не находиться в туннеле. Рис. 3.3
5 3.2. СЦЕНАРИИ [01 Пусть теперь на вход системы поступило описание «Поток воздуха из рассеивателя сдувает бумаги, лежащие на столике». Пользуясь нашим сценарием, можно было бы пополнить описание, например, таким фактом: «Пылесос находится в том же помещении, что и столик с бумагалш в момент времени t» (имеется в виду момент времени, которому соответствует факт, указанный в исходном описании). Как и в предыдущем случае, механическое перенесение пространственных и временных утверждений с части предмета на него целиком, конечно, не всегда возможно. Пополнение с помощью сценария, опирающегося на отношение целое — часть, может касаться не только положения в пространстве и времени. Если, например, входное описание имеет вид «Электродвигатель пылесоса стоит более ста рублей», то в качестве пополняющего факта может быть введен в описание факт: «Пылесос стоит более ста рублей». Этот новый факт может быть сформирован на основании сценария, показанного на рис. 3.3, и дополнительного правила о суммировании цен при переходе от части к целому (более точно, не о суммировании цен, а о сохранении отношения стоить больше). Те дополнительные правила, о которых мы говорили в последнем примере, являются правилалш продукционного типа. Их применимость в том или ином случае связана с выполнением условия применимости продукции. В условие применимости продукции входит также та необходимая связь между объектами, которая фиксируется в сценарии. Таким образом, мы приходим к выводу, что возможны два пути пополнения описаний: за счет формальных свойств используемых в сценариях отношений и за счет семантики последних. Так, в первых двух примерах мы рассмотрели отношения «причина— следствие» и «порядковое отношение». Эти отношения транзитивны. А это значит, что без всякого учета семантики фактов а, наличие в исходном описании фрагментов [а-^га.^ и (аггад) позволяет пополнить описание фрагментом {а^га^). Например, из того, что «Цилиндр есть часть двигателя» и того, что «Двигатель есть часть автолюбиля», следует, что «Цилиндр есть часть автолюбиля». Аналогичным образом происходит пополнение описания, если в не.м используется симметричное отношение. Если, например, на вход системы поступило описание «Сверлильный станок включен одновременно с токарным станком», то оно пополняется фактом «Токарный станок был включен одновременно со сверлильным станком». Другими словами, при наличии фрагмента (aira^) с симметричным отношением г можно автоматически пополнить описание за счет фрагмента (azmi). Но пополнения такого типа, использующие лишь алгебраические свойства отношений, входящих в них, не столь интересны. Более важны правила, учитывающие семантику caNuix отношений и семантику той ситуации, в которой фop^шpyeтcя пополнение.
102 I Л. 3. ПОГЮЛНЕНИЕ ОПИ.САНИП СИТУАЦИИ Пример 3.5. Возьмем из табл. 2.2 отношения л^х— иметь объектом действия и Г74 — действие — место. Пусть а — самолет, U— борт 1244, d — полет, b — город, /о— Одесса. Отношение /-40, взятое нами из табл. 2.1, означает быть сверху. Пусть на вход системы поступила следуюш^ая информация; «Самолет борт 1244 пролетает над Одессой». Запись этого описания на ЯС^' имеет вид {(api,) r.^d) ((арч) Г40 (ЬрЧ))- Между большими скобками опуидено отношение одновременно. Семантика Г71 и Г40 такова, что исходное описание можно пополнить фактом следующего вида: {dr^o (bpi-z)). что соответствует утверждению о том, что полет происходит над Одессой. Приведенные примеры показывают, что сами по себе сценарии еще не решают проблемы пополнения описаний. На самом деле для решения задачи пополнения нужно создавать продукционные системы, в которых правила учитывают семантику отношений, входящих в пополняемое описание. В последующих параграфах (начиная с § 3.4) мы покажем, как строятся такие системы для выделенных групп отношений. В ближайшем же параграфе мы обсудим связь между сценариями и фреймовыми представлениями, которыми мы занимались в гл. 2. § 3.3. Сценарии и фреймы ** Цель данного параграфа — показать, что сценарии легко отображаются в те фреймовые структуры, которые мы описали в § 2.9. Для наглядности здесь мы воспользуемся графическим изображением фрейма в том виде, как показано на рис. 3.4. Каждый прямоугольник соответствует фрейму с определенным именем. Фрейм состоит Имя слота\ Имя cjromg | ... | Имя слота [ Имя сорейма Имя слота\ \ймясуюпю\ Имя дйреОма \ Имя слстпа ... \Имя слогла\ Рис. 3.4 из слотов, имена которых указаны в прямоугольниках меньшего размера. Слоты могут быть тepминaльны^ш или нетерминальными. В последнем случае их имена служат именами др\тих фреймов, составляющих содержание данного слота. TepNninaibHbie слоты задают
104 ГЛ. 3. П0П0ЛНЕЕ1ИЕ ОПИСАНИП СИТУАЦИИ нальные связи и связи типа часть — целое. Покажем, что сценарии такого типа легко отображаются в структуры рассматриваемых нами фреймов. причинно - следственное отношение ^ ... Ш Т Т W Т- Рис. 3.7 Пример 3.6. Вернемся к сценарию, описанному в примере 3.2. Рассмотрим сеть фреймов, изображенную на рис. 3.6 (терминальные слоты заштрихованы). Легко видеть, что эта сеть эквивалентна сценарию, показанному на рис. 3.1. I Проявление : \ • •. \ Проя^и/е/шв л [ Механизм 19оО//ечия Цепочка 1С-отнпч/ечиц \;<c-i\ \пг:--?\ \nF\ о строя кродопотвпя /)ь/зь/бает падение артериального дадле^/ия Причин^ ]^лсдст<^ие Закономерность^ У'ченьшвние объема ц иркулирутщеи /\ро6'и Уменьшение объема плазмы мпови Уменьшение од ь ем а плазмы циркулирующей крови ведет к CHumenuw артераального давления Рис. 3.8 На рис, 3.7 фрейм причинно-следственного отношения показан в общ.ем виде. На нем, кроме слотов ПРИЧИНА и СЛЕДСТВИЕ, имеются еще слоты МЕХАНИЗМ, ВОЗДЕЙСТВУЮЩИЕ ФАКТОРЫ и ЗАКОНОМЕРНОСТЬ. Фреймы, соответствующие слоту МЕХАНИЗ.М, описывают причинно-следственные цепочки (на
106 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СНТУЛЦНГ! конечные тексты. Слоты ВОЗДЕЙСТВУЮЩИЕ ФАКТОРЫ (буквы ВФ с paзличны^иi индексами) отсылают нас к фреймам, в которых описываются факторы, служащие причиной возникновения явления, описанного во фрейме с именем X. Наконец, слоты, соответствующие ЗАКОНОМЕРНОСТЯМ (буквы 3 с различными индек- ca^иI), всегда терминальны. Их содержание отражает характер закономерности, существующей между причинами и следствиями, опи- caнны^иI во фрейме с именем X. Пример 3.7. На рис. 3.8 показано отображение в систему фрей- ^юв причинно-следственного сценария для объяснения факта острой кровопотери. Значение слота СЛЕДСТВИЕ в исходном фрейме ОСТРАЯ КРОВОПОТЕРЯ — имя этого фрейма. Рассмотрим теперь представление сценариев, опирающихся на операциональные отношения, в виде сети фреймов. Пример 3.8. В примере 3.3 мы рассмотрели сценарий, показанный на рис. 3.2 и относящийся к операции посадки самолета в аэропорту. На рис. 3.9 показана сеть фреймов, соответствующая, как легко видеть, сценарию на рис. 3.2. Движение по сети фреймов происходит за счет слотов УСЛОВИЕ. Они позволяют совершать те или иные операции, связанные с данным фреймом. Результаты проведенных операций влияют на значение слотов УСЛОВИЕ в других фреймах, связанных с данным фреймом операционально. В нижней части рисунка показан результирующий фрейм, реализация которого соответствует полному выполнению сценария. Мы не будем увеличивать число примеров. Поясним только на последнем из них, как производится пополнение описания ситуации. Пусть, как и ранее, на вход системы поступил текст: «Самолет совершил посадку, пассажиры ожидают багаж». Эти два факта свидетельствуют о том, что имеются результаты, локализованные во фреймах ПОСАДКА и ПЕРЕХОД В БАГАЖНОЕ ОТДЕЛЕНИЕ. Это позволяет, пользуясь сетью фреймов, показанной на рис. 3.9, двигаясь от имеющихся результатов к условиям последующих фреймов, узнать, что имелись условия для операций, связанных с высадкой пассажиров, а также для реализации всего сценария. Если теперь двигаться по сети фреймов от конца к началу, от условий к результатам, которые определяли данные условия, то мы получим всю нужную нам совокупность фактов. Итак, сети фpeй^юв не только удобны для представления знаний, о чем подробно говорили в § 2.9, но и оказывают важную услугу при решении задачи пополнения описаний. § 3.4. Псевдофизические логики * Мы уже говорили о том, что было бы желательно для определенных классов отношений построить дедуктивные продукционные системы, которые позволяли бы производить необходимое пополнение описаний без хранения в памяти системы совокупности боль-
§3.4. ПСЕВДОФИЗИЧЕСКИЕ ЛОГИКИ 107 шого числа сценариев. Одним из классов таких дедуктивных систем являются псевдо(ризические логики. Название «псевдсфизическпе логики» они получили из-за тсго, что в их правилах вывода использованы свойства восприятия человеком окружающего Nnipa, которое обладает рялом субъективных особенностей. Поэтому они описывают не объективный фпзическш! мир, а его субъективнее госприятие человеком. В отличие от формальных систем, о которых шла речь в § 1.5, псевдофизические логики обладают рядом важных особенисстей. Отметим основные из них. 1. Псевдофизические лсгики суть логики отношений. Именно отношения выполняют в них роль переменных. Поэтому псевдсфизическпе vioTHKH классифицируются в зависи.\юсти от типов используемых отношений. Логика времени изучает взаимосвязь временных отношений, логика пространства — пространственных, логика действий — отношен1и1 типа субъект — действие или действие — место, каузальная логика — взаи>юсвязь отношений типа причина — следствие, частотная логика — отношений типа повторяемость — частота и т. д. Объекты же, связанные oтнoшeния^ni, выступают в этих логиках лишь в качестве неизменной части опг^саний. Поясним это следующим примером. Пусть в нашем распоряжении имеются два факта (аг-.Ф) и (cr^M- них при любой интерпретации объектов а, b п с можно вывести факт (аг22с). Правило вывода такого рода должно входить в систему правил временной псевдофизической логики. 2. Псевдофизические логики суть логики на шкалах. Шкалы бывают двух типов: метрические и топологические. Метрические шкалы в свою очередь делятся на абсолютные и относительные. Топологические шкалы задают между факта.\и1, проецируемылп! на них, отношения нестрогого порядка, или размытые отнои1ения, о которых говорилось в §2.11. Пусть, например, мы рассуждаем о пространственном расположении трех объектов а, b и с на прямой. Если в нашем распоряжении имеется абсолютная метрическая шкала, то на ней задан некоторый масштаб и зафиксировано начало отсчета. Предположим для простоты, что масштаб шкалы выбран так, что объекты, о которых идет речь, люжно считать точечны1\и1, расположенными на делениях шкалы. Ситуация такого типа показана на рис. 3.10,67. При наличии абсолютной метрической шкалы все пространственные отношения на прялюй легко вычисляются и не вызывают никаких проблем. Одна абсолютная илкала отличается от другой лишь расположением начальной точки и масштабом, что дает простые соотношения для перехода от одной шкалы к другой. На рис. 3.10,6 показана относительная шкала, а точка начального отсчета фиксируется только в салн1Х описа}И1ях, например: «В двух километрах за селом находится река, подо села мне еще идти три километра». Относительная метрическая шкала легко переводится в абсолютную. Формулы для такого преобразования тривиальны.
108 гл. 3. ПОПОЛИСНИЕ ОПИСАНИИ СИТ^АЦ[1П Более интересны топологические шкалы. Они тесно связаны с нечеткими словесными оценками, активно используемыми человеком для описания ситуаций (в том числе и технологических, например). Эти словесные оценки определяют лишь некоторый порядок расположения фактов на шкалах. На рис. 3.10, в показан / 5 2 3 5 6 7 8 Наиоло omct/ema Ю 11 12 -i Село Река б Расстояние, км расстояние, км Начало ожчета Рис. 3.10 Поррдкобая шкала пример отображения на топологическую шкалу времен трех фактов: а — скоро наступит момент, когда сталь будет готова, Ь — после разлива стали бригада закончит смену, с — через небольшое время после окончания работы специалисты выйдут с территории предприятия. Топологические шкалы связаны с проблемой формализации качественных описаний и понимания таких описаний. Об этом мы говорили в § 2.11. Различие шкал определяет и различие логик, которые могут быть метрическими и топологическими. 3. Не только факты располагаются на шкалах, но и сам вывод (конструкция продукционных правил) должен учитывать упорядоченность, присущую рассуждениям в рамках псевдофизических логик. Для иллюстрации этого положения рассмотрим следующую схему рассуждений. Пусть нарушение технологии а приводит к ухудшению качества продукции степени |3. Пусть нарушение технологии Y более серьезно, чем а (расположено на шкале серьезности нарушений технологии дальше от начала координат, чем а). Тогда, если а соответствует (5, то ^ должно соответствовать такому ухудшению продукции, которое по шкале оценки ухудшения качества должно находиться дальше (во всяком случае не ближе), чем |i. Рассуждения такого типа весьма важны при создании правил вывода для псевдофизических логик. 4. Псевдофизические логики в качестве своих аксиом содержат некоторые утверждения, вытекающие из восприятия мира человеком. Эти утверждения должны быть обоснованы результатами соответствующих психологических экспериментов. Аксиомы связывают между собой отношения различной природы, что позволяет челове-
§ 3.4. ПСЕВДОФИЗИЧЕСКИЕ ЛОГИКИ 109 Могила целей 1 Логина деистбцй —Г Логика оценок Г Логика каузальная Логике г/ростринс/п^б'ннс/я 1— ——1 Логина npocpipancmtfo - dducwdue ку производить замену одних отношений другими. Примером может служить замена пространственных отношений временными «Далеко ли магазин? — Минут пятнадцать-двадцать ходу.». Здесь замена оказалась возможной благодаря аксиоматическому соотношению, связывающему путь, время и среднюю скорость передвижения пешком. 5. Система псевдофизических логик характеризуется связями, существующими между отдельными логиками. Одни из типов связей проиллюстрирован выше. Аксиому s^vt, где s — путь, i — время, V — скорость, можно рассматривать в качестве связи временной, пространственной псевдофизических логик и псевдофизической логики действия. Примерами связей иного рода могут служить отношения, существующие между каузальной (причинно-следственной) логикой и логикой действий. При построении псевдофизических логик следует учитывать три типа задач, для решения которых они предназначены: а) пополнение поступающих в память системы описаний ситуаций с помощью тех знаний, которые уже хранятся в системе об объекте управления, предыстории управления и законов управления объектом; б) проверка достоверности поступающего описания ситуации, выявление противоречий в этом описании и совместимости его с той информацией, которая уже хранится в системе; в) участие в формировании решений по управлению и проверке возможностей реализации выбранного управляющего воздействия. Однако здесь мы будем обсуждать псевдофизические логики лишь для задач первых двух типов. В последующих главах, посвященных Логики иаостра^стбс - брб^ш Логика дрем&ииая 1 i \ Логика бремя - дайстдие Рис. ЗЛ1
110 гл. 3. ПОПОЛНЕНИЕ ОПИСЛРПШ СИТУАЦИП проблемам обобщения и классификации ситуаций и выработке решений по управлению, мы вновь вернемся к псевдофизическим логикам. Обычно та или иная псевдофизическая логика охватывает круг представлений человека о тех или иных явлениях окружающего мира. Так возникают временная логика, отражающая закономерности, присущие человеку при восприятии времени и рассуждений о нем, пространственная логика, каузальная (причинно-следственная) логика, логика действий, логика целей, логика оценок и т. п. Для задач управления сложными объектами наиболее интересны, именно те шесть логик, которые мы только что перечислили. Эти логики не независимы. На рис. 3.11 показана взаимосвязь между ними, к сожалению, пока в ситуационном управлении использовались лишь отдельные фрагменты псевдофизических логик, что объясняется их неразработанностью. За последние годы в этой области сделаны большие успехи. В настоящее время можно считать, что завершено создание временной логики и статической пространственной логики, созданы фрагменты для логики время — действие и для логики целей. Однако для каузальной логики, логики пространство — действие и, как следствие этого, полной логики действий ситуация пока еще остается не слишком хорошей. Что касается логики оценок, то она в настоящее время проходит в своем развитии этап философского осмысления тех понятий, которые должны быть использованы в ней при построении этой логики, нацеленной на решение задач управления. Более подробные сведения о путях развития псевдофизических логик можно найти в работах; обсуждающихся в комментарии к -гполиеннь/е данной главе. В трех по- ' списания- ^, следующих параграфах мы в качестве примера построения таких логик и использования их для целей пополнения описаний затронем лишь временную, пространственную и каузальную логики. Каждая псевдофизическая логика может рассматриваться как система, имеющая структ}'ру, показанную на рис. 3.12. На нем показано, что сначала из исходного описания выделяется некоторая структура фактов или событий, характерная для данной псевдофизической логики (временная структура, пространственная стру- Модель предстидлений Рис. 3.12
§3.5, ВРЕЛ\ЕННЛЯ ЛОГИКА щ М Это значит, что между ti^s^^h + s^ i ^Р" любом s от О до /г—1 нельзя вста- вить никакого элемента из Т без нарушения порядка. ктура и т. д.). в ней выделены некоторые единицы типа явлений, событий, процессов, фактов и определены отношения между ни^ш из рассматриваемой группы отношений. Эта часть, по сути, не относится к собственно псевдофизической логике и ее функционирование основано на процедурах, описанных в §2.10. В модели представлений отражены те основные закономерности восприятия, которые характерны для системы управления (или человека, если происходит имитация его восприятия). Для конкретных псевдофизических логик эта модель превраихается в модель времени, модель пространства и т. д. Наконец, модель вывода содержит правила, с помоидью которых происходит пополнение описания ситуаций. Функционирование модели представления и модели вывода, а также методика их построения будут ясны из материала следуюш.их трех параграфов. § 3,5. Временная логика ** Мы начнем с рассмотрения наиболее простой псевдофизической логики — временной. Как следует из рис. 3.12, нам нужно построить модель представления времени и модель вывода новых фактов о времени, которые могли бы вытекать из уже имеющихся фактов. Начнем с первой компоненты. Сформулируем сначала некоторые общие свойства времени, которые удобно принять при построении временной логики, ориентированной на использование в системах управления, причем мы не будем учитывать здесь возможных философских возражений, связанных с временем как философской категорией. В комментарии к данной главе об этом говорится более полно. Pacc^ютpим множество Г, элементы которого мы будем называть моментами времени. Зададим на Т полный строгий порядок. Отношение строгого порядка на Г задает порядковую шкалу для моментов времени tt. Рассмотрим другое множество элементы которого ej мы будем называть событиями. Рассмотрим отношение {e^xti), смысл которого сводится к приписыванию событию некого момента времени ti. Мы будем говорить, что событие^; происходит в люмеит времени ti. Если для Cj существует лишь один момент времени tt, в котором оно происходит, то событие е^ в данной шкале называется точечным. Кроме точечных событий, могут быть еще интервальные события и цепочечные событи.я: интервальные события обладают тем свойством, что им с помощью отношения проектирования на шкалу сопоставляются моменты времени tu ti+i, . • ii-^-u^ образующие непрерывную последовательность^) на этой шкале (т.е. имеет место: <^;^1<. . .<ti^k). Для цепочечных событий отображение, осуществляемое с помощью т, произвольно. Ясно, что цепочечные события
112 гл. 3, ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЯ -Декабрь -1985 -Январь 1935 распадаются на совокупность интервальных и точечных, а интервальные события могут заменяться совокупностью точечных событий. Введем теперь специальную операцию дискретизации D^. Если эту операцию применить к множеству Т с заданным на не.м отношением строгого порядка, то с ее пo^юш,ью между любой парой соседних элементов из Т таких, что ti<^ti+^, вставляется ровно п новых элементов t] и ti<t[<t2<. . .<t;,<ti^^. Введем еш,е операцию редискретизации 7?д. Она устроена сле- дуюш,им образом. Если Rn применяется к ^шoжecтвy Т с введенным на нем отношением строгого порядка, то для любой совокупности из п-\-2 элементов 7, образующих непрерывную последовательность tt < t^+i < <. . .<^;+„+i, исключаются п ^сред- них элементов, которые тем самым исключаются и из множества Т. При этом Rn применяется последовательно, начиная с салюго левого элемента из Г, образующего шкалу. После выбрасывания первых п элементов рассматривается новая последовательность из (п+2) элементов, левым элементом которой является сохраненный на -ХХве^ предшествующем шаге правый элемент предшествующей последовательности. Суть введенных операций дискретизации и редискретизации поясним на следующем примере. Пример 3.9. На рис. 3.13, а показана исходная порядковая шкала. На ней моменты времени — годы. На рис. 3.13, б показан результат применения к этой шкале операции D^. Новая шкала устроена так, что между двумя старыми элементами Т появились 11 новых элементов для каждой пары. Для различения элементов введены новые названия. На рис. 3.13, в показан результат применения к исходной шкале операции R^^. С ее помощью каждая непрерывная последователь- ^ ность из 101 элемента преобразована в последовательность из двух элементов, которым присвоены новые имена (XX век, XXI век). Таким образом, с помощью операций и Rn порождается для множества Т бесконечное ^шoжecтвo шкал. Вместо введенных нами операций дискретизации и редискретизации можно для формирова- -/т -19В7 -Февраль -Март -Апрель -Маа -Июль -Июль -Авзуст -Сентябрь -Ошябрь -Ноябрь -Декабрь -Январь -Февраль -Март -Апрель -Май -Июнь -Июль -Август -Сентябрь -Октябрь -Ноябрь -Декабрь -Яндарь 1987 - Февраль Ь 6 Рис. 3.13
§3.5. БРЕ.МЕННАЯ ЛОГИКА 113 1357 год ння новых шкал использовать любую монотонную функцию, так как все такие функции обладают свойством сохранять строгий порядок, заданный на элементах множества Г. Все шкалы такого вида мы в дальнейшем будем называть абсолютными. Если для некоторой шкалы с номером i (нумерация шкал может быть задана произвольным образом, например, с помош,ью ряда натуральных чисел) было произведено отображение элементов множества Е на эту шкалу, то при переходе к новой шкале т^ изменится. Если Cj было точечным событием, то при операциях точечные события сохраняются и отображаются в тот момент времени, который сохраняется в новой шкале в качестве левого момента в обрабатываемой последовательности. Если ej было интервальным событием, то после преобразова- ^ ния оно либо сжимается, стягиваясь ^ к левому концу старого интервала, либо (в пределе) превраш^ается в точечное событие. Цепочечное событие при операциях редискретизации превра- ш^ается либо в цепочечное событие с е,^ меньшими интервалами, либо в интервальное событие, либо стягивается в точечное событие. Пример 3.10. На рис. 3.14, а показано точечное событие соответст- вуюш,ее высказыванию «Константин Циолковский родился 17 сентября 1857 г.». На рис. 3.14, б показано, как преобразовалось это событие в отображение на шкале, в которой совершен переход от дней к месяцам. Теперь точечное событие е[ соответствует высказыванию: «Константин Циолковский родился в сентябре 1857 г.». Интервальное событие е^, показанное на рис. 3.14, а, соответствует в данном случае высказыванию «Весь сентябрь 1857 г. лил, не переставая, проливной дождь». На рис. 3.14, б это же событие показано как точечное (^о)- Если над шкалами производится операция дискретизации, то отображения событий на шкалах могут претерпевать следуюш.ие изменения: точечные события могут превраш^аться в интервальные 1 ;8о7год zQ/Vlli '301VIII 211Vill 2/'/ У 5//X 6/IX 7/lX 8//Л 91/Л 10//X Ill/A /2//Х /J//X Idh'X WIIX /7//Х /8//Х fOjIK 20llX 2//fX 22//X 25/fX 2^//X 25//X 26//X 27//X 2o/,iK 29//X JO//X h'x- 2/X - Опгордрь Рис. 3.14
114 ГЛ. 3. ПОПОЛ£{ЕН11Е 0ПИСу\НИГ1 СИТУАЦИ1Г или цепочечные, интервальные события могут растягиваться или превращаться в цепочечные, а цепочечные события могут приобретать большую длину отдельных своих участков или увеличивать число отдельных интервальных участков. При этом возможны различные комбинации из указанных типов изменений. Пример 3.11. Если использовать рис. 3.14, б и сделать переход к шкале, типа показанной на рис. 3.14, а, то в качестве результата для е[ мы получим интервальное событие ^i', изображенное пунктиром на рис. 3.14, а. Таким образом, сравнение отображения этого события с тем, что было на рис. 3.14, а, показывает, что может возникнуть потеря информации, и операции и Rn не могут рассматриваться по отношению к отображаемым событиям как взаимно обратные. Название, которое мы присваиваем каждому моменту времени ti на той или иной шкале, отражает наше представление о порядке следования этих моментов времени. За точку начального отсчета обычно выбирается некоторое событие, относительно которого имеется всеобщая договоренность. В человеческом обществе существовали самые разнообразные начальные точки отсчета. В допетровское время в нашей стране счет годам велся от сотворения мира, со времен Петра I мы ведем счет от рождества Христова, жители мусульманских стран ведут счет от вхождения Пророка в Мекку и т. п. Важно, что эта начальная точка отсчета для моментов времени раз и навсегда зафиксирована, имеет абсолютное значение. Именно поэтому подобный тип шкал мы назвали абсолютными шкалами. Но кроме абсолютных шкал возможны еще шкалы относительные. В них за начало отсчета принимается тот момент времени, когда происходит некоторое событие, называемое в высказывании, или когда актуализируется само высказывание. В последнем случае обычно говорят о «точке говорения», которую и принимают за начало отсчета для моментов времени. Следующие два примера иллюстрируют высказывания, в которых упоминаемые события отображаются на относительные шкалы: «За два года до начала Великой Отечественной войны Германия захватила Чехословакию» и «Через пять минут обед будет готов». В первом из них за начальную точку отсчета взят момент начала Великой Отечественной войны, а во втором — тот момент, когда актуализируется (например произносится) само высказывание. Абсолютные шкалы и относительные шкалы являются метрическими (в качестве единицы измерения расстояния между ti и tj можно брать увеличенное на единицу число моментов времени, которые образуют от ti до tj непрерывную последовательность) и могут иметь одинаковую (по наименованию) единицу измерения. Однако между hiinm не всегда можно установить прямую связь. Так, для первого из двух приведенных выше высказываний за счет знания факта, что Великая Отечественная война началась в 1941 г.,можно связать относительную шкалу с абсолютной, в которой в качестве наименовании
§3.5. ВРЕМЕННАЯ ЛОГИКА 115 моментов времени используются годы. Если начало отсчета рассматриваемой относительной шкалы совместить с моментом времени с именем 1941 на абсолютной шкале, то событие «Германия захватила Чехословакию» получит точное место с именем 1939 на этой абсолютной шкале. Но для второго высказывания такое отобрал^ение вoз^южнo только в том случае, если в люмент его произнесения посмотреть на часы, которые показывают точное время и календарь, отмечающий текущее число, месяц и год. Без такой информации отображение в абсолютную шкалу окажется невозможным. Таким образом, в любом случае переход от относительных шкал к абсолютным требует привлечения специальных дополнительных знаний, которые должны храниться в памяти системы или наблюдаться ею. Отметим еще, что к относительным шкалам можно применять те же операции и Rn, которые мы рассматривали для абсолютных шкал. Преобразование отображений событий на относительных шкалах в результате применения и Rn происходит по тем же правилам, что и описанные ранее преобразования для абсолютных шкал. Отметим важное для нас обстоятельство, а именно то, что для метрических шкал любое интервальное событие можно полностью определить двумя точечными событиями, соответствующими моментам времени, когда интервальное событие начинается и когда оно заканчивается. Эти точечные события называются маркерами начала и конца и обозначаются как ix^ и ^{^, где / — индекс интервального события ej. Цепочечные события можно заменить на последовательность интервальных событий с разными индексалш, а каждое такое интервальное событие можно задать парой своих маркеров. Кроме метрических шкал, как уже упоминалось в § 3.4, существуют еще топологические шкалы. В таких шкалах люментам времени нельзя сопоставить никаких имен и нельзя ввести расстояния между этими моментами. Таким образом, на топологической шкале можно отразить только порядок некоторых моментов времени. Поэтому при отображении событий на топологические шкалы фиксируется лишь их взаимное расположение во времени. Необходимость в топологических шкалах >южет возникнуть по разным причинам. Примерами их могут служить нечеткое отображение событий на шкалу или нечеткие временные отношения, устанавливаемые между событиями. Первый случай иллюстрируется высказыванием «В начале мая подул свежий ветер». Второму случаю соответствует, например, высказывание «Незадолго до выстрела сосед вышел из комнаты преступника». Разница между этими двумя типами неопределенностей состоит в том, что при переходе от абсолютной шкалы, единицами которой служат дни месяца, к другой, тоже абсолютной шкале, eдиницa^UI которой служат сами месяцы, можно «спрятать» нечеткость первого высказывания. Для высказывания второго типа это принципиально невозможно. Между введенными нами топологическими шкaлa^пI и рассматривавшимся в §2.11 нечетким отношением ;Моделирования сущест-
116 rv. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ вует прямая связь. Матрица, задающая это отношение, по сути, является способом перехода от четких шкал (абсолютных и относительных) к нечетким шкалам, которые входят в состав топологических шкал. Поэтому часто топологические шкалы называют размытыми или нечеткими. Л\ы, однако, в нашей книге будем придерживаться введенного термина, так какие всегда топологическую шкалу можно интерпретировать в виде набора функций принадлежности, характеризующих значения лингвистических переменных, как было в §2.11. Отметим также, что матрица, задающая нечеткое отношение моделирования, позволяет преобразовывать и топологические шкалы в некоторые метрические. С помощью преобразования матрицы нечеткого отношения моделирования, сохраняющего порядок, можно вводить классы топологических шкал (по аналогии со шкалами, получающимися для метрических шкал с помощью операций и Rj^ или монотонных преобразований). Для завершения модели представлений во временной логике мы должны еще зафиксировать тот набор временных отношений, который будет использоваться для описания временной структуры ситуаций. Начнем с точечных событий. Одно базовое отношение (б^т^/^), где т — номер шкалы, мы уже ввели. Введем еще четыре отношения: Г21 — одновременно, г^^—быть раньше, Газ—быть позже и г26— непосредственно примыкать слева}) Ясно, что с помощью введенных отношений можно описать любую временную структуру, Е которую входят ЛИШЬ точечные события. Пример 3.12. Рассмотрим следующий текст: «В 9 часов Павел садится, как обычно, на лошадь и в сопровождении наследника отправляется осматривать войска. 10 часов. Обычный плац-парад, развод караула в присутствии императора... С 11 часов их величества изволили прогуливаться по городу верхом: его императорское величество с графом Кутайсовым, а ее императорское величество с фрейлиной Протасовой 2-й». Город, как обычно, пустеет до часу дня, все боятся встречи с Павлом... После обеда «В 4 часа ее императорское величество с фрейлиной Протасовой 2-й изволила выезд иметь в карете в Новодевичий Смольный монастырь и возвратилась обратно в 6 часов. Потом их императорские величества изволили в сей вечер препроводить время с их и.мператорскими высочествами и знатными особами в гостинной комнате...» ^). На рис. 3.15 показано отображение событий, перечисленных в нашем тексте, на абсолютную шкалу. То, что эти события происходили 11 марта 1801 г., указано в источнике, откуда взят текст для примера. Как мы видим, на осях лет, месяцев и дней все события, перечисленные в тексте, отображаются все вместе в одно событие ^) Номера отношений Го1, Ло-2, ^23 и г.,^ совпадают с прпсвоенньрми им номерами в табл. 2.1. 2) Э й д е л ь м а н Н. Я- Грань веков.— М.: Мысль, 1982, с. 268, 274, 275
§ 3.: ВРЕМЕННАЯ ЛОГИКА 117 на каждой из них. На оси часов события разводятся. Эти события являются либо точечными (например, Павел садится на лошадь и отправляется осматривать войска), либо представляют собой некоторое множество событий на оси часов, образуюш.их непрерывную последовательность (например, город пустеет). Некоторые Январь 6 7 3 9 10 ;/ Февраль Март Дни •Повел садится на лошадь ■Плац-параду развод napayjia -На1^ало прогулка по городу Город пустеет -Возвращение с прогулу -На^^ало поездки 6 монастырь Поездка в монастырь ■Возбраш,ение из монастыря Вечер с детьми Месяцы Годы Рис. 3.15 события не привязаны в тексте к точным часам (например, возвращение с прогулки). Наконец, событие, связанное с вечерним препровождением времени императорской четы с детьми, на шкале часов не отмечено, так как в тексте не указаны ни начало, ни конец этого события. Ясно только, что оно началось позже шести вечера. Такие события связаны с топологическими, а не с абсолютными шкалами.
jjg гл. 3. ПОПОЛНЕНИЕ ОППСАНИП СИТУАЦИЙ Для систем управления важно еще ввести функцию p{ei,ej), с помощью которой можно определять расстояние между coбытия^пI ei и на метрической шкале, а также обычные арифметические операции над расстояниями. Это позволит системе управления, например, получить ответ на вопросы типа «Насколько событие е-^ случилось раньше события ер», «Сколько времени прошло между событиями et и ер», «Если ei случилось через т единиц после Cj, ^2 е. \.пп-х ■ ^1 к ■'г -Н'2 Рис. 3.16 а ej было на п единиц раньше г,^, то сколько времени прошло между событиями ei п е^?» Легко видеть, что выбранная нами базовая система отношении для точечных событий не единственно возможная и не минимальная. При наличии функции р можно считать, что события е^ и е^ находятся в отношении г^г. если р(^ь ^;)=0, и в отношении Гге, если эта функция принимает значение 1. Отношения Г22 и можно выразить друг через друга с использованием операций конъюнкции и отрицания: (eir^2ei) = (e7^) i^iriiej). Но стремление к минимальности
§3.5. временная логикл П9 базового набора отношении не всегда оправдано. Чем меньи]е допустимый для системы набор отношений, тем более громоздкими будут представления в ней ситуаций. Правда, уменьшение числа отношений может привести к уменьшению количества правил вывода в модели ввода, но длина вывода в среднем все равно будет возрастать. Поэтому ни здесь, ни в дальнейшем мы не будем решать задачу минимизации базового множества отношений в той или иной псевдофизической логике. Для топологических шкал отношение т не реализуется. Вместо него появляется отношение т, аналогичное нечеткому отношению моделирования. Отношения Г22, ^2з и Ггв сохраняются. Они задаются с помощ.ью специальных размытых квантификаторов вида незадолго до этого, вскоре, сейчас же после этого и т. п. Следовательно, эти отношения также связаны с функциями принадлежности и нечетким отношением моделирования. Наконец, отношение Гц может задаваться либо как точное, либо опять-таки как нечеткое отношение моделирования (например, с помощью квантификатора вида почти одновременно). При работе с топологическими шкалами используется также идея универсальной шкалы, которая обсуждалась в §2.11. Все события, для которых в систему управления люжно ввести сведения о частотных гистограммах этих событий, переводятся на универсальную шкалу. Перейдем теперь к интервальным событиям. Введем для них восемь отношений, семантика которых проиллюстрирована на рис. 3.16. Эти отношения имеют следующие названия: Г22—быть раньше, — быть позже, г^х— начинаться одновременно, г^.^— кончаться одновременно, г^^— примыкать по времени слева, Гг-— пересекаться во времени, г2%— совпадать во времени, г^^— быть внутри по времени. (Названия всех отношений заимствованы из табл. 2.1.) Если для всех интервальных событий указаны маркеры их начала и конца или длина события и один из его концевых маркеров, то отношения между интервальными событиями ^южнo заменить совокупностью отношений между маркерами, т. е. между точечными событиями. Если, например, события е-^ и ^2 находятся в отношении /'25, то для их маркеров выполняются следующие отношения: Другими словами, для маркеров начала событий и ^2 ^югyт реализоваться произвольные отношения, а для маркеров концов этих событий всегда выполняется отношение Г21- Аналогичным образом можно записать отношения между маркерами событий е^ и во, когда между ними реализованы другие отношения для интервальных событий. Однако, к сожалению, это не всегда удается. Весьма часто в текстах содержится неполная информация о моментах начала и окон-
120 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ чания интервальных событий. В таком случае отноиленпя между ними задаются фактически на топологическо!! шкале. Пример 3.13. Пусть имеется следуюш,ий текст: «Барон Мюнхгаузен, как был в спальном колпаке и длинной ночной сорочке, спустил ноги в туфли и в следуюш,ую секунду уже сидел в карете и торопил фельдъегеря, хотя тот и сам отчаянно торопился, от нетерпения время от времени соскакивал с козел и, подавая лошадям пример, несколько раз их обгонял. Досадная задержка произошла, когда уже подъехали к Потсдаму. Лошади так разгорячились, что не было никакой возлюжности их остановить. Пришлось объехать Потсдам тринадцать раз, пока удалось, наконец, сдержать тридцать шесть ог- недышаш,их змиев,— на это ушло по крайней мере три минуты. У лошадей затлелись постромки, удила и подпруги, а дуги и дышла охватило огнем, и они сгорели прежде, чем подоспели пожарные.» ^). Приведенный текст можно различным образом преобразовать во временную структуру. Это зависит от способа выделения из него событий. Предположим, что выделение событий таково, что мы имеем следуюш.ие события, верхний индекс у которых показывает, относятся ли они к Мюнхгаузену, фельдъегерю, лошадям или пожарным. ^м — Мюнхгаузен спускает ноги в туфли, — Мюнхгаузен садится в карету и сидит в ней; — Мюнхгаузен торопит фельдъегеря; — Мюнхгаузен покидает карету; — фельдъегерь садится ^ ^ N е? '3 ^3 1 i [У:Ш:^-.^т^:^^^^^^^^^^^^ Рис. 3.17 на козлы; —фельдъегерь соскакивает с козел и некоторое время бежит рядом с лошадьми; — фельдъегерь пытается остановить лошадей; е'1 — лошади несутся; — лошади объезжают вокруг Потсдама; — лошади останавливаются; е2 — у лошадей тлеют постромки, удила и подпруги, а дуги и дышла горят; — подъехали пожарные. Соответствуюш.ая структура показана на рис. 3.17. Для боль- шей наглядности на этом рисунке события, относяш.иеся к разным ^) Г л о б а А. П. Сказки дня и ночи. —М.: Современник, 1976, с. 72.
§35 ВРЕЛ\ЕННЛЯ ЛОГИКА 121 персонажам, показаны на различных временных осях. Разные события выделены штриховкой, зачернены или заполнены точками. Между отдельными осями времени имеется временное соответствие — события, лежащие на одной вертикали, происходят одновременно. На каждой из осей совмещены те события, которые происходят одновременно для данного персонажа. Дадим некоторые дополнительные пояснения. Мы не знаем из текста, когда именно наступают моменты времени, в которые барон Мюнхгаузен торопит фельдъегеря. По-видимому, это происходит неоднократно. Поэтому внутри события е^^ появляется некоторое число событий е^. Оно в реальной системе может, например, породиться случайным образом. Длины событий для Мюнхгаузена не определены анализируемым тексто.м. Однако ясно, что длина значительно превосходит длины остальных событий, события и по длине близки между собой. О событии в тексте вообще ничего не говорится. Его можно было бы и не показывать на рис. 3.17. Но если бы оно не произошло, то базой, наверное, сгорел бы, что противоречит дальнейшему тексту ^лобы. Для фельдъегеря число событий и из текста не определяется, ясно лишь, что общее число событий должно быть на единицу больше числа событий е^. Кроме того, и должны чередоваться и последовательность начинается и заканчивается событием е^. Последнее событие совмещается во времени с началом попытки остановить лошадей. Длина последнего события в тексте определена словами «На это ушло по крайней мере три минуты». Можно предположить, что события и имеют меньшую длительность, хотя для это может оказаться и неверным, если фельдъегерь способен долго бежать в темпе лошадей. Наконец, для лошадей до события продолжается их скачка, часть которой («по крайней мере три минуты») совпадает с событием е?. Когда начинает загораться сбруя — из текста неясно, поэтому начало события не определено. Более или менее ясно, что загорание должно было бы произойти еще во время скачки. Что касается пожарных, то относительно местоположения события их прибытия на место происшествия вряд ли могут быть разногласия. ■ Отметим, что при переходе от текста к временной структуре мы использовали не только те сведения, которые прямо содержатся в тексте, но и некоторую дополнительную информацию, вытекающую из сценариев, связанных с тe^ПI или иными действиями. Подобное положение возникает весьма часто. Именно сценарии играют большую роль при фор1\и1ровании временной структуры и пополнения описаний. Ниже мы будем говорить об этом более подробно. Для цепочечных событий мы не будем вводить собственную систему отношений. Их мы будем сводить к последовательности интервальных и точечных событий, что на самом деле не всегда возможно на топологических шкалах, но этот тонкий вопрос мы здесь рассматривать не будем.
122 гл. 3. ГЮПОЛИЕНПГ ОППСАНИП СИТУАЦИЙ Мы закончили построение модели представлений для временной логики. Эта модель состоит из набора шкал, отношений проекциро- вания Xi или Ti событий на шкалы, системы отношений во времени между событиялп!, связываюш,их отношения для интервальных событии с точечными через маркеры, и функций р для различных шкал вместе с набором необходимых арифметических процедур. Теперь можно перейти к модели вывода новых утверждений о времени на основе тех правил вывода, которые мы заложим в нашу логику, и знаний, храняш,ихся в системе управления. Все правила вывода можно разбить в любой псевдофизической логике на две группы: синтаксические и семантические. К первой группе относятся правила вывода, вытекающие из алгебраических свойств тех отношений, к которым они применяются. Правила второй группы вытекают из некоторой внешней семантической интерпретации этих отно[пений и сценариев, используемых при выводе новых фактов и отношен[1Й. Общее число используемых нами во временной логике отношений равно восьми. Правила первой группы для них строятся следующим образом. Рассматривается некоторое отношение. Выявляются его алгебраические свойства и выписываются соответствующие правила. Например, рассматривая отношение г22, мы убеждаемся, что оно антирефлексивно, антисимметрично и транзитивно. Это позволяет нам написать следую ие три утверждения: (ег22^); (ei/'22^2)=>(^2/'22^i); (^i/'-22^2) (^2^22^3)—>(^1/'22^з). Среди этих утверждений основной интерес представляет третье, которое имеет вид классического правила вывода в виде продукции. Второе утверждение также имеет продукционный вид, но его использование для получения новых фактов сомнительно. Скорее оно может оказаться полезным при проверке содержимого памяти системы на непротиворечивость. В качестве другого примера можно рассмотреть правило типа (^i/*2o^2) (^2^26^3) =>(^ЛбО. Его смысл сводится к тому, что если события ei и Cz заканчиваются одновременно и событие ^2 непосредственно слева примыкает к событию ^3, то и событие ^1 непосредственно слева примыкает к событию е^. Проиллюстрируем работу правил первой группы на примере. Пример 3.14. Вернемся к ситуации, описанной в тексте, приведенном в примере 3.13. Выпишем из этого текста набор ядерных конструкций (троек вида (arb)), который в нем непосредственно содержится. Анализируя текст последовательно, мы получаем следующий набор: {е^г,^е^)1 (e^-,,^f); (^^,,^2''); (^'^22^:^; (^2^22^); (^?^2.э^4). Посмотрим, какую дополнительную информацию можно получить из этого набора. Сравнивая первую тройку со второй и третьей, мы .люжем вывести новую информацию, используя правило вывода {егг^,е^)(е,г,,е^)^>(е,г,,е,).
§3.5. ВРЕМЕННАЯ ЛОГИКА 123 Применяя его, мы находим еще две тройки: {e^^'r^oef) и {efr^ie^). Из четвертой и пятой тройки с помощью соответствующего правила (мы их не выписываем, чтобы не загромождать изложение) получается тройка (^1^22^^). Четвертая и шестая тройки порождают (е?^22^?)^ пятая и шестая — (et'^s2^3). Наконец, две последние тройки порождают новый факт вида {е^Гг^Т}- Интересно сравнить полученный результат с временной структурой, показанной на рис. 3.17. Становится ясным, что правила вывода первой группы дают недостаточно информации для пополнения. События и вообще не возникли, и, следовательно, не возникли временные отношения, связывающие их с остальными событиями. Осталось полностью не определенным, как соотносятся между собой события el и ej, а также события и е^. Всю эту информацию нельзя получить с помощью правил вывода первой группы. Она возникает лишь при обращении к знаниям, хранящимся в виде сценариев в памяти системы. Правила вывода, работающие с этими сценариями, относятся ко второй группе правил. Их работу мы проиллюстрируем на двух примерах пополнения описаний. Пример 3.15. Рассмотрим текст, который уже использовался в примере 3.3: «Самолет совершил посадку. Пассажиры ожидают багаж». При попытке построить временную структуру этого текста, используя только сам текст, нас ожидает полная неудача. Мы выделяем два события: е^—- самолет совершил посадку; е^— пассажиры ожидают багаж. Но мы не можем установить никакого временного отношения между ними. Однако, если в памяти системы хранится сценарий, подобный показанному на рис. 3.2, то с его помощью легко устанавливается нужное отношение, а именно (^1^22^2). Пример 3.16. Предположим, что на вход системы поступил текст «В пятницу на балу Вельчковский публично оскорбил За- ренина, и Заренин, немедля ни секунды, вызвал его на дуэль. После бала Заренин заехал к своему старому другу генералу Мурашёву и попросил его быть секундантом. Был составлен письменный вызови утром в субботу он был вручен Вельчковскому. Сейчас Заренин и Мурашёв писали протокол об отказе от дуэли, ибо срок ответа, даже при наличии веских причин, уже прошел». После анализа этого текста система может выделить следующие события: е^— оскорбление Заренина, е^— вызов Вельчковского на дуэль, ^3— просьба Заренина, обращенная к Мурашёву, и согласие последнего, ^4— составление письменного вызова, в-— вручение вызова, (?б— составление протокола об отказе. Из текста молшо установить следующие тройки: {е^г^^е^)', (^2^22^3); (^3^22^4); {е^^^е-Х (^5^22^.0; {е{^!)\ (e.Tf): (e.xs). Здесь f и S означают соответственно дни недели: пятницу и субботу. Пользуясь oбычны^и^ правилами, связанными с транзитивностью отношений Гос и Го2, система ^южeт вывести еще ряд соотношений типа (eir^iCi). Но из текста она не ^южeт вывести никаких троек, П03В0ЛЯЮ1ЦИХ отобразить с по1\ющью т на шкалу дней недели
124 -'Л. 3. ПОПОЛНЕНИЕ ОПИСЛНИП СИТУЛЦИП события t?3, и с^б. Это можно сделать только в том случае, если в памяти системы имеется сценарий, описывающий принятый порядок проведения дуэлей. Если такой сценарий имеется i), то ясно, что событие ^6 не ^юглo произойти ранее утра понедельника (т), так как ответ на письменный вызов на дуэль должен быть получен от обидчика не позднее, чем через 24 часа после вручения ему письменного вызова. Упомянутые в тексте «веские причины» позволили отдалить ответ еще на 24 часа. После этого, если ответ обидчика не поступал, то составлялся унизительный для него протокол об отказе от дуэли. Так что могло происходить только в понедельник, что позволяет вывести тройку (^етт). В тексте сказано, что Заренин заехал к Мурашёву после бала. Это означает, что скорее всего событие ез произошло в пятницу, так как в XIX веке балы, как правило, кончались к полуночи. Поэтому с большой долей вероятности события бз и ei произошли в пятницу, что позволяет системе вывести еще две тройки: {е.^г[) и (e^rf). Нам остается обсудить проблемы, -связанные с выводом на топологических шкалах. Для возможности отображения событий на таких шкалах обычно используются методы, подобные описанным в §2.11. Прежде всего выбирается список квантификаторов, который мог бы образовать некоторую порядковую шкалу размытых моментов времени. Примером такого списка для временных размытых квантификаторов может служить последовательность: очень давно, давно, недавно, совсем недавно, только что, сейчас, вскоре после этого, очень скоро, скоро, в недсигеком будущем, в будущем. Более или менее ясно, что такая последовательность способна порождать некоторую порядковую шкалу. Для того чтобы последняя .\югла служить для целей вывода и пополнения описаний, необходимо перейти к более точному шкалированию. Для этого используется аппарат функций принадлежности, о которых шла речь в том же § 2.11. Для каждого элемента из заданного списка строится с помощью эксперимента с людьми функция принадлежности этого элемента к отрезку [О, 1]. Затем выбирается такой уровнь отсечки а, который >юг бы образовать хорошую шкалу на данном отрезке. Как уже говорилось выше (см. §2.11), это приводит к тому, что отрезок [О, 1] разбивается на непересекающиеся интервалы, каждый из которых соответствует с гарантированным уровнем функции принадлежности, равным 0<«<:1, некоторому элементу из списка, образующего словесную шкалу. Этот процесс показан на рис. 2.17 для размытых частотных квантификаторов. Для временных квантификаторов он реализуется аналогичным образом. После получения топологической шкалы оказывается возможным строить систему правил вывода на ней. Мы не будем специальна ^) Например, дуэльный кодекс, описанный в книге: Д у р а с о в, Дуэльный кодекс— Град Святого Петра, 1908.
§ 3.g. прострлнствнпная логика 125 останавливаться на этом во временной логике, так как в следующем параграфе опишем всю методику достаточно подробно. Перенесение ее на случай более простой временной логики не вызывает затруднений. § 3.6. Пространственная логика ** Как и для временной логики, начнем построение пространственной статической логики с ^юдeли представлений. Учитывая достаточно полное изложение методики построения псевдофизических логик на примере временной логики, мы ограничимся для пространственной логики более фрагментарным изложением. Наибольший интерес в пространственной логике представляет та ее часть, которая связана с получением выводов на топологической шкале расстояний между объектами. Именно эту часть логики мы и рассмотрим здесь. Наше изложение должно пополнить общее представление о тех проблемах, которые встают перед разработчиками псевдофизических логик. Другие же разделы, относящиеся к пространственной статической логике (работа с метрическими шкалами и отображение высказываний на них, работа с отношениями взаимного расположения предметов, отношениями ориентации их в пространстве и многое другое), фактически строятся аналогично тому,, как это делалось для временной логики. Начнем с формирования списка размытых квантификаторов, которые могут использоваться для оценки расстояния на топологической шкале расстояний. Конечно, этот список может быть более или менее обширным. В качестве примера рассмотрим список из 25 квантификаторов, перечисленных в левом столбце табл. 3.1. В ней показаны результаты экспериментов, проведенных на основе данного списка квантификаторов расстоятя, для большой группы испытуемых. В столбцах указано число испытуемых, положивших карточку с соответствующим квантификатором в позицию, номер которой указан вверху. Какие выводы >южно сделать из данных табл. 3.1? Таких выводов ^южнo сделать несколько. Испытуемые плохо различают между собой некоторые квантификаторы: вплотную и очень-очень близко, довольно близко и совсем близко^ близко, вблизи, рядом, возле, около и другие. Два квантификатора: недалеко и неблизко испытуемые понимают неодинаково. При построении хорошей порядковой шкалы это надо учесть. Поэтому вместо исходного списка квантификаторов для построения шкалы нужно оставлять только те, которые указаны в левом столбце в табл. 3.2. Здесь уже произведено отображение результатов из табл. 3.1 в соответствии с процедурой, описанной в §2.il, в значения функции принадлежности. Наверху с шагом 0,1 перечислены значения переменной из отрезка [0,1], на котором определены семь функций принадлежности (строки табл. 3.2) для всех оставшихся в списке квантификаторов.
12G гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИП Из таблицы ясно видно, что оставшиеся семь квантификаторов образуют хорошую порядковую шкалу для отношений расстояния. В рамках настояндего параграфа мы будем рассматривать лишь двумерную пространственную логику расстояний. Перенос излагае- Таблица 3.1 Лексемы н сочетания лексем 0 1 2 3 4 5 6 7 8 9 Ю 1. Вплотную 27 2. Очень-очень близко 20 7 3. Очень близко 2 21 4 4. Довольно близко 1 13 13 5. Совсем близко 2 20 4 1 G. Совсем рядом 15 7 4 1 7. Близко 4 21 2 8. Вблизи 3 18 6 9. Рядом 3 19 3 2 10. Возле 2 15 8 2 И. Около 5 18 2 2 12. Неблизко 3 И 9 4 13. Не очень близко 4 12 8 3 14. Недалеко 1 2 11 10 3 15. Не далеко, но и не очень 12 12 3 близко 16. Не далеко у не близко 27 17. Не очень далеко^ но и 9 14 3 1 не близко 18. Не очень далеко 3 8 14 2 19. Вдали 2 12 10 2 1 20. Совсем далеко 4 20 3 21. Довольно далеко 6 18 3 22. Очень-Очень далеко 7 20 23. Очень далеко 4 21 2 24. Далеко 1 19 7 25. В бесконечности 27 Таблица 3.2 Локсемы и сочетание 0,1 О,5 0.3 0.4 0,5 0,6 0,7 0,8 0.9 1,0 1. Вплотную 2. Очень близко 3. Близко 4. Не далеко у не близко 5. Далеко 6. 0'/е?нь далеко 1. Очень-очень далеко 0,966 0,2 0.033 0,606 0,133 0,133 0,733 0,133 о, 0,666 0,066 0,133 0,266 0.666
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА J 27 мых ниже результатов на случаи трех или больи]его числа измерений происходит чисто техническим путем. Для интерпретации квантификаторов расстояний нам понадобится рассмотреть еще синеок нечетких квантификаторов, оценивающих размеры предметов. Связь между оценками расстояний на топологической шкале и оценками размеров предметов, между которыми определяются расстояния, довольно хорошо прослеживается с помощью примеров. Рассмотрим два высказывания: «Человек находится далеко от города» и «Человек находится далеко от автомобиля». Ясно, что в первом случае далеко оценивает большее расстояние, чем во втором. Еще два высказывания — «Книга находится близко от стола» и «Лес находится близко от деревни» — также характеризуют зависимость оценки фактического расстояния, передаваемого квантификатором близко, от размеров предметов, о которых здесь идет речь. Введем список квантификаторов размеров, который образует порядковую шкалу для оценок размеров. Эта шкала получена в результате такого же эксперимента, который для расстояний отражен в табл. 3.1 и табл. 3.2. Список квантификаторов размеров имеет следующий вид: нулевой, очень маленький, средний, большой, очень большой и очень-очень большой. При этом в класс средних предметов попадает человек, что делает его как бы модулем, относительно которого происходит деление окружающих предметов на классы, К классу очень маленьких предметов относятся, например, булавка Таблица 3.3 Расстояние Размер 1 -о ?^ at =1 о а: ?2 1| о.§ Вплотную 0,933 0,033 Очень близко 0,2 0,6G6 0.133 0,133 Близко 0,333 0,733 0.266 Не далеко, не близко 1,0 Далеко 0.933 0,066 Очень далеко 0.266 0,733 Очень-очень далеко 0,066 0,933 ИЛИ пуговица. Чашка или книга могут выступать представителями маленьких предметов, а город в зависимости от своего размера попадает либо в класс очень больших, либо очень-очень больших объектов.
128 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТУАЦИИ Размер Расстояние 1. Нулевой 2. Очень маленький 3. Маленький 4. Средний 5. Большой 6. Очень большой 7. Очень-очень большой Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Будем в дальнейшем обозначать через а]^ некоторый объект с именем i и раз.мером q. Размеры будем задавать порядковыми но- мepa^иI в соответствии с нумерацией размеров в табл. 3.4. Через Rj будем обозначать отношение расстояния на топологической шкале. Индекс / совпадает с порядковым номером соответствуюш,его отношения в тон же табл. 3.4. Запись {al'Rja^-) означает, что кратчайшее расстояние между границами объектов и аа с размера>и[ q\ и ^2 оценивается как Rj. На рис. 3.18 показа- но графическое изображение этой ситуации. ^2J Выскажем еще две гипотезы по поводу оцен- ки расстояний на топологической шкале. Рас- c^ютpим рис. 3.19. На этом рисунке объект аг остается неиз.менным, а вместо объекта а%~ подставляются объекты различного размера, но так, что истинное расстояние между границали! объектов не меняется. Гипотеза 3.2. Оценка расстояния на топологической шкале для тройки (aVRjCiV') не меняется при изменении размеров объекта a-i и сохранении истинного расстояния мэжду границами объектов. Проведем теперь психологический эксперимент, в ходе которого испытуемые должны оценивать по некоторой условной десятибалльной системе оценок степень близости пар квантификаторов, один из которых относится к размерам, а другой — к расстояниям. Результат одного из таких экспериментов приведен в табл. 3.3. Из анализа этой таблицы явно вытекает наличие связи между оценками расстояний и размерами на топологических шкалах. Между списками тех и других квантификаторов суш.ествует определенное соответствие. Оно может быть выражено в виде некоторого гипотетического утверждения. Гипоте 3 а 3.1. Для оценки расстояний между двумя объектами можно использовать третий объект, помеш,аемый между ними вплотную. Размер этого объекта однозначно определяет расстояние между исходными объектами в соответствии с табл. 3.4. Таблица 3.4
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 129 Как и гипотеза 3.1, данная гипотеза может приниматься или не приниматься, так как ее истинность нельзя строго доказать. Оправданием ее служит лишь то (как и для других гипотез), что с ее помощью получаются результаты, не противоречащие интуиции человека. Заметим, что при изменении размеров предмета а^, от которого оценивается расстояние (лучше сказать «с точки зрения» которого), оценка расстояния даже при сохранении истинного расстояния может изменяться. Если, например, некоторый человек находится близко от дома, то для булавочной головки это расстояние может оказаться весьма далеким. Отсюда вытекает еще одна гипотеза, говорящая о несимметричности оценок расстояний. Г и п о т е 3 а 3.3. При различных размерах объектов и Да в тройках (aVRjul^) я {al*Rf^aV) значения Rj и Rf^ могут отличаться друг от друга. Нетранзитивность Rj очевидна. Ясно, что если ai близко от ^2, а2 близко от аз и т. д., то между ai и последним объектом в такой V N \ \ \ \ I / / У Рис. 3.19 Таблица 3.5 Вплотную- вплотную о.м ? ом м ? м с ? с б ? б об ? об ооб ? ооб 1. ОМ обл обл обл обл обл обл 2. М бл обл обл обл обл обл 3. С нд, нбл бл обл обл обл обл 4. б д нд, нбл бл обл обл обл 5. об од д нд, нбл бл обл о^л 6. ооб оод ^д д нд, нбл бл оэт последовательности может зафиксироваться практически любое отношение от близко до очень-очень далеко. Это зависит от числа элементов в рассматриваемой последовательности. Сформулируем последнюю гипотезу, обоснованием которой могут служить результаты многочисленных психологических экспериментов, а также интуиция человека. Гипотеза 3.4. Для любых трех объектов одинакового размера, расположенных вплотную друг к другу на одной прямой, расстояние между крайними объектами в тройке оценивается квантификатором очень близко. 5 д. А. Поспелов
130 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Все сформулированные гипотезы (если они принимаются, конечно) использованы при построении базовой матрицы оценок расстояний на топологической шкале (табл. 3.6). В этой матрице использованы следуюш,ие обозначения: ом — очень маленький, м — маленький, с — средний, б — большой, об — очень большой, ооб — очень-очень большой, обл — очень близко, бл — близко, нд, нбл — не далеко, не близко, д — далеко, од — очень далеко, оод — очень-очень далеко. Запись q7 q, где д — указание некоторого размера, соответствует тому, что вместо среднего объекта вплотную к двум крайним указанного размера можно вставить третий объект, размер которого указан в левом столбце матрицы. При этом расстояние между крайними объектами можно оценить путем оценки расстояния, указанной в соответствующей клетке матрицы. Например, если между двумя объектами среднего размера вплотную к ним поместить маленький объект, то расстояние между крайними объектами будет очень близким, а при помещении между объектами среднего размера вплотную к ним очень большого объекта получится расстояние между исходными объектами, которое оценивается квантификатором не далеко, не близко. Пример 3.17. Расстояние между двумя блюдцами оценено как очень далеко. Какова бы была оценка того же расстояния, если бы вместо блюдец мы имели людей? Будем считать, что блюдца — маленькие объекты. В столбце м?м табл. 3.5 ищем квантификатор од и находим, что он соответствует помещению между блюдцами вплотную очень-очень большого объекта (ооб). Теперь в строке, соответствующей этому объекту на пересечении со столбцом с?с (считаем, как говорилось ранее, что человек относится к классу средних по размеру объектов) находим оценку расстояния в виде квантификатора далеко. Таким образом, если вместо блюдец на их места поставить людей, то между ними будет расстояние, оцениваемое квантификатором далеко. Пример 3.18. Пусть два человека находятся на одной прямой по обе стороны современного городского дома, имеющего форму замкнутого квадрата или прямоугольника, близкого к квадрату (в идеале — форму цилиндра, как некоторые экспериментальные дома в Ереване или Братиславе, например). И мы хотим оценить расстояние между этими людьми. Так как человек относится к классу средних по размеру объектов, а дом, по-видимому, следует относить к классу больших объектов, то на пересечении столбца с?с и строки для больших объектов в табл. 3.5 мы находим интересующий нас квантификатор расстояния. Как следует из базовой матрицы, этим квантификатором является квантификатор близко. Теперь можно перейти к обсуждению правил вывода, характерных для топологической шкалы расстояний в статической простран-
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 131 ственной логике. Сначала рассмотрим ситуацию, иллюстрируемую рис. 3.20. На этом рисунке имеются три объекта с заданными размерами (размер объекта аз не играет роли, как следует из нашей гипотезы 3.2), расположенные на одной прямой. Известны оценки расстояний между объектами aV и а2\ а также между объектом а2* и аз. Требуется найти оценку расстояния между объектом а?* и лз. Другими словами, требуется построить систему правил в виде таких продукций: {aVRfiV) {а',%аз)=^{оГЯ?аз), с помош,ью которых можно было бы задать полную систему выводов о расстояниях на топологической шкале для объектов, расположенных на одной прямой. Рассмотрим последовательно четыре возможных случая. 1. Объекты ai и az имеют одинаковые размеры, а Rt и Rj совпа- дают^ Тогда правило вывода записывается следующим образом: (aiRaj) {aiRa3)=>(aiR,a3), В этом случае /?? определяется с помощью операции R-^=R. Смысл этой операции поясняется с помощью табл. 3.6. -1. Таблица 3.6 R R - i Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Очень близко Близко Не далеко, не близко Далеко Очень далеко Очень-очень далеко Очень-очень далеко Вплотную Вплотную Очень близко Близко Не далеко, не близко Далеко Очень далеко Пример ЗЛ9. Пусть ai и аг — маленькие объекты и оценка расстояний между ними, а также между аз и аз есть близко. Тогда оценка расстояния между ai и не далеко, не близко. 2. Объекты а^ и а^ имеют одинаковые размеры, wo Ri w Rj различны. В этом случае правила вывода имеют вид (aiRtal) [alRj-a^) =Ф (а?/?, аз). Значение определяется на основании следующего соотношения: ^1 тах(/?^, Rj), если |i —/|>1, ■ ^ \ max(i?;, Rj)-[-\, если |i —/| = 1. Если U'—/1=0, то этот случай сводится к предшествующему. 5*
132 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Пример 3.20. Пусть для маленьких и аг расстояние от до аз оценивается квантификатором близко, а от до as — квантификатором далеко. Тогда расстояние от ai до аз будет оцениваться квантификатором очень далеко, так как в нашем случае = = 13-5 =2. 3. Оценки Ri и Rj совпадают, но размеры объектов ai и ag различны, В этом случае правила вывода имеют вид {aVRal') {al^Ras)=>{aVR,as). В этом случае сначала необходимо «уравнять» размеры ai и ag. Для этой цели воспользуемся гипотезой 3.2 и базовой матрицей, отраженной в табл. 3.5. В первой тройке приписываем аз размер qi, что не сказывается на квантификаторе R. Во второй тройке приписываем тот же размер аз, что не сказывается на R, если не менять размера аг. Но так как мы его меняем, то необходимо найти новое значение квантификатора. Для этого и служит табл. 3.5. Если новое значение R' во второй скобке сохранит то же значение R, то данный случай сводится к первому из рассмотренных ранее случаев. Если же это не произойдет, то наш случай сводится ко второму из ранее рассмотренных случаев. Пример 3.21. Пусть от чашки (маленький объект) до дома (большой объект) расстояние оценивается квантификатором близко, а от дома до некоторого третьего объекта аз — квантификатором не далеко, не близко. Для перехода от класса больших объектов к маленьким объектам используем базовую матрицу (табл. 3.5). Находим в этой матрице столбец б?б и иш,ем в нем квантификатор не далеко, не близко. Ему соответствует последняя строка таблицы, т. е. объект, относящийся к классу очень-очень больших. Помещая такой объект между маленькими объектами (т. е. заменяя большой а^^ на маленький), мы находим в столбце м?м на пересечении с последней строкой значение R\ Как видно из табл. 3.5, это значение есть очень далеко. Так как оно не совпадает с квантификатором близко, то имеет место второй случай. Учитывая, что U*—^;J = I3—6|=3, получаем окончательно, что расстояние от чашки до объекта аз должно оцениваться квантификатором очень-очень далеко, 4. Пусть не совпадают ни размеры Ui и а^, ни квантификаторы Ri и Rj. Тогда можно с помощью базовой матрицы сначала уравнять размеры объектов, а затем получить ту же ситуацию, что и в предшествующем случае. Приведенные правила вывода, хорошо работающие для случая трех объектов, расположенных на одной прямой, удовлетворяют в этом случае человеческой интуиции, но при перенесении на случай произвольного числа объектов на одной прямой могут привести к нежелательным эффектам. Пример 3.22. Пусть имеется шеренга посаженных вдоль дороги деревьев. Между соседними деревьями такое расстояние, которое оценивается квантификатором близко. Если ai, аа, а^ суть
§3.6. ПРОСТРАНСТВЕННАЯ ЛОГИКА 133 деревья, то от ах до аа близко, от ai до аз на основании первого случая правил вывода не далеко, не близко, от до на основании того же правила далеко, а для расстояний от до ag и всех последующих деревьев в шеренге будет сохраняться отношение далеко. Это происходит в результате поглощения одним квантификатором других, которые отстоят от него более чем на единицу. В настоящее время для устранения эффекта поглощения нет сколько-нибудь эффективных приемов. Один из частных приемов, к сожалению, применимый не всегда,— способ разбиения на каждом шаге объектов на пары, внутри которых квантификаторы отличаются на единицу по своему индексу, и правила вывода применяются именно к таким парам. Если таких квантификаторов нет, то используются пары с одинаковыми расстояниями между объектами. Подобный подход неприменим, если все попарные расстояния отличаются по индексам квантификаторов более чем на единицу. Пример 3.23. В условиях примера 3.22 после нахождения расстояния от ai до аз имеет смысл искать расстояние от аз до а^, которое будет оцениваться в результате как не далеко, не близко. Применяя теперь правило вывода к объектам а^, а^ и аз, а-, мы получим, что расстояние от а^ до оценивается квантификатором далеко. Аналогично расстояние от а^ до оценивается также квантификатором далеко. Если теперь использовать правило вывода для объектов Ui, ag и ад, то расстояние от ai до будет оцениваться уже квантификатором очень далеко. Продолжая процедуру подобным же образом, можно оценивать расстояния по все более увеличивающимся по индексу квантификаторам (в предположении, что за квантификатором о^^яб- очень далеко находится бесконечная их последовательность: очень-очень-очень далеко, очень- очень-очень-очень далеко и т. д.). Перейдем теперь к построению правил вывода для пространственной логики расстояний на плоскости. Базовая матрица (табл. 3.5) дает возможность преобразования любых произвольных по размерам объектов в очень маленькие объекты, которые в дальнейшем мы будем для краткости называть точечными. Поэтому при построении правил вывода на плоскости будем рассматривать лишь точечные объекты. На рис. 3.21 показаны три объекта ai, аг и аз, произвольно расположенные на плоскости. Пусть расстояния Ri и Rj нам известны (т. е. мы знаем их словесную оценку), а расстояние R^ требуется определить. Построим два вспомогательных объекта а^ и так, как / \ / >f \ Рис. 3.21
134 гл. 3. ПОПОЛНЕНИЕ 0ПИСАН[1И СИТУАЦИП показано на рисунке. Ясно, что для индексов квантификаторов выполняются неравенства /?тш^^Ф^^тах- определения R^^in и /?гпзх используются следующис специальные операции: Вплотную, если если если i = i + U Ri, если i—j>2, если если i если i = ■ R, + l, если / = t + l, Rt^ если i если / —1>2. Ограничимся для простоты не любыми угловыми направлениями Ф на плоскости, а некоторым числом фиксированных направлений. При достаточно большом их числе можно получить сколь угодно близкое приближение к модели с непрерывным значением ф. Для наглядности возьмем небольшое число направлений, показанное на рис. 3.21. Другими словами, будем считать, что объект а.э может находиться только на этих фиксированных пяти направлениях. Построим специальную таблицу (табл. 3.7), которая по местонахождению объекта аз и вычисленным значениям R^^-^^ и jRj^a^ определяет Таблица 3.7 S T2 Фз ф. 0 ^max ^max ^max ^тах ^тах 1 ^max ^min 2 ^max ^min 3 ^max ^min 4 ^max ^Фз-1 ^rain 5 ^max (^,.-^1)^1 ^min 6 ^max ^min 7 ^max значение /?ф. При увеличении числа направлений характер таблицы не меняется. Здесь S означает разность индексов для квантификаторов, соответствующих R^^^ и Д-^^ случая s=l предполагается, что
§ З.б. ПРОСТРАНСТВЕННАЯ ЛОГИКА 135 ^min не является квантификатором вплотную. Если это так, то ^Ф1=^Ф2=^Ф. =^Ф4= очень близко. При 5=-0 Rm^^-=Rm\n- Операция специального вычитания, используемая в этой таблице, определена в правом столбце табл. 3.6. Для полного завершения логики на плоскости необходимо еще построить правила вывода направлений по заданным направлениям для двух объектов относительно третьего. Другими словами, необходимо еще ввести правила вывода следующего типа: Приведем примеры подобных правил, ограничившись лишь четырьмя фиксированными направлениями впереди, слева, сзади, справа. Эти правила сведены в табл. 3.8. Таблица 3.8 Впереди Слева Сзади Справа Впереди Впереди Впереди, если Слева, если Rj > Ri Впереди, если R/<:Ri Сзади, если Rj>Ri Впереди, если Rj < Ri Справа, если Rj > Ri Слева Слева, если Rj<Ri Впереди, если ^/>^/ Слева Слева, если Rj^Ri Сзади, если Rj > Ri Слева, если Rj^Ri Справа, если Rj>Ri Сзади Сзади, если Rj < Ri Впереди, если Rj > R( Сзади, если Rj^Ri Слева, если Rj > Ri Сзади Сзади, если Rj < Ri Справа, если Rj > Ri Справа Справа, если Rj^Ri Впереди, если Rj > Ri Справа, если Rj<.Ri Слева, если Rj > Ri Справа, если R/^Ri Сзади, если Rj > Ri Справа Пример 3.24. Пусть впереди дома далеко имеется лес, а справа от леса близко находится ветряная мельница. Определим направление от дома к ветряной мельнице. В нашем случае Rj>Ri и, согласно табл. 3.8, мы получаем, что мельница находится впереди дома. При увеличении числа допустимых направлений таблица для определения направлений быстро растет, увеличивается и число
136 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИП СИТУАЦИИ условий, связанных с соотношением Ri и Rj для выбора того или иного ответа. Но суть дела от этого не меняется. Как и во временной логике, в пространственной логике не всегда удается получить пополнение описания, используя лишь те правила вывода, которые мы здесь описали. Часто возникает необходимость в использовании дополнительной информации, храняи;ейся в памяти системы в виде сценариев или в каком-либо ином виде. Пример 3.25. В примере 3.4 мы обсуждали сценарий, в котором отражено строение пылесоса из ряда деталей. Пусть на вход системы поступило следующее описание ситуации: «В комнате рядом со столом работает пылесос». Если непосредственно по этому описанию построить пространственную структуру ситуации, то она будет иметь следующий вид: (аг^^Ь) (aR^c), где а — пылесос, b — комната, с —стол, Гз8 — быть внутри, ^3 — близко. Ничего другого из исходного описания впрямую получить нельзя. Однако используя сценарий, приведенный на рис. 3.3, можно это описание пополнить, например, фактом {drs^b) или фактом (dRac), где d.— шнур от пылесоса. §3.7. Каузальная логика* Выше уже говорилось, что в настоящее время не существует сколько-нибудь завершенного фрагмента этой логики, которая должна работать с отношениями, связывающими между собой причины и следствия. Вообще говоря, если каузальную логику трактовать достаточно широко, то ее можно расширить почти до теории вывода, в которой рассматриваются не только традиционные дедуктивные системы вывода, но и выводы индуктивного типа или выводы типа «от частного к частному» (традуктивные). Но мы не будем заниматься таким расширением, а рассмотрим в рамках данного параграфа несколько фрагментов каузальной логики в узком смысле, которые уже сейчас можно применять в системах управления семиотического типа. Прежде всего необходимо отметить, что до последнего времени даже в философском плане не проведено достаточного анализа сути отношения причина — следствие. Большинство авторов склоняется к тому, что существует по крайней мере пять основных видов таких отношений. 1. Энергетическая причина. Причина изменения w, наблюдаемого в некотором явлении или процессе Па, есть передача некоторой энергии V от явления или процесса Hi. В этом случае можно говорить, что V — есть причина w, aw — следствие v. 2. Причина изменения w в есть не само воздействие v. Оно скорее играет роль «последнего толчка», после которого в Пз начинает развиваться процесс, приводящий к w. Однако и в этом случае можно считать v причиной (первопричиной) для w, sl w — следствием V.
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 137 3. Причина изменения w есть информация и, в которой содержится указание для Па о характере необходимого изменения. В таком случае также можно считать, что между этим указанием v и изменением W есть отношение причина — следствие, 4. Изменение w возникает за счет того, что в Из имеются два подпроцесса, или системы, которые взаимодействуют между собой и порождают само изменение w. Такие причины изменений могут возникать и как вторичные после появления первичных причин, указанных в предшествуюш,их пунктах. Отметим, что взаимодействие внутри процесса может определять развитие самого процесса, которое выражается в цепи его изменений Wi, Wz, Wn, ... 5. В качестве причины может выступать некий «фундаментальный» закон, согласно которому всякий процесс стремится к некоторым устойчивым состояниям (например, всякое тело, находящееся под влиянием гравитационного поля, стремится «упасть»). Существует довольно устойчивое представление о причине некоторого явления, как об его единственной, необходимой и достаточной причине. Даже при создании методов вывода на основании индукции (мы с ними столкнемся в гл. 4) это заблуждение будет играть роль некоего весьма важного предположения, при выполнении которого тот или иной метод эффективно реализуется. На самом же деле связь причин и следствий может оказаться значительно более тонкой. С этой точки зрения можно дать следующую классификацию причинно-следственных отношений. 1. Необходимая и достаточная причина. Причина V при своей актуализации всегда вызывает следствие w, И, наоборот, появление w всегда свидетельствует о предшествующей актуализации и. Это довольно редкий для реальной ситуации случай. Примером его может служить связь между лишением некоторого тела опоры и его падением. 2. Достаточная причина. Это наиболее часто встречающийся в реальной практике случай, когда причина v всегда вызывает следствие w, а из появления w не всегда следует v. Примером такого положения может служить связь между невыполнением плана и отсутствием премирования. Однако из отсутствия премирования не люжет следовать вывод о невыполнении плана. 3. Дополнительные с о п р и ч и н ы. Ни t^i, ни ^2 не являются причинами w. Лишь их совместное действие вызывает W. Возможен случай не пары дополнительных сопричин, а некоторого множества их. Например, если Vi есть наличие пневмококка, а W — заболевание пневмонией, то для возникновения w кроме Vi необходима актуализация еще какой-либо сопричины, например, переохлаждения, простуды или травмы. 4. Необходимые сопричины. В списке сопричин, каждая из которых к w т приводит, могут быть сопричины, наличие которых для вызывания w необходимы. Для предшествующего примера такая необходимая сопричина — наличие пневмококка.
138 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИИ 5. Возможные сопричины. Причинами аварии на улице могут быть неисправность некоторого транспортного средства, нарушение правил дорожного движения, состояние опьянения у водителя и т. д. Ни одна из этих сопричин не обязательно приводит к аварии. Но возрастание множества подобных одноврехменно актуализированных сопричин увеличивает шансы на появление w. В нашу классификацию причин можно было бы включить и различные псевдопричины, нередко игравшие на первых порах развития мышления определяющую роль. Примером такой псевдопричины может служить правило «После этого,— значит вследствие этого». При рассмотрении не одной причинно-следственной связи, а цепочки таких связей может оказаться, что воздействие тех или иных последовательностей причин куммулирует или ослабляет эффект, связанный с необходимостью появления Вообще, в причинно- следственных сетях могут возникать различные тонкие эффекты, часть которых мы обсудим чуть ниже, когда будем анализировать сценарии, связанные с каузальными отношениями. Вернемся к примеру 3.2 и связанным с ним рис. 3.1 и рис. 3.6. Основным свойством причинно-следственных отношений является их антисимметричность и транзитивность, что позволяет для любого явления, которое может выступать в роли следствия, строить дерево причин или сопричин, способных его породить. Как можно использовать это дерево? Если, например, в тексте, поступившем на вход системы, явно содержится информация о том, что внешний поставщик сорвал план поставки заготовок, то текст может быть пополнен фактами о том, что заготовок нет и станок простаивает (см. рис. ЗЛ). Наличие причинно-следственного сценария, таким образом, позволяет при наличии сведений о любой его вершине достраивать цепочки фактов, ведущих от нее к следствиям. Единственная тонкость тут заключается в необходимости учета времен наступления событий. Если факт «Поставщик сорвал план поставки заготовок» поступил в момент времени t, то факты «Заготовок нет» и «Станок простаивает», которые являются одномоментными, сами могут возникнуть не в момент ^, а в некоторый момент t+x, ибо производство может располагать определенным запасом заготовок. И величина т может быть достаточной для того, чтобы факты-следствия вообще не возникли, если за время т запас не израсходуется, а поставщик исправит свою оплошность. Именно здесь смыкаются временная и каузальная логики. Мы уже говорили, что рассуждения о будущем носят модальный характер. В будущем может реализоваться не одна последовательность событий, а целый веер таких последовательностей. И при выводе от причин к следствиям это необходимо учитывать. Поэтому причинно-следственные сценарии нужно снабжать дополнительной информацией (весами) о временных задержках в наступлении следствий после непосредственных причин. Этими весами можно помечать
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 139 дуги, показанные в сценарии, что дает возможность делать выводы в каузальной логике более богатыми. Пример 3.26. На рис. 3.22 показан тот же сценарий, что и на рис. 3.1. К нему лишь добавлена информация о времени возникновения следствий после наступления непосредственных их причин. Пусть в момент t в системе имеется информация о том, что станок простаивает, а в момент t—т поступила информация о том, что поставщик прекратил поставлять заготовки. Если т меньше чем 48 ч, то вывод о том, что заготовок нет и станок простаивает, еще не реализуется. Вывод от причин к следствиям всегда использует свойство транзитивности. Если имеется информация о двух событиях, одно из которых может рассматриваться как причина, а другое — как следствие, то легко выводятся и все промежуточные события. Вывод же от следствий к причинам более сложен, ибо он не однозначен. При формировании та- _ ких правил каузальной логики большую роль р^^^, 3 22 играет вся информация, имеющаяся в распоряжении системы на данный момент времени. Если, например, системе известно, что станок простаивает, то еще нельзя восстановить причину. Но если при этом имеется дополнительная информация о том, что станок исправен, а заготовки имеются, то из факта простоя станка немедленно будет следовать факт, что на рабочем месте нет рабочего. При построении причинно-следственных сценариев часто возможно указать ряд отношений, связывающих между собой причины. Например, может оказаться, что некоторые причины не могут одновременно существовать. Например, следствие «Магнитофон не воспроизводит запись» может возникать в результате двух фактов: «В магнитофоне нет пленки» и «Произошел обрыв пленки». Эти два факта-причины между собой взаимосвязаны. Они не могут существовать одновременно. Поэтому при выводе причины для следствия «Магнитофон не воспроизводит запись» и наличии дополнительной информации о реализации факта «Пленка вынута из магнитофона» система должна сделать однозначный вывод о том, что причина интересующего нас факта состоит в отсутствии пленки в магнитофоне. Сценарий, показанный на рис. 3.6, довольно прост. Но сценарий, который приведен на рис. 3.8, содержит много дополнительной информации, которую вполне хможно использовать в процессе получения выводов как от причин к следствиям, так и от следствий к причинам. Кроме указания на прямую связь причин и следствий, в этом сценарии содержится еще информация о тех воздействующих факто-
140 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ рах, которые вызывают или стимулируют причины. Вместе с тем в этом сценарии могут быть указаны и тормозящие факторы, которые препятствуют возникновению причин. И, наконец, в сценарии могут быть указаны некоторые наблюдаемые закономерности в появлении и непоявлении фактов, что позволяет устанавливать причины и прогнозировать развитие процесса от причин к следствиям. Таким образом, в каузальной логике больше вопросов и нерешенных проблем, чем ответов на них. И один из наиболее трудных вопросов — проблема получения в каузальной логике нечетких выводов, когда наличие причин известно лишь с некоторой оценкой достоверности, а иногда и нет полной уверенности, что именно данные факты служат причинами интересующего нас факта. Именно этой проблемой, играющей во всех системах управления объектами сложной природы большую роль, мы будем заниматься в оставшейся части настоящего параграфа, причем будем считать, что уже выработана гипотеза о том, что Ui, Уг, Vm могут быть причинами W. О методах формирования таких гипотез будет говориться в гл. 4. Мы же обсудим, как строятся специальные правила вывода, позволяющие осуществлять переход от Vi, Ua, к ьу, и сосредоточим свое внимание на том случае, когда все причины непосредственно приводят к W. Для простоты изложения ограничимся случаем, когда между Vt нет никаких связей, которые запрещали бы появление одной из причин при наличии другой. В списке литературы к данной главе указаны источники, в которых это ограничение снято. И, наконец, будем считать, что w наступает, если все Vt реализованы. Случай, когда достаточно хотя бы одной причины для реализации W, не вносит ничего принципиально нового и также рассмотрен в работах, указанных в списке литературы. В логических системах вывода широко используются схемы вида A^j {Л^, Лд, —^В В Смысл их интерпретируется следующим образом: если Л2, Лу1 уже выведены и из совокупности выведенных формул Лх, Л а, Лт1 следует выводимость В, то В считается выведенным. Эта схема обобщает знаменитое правило «модус поненс», принадлежащее классической логике: Л, А^В В Здесь знак трактуется как обычная импликация. Пусть теперь наши знания о том, что Л^ действительно выведены, неполно. Другими словами, вместо той части схемы вывода, которая стоит над чертой, мы имеем
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 14| Здесь yii — некоторые квантификаторы, например, квантификаторы частотного типа почти никогда, очень редко, редко, не часто, не редко, часто, очень часто, почти всегда ^). В этой записи причины, вызывающие выводимость В, заданы с некоторой долей уверенности. Что в этих условиях можно сказать о выводимости 5? Неполным может быть и наше знание не о причинах Л ^ а о самом факте выводимости из этих причин. В таком случае верхняя часть схемы дедуктивного вывода выглядит следующим образом: А„ А^, Л„; >|[{Л1, Ла, А^\:=^>В1 Как и ранее, квантификатор >| можно трактовать здесь по-разному. Лишь бы он отражал каким-то образом степень уверенности в том, что вывод из {Аi} в В реализуется. Конечно, возможен и такой случай, когда имеет место и та, и другая неопределенность. Описанная ситуация на практике возникает весьма часто. В условиях ситуационного управления она оказывается скорее правилом, чем исключением. Знания об объекте управления и способах управления им накапливаются постепенно, и необходимость использования нечетких схем вывода, примеры которых мы только что рассмотрели, остается почти на всем периоде функционирования системы управления, построенной на основе семиотических моделей. Возможны различные способы работы с такими нечеткими правилами вывода. Проиллюстрируем это на нескольких подходах, причем для большей наглядности изложения мы будем анализировать лишь тот случай, когда схема вывода имеет вид такой продукции >|аЛ, >|[Л—>S], где >|а и >| — квантификаторы некоторого типа, отражающие сомнение в истинности посылки А и самой продукции. Нас интересует значение квантификатора >|д, с которым надо записать факт В в память системы или использовать его в дальнейшем выводе или при принятии окончательного решения. Рассмотрим вначале случай, когда вместо квантификаторов стоят некоторые вероятности, отражающие наши знания о влиянии Л на появление В и появление самого Л. Такие вероятности могут быть либо априорными, либо апостериорными, накопленными после некоторого опыта работы системы. В таком случае можно предложить две схемы приписывания вероятностной оценки для В, которые более или менее соответствуют интуиции человека: Ра>С1 Ра >а Рл^Ув>Ь . Рл^>в>Ь Рд>шах(0, а + Ь —1) ' ^аЬ ' В приведенных соотношениях указаны лишь оценки снизу. Насколько их можно превышать, остается неясным. Некоторая информация об этом может быть извлечена из оценок для правила ^) Возможны и иные квантификаторы. Например: почти уверенно, с некоторой долей уверенности, фифти-фифти, сомнительно и т. п.
142 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ P^<min(l, 1—а + Ь)' < min(l, Ь/а), афО' Буквами Р в этих схемах всюду обозначены соответствуюидие вероятности. Однако, как уже говорилось, в семиотических системах управления и, в частности, в системах ситуационного управления накопление статистических данных идет слишком медленно, а априорные знания о вероятностных оценках отсутствуют. Поэтому представляется интересным формировать оценку достоверности В, оставаясь в рамках использования квантификаторов, оценивающих достоверности Л, Az=^>B и В. Зафиксируем в качестве таких квантификаторов частотные квантификаторы, которые мы только что привели, добавив к их списку еще два квантификатора никогда и всегда, ограничивающие его слева и справа. Для этих квантификаторов мы и будем строить правила оценки В. Пример 3.27. Рассмотрим следующую схему рассуждений: При швартовке судно «А. Пушкин» изредка теряет 20—30 мин времени; если потеряно более 20 мин времени, то план погрузки очень часто приходится переделывать. Обозначим через А высказывание «Швартовка судна «А. Пушкин» приводит к потерям 20— 30 мин времени», через >^ — квантификатор редко, через В — высказывание «План погрузки переделывается», а через > — квантификатор очень часто. Тогда приведенный текст можно представить схемой >А^1 >[Л=^>5]. Что можно сказать об оценке истинности В, если известно, что в данный момент судно «А. Пушкин» готовится начать швартовку? Более или менее опытный диспетчер при наличии такой информации скорее всего станет готовиться к процедуре изменения плана погрузки. В § 2.11 и в предшествующем параграфе мы уже говорили о том, что квантификаторам можно сопоставить функции принадлежности или интервалы на отрезке [0,1]. В частности, на рис. 2.16 и 2.17 были показаны эти интервалы и вид функций принадлежности как раз для случая частотных квантификаторов. Тогда задачу можно поставить следующим образом. По известным квантификаторам >^ и >| строим (или используем ранее построенные) функции принадлежности (или интервалы) на отрезке [0,1] и ищем отображение пары этих функций (или интервалов) в функцию принадлежности (или интервал) для квантифика- «модус толленс», также хорошо известного в классической логике: А Вероятностные аналоги этого правила имеют вид РА^ув>а РА^>в>а
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 143 тора Таким образом, нас интересует вид функции F, задающей соотношение \^в^^{\^ау М-)- Здесь р.^, \i и — функции принадлежности, соответствующие >|а, >| и Прежде чем определять вид функции F, сформулируем некоторые достаточно очевидные свойства, которым она должна удовлетворять. Если в качестве квантификаторов взять квантификаторы всегда, то верхняя часть схемы вывода будет иметь вид Л; Л=>5. Другими словами, правило вывода превратится в «модус поненс». Это означает, что и квантификатор >д должен стать квантификатором всегда. Для функций принадлежности это эквивалентно требованию выполнения равенства F{\i\, \^^) = \^ву где (l^ \1в — функции принадлежности, соответствующие квантификатору всегда. Для случая, когда есть квантификатор всегда, а у( — никогда, очевидно, что >|д должен также принимать значение/iw/co2(3a. Другими словами, должно выполняться равенство = где и \i% — функции принадлежности, соответствующие квантификатору никогда. Два сформулированных нами требования к функциям принадлежности и [х^ ограничивают вид этих функций. Их можно определить лишь двумя способами: 1. \i4x) = 0, х€[0, 1), о i\i'(x)=^x, хе[0, 1], li'{x)=^\, х=1, • \^о{х)=^1-х, д:6[0, 1]. li'{x) = 0, х€(0, 1], Рассмотрим один из возможных способов определения F, при котором удовлетворяются сформулированные нами требования Этот способ сводится к тому, что (1д получается из (Ла и [х с помощью суперпозиции \^в{х)^ = (iAtlx(-^)l. Такая операция Г\/^а корректна, так как для функций принадлежности областью определения и областью значений является отрезок [О, 1]. Легко проверить, что при любом из двух возможных способов определения функций принадлежности для квантификаторов всегда и никогда в случае суперпозиции выполнены наши два требования. Пусть теперь р.^ и р. — произвольные функции, соответствующие каким-то значениям квантификаторов частоты. На рис. 3.23 показаны две одногорбые кривые, отвечающие этим функциям. Результат их суперпозиции — двугорбая кривая, показанная штриховой линией. Каков ее смысл? Если, например, (Лл есть редко, ар. — часто. Рис. 3.23 ^) Он предложен И. В. Ежковой.
144 ГЛ. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ 0,1 0,г 0,3 0,^ 0,5 0,6 0,7 0,8 0,9 I X Рис. 3.24 то максимумы их суперпозиции характеризуют те значения из отрезка [О, и, которые редко встречаются в нечетком подмножестве функции принадлежности часто. Если же, например, и |.i отвечают квантификатору часто, то максимумы соответствуют тем значениям, которые часто встречаются в нечетком подмножестве функции принадлежности часто. Поскольку >| характеризует множество возможных значений частоты появления факта В, обусловленных всевозлюжными значениями частоты появления факта Л, то суперпозиция выделяет из этого множества лишь те значения частоты появления факта В, принадлежность которых этому лшожеству характеризуется квантификатором ^j^. Иными словами, оценка, задаваемая квантификатором выделяет из множества значений, выделяемых квантификатором ^, те значения, которые встречались в множестве, характеризуемом >|, с частотой, характеризуемой Такая интерпретация операции суперпозиции является достаточно «человеческой», что может служить аргументом в пользу принятия подобного способа определения функции F. Единственный недостаток предлагаемого подхода к определению функции F состоит в том, что суперпозиция порождает функции принадлежности, число горбов в которых может при повторном применении этой операции возрастать. Но, как мы показали еще в § 2.11, а затем и в § 3.6, функции принадлежности, соответствующие различным квантификаторам, которыми пользуются люди, либо монотонны на отрезке [О, 1], либо унимодальны. Появление многогорбых функций делает словесную интерпретацию результатов достаточно сложной. В естественном языке просто нельзя найти соответствующих им лексем или сочетаний лексем. Однако это не так уж и страшно, если все результаты, связанные с оценкой >|д при многошаговом выводе с помощью нечетких схем вывода, будут лишь внутрисистемными. При выдаче окончательного результата пользователю системы или для принятия решений по управлению можно использовать специальную процедуру «аппроксимации»- лшогогорбых функций теми же словами, которылш характеризуются исходные частотные квантификаторы с некоторыми словесными добавками (например, близко и часто или между редко и не редко, не часто). Пример 3.28. Вернемся к примеру 3.27. На рис. 3.24 показан в виде штрих-пунктирной кривой результат суперпозиции двух функций принадлежности, соответствующих тем квантификаторам, которые имеются в этом примере. С помощью уровня отсечки со значением 0,7 получены нечеткие интервалы на оси абсцисс. Теперь мы люжем сказать, что диспетчер должен ожидать изменения плана
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 145 погрузки С уверенностью не менее 0,7 со значениями внутри интервалов (0,62; 0,67) и (0,95; 1). Если же взять уровень отсечки, равный единице, то диспетчер может ожидать изменения плана на интервалах (0,6; 0,7) и (0,9; 1) с теми показателями уверенности, которые задаются функцией [Iq, И в том, и в другом случае мы получаем, что при наличии факта (сведений) о начале швартовки судна «А. Пушкин» опытный диспетчер, начинающий готовиться (по крайней мере морально) к изменению плана погрузки, поступает разумно. Мы рассмотрели лишь простейший случай правила вывода в случае нечетких частотных кванторов. В литературе по этой проблеме, указанной в комментарии к настоящей главе, сформулированы требования к построению >|д в случае наличия п посылок Л^-, из которых следует утверждение В (зависимых между собой или независимых в смысле влияния на появление друг друга), а также получение оценок типа х в.в^^ли ^b.vb^^ когда из группы посылок выводится конъюнкция двух фактов или их дизъюнкция. Рассмотрение таких достаточно громоздких конструкций выходит за рамки данной книги. Другой способ определения функции F, отличный от способа суперпозиции, состоит в том, что при применении какого-либо квантификатора к другому квантификатору происходит некое монотонное преобразование исходной функции принадлежности, сводящееся к растяжению и сдвигу максимума функции в ту или другую сторону. Преимущество такого способа определения F состоит в том, что при монотонных преобразованиях вид функции принадлежности меняется не кардинально. Ее унимодальность или монотонность сохраняется, и переход от нового вида функции к словесной оценке, соответствующей некоторому квантификатору, происходит куда проще, чем от многогорбых функций, возникающих в результате операции суперпозиции. Пример 3.29. На рис. 3.25 показаны два результата, полученные с помощью суперпозиции и сдвига с растяжением, для случая, когда >|а и >| соответствуют квантификатору часто. Разница состоит, по-видимому, в том, что суперпозиция вычленяет в функции принадлежности часто те значения, которые часто встречаются. В случае же сдвига и растяжения мы можем интерпретировать результат как появление нового квантификатора со значением часто- часто, который можно при желании аппроксимировать, например, значением очень часто. Недостаток второго подхода к определению вида функции F заключается в том, что ни сдвиг функции принадлежности для >|, ни характер ее растяжения, определяемые функцией принадлежности, соответствующей >|а, никак не определены. Нужны какие- то специальные соображения по поводу этих параметров. Но в настоящее время такие соображения отсутствуют.
146 ГЛ. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Рис. 3.25 в заключение настоящего параграфа рассмотрим некоторый новый подход к получению нечетких выводов, успешно развиваемый в последнее время С. В. Чесноковым. Приводимые ниже результаты, возможно, за исключением их интерпретации, заимствованы из работ этого автора, указанных в списке литературы к данной главе. На рис. 3.26 показана некоторая ситуация, исходя из которой можно утверждать, что некоторые щ суть Ь, где i = l, 2, п. Рассмотрим запись вида а^и^б, которую мы будем называть детерминацией. Введем два важных понятия. Точностью детерминации будем называть величину условной вероятности P{blai). Полнотой детерминации aiv^b будем называть величину условной вероятности Р {ajb). Если точность детерминации оценивает степень уверенности в том, что появление некоторого элемента из А ведет к появлению 6, то полнота детерминации оценивает верность утверждения о том, что появление b свидетельствует о наличии хотя бы одного элемента из А. Далее мы всюду будем вместо множества причин, стоящих в левой части детерминации, рассматривать только одну причину, которую и будем обозначать через а. Пример 3.30. Пусть, например, на основании некоторых наблюдений получена табл. 3.9. Каждая ее клетка в соответствии с определением точности и полноты детерминации, которые мы будем соответственно обозначать буквами / и С, позволяет определить эти характеристики детерми- лации. Для нашего примера имеем Рис. 3.26
§ 3.7. КАУЗАЛЬНАЯ ЛОГИКА 147 Для обратной детерминации Ь\^а точность и полнота получаются перестановкой значений точности и полноты для прялюй детерминации. Другими словами: /(feh^a)=0,4, а C{b\^a)=OJ, Таблица 3.9 Таблица 3.10 Есть а Нет а Есть b Нет b 60 140 590 210 Есть а Нет а Есть b Нет b 100 100 100 100 Таблица 3.11 Таблица 3.12 Есть ас Есть ас Есть ас Есть' ас Есть b Нет b 100 0 40 60 0 100 60 40 Есть с Нет с Есть b Нет b 140 60 60 140 Пример 3.31. Пусть а означает наличие в данном месте известняка, с — наличие карстовых воронок и пещер в том же месте, 6 — наличие подземных рек и озер. Отрицание этих пропозициональных переменных соответствует отсутствию соответствующего явления. Рассмотрим табл. 3.10—3.12. Что показывают эти таблицы? Табл. 3.10 показывает, что на основании некоторой статистики, отраженной в ней, можно утверждать, что в половине случаев в тех местах, где имеется известняк, имеются подземные реки и озера. Табл. 3.11 говорит о том, что при наличии в известняке карстовых явлений всегда есть уверенность в существовании в этом месте подземных рек и озер. Даже в том случае, когда карстовые явления (более точно, их аналоги) имеются не на чистом известняке, то в 40 случаях из 400 есть и подземные реки и озера. Однако в известняковом слое, в котором не обнаружено карстовых являений, подземные реки и озера искать бесполезно. Вот если их нет в тех местах, где вместо известняка наблюдаются другие породы, то в 40 случаях из 400 можно дать положительный ответ и на вопрос о наличии здесь подземных рук и озер. Как следует из этих таблиц, /(ah^fe)=0,5, а 1{ас\^Ь) = 1. Таким образом, наличие карстовых явлений для известняковых пород уточняет детерминацию, с помощью которой утверждается наличие в данном месте, подземных рек или озер. Если рассмотреть ach^b, то, как следует из табл. 3.11, точность ухудшается до нуля. Поэтому
148 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ дополнительная конъюнктивная посылка в детерминации может как увеличивать ее точность, так и уменьшать ее. Аналогичным образом можно рассмотреть и случай, когда при переходе от а кЬ используется не конъюнкция, а дизъюнкция, т. е. осуществляется переход к детерминации вида {а\/с)\^Ь. Интуитивно ясно, что детерминации тесно связаны с нечеткими выводами, когда квантификаторы частоты оцениваются статистическими вероятностями. Это действительно так. Мы проиллюстрируем их связь на примере обобщения понятия силлогизма, являющегося классическим объектом в логике. Как известно, Аристотель предложил 19 основных модусов силлогизмов, которые дают всегда верные результаты. Кроме того, имеется еще пять модусов, которые представляют собой ослабленные основные модусы. Например, для модуса (все а суть 6; все 6 суть с)=:>(все а суть с) ослабленный модус имеет вид (все а суть Ь)\ (все b суть с)=^(некоторые а суть с). Остальные модусы четырех возможных фигур Аристотеля, кроме этих 24, не являются в строгом смысле истинными. Детерминации позволяют расширить множество модусов, оперирование которыми становится возможным за счет введения в них частотных квантификаторов. Пусть мы имеем детерминации а\-^Ь и Ь\-^с. Эти детерминации характеризуются своими точностями и полнотой. Обозначим их для простоты записи следующим образом: / {a\-^b)=i g L^; C{a\-^b)^ =k^M^\ I{b^c) = leL^\C{b^c)=m^M^. Здесь L\ M\ и M^ — какие-то конкретные значения интервалов из отрезка [О, 1]. Нас будет интересовать, что можно сказать при известных 1, k, 1 и т о точности и полноте детерминации с\-^а. Эти характеристики детерминации с ь^а будем обозначать соответственно как г и s, а интервалы, в которых лежат эти значения,— как и М^. Если вернуться к рассмотрению силлогизмов Аристотеля и взять тот модус, который мы только что рассмотрели, то для него L^ = =L^=L^=^l. Относительно Л1\ и ничего сказать нельзя. •Они могут быть любыми интервалами в полуинтервале (0,1]. Таблица 3.13 а Х2 •^'4 а Хб b ъ b ь с с
§3.7. КАУЗАЛЬНАЯ ЛОГИКЛ 149 ^ Xi + X2 + Xb + Xf • Аналогично определяются и остальные характеристики детерминаций, образующих силлогизм. Поставим теперь перед собой задачу поиска силлогизмов, в которых участвовали бы частотные квантификаторы, и пусть последние соответствуют соотношениям, связанным с точностью и полнотой детерминаций, входящих в силлогизм. Пример 3.32. В качестве примера такого силлогизма рассмотрим рассуждение Среди водителей автобусов мало нарушителей уличного движения Среди женщин мало нарушителей движения Почти все водители автобуса — женщины. По-видимому, читатели не согласятся с верностью полученного вывода. Но если предположить, что эти рассуждения относятся к военному времени, то в ситуации, когда класс водителей автобусов почти включался в класс женщин, такое утверждение могло бы оказаться верным. Значит, все дело в том, как связаны друг с другом эти классы, что определяется введенными нами характеристиками детерминаций, образующих модус силлогизма. Задачу построения силлогизмов, удовлетворяющих некоторым заранее заданным требованиям, учитывающим их обоснованность, можно сформулировать во вполне строгой форме. Вернемся к табл. 3.13. Будем считать Xt неизвестными. Выпишем набор ограничений, которым эти неизвестные должны удовлетворять. Первое ограничение тривиально: (1) х,+Х2 + Хз + х, + х,-гх, + х, + х^=\. Следующие шесть ограничений, которые можно назвать ограничениями на «контекст» силлогизма, вытекают из того, что частоты, с которыми встречаются а, b и с, должны лежать в некоторых заданных пределах: (2,3) 0<g,^x, + x, + x,^x,^h,^\, (4, 5) 0<йг^<х, + л:з + х,+д:,</1^<1, (6, 7) О < < X, + X, + X, Ч- -v'e < Л, < 1. И, наконец, имеется еще восемь ограничений, связанных с требованиями удовлетворения определенным ограничениям точности Введенные нами характеристики трех детерминаций, определяющих силлогизм, вычисляются по стандартным формулам на основании табл. 3.13. В соответствии с этой таблицей величина /, например, равна Xi + Xs
150 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ ' Xi + X2 + X3 + X^' Тогда при заданных ограничениях и таких Xt, что все 15 ограничений удовлетворяются, можно утверждать, что точность и полнота детерминации ска, которые мы можем обозначить через г и удовлетворяют ограничениям Го<г^Г1 и So^s^Si. Решение сформулированной задачи можно свести к задаче дробно-линейного программирования. Результатом ее решения будет нахождение таких областей в пространстве Xi, в которых будет реализовываться вывод с помощью силлогизма с заданными фиксированными значениями квантификаторов. Для этого только еще нужно сопоставить словесным оценкам этих квантификаторов некоторые отрезки или интервалы на отрезке [О, 1]. Нашу постановку задачи можно упростить. Так как из ограничений 2, 4, 6 следует строгая положительность знаменателей в ограничениях 8—15, то все ограничения можно переписать в линейной форме. Кроме того, если еще учесть, что Р{uv)=^Р{u/v)P(v) и перейти от условных частот к частотам Р{аЬ), Р{ас) и Р{сЬ), то и целевые функции в нашей задаче можно выразить в линейной форме (для этого нужно будет изменить значение ограничений). Тогда задача поиска обобщенного (детерминационного) силлогизма будет сведена к стандартной задаче линейного программирования. Для качественного анализа того, что получается при решении подобной задачи, рассмотрим случай, когда нас инетересует лишь точность соответствующих детерминаций. Кроме того, предположим, и ПОЛНОТЫ детерминаций, входящих в посылки силлогизма. («■9) (12, 13) /о< </i, (14, 15) то<— Ограничения (8,9) и (10, 11) задают условия, налагаемые на точность И полноту детерминации ан^б, а остальные ограничения — на точность И полноту детерминации Ь\-^с. Четырнадцать параметров в этих ограничениях (верхние и нижние границы в неравенствах) дают весьма широкие возможности. Их задание определяет вид тех частотных квантификаторов, которые используются в посылках силлогизма. Нас же интересуют значения четырех ограничений для точности и полноты детерминации с\^а^ которая является заключением силлогизма г < ^1 + ^2 ^ ^'^х, + х, + х, + х,^'^'^
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 151 ЧТО имеют место следующие однородные ограничения на точности детерминаций (они обозначены соответствующими условными вероятностями) и на контекст силлогизма: у.<Я(Ь/аХ1, X < Я (с/Ь) < 1, 0<v<P(aXl, О < V < Р (ЬХ 1, 0<v<P(cXl, где X и V — неизвестные пока ограничения на частоты. С учетом этих неравенств и равенства (1) можно свести исходную задачу к задаче вида: найти Xi, лгз, х^, х^, х^, х^, х^ и х^, которые удовлетворяют ограничению (1) и системе ограничений (1—X) a:i + X2 + (1—х) л:з + л',>0, (1—х)л:1 + л:з + (1—л:5 + х->0, ^1 + ^2 + ^'з + ^'4>^. a:i + a:3 + x.+a:,>v, Xi-fA:2 + A:5 + ^e>v. Кроме того, все Xi должны быть равны или больше нуля (это условие вместе с соотношением (1) гарантирует выполнение верхних ограничений для всех пяти вероятностей), а Р{с1о) должно лежать в заданных пределах [б, 1]. Если найти решение поставленной задачи, считая х и v некоторыми параметрами, то оно будет иметь вид, различный для трех областей, на которые разбивается единичный квадрат, задаваемый соотношениями O^x^l и 0<v^l: 6 = О для области 2 — 1/v для области 2, 1—(1—x)(x+l/v) для области 5. Перенумерованные области показаны на рис. 3.27. Их границы определяются следующими соотношениями: Область I Область 2 Оотасть 3 Г v<0,5 1-х ; f V > 0,5 v< 1+х- X 1+х —Х2 1—X
152 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Рассмотрим эти области В области / выполняется неравенство 0<Р(с/аХ1. Оно тавтологично, так как выполняется всегда и никак не зависит от точности детерминаций, образующих посылки. Для этого достаточно лишь факта существования самой частоты Р{с1а), что в нашем квадрате всегда имеет место. Значит, область 1 нам ничего интересного не дает. В области 2 выполняется неравенство 2— l/v<P(c/a)<l. Рассмотрим лишь те свойства, которые мы обозначили через аи Cj г про b не будем иметь никакой информации. Тогда неравенство для Р{с/а) в данной области все равно будет иметь место только потому, что для Р{а) и Р{с) величина v превышает 0,5. Таким образом, область 2, хотя и не тавтологична, как область но не содержит собственно силлогизмов. Утверждения из этой области можно было бы назвать, например, тривиальными истинами. Для области 3 выполняется неравенство 1 —(1 —к) (к +1 /v)< Р {с/а) < 1. Наличие к в данном неравенстве связывает точность заключительной детерминации с точностями детерминаций, входящих в посылки. Это область обобщенных силлогизмов. Если, например, то Р{Ь/а) = \, Р{с1Ь)=\ и Р{с1а)=\, Мы получаем известный аристотелевский силлогизм, называемый обычно Barbara, Интересно, что при х=1 оказываются незначимыми значения v, т. е. характер контекста силлогизма. Это означает, что то условие v=2, которое всегда подразумевается в классическом истолковании силлогизмов Аристотеля, не является обязательным для модусов типа Barbara. Если отказаться от одинаковости ограничений v в контексте, то можно получать и другие расширения силлогизмов. Отметим, что значение v легко связывается с квантификаторами оценки частоты типа часто, очень часто, почти всегда, А если правые ограничения в контексте также сделать различными и отличными от единицы, то контекст будет определять частотные квантификаторы, с которыми входят в схему вывода посылки силлогизма. Пример 3.33. Пусть 0<х<е и 0<v<e, где е — малое число. Тогда, согласно Аристотелю, такие параметры будут давать ложные силлогизмы. На рис. 3.28 показаны области, построенные в квадрате (х, V), аналогичные приведенным на рис. 3.27. Область / есть область ложности силлогизма. Область 2, показанная жирной линией, есть область тривиальной истины, подобная области 2 на рис. 3.27. 1) Штриховка показывает открытую границу,
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 153 В областях 3 и 4 силлогизм существует, а в области 5 не существует. Открытые границы областей показаны штриховкой. Вот пример силлогизма, содержащегося в области существования силлогизма, показанной на рис. 3.28. Среди любителей сигар редко встречаются женщины Среди женщин редко встречаются политические деятели Среди любителей сигар политические деятели встречаются нередко В заключение остановимся еще на одном классе правил вывода нечеткого типа. Такие правила, по-видимому, не имеют прямого отношения именно к каузальной логике, но по своей идеологии они тесно связаны с рассмотренными нами здесь правилами. Эта группа правил связана с рассуждениями по аяа- лог/^/^, играющими огромную роль для человека и находящими широкое применение при полуформальном объяснении технологии управления и способов принятия решений в условиях альтернативного выбора. Прежде всего возникает вопрос о том, что именно следует считать аналогией . Рассмотрим следующий примере). Пример 3.34. Пусть имеются два текста, описывающих две ситуации. Первый текст: «Ромео любит Джульетту. Джульетта любит Ромео. Ромео — мужчина. Он итальянец. Джульетта — женщина. Она красива. Она незамужняя». Второй текст: «Тристан любит Изольду. Тристан — мужчина. Он бретонец. Изольда — женщина. Она красива. Она замужем за королем Марком». На рис. 3.29 показаны графы, соответствующие приведенным текстам. Из самих текстов и из рис. 3.29 вытекает (с точки зрения человеческой интуиции), что между обеими ситуациями много общего. Но в чем это проявляется? Что важно в описаниях для установления аналогии и что не столь уж важно? Важно ли то, что Ромео и Тристан мужчины? Играет ли роль их национальность? Весомо ли различие в том, что у Изольды есть муж, а у Джульетты его нет? Ответы на эти вопросы зависят от того, как будет определено само понятие аналогии. В настоящий момент все исследователи согласны, что одной из моделей, которые могут использоваться при выявлении сути рассуждений по аналогии и построении соответствующих правил вывода. 0.5 Рис. 3.28 1) Этот пример был рассмотрен в докладе А. Фарренн и А. Праде на Европейской конференции по искусственному интеллекту, проходившей в Орсее в 1982 г.
154 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИЙ может служить введенный еще Лейбницем предикат аналогии. Этот предикат описывается диаграммой, весьма похожей на диаграмму моделирования, о которой упоминалось в §2.11: А' в' Рассмотрим класс объектов X, в котором реализуется вывод из объекта А в объект А\ другой класс объектов где реализуется вывод из объекта В в объект В\ и пусть, наконец, между объектами, входящими в X и установлено некое соответствие (например, существует взаимно однозначное соответствие между X и F). Тогда, Мужчина Женщищ 'Итальянец Незамужняя Мужчина Женш,ина Люди/г? If. му>на оретомец *^ Рис. 3.29 если согласно этому соответствию А отображается в В, то должно выполняться требование коммутативности диаграммы. Другими словами, должно существовать отображение W, которое устроено так, что В'ютображается в тот же элемент А\ который выводится с помощью 7 из Л, если В' получен за счет вывода Q из В. Напомним, что и для диаграммы моделирования требование коммутативности было необходимым. И такое совпадение не случайно. Как приведенная нами диаграмма, иллюстрирующая суть аналогии по Лейбницу, так и диаграмма, характеризующая отношение моделирования, по сути одинаковы. Введение нечеткого отношения моделирования
§3.7. КАУЗАЛЬНАЯ ЛОГИКА 155 есть один из возможных способов введения аналогий. Но их можно вводить и без аппарата функций принадлежности, оставаясь в рамках обычных алгебраических систем. Эта возможность иллюстрируется следующим простым примером i). Пример 3.35. На рис. 3.30 показаны три элемента Л, Л' и В, которые входят в диаграмму для предиката аналогии. Возникает вопрос, какая картинка должна стоять на месте В' для сохранения коммутативности диаграммы? Для ответа на него необходимо построить отображения V и W. Но прежде чем делать это, необходимо описать сами картинки, выбрав подходящий язык. Для нас естественно выбрать в качестве такого языка язык ситуационного управления, описанный в гл. 2. Позаимствовав из табл. 2.1 обозначения для отношений, введем следующие обозначения: — маленький незакрашенный кружок, аа — большой кружок, аз — прямоугольник, fei —крестик, fea — треугольник, — маленький черненький кружок, г^о — быть сверху, — быть снизу, г^з — находиться в. Опишем в этих терминах картинки, соответствующие А, Л' и В. Л': (a3^43a2)(a2^4iai); В: {Ь.гМФггМ- Введем теперь соответствие V; зададим его как изоморфизм: ai<->fei, a2<r^b2, аз<->^з' Так как мы установили отношение изоморфизма, то вместе с V однозначно определено и W, Тогда для перехода от описания Л' к описанию В' достаточно произвести нужную замену, вытекающую из заданного изоморфизма. Проделав это, получим В': (йз^зйг) (^2^1^!). Такому описанию соответствует картинка, показанная в правом нижнем углу на рис. 3.30. Она и должна быть помещена в качестве В' в основной рисунок. д 1 /+\ > ? 1 • 1 11 + А Рис. 3.30 1) Этот пример приводится в докладе Д. Пётчке, представленном в материалах той же Европейской конференции по искусственному интеллекту, проходившей в Орсее в 1982 г.
156 гл. 3. ПОПОЛНЕНИЕ ОПИСАНИИ СИТУАЦИИ §3.8. Неполнота и «абсурдность» знаний Проблему противоречивости знаний, хранящихся в системе управления, мы уже затрагивали в § 1.6. При работе системы пополнения знаний, особенно при использовании правил вывода, которые не имеют абсолютного характера истинности получаемых утверждений, появление в памяти системы управления противоречивых описаний объекта управления протекающих в нем процессов или самой Сделаем несколько важных замечаний. Процедура установления соответствий V п W зависит от выбранного способа описаний Л, Л' и Б. Представим себе, например, что Л' описано не так, как мы сделали, а в следующем виде: А': {а1Г^оа2){с1зГ^з^2)- Тогда сравнительный анализ описаний не дает возможности найти какой-либо гомоморфизм между тремя заданными описаниями. В качестве второго замечания укажем на то, что для описания нужно выбирать такие отношения, для которых существовали бы правила вывода, переводящие комбинации одних отношений в комбинации других отношений. В нашем случае это оказалось возможным из-за наличия правила вывода, относящегося к пространственной логике взаимного расположения предметов, которое имеет вид И последнее замечание. Если Т и V установлены и являются отношениями изоморфизма, то Q и всегда существуют и также являются отношениями изоморфизма. Анализ приведенного примера и высказанные после него замечания показывают, что на пути практического использования правил, отражающих рассуждения по аналогии, имеются пока большие трудности. Особенно это касается выбора подходящего языка описания множеств объектов, входящих в диаграмму аналогии, и разработки мощных средств преобразований описаний друг в друга. В гл. 4 мы еще раз вернемся к правилам рассуждений по аналогии в связи с описанием специального метода, позволяющего генерировать гипотезы о наличии или отсутствии причршно-следственных связей между.явлениями и распространять эти гипотезы на ранее неизвестные случаи. Завершая параграф, посвященный каузальным логикам, надо отметить, что по сравнению с временными и пространственными логиками эти логики пока еще разработаны весьма поверхностно. Требуются еще большие усилия для их завершения. Особенно мало сделано в области анализа взаимного влияния выводов в каузальных логиках на выводы во временной и пространственной логиках (на рис. З.П эти. связи отмечены прямыми стрелками, идущими между соответствующими логиками), а также в области влияния каузальных логик на принятие решений в логиках действий. Об этом последнем влгшнни мы еще поговорим в последующих главах, где будут обсуждаться логики действий.
§3.8. НЕПОЛНОТА И сАБСУРДНОСТЬ» ЗНАНИЙ 157" процедуры управлер1ия не столь уж маловероятно. Поэтому здесь мы обсудим некоторые из причин появления «абсурдных» знаний и методы их устранения. Источник неприятностей, которые могут возникнуть в памяти системы^ кроется в неполноте информации, хранящейся в базе знаний. Если в базе отсутствует некая информация, то совершенно неясно, является ли отсутствующий факт истинным (и, например, противоречащим какому-либо факту, который уже имеется в памяти) или ложным. В силу неполноты заполнения памяти отсутствие в ней какого-либо утверждения ничего не говорит об его истинности или ложности, возможности или невозможности его появления в памяти. В известной логической системе средневековой Индии Навья-ньяя различаются четыре вида отсутствия: отсутствие из-за непоявления этого до настоящего момента времени, отсутствие- чего-либо, так как к настоящему моменту времени оно уже исчезло, отсутствие- в силу невозможности появления этого никогда ни в прошлом, ни в настоящем и отсутствие из-за того, что в настоящий момент присутствует нечто, с чем несовместимо появление интересующего нас. Все четыре вида отсутствия в Навье-ньяя. строго различаются; и оперирование с ними происходит различным образом. Нечто подобное наблюдается и в современных базах знаний как в семиотических: системах управления, так и в других интеллектуальных системах, опирающихся в своей работе на базу знаний. Поэтому мы здесь попробуем обсудить некоторые фрагменты еще не созданной теории работы с неполными базами знаний. Начнем с того, что неполнота, о которой идет речь, многолика. Существует несколько видов неполноты, по-разному сказывающихся на возможности появления противоречивой информации в памяти системы. Во-первых, значения данных, начиная с числовых, могут быть точно не определены. Вместо точного значения q, о котором известно, что оно принимает некоторое числовое значение, в памяти системы имеется лишь указание на некий интервал, в котором находится это значение. Пусть, например, мы имеем q, значение которого фиксировано где-то в интервале (О, 10) и g, значение которого фиксировано где-то в интервале (5, 12).. И пусть нам известно, что g<q> Тогда информация, хранимая в памяти системы, в некотором смысле противоречива, так как при значениях g из интервала (10, 12) будет нарушаться условие g<q> Для устранения этого противоречия можно произвести уточнение информации для g и считать, что g приписывается значение из интервала (5, 10), а q — значение также из интервала (5, 10). С такими интервальными значениями можно совершать все необходимые операции. В настоящее время арифметика, работающая с интервальными представлениями, хорошо развита. Две такие системы описаны в работах, указанных в комментарии к данной главе. Можно предполагать, что конкретные значения, которые на самом деле соответствуют q, не просто фиксированы где-то на интервале (а, Ь), а имеется дополнительная информация о выборе истинного значения q на этом интервале. Такая информация может иметь характер вероятностного распределения для поиска истинного значения или задаваться, например, в виде функции принадлежности того типа, который мы ввели в § 2.11 и уже неоднократно использовали. В подобных случаях также могут возникать противоречивые ситуации, связанные, например, с несовместимостью таких утверждений; «С вероятностью, большей 0,99, значение q находится в интервале (О, 1)» и «С вероятностью, большей 0,95, значение q находится в интервале (10, 60)». Арифметика таких интервальных величин развита чрезвычайно слабо и еще ждет своих исследователей. Таким же образом можно определить неопределенное множество, неопределенную переменную, неопределенный предикат и неопределенное отношение. Несколько сложнее вводится понятие неопределенной функции. Весь этот набор не-объек- тов требует создания для оперирования с ним специального математического аппарата. Только в этом случае появляется надежда справиться с теорией баз знаний, в которых представлены неопределенные объекты. В рамках этой теории должны быть, в частности, разработаны методы уточнения границ интервалов и описания множеств, предикатов, отношений и функций, которые позволили бы системе максимально устранять в содержимом памяти возможные в будущем противоречия из-за поступления новой информации.
i5S гл. 3. ПОПОЛНЕНИЕ ОПИСАНИЙ СИТУАЦИЙ Другим видом некорректности, грозящим «спокойствию» содержимого базы знаний, является так называемая переопределенность. При переопределенности одним и тем же интервальным константам, переменным и прочим не-объектам приписываются одновременно и с равным основанием противоречащие друг другу значения. Например, некоторой пропозициональной переменной одновременно приписывается значение истины и лжи. Для работы с подобными переопределенными (абсурдными) объектами также строятся специальные процедуры. Примером такой процедуры может служить четырехзначная логика, в которой каждой пропозициональной переменной приписывается одно из четырех значений: истина, ложь, полная неопределенность и истина —ложь (абсурд). В последние годы исследования в области логик такого типа активно развиваются, и есть надежда, что в ближайшем будущем необходимый аппарат будет создан. В заключение настоящего параграфа напомним о том, о чем уже говорилось в § 1.6. В ряде случаев противоречащие друг другу утверждения возникают в памяти системы и из-за того, что для каждого достаточно жизненного (не чисто математического) понятия всегда возможно его рассмотрение в различных аспектах или различных возможных мирах. И это противоречие устраняется фиксацией того аспекта или мира, к которому данный объект относится.
ГЛАВА 4 ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Интервью с пожарником в консерватории: — Вы проработали здесь 20 лет и теперь, наверное, хорошо знаете разницу между контрабасом и скрипкой? — Конечно. Контрабас горит значительно дольше. Из музыкального фольклора- §4.1. Суть проблемы Вернемся на минуту к рис. 1.7, на котором мы привели общую схему, характерную для систем ситуационного управления; центральной ее частью был КЛАССИФИКАТОР. С его помощью решается основная задача — получение классов ситуаций, каждый из которых однозначно или с определенными приоритетами соответствует тем или иным решениям по управлению. Отсюда становится очевидной важная роль процесса обобщения описаний и их классификации. На первый взгляд может показаться, что подобная проблема активно решается в других науках, например, в теории распознавания образов или в кластерном анализе. Это так и не так. Конечно, многие методы, развитые в данных разделах дискретной математики, используются (и не безуспешно) и здесь. Но кардинальное отличие проблемы обобщения и классификации в ситуационном управлении и вообще в семиотических моделях состоит в том, что, кроме самой задачи формирования обобщенных понятий и классификации по множеству заданных признаков, требуется еще решать задачу определения прагматически важных признаков, которая, как правило, заменяется в теории распознавания образов поиском информативных признаков. Различие в этих подходах можно проиллюстрировать цитатой ^) «...можно увидеть в логарифмической линейке предмет для забивания гвоздей. Логарифмической линейкой можно забить гвоздь, в ней есть протяженность и известная масса. Но это тот самый вариант, при котором видишь десятую, двадцатую функцию предмета, между тем как с помощью линейки можно считать, а не только забивать гвозди». Можно сформировать много различных понятий, которые будут опираться на четкие логические соображения, но они не будут играть никакой роли при решении задачи управления. Ведь недаром среди специалистов, занимающихся диагностикой психических заболеваний, бытует такое определение «Он рассуждает абсолютно логично, но неверно». Что это значит? Хорошо известен тест, с ^) С е м е н о в Ю. Семнадцать мгновений весны.— Баку, 1981, с. 17.
160 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП 1) Асмус В. Ф. Логика.—М., 1947, с. 70. ПОМОЩЬЮ которого проверяется способность к «правильной» классификации. Из заданных на карточках изображений предметов надо сформировать некоторые группы — классы. В этой задаче проверяются те основания, которые будет использовать человек при образовании понятий. Классическим примером является тот, в котором испытуемьи"! в один класс объединяет изображения человека, дерева, карандаша, а в другой — изображения шкафа, водосточной трубы и надувного шара. На вопрос о причинах такой классификации испытуемый отвечает, что он выбрал информативный признак — наличие пустоты внутри объекта. Такая классификация, конечно, логически безупречна. Но ее ли Мы априорно ожидали, начиная испытания? Очевидно, нет. Итак, первая особенность задач формирования понятий и классификации в ситуационном управлении — поиск прагматических признаков классификации, способных обеспечить нахождение таких обобщенных описаний ситуаций, которые позволяли бы успешно решать задачу поиска решения по управлению объектом. В традиционной теории распознавания образов и в кластерном анализе центральную роль играет понятие признака. Именно признаки выступают в качестве параметров, на основании которых происходит выделение обобщенных понятий и строится та или иная классификация. В языках описания ситуаций, типичных для всех методов управления, опирающихся на семиотические модели, огромную роль играют не признаки, а структуры отношений между объектами. Во многих случаях, конечно, комплексы отношений можно было бы рассматривать как своеобразные признаки. Поэтому мешают два обстоятельства. Прежде всего, отметим резкое возрастание числа признаков, так как число возможных комплексов отношений стремительно возрастает с ростом числа отношений и увеличением их типового разнообразия, а большинство их комбинаций не имеет никакого значения для решения задачи обобщения. Кроме того, признаки приписываются определенным объектам и использование комплексов отношений в качестве признаков приведет к необходимости введения огромного числа лишних объектов. Понятия, связанные с этими объектами, также будут лишними, ибо «понятие, которое мы не можем развернуть в суждение, не имеет для нас никакого логического смысла». ^) И, наконец, зачастую практически невозможно вычленить тот признак, который используется для формирования понятия. Примерами таких псевдопонятий (в рамках призначного подхода) могут служить: ручка управления, нос корабля, очередь на обслуживание и т. п. Вторая особенность задачи формирования понятий и обобщения ситуаций в рассматриваемой области — наличие процедур обобщения, основанных яа структуре отношений, присутствующей в описании ситуаций.
§4.1. СУТЬ проблемы 161 И, наконец, третья особенность обсуждаемых процедур, характерных для всех систем, работающих со знаниями,— возможность работы с именами, присваиваемыми отдельным понятиям и ситуациям. Имена—это, конечно, не признаки. Во всяком случае, это признаки особого рода. И использование их при классификации отличает описываемый подход от традиционных процедур. Для человека в его модели мира имена, по-видимому, играют особую роль. Как писал В. Катаев, «Я заметил, что человека втрое больше мучает вид предмета, если он не знает его названия. Давать имя окружающим вещам — быть может, это одно и отличает человека от другого существа. Но у меня нет такого запаса слов, чтобы назвать миллионы существ, понятий, вещей, окружающих меня. Это мучит. Но еще большее мучение, вероятно, испытывает вещь, лишенная имени: ее существование неполноценно. Сонмы неназванных предметов терзаются вокруг меня и в свою очередь терзают меня самого страшным сознанием того, что я не бог. Не имеющие имен вещи и понятия стоят в стеклянных шкафах вечности, как новенькие золоченые игуры еще не воплотившихся будд в темных приделах храма... ни ждут своего воплощения, а это может произойти лишь тогда, когда в мире появится какое-нибудь совершенно новое понятие, требующее пластического выражения» Эти три особенности задачи обобщения понятий и классификации заставляют разрабатывать специфические процедуры формирования понятий и их классификации, ориентированные на решение задач ситуационного управления и других методов управления аналогичного типа. Общая постановка этих задач в нашем случае имеет следующий вид (обозначения взяты из § 1.4). На множестве конкретных ситуаций {Qi} найти такое разбиение их на классы, при котором каждый класс имел бы в рамках данной модели управления некоторую «разумную» интерпретацию процесса управления ситуацией. На множестве полных ситуаций {Si} необходимо выделить такое множество классов S'\ что каждый из них допускал бы «разумную» интерпретацию для процедуры поиска решения по управлению объектом. В частности, классификация S' по некоторому основанию должна быть согласована с классификацией на множестве воздействий (управлений) {6^^}. Сделаем некоторые пояснения в связи с подобной постановкой задач. Как мы видим, задача разбивается на два этапа: обобщение текущих ситуаций и обобщение полных ситуаций. Такая этапность не обязательна. Но в большинстве практически интересных случаев она оправдана. Текущие ситуации связаны только с самим объектом управления, с особенностями протекающих в нем процессов. Поэтому классам Q'* отвечают обобщенные описания данного объекта. Они базируются на признаках и структурах отношений, характерных для объекта управления и важных для сжатия информации об ^) Катаев В. Трава забвения,— М.: Детская литература, 1967, с. 31. 6 д. а, поспелов
152 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП объекте и протекающих в нем процессов. Классы же формируются в основном на базе тех признаков и структур отношений, которые связаны с процессом управления объектом, они используют как априорные знания об объекте и методах управления им, так и реальную предысторию, накопленную в процессе функционирования системы управления. При постановке задачи обобщения для текущих ситуаций речь шла о поиске разбиения множества {Q^}. Другими словами, классы Q' удовлетворяли двум требованиям, обязательным для разбиений: Q'nQ^ = 0 если i^j и и —Q, где Q—полное множество всех текущих ситуаций. То или иное решение этой задачи всегда возможно. При решении же задачи об обобщении и классификации полных ситуаций, как правило, найти разбиение их множества на классы не удается. Это связано с тем, что для поиска классов S^ используется весьма неполная информация, получаемая от технологов-управленцев, имеющих по многим вопросам управления свое личное мнение, не совпадающее с мнениями других экспертов. Поэтому вместо разбиения {5^} на классы в этом случае решается задача о нахождении покрытия множества 5. При этом 5' П S^' не обязательно пусты при /=7^у, но и 5'=5. t И последнее пояснение. В процессе обобщения ситуаций St и появления классов ситуаций возникает естественная иерархия, определяемая вхождением одних классов в другие. Так как прагматическая классификация основана на стремлении так сформировать классы, чтобы облегчить поиск решения по управлению объектом, то иерархия классов полных ситуаций должна быть согласована с иерархией воздействий (управлений) следующим образом: если S'czS^' и для 5' характерны управления из множества U'\ а для 5^' — из множества t/^, то должно иметь место вхождение Ниже мы укажем пути решения поставленных задач. В ближайшем же параграфе мы сообщим некоторые сведения их психологии мышления, которые оказываются важными при решении задач формирования понятий и классификации в системах семиотического управления. § 4.2, Обобщение понятий и классификация у человека Здесь мы достаточно бегло и конспективно коснемся данных, накопленных в области психологии мышления и важных для решения проблем, обсуждаемых в данной главе. Прежде всего привлекают внимание современные представления о том, каким образом у ребенка возникают понятия, каким образом он из потока собственных ош,ущ,ений вычленяет тот или иной их комплекс, который впоследствии выступает для него как единое обобщенное целое, как понятие или типовая ситуация. Если суммировать эти представления, то они сводятся к следующему. В начальный период (так называемый период бормотания) ребенок, еще не овладевший словом, а вместе с тем и способностью к декомпозиции ощущений и представлений, воспри-
§ 4.2. ОБОБЩЕНИЕ ПОНЯТИЙ И КЛАССИФИКАЦИЯ У ЧЕЛОВЕКА 163 нимает конкретные ситуации в нерасчлененном виде. При этом зрите.1ьные, акустические и другие ощущения оказываются у него тесно связанными с данной ситуацией. Поэтому на первом этапе овладения языком именно звуковые образы начинают играть роль имени некоторого объекта (например, би-би для обозначения автомашины или кис-кис для кошки). Характерным примером важности «интонационного бормотания» для понимания ситуации могут служить многочисленные в последнее время мультфильмы для детей, герои которых не произносят никаких слов, а только интонационно бормочут «по-английски», «по-польски» или «по-русски». И тем не менее такое неязыковое бормотание вполне однозначно интерпретируется зрителями фильмов. В этот период ребенок объединяет в единые комплексы случайно оказавшиеся в ситуации факты и явления. Для него в роли понятий выступают такие конкретные ситуации, в которых как определяющие, так и случайные факторы оказываются равноправными. На следующем этапе формирования своей модели окружающего мира ребенок использует то, что психологи называют «псевдопонятиями». Эти образования в отличие от комплексов уже не случайны. Основную роль в них играют ассоциативные связи между отдельными явлениями и фактами, подкрепляемые той деятельностью, которую реализует ребенок в окружающей его среде. В этот период он уже овладевает морфологией и приобретает возможность разделять между собой объекты, процессы и явления (от би-би образует бибика, бибикать, бибиканье). Чуть позже возникает стремление к классификации накопленных знаний. В этот период, когда ребенок еще не может оперировать с абстрактными понятиями, а пользуется лишь понятиями-комплексами, состоящими из конечного числа включаемых в данное понятие его конкретных представителей, детская классификация конкретна. Отсюда возникают такие классифицирующие «определения» как «Собака — она меня вот сюда укусила» или «Завод — это где папа работает». Но в этом возрасте (4—6 лет) уже идет активное развитие способности к вычленению понятий-классов из окружающего мира. Конкретное уступает место общему. И если раньше на вопрос «Кто водит поезда?, ребенок отвечал «Машинист», а на вопрос «Кто ломает игрушки?» — «Петька», то теперь на второй вопрос он вполне может дать ответ «Ломатель». Если проследить, как ребенок структурирует окружающую его действительность, то можно выделить следующие этапы: нерасчлененные гештальты ситуаций, выделение и называние некоторых элементов таких ситуаций (присвоение им имен по KaKOi'i-нибудь составляющей данной ситуации), присвоение самостоятельного имени ситуации, присвоение имен отдельным объектам и фактам, образование понятий-комплексов, называние истинных понятий и формирование (как правило, четко не формулируемое) функций классификации, обеспечивающих отнесение тех или иных единичных с\'Щностей к тем или иным понятиям, вычленение признаков как самостоятельных атрибутов, связанных с понятиями, ситуативная классификация понятий, логическая классификация понятий. Многое из сказанного требует пояснений. Мы их дадим постепенно, использовав для этой цели не только наблюдения за развитием способности детей к классификации и образованию понятий, но и соответствующие наблюдения над взрослыми людьми. Прежде всего еще раз обратим внимание на то, что при формировании истинных понятий (которыми оперируют и взрослые люди) основания, служащие для их выделения, появляются генетически раньше возникновения четкого'осозна- ния признаков предметов, процессов и явлений как специальных, особых сущностей. Поэтому у взрослого человека, как и у ребенка, огромные трудности вызывает задача определения через призначную структуру тех понятий, которые носят для него само-собой разумеющийся характер (так называемые бытовые понятия в отличие от научных, вводимых с помощью строгих научных определений). В Одной из своих популярных книг известный специалист в области языка и культуры А. М. Кондратов приводит результаты эксперимента, который проводился со школьниками старших классов и взрослыми испытуемыми. Требовалось дать определение понятия, «дверь». Оказалось, что задача эта чрезвычайно трудна. Вот образцы полученных в ходе эксперимента ответов. — Дверь... На нее табличку можно повесить, дермантином обить, ручку красивую сделать.
164 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ — Ну, дверь... Это когда входить в квартиру. Она открывается. Еще запереть ее можно, чтобы не обокрали. — Дверь, она деревянная. Хотя не всегда — бывают и стеклянные двери, в гостиницах, например. Она поворачивается, дверь. Хотя есть и раздвижные — в купе поезда. При чтении таких «определений» хорошо всем известного класса предметов охватывает какое-то чувство неловкости за человека. Но не следует спешить с выводами об уровне развития тех, кто давал эти ответы. Попробуйте сами дать определения таких простых понятий, как «окно», «стол», «ложка» и многое другое А вот как понятие «дверь» определяется в «Кратком толковом словаре русского языка для иностранцев»: «Дверь — отверстие в стене для входа и выхода, а также то, чем закрывают это отверстие». Теперь трудность задачи очевидна. Ибо даже толковый словарь дает явно неточное определение (или толкование) понятия «дверь». Согласно ему, например, штора, закрывающая «отверстие в стене для входа и выхода», также является дверью. Итак, большинство понятий, с которыми оперируют люди в повседневной жизни, не имеют для них строго выделенной призначной структуры. Что же тогда служит для объединения конкретных сущностей в некоторый класс, которому присваивается специальное имя? Ответ на поставленный вопрос с виду несложен. В подавляющем большинстве случаев это объединение происходит по принципу одинаковой прагматической функции, реализуемой всеми сущностями, входящими в данный класс. В ответах по поводу двери у испытуемых несколько раз встречались попытки выявления этой функции. В толковом словаре сделана попытка также использовать для определения двери ее функциональное назначение. Поэтому столь часто встречаются определения типа «Стул — это на чем сидят», «Ложка — это то, чем едят кашу и жидкую пищр и т. п. Однако наряду с этим встречаются понятия, которые сформированы по другому принципу. Интересно, что классифицирующие возможности естественных языков отражают именно другую возможность выделения понятий. Характерное для ряда языков деление по родам основано на вычленении в живом сложного признака — пола. Правда, род мы распространяем и на неодушевленные объекты, хотя говорить о неграмматической основе отнесения стола к мужскому роду, а табуретки — к женскому не приходится. Но для одушевленных предметов этот признак выделяет вполне определенные классы сущностей. А в папуасском языке асмат с помощью грамматики выделяется шесть классов: предметы узкие и высокие, покоящиеся на малом основании (люди, деревья), одинаково высокие и широкие (дом, собака), широкие и низкие, покоящиеся на большом основании (лежащие стволы, змея), плавающие (рыба, лодка), летающие (птица, бабочка), лежащие наверху так, что для того, чтобы увидеть их, надо подняться па что-нибудь (лук, лежащий под крышей хижины на полке и не видный с пола хижины). И для каждого такого класса имеются свои специальные способы обозначения с помощью грамматических форм. Язык позволяет вводить и такие абстрактные понятия, которые вычленяются прямым указанием на классифицирующий признак. Таково, например, понятие синев, вычленяющее из всего окружения все, что имеет синий цвет. Классические опыты Лурия, проведенные в тридцатые годы, в глухих кишлаках Средней Азии (особенно, когда испытуемыми были женщины) выявили ряд особенностей формирования понятий, которые у людей, подвергшихся влиянию науки и обучения научному мышлению, становятся мало заметными. Основной особенностью, отмечаемой исследователем, является доминанта различения над сходством. Гипотезу о том, что исторически сначала возникла операция различения и выделения различия, а лишь потом операция объединения и выделения сходства выдвинул еще А. Бинэ. Он основывался на том, что факт различия непосредственно наблюдается в сравниваемых объектах или явлениях, а факт сходства есть результат проведения некоторой логической, абстрактной операции. Гипотеза Бинэ ^) По слухам, известному ленинградскому писателю-фантасту принадлежит следующее замечательное определение ложки. «Ложка, по военной терминологии, делится на хлебало, держало и соединительную планку».
§ 4.2. ОБОБЩЕНИЕ ПОНЯТИИ И КЛАССИФИКАЦИЯ У ЧЕЛОВЕКА 165 подтвердилась в опытах Лурии. Испытуемые, например, никак не могли сформировать класс «домашние животные», когда им показывали изображение на карточках домашних животных, растений, диких животных, предметов домашнего обихода. И даже на прямой вопрос экспериментатора «Что общего между курицей и собакой?»,— следовал ответ «Ничего общего. У собаки четыре ноги, а у курицы две». Подобно детям, жители глухих кишлаков Памира в эти годы так давали «определения» понятий: «Дерево — это яблоня, карагач, тополь», «Автобус силой огня движется и его человек двигает... Если масла туда не наливать, и народа не будет, он не будет двигаться». Весьма характерно, что многие вещи, которые в эксперименте предлагалось определить, не определялись потому, что «это и так видно». В ответ на просьбу дать определение понятию «горы» был получен ответ «Если горы ты никогда не видел, как тебе это можно объяснить?» Аналогично на вопрос, как можно объяснить человеку, который никогда не видел автобуса, что это такое, был получен ответ «Буду так рассказывать: ходят автобусы, у них четыре ноги, передние стулья, чтобы сидеть, крыша для тени и машина... А вообще, я скажу: если сядешь, увидешь, что это такое». • Приведенные эксперименты еще раз подчеркивают важную для нас мысль о том, что не призначная структура, находящаяся в центре внимания специалистов по распознаванию образов, а ситуативное положение того или иного факта или объекта определяют его интерпретацию у человека, не имеющего дело с научными определениями и теориями. Перейдем теперь к проблеме классификации. И здесь научный стиль мышления сыграл значительную роль в нашей оценке этой процедуры. Начиная с Линнея, давшего блестящую структуру классификации растений, в науке возобладал принцип родо-видовых классификаций. Такие деревообразные классификации стали повсеместным явлением. Получение классификации подобного типа представляется заманчивым и абсолютно необходимым. Возрастает роль отношений типа часть — целое, род — вид, мношство — подмножество, элемент — класс и т. п. Однако те же психологические эксперименты показывают, что естественная для человека классификация основана на других принципах. При раскладывании карточек испытуемые А. Р. Лурии никогда не клали в одну группу изображение овцы и волка, ибо «волк загрызет овцу, а это нехорошо», но помещали в одну группу карточки с изображением овцы, котла, ножа, скатерти, говоря «Будет праздник, расстелим скатерть, овцу зарежем, сварим хороший плов». Таким образом, ситуативная классификация играет в мышлении человека доминирующую роль, а категориальная классификация (в частности, родо-видовая) —куда менее значительную. Заметим, что среди категориальных классификаций использованле прямых наблюдаемых признаков также встречается весьма нечасто. Многие классифицирующие системы основаны на прагматических признаках, о которых мы уже упоминали. Так, например, образованы понятия орудия труда или растения. Особый класс понятий составляют социальные понятия: семья, школьный класс, нумизматы нашего города и т. п. Основанные на них классификации также весьма характерны для человека. Остановимся еще на одном тоже важном для построения систем классификации свойстве человеческого мышления. Известно, что при образовании понятий значительную роль играют ассоциации, возникающие у всех нас при работе с языковыми и внеязыковыми текстами. Упомянем о результатах, относящихся к семантическому пространству Ч. Осгуда. Идея, которую много лет развивал этот ученый и его многочисленные ученики и последователи, заключалась в том, что все понятия, которыми оперирует человек, занимают определенное местоположение в специальном субъективном семантическом пространстве, метрика которого отражает ассоциативную близость тех или иных понятий. Само это пространство строится следующим образом. Для естественного языка берутся антонимичные пары типа: большой — маленький, острый — тупой, быстрый — медленный, добрый — злой и т. п. Для каждой такой пары (обычно в языке их 300—400) строится шкала, в которой сами эти слова занимают концевые позиции, а середину шкалы—нейтральное выражение (например, не большой, не маленький и т. п.). Кроме того на шкале имеется еще некоторое число делений, которые могут и не обозначаться
156 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЯ ^) Имеется немало критических замечаний по поводу методики Осгуда и результатов, получающихся с ее помощью. Но главные идеи, о которых мы говорим, по-видимому, находятся вне этой критики. никакими словами. Для заданного списка слов испытуемые должны на каждой из шкал отметить местоположение каждого слова. Подчеркнем, что, как правило, признак, которым характеризуется шкала, никак не связан с понятием, выражаемым данным словом. Тем не менее по требованию эксперимента испытуемый все равно должен (пусть случайным способом) поставить слово из списка на какое-то деление каждой из шкал. Статистическая обработка результатов подобного эксперимента весьма интересна. Оказывается, что наблюдаются определенные статистически значимые закономерности расстановки слов на шкалах. После соответст- вуюш,ей обработки (например, по методу выделения факторов дисперсионного анализа) мы получаем возможность выделения трех главных факторов, «съедающих» в сумме почти всю дисперсию. Эти факторы Осгуд назвал: шкала оценок, шкала силы и шкала активности. Они и образуют оси семантического пространства М- На них проецируются практически все исходные шкалы. Так шкалы добрый—злой, полезный — бесполезный, хороший — плохой и т. п. проецируются на шкалу оценок; шкалы типа большой — маленький, тяжелый — легкий, сильньг-1 — слабый и т. п.— на шкалу силы, а шкалы типа: острый — тупой, быстрый — медленный, спокойный—беспокойный и т.п.— на шкалу активности . Теперь каждое понятие может рассматриваться как точка семантического пространства. Наиболее интересный для нас результат Осгуда состоит в том, что при использовании кластерного анализа в этом пространстве мы получаем в отдельных кластерах понятия, связанные между собой либо ситуативными, либо ассоцнат:1Бнымн связями. Примерами кластеров, которые выделяются в семантическом пространстве Осгуда, могут служить (рыцарь, роза, турнир, перчатка, поцелуй) НЛП (отец, мать, сын, дочь, собака). Таким образом, мы приходим к чрезвычайно важному для нас выводу, что в обычной жизни человек формирует понятия и организует системы классификации, кпК правило, на основе тех ситуаций, с которыми он сталкивается в своей повселневноп деятельрюсти и на основании тех прагматических признаков, учет которых важен для успешной ее реализации. Этот факт необходимо учитывать при nocTpofhiMi классифицирующих систем в системах управления. И еще одно, последнее в данном параграфе, замечание. При проведении психологических экспериментов на «мгновенный отклик», в ходе которых испытуемый должен - не раздумывая» отвечать каким-либо словом на слово, произносимое экс- пер^1ментатором, был обнаружен устойчивый факт вероятгюстцого предпочтения типового ответа. Характер ответа зависел от того социума, к которому принадлежит испытуемый, но в пределах этого социума ответ на многие слева прогнозируется правильно с вероятностью, близкой к единице. Если, например, просить испытуемых быстро ответить на задание типа «Назовите поэта», «Назовите плод», «Назовите предмет, относящийся к мебели», то в подавляющем большинстве случаев в качестве ответов мы получим «Пушкин, яблоко и стол». Это происходит потому, что в системе классификации реалий окружающего мира у человека имеется еще некая оценка типичности тон или иной ситуации, того или иного контекста, в котором встречается данное понятие. Это как бы готовый отклик на ситуацию, в которой надо принимать мгновенное решение, когда нет времени на анализ задачи и поиск решения. По-видимому, именно эта способность (а также априорное проигрывание абсурдных ситуаций, о котором мы говорили в §3.8) позволяет человеку довольно успешно реагировать на встречающиеся ему непредвиденные и незнакомые по прошитому опыту ситуации. Во всяком случае, подобная тактика во многих случаях оказывается успешной. Отметим, что идея шкалированности, которая следует из приведенных нами рассуждении, во многом похожа иа выводы и положения, изложенные в § 2.4, посвященном общим свойствам псевдофизических логик.
§ 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 167 § 4.3. Обобщение по признакам * Начнем с самого простого и хорошо изученного случая обобщения по признакам. Обшая постановка задачи имеет следующий вид. Имеется множество объектов A = {ai} и множество признаков П = {я^}, каждый из которых может принимать какое-либо значение из соответствующего множества значений признаков (П'}. Здесь верхний индекс показывает тот признак, к которому относится это множество значений. Все множества, кроме Л, предполагаются конечными. Обобщенным объектом называется некоторое подмножество множества А. Если удается построить такую функцию \|:(Я1, JX2,...,^7i)» что она определяет принадлежность или непринадлежность любого at к интересующему нас подмножеству, то эта функция называется решающей функцией (вместо нее может быть сформулировано некоторое решающее правило, использующее значения этой функции или некую процедуру, которую трудно выразить в виде аналитической функциональной записи, но мы не будем акцентировать пока на этом внимание). В самом простейшем случае функция ij} может быть булевой функцией, если для определения принадлежности элемента at к подмножеству Л'^Л требуется ответить на вопрос, какими признаками или значениями признаков он обладает или не обладает. Какие у нас имеются возможности для построения решающей функции? Пример 4.1. На рис. 4Л показана гистограмма распределения значений некоторого признака среди множества объектов. Какие мо- 2 3 ^ 7 Рис. 4.1 7^ Л' гут быть основания для его разбиения на классы? По-видимому, единственный способ — такое разбиение, при котором в один класс попадают объекты с достаточно часто встречающимся значением признака, а один класс от другого отделен «провалами». На рис. 4.1 таким способом можно выделить три класса; им соответствуют три
168 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ обобщенных понятия, которым можно присвоить новые имена. Для задания понятий можно использовать задание отрезков, из которых берутся значения признака: [2, 3], [4, 7] и [9, 12]. iMeTOA, проиллюстрированный в примере 4.1, в свое время М.М. Бонгард назвал «развал на кучи». В методах такого типа предполагается, что структура признаков выбрана столь удачно,что в пространстве признаков объекты, образующие некоторое понятие, группируются компактным образом. Они как бы «сгущаются» около некоторого «ядра», характеризующего наиболее существенные для данного признака комбинации их значений. На этом принципе построено довольно много методов обобщения понятий, которые можно было бы назвать методами разделения в пространстве признаков, В простейшем случае ситуация, показанная на рис. 4.1, обобщается на пространство произвольной размерности и строятся методы выделения наиболее крупных скоплений объектов, для которых расстояния между признаками значительно меньше расстояний между отдельными скоплениями. На этой идее основано большинство методов, развиваемых в рамках кластерного анализа. Обобщением такого подхода к образованию понятий служит идея использования специальной функции для выделения «ядер» из заданного множества объектов. Эта функция может быть построена различными способами. Например, она может принимать на объектах, входящих в ядро, значения, значительно превосходящие значения той же функции в некоторой окрестности пространства признаков, окружающей ядро. Эти функции как бы задают распределение потенциалов в пространстве признаков, почему и сам метод работы с такими функциями получил название метода потенциальных функций. Однако подобные методы, основанные на использовании лишь сведений о пространстве признаков и некоторых его свойствах, многократно исследованные в теории распознавания образов, почти ни чего не дают для решения задачи формирования понятий, возни кающей в теории ситуационного управления и родственных ей под ходов к решению проблемы целесообразного управления объектом И связано это с тем, что в таких условиях мы всегда имеем некото рую априорную информацию о конкретных представителях, входя щих в формируемое понятие. Иными словами, мы заранее знаем что некоторые объекты должны входить в формируемое понятие {положительные примеры), а другие не должно входить в него {отрицательные примеры). Это приводит к постановке задачи обобщения по признакам на основе обучающей выборки, состоящей из положительных и отрицательных примеров. Именно такие задачи мы и будем изучать ниже в данной главе. Существует большое число методов, занимающих пограничное положение между методами типа выделения ядер и методами, основанными на привлечении дополнительной содержательной инфор-
§ 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 169 W 9 8 7 6 6 ^ 3 2 ■7 ^1 --f £ в С ог 1 I - - _J__ 1 1 I 1 3^5 Рис. 4.2 7ti мации об объекте управления и методах организации управления им. Опишем кратко наиболее широко распространенный метод такого пограничного типа, который обычно называют методом гиперплоскостей. Поясним его на примере двух признаков, приписываемых объектам а^. Это позволит нам проиллюстрировать идею метода геометрически, что обеспечивает необходимую наглядность. При реализации метода гиперплоскостей для произвольного числа признаков нужно произвести прямой перенос всех процедур с двумерного случая на п-мерный. Итак, пусть мы имеем некоторое множество объектов Л={а;}, элементы которого обладают двумя признаками и Я2, принимающими значения из некоторых множеств П1 и П^. Для простоты будем считать, что Ш и — определенные отрезки на оси действительных чисел. Тогда все объекты Ui в пространстве признаков находятся внутри некоторого прямоугольника. Одну из его вершин мы примем за начало координат. Рассмотрим ситуацию, показанную на рис. 4.2. На нем показаны объекты, имеющиеся в обучающей выборке. Зачерненные кружки соответствуют положительным примерам, светлые — отрицательным. Таким образом, в нашем конкретном случае имеется четыре положительных примера и два отрицательных. Будем формировать обобщенное понятие последовательно. Возьмем один из положительных примеров (пусть это будет и проведем прямую, которая отделила бы его от некоторого отрицательного примера (пусть это будет а^). Для построения разделяющей прямой тя1+/^2+9=0, воспользуемся следующим приемом. Будем подбирать q таким образом, чтобы точки, соответствующие и лежали по разным сторонам от нашей прямой. Подставляя в уравнение прямой координаты точек, соответствующих и получаем ш+8/+д=0 и 5m+3/+g=0. Так как для определения трех неизвестных мы имеем два уравнения, то можно разделяющую прямую построить различным способом. Положив, например, /=0 и взяв т=1 и q~—2, мы получим разделяющую прямую в виде: —2=0, которая на рис. 4.2 помечена буквой Л. Но эта прямая плоха тем, что отделяет всего одну точку из формируемого множества и сложность оставшейся задачи почти сравнима со сложностью исходной. Куда более разумным было бы в качестве разделяющей прямой взять прямую Я1—4=0. Она на рис. 4.2 помечена буквой В, Эта прямая отделяет от объектов, не принадлежащих фор-
170 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ мируемому множеству, все нужные точки, кроме а^. Теперь наша задача состоит в отделении этого объекта от и а^. Для этого можно, например, воспользоваться прямыми С и D на рис. 4.2. Жирным контуром выделена получившаяся граница между сформированным множеством объектов (зачерненные кружки) и остальными объектами. Для проверки того, принадлежит ли произвольный объект а* (я^, п1) сформированному множеству, надо подставить его координаты в уравнения прямых В, С и D и проверить знаки отклонения. Если знаки отклонения составляют комбинацию (—, +, —), то проверяемый объект принадлежит к сформированному понятию, если эта комбинация иная, то проверяемый объект к нашему понятию не принадлежит. Такое разделение не всегда получается. На рис. 4.3 показана ситуация, в которой положительные и отрицательные примеры сгруппированы таким образом, что при проведении разделяющих прямых возникают области, не содержащие ни положительных, ни отрицательных примеров из обучающей выборки. Эти области отмечены на рисунке знаком вопроса. Относительно объектов из них мы не можем ничего сказать об их принадлежности или непринадлежности к построенному понятию. Поэтому в методах, опирающихся на разделение в пространстве признаков, применяют специальные приемы для повыше- py^f, 4 3 ния эффективности отделения (например, проводят гиперплоскости посредине между двумя разделяемыми объектами перпендикулярно соединяющему их отрезку) и для уменьшения объема областей, в которых объекты не классифицируются. В списке литературы, указанном к данной главе, эти приемы описаны весьма подробно. Видоизменением метода разделяющих гиперплоскостей являются методы, в которых разделение происходит за счет криволинейных поверхностей. Однако в силу трудностей формирования удачных разделяющих поверхностей второго и более высоких порядков эти методы на практике применения фактически не нашли. Имеется еще группа методов, в которых вместо простого разделения в пространстве признаков используются метрические функции этого пространства. Например, группировка объектов в новое понятие происходит таким образом, что расстояния между парами объектов, попавших в одно понятие, существенно превосходят расстояние от них до объектов, лежащих вне его (разделение по потенциальной функции). Недостаток описанного метода и тех методов, которые подобно
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 171 методу гиперплоскостей используют лишь гипотезу об образовании в пространстве выбранных признаков компактного множества объектов, входящих в одно обобщенное понятие, состоит в том, что языки, на которых задано как описание объектов at (т. е. язык набора выбранных признаков и их значений), так и описание самого сформированного понятия, различны. В нашем конкретном методе понятие задается перечислением разделяющих гиперплоскостей с указанием знаков отклонений от них. Такой способ описания понятий не позволяет производить процедуру обобщения на последующем шаге, т. е, получать понятия второго уровня общности, а, следовательно, не дает основ и для построения классификации понятий. Указанный недостаток, несмотря на простоту процедур формирования понятий по методу разделения в пространстве признаков, делает эти методы мало пригодными для задач ситуационного управления. Именно поэтому в системах ситуационного управления, как правило, используются другие принципы формирования понятий и организации классификации. Прежде всего, необходимо указать группу методов, в основе которых лежит предложенная Бонгардом схема формирования решающего правила для оценки принадлежности объектов к фop^пI- руемому понятию. Эта схема устроена следующим образом. Заданы некоторые логические функции от признаков, которые могут характеризовать объекты. Для осуществления такой возможности предполагается, что признаки принимают двоичные значения (типа есть — нет). Подобный переход от произвольных признаков к двоичным Теоретически всегда возможен. Для этого достаточно считать, что каждое допустимое значение признака выступает как самостоятельный признак или что на множестве его значений введены какие-то предикаты, превращающие их значения в двоичные переменные. Набор этих логических функций должен быть достаточно богатым, чтобы охватить как можно больше отношений между признаками. В методе Бонгарда в зависимости от специфик задачи набор предикатов выбирается каждый раз заново. Если нужно различать арифметические выражения, то в качестве таких предикатов выступают предикаты, связанные с арифметикой, если речь идет о сравнении некоторых программ и формировании классов программ, то в качестве предикатов выступают предикаты-процедуры, оценивающие истинность или ложность утверждений, касающихся, например, длины программы, необходимого объема памяти для ее размещения или времени ее выполнения. Если же в качестве предметной области, где производится обобщение, выбираются задачи, связанные с ситуационным управлением, то предикаты, превращающие наборы признаков в двоичные переменные, полностью определяются семантикой той проблемной области, в которой используется ситуационное управление. Важно лишь выделить достаточно полный набор таких предикатов, а применение их к объектам можно организовать и с помощью случайной процедуры.
172 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Когда всем объектам сопоставлены наборы двоичных признаков, наступает второй этан. На нем случайным образом генерируются функции от получившихся двоичных аргументов, принимающие также двоичные значения. Число аргументов у этих функций может быть либо фиксированным, либо меняться от 1 до т, где т — число различных двоичных признаков, получившихся после применения предикатов к исходному множеству признаков. Каждая такая функция рассматривается как потенциальное элементарное разделяющее правило. Для обеспечения разделения нужно, чтобы для всех объектов, входящих в число отрицательных примеров в обучающей выборке, эта функция обращалась в нуль, а для всех объектов, входящих в число положительных примеров в той же обучающей выборке, принимала значение 1 хотя бы один раз (но чем больше, тем разделяющее правило лучше). Тогда дизъюнкция таких элементарных разделяющих правил может рассматриваться как окончательное разделяющее правило при условии правильной классификации всех объектов, образующих обучающую выборку. Возможны и другие способы организации общего решающего правила, а также отбора для включения в него элементарных разделяющих правил. Но суть метода от этого не меняется. Проиллюстрируем выполнение описанной процедуры сначала на очень простом примере, в котором исходное множество признаков таково, что они уже являются двоичными. В этом случае первый этап, связанный с применением подходящих предикатов к исходным признакам, отсутствует. Пример 4.2. На рис. 4.4 показана обучающая выборка, состоящая из пяти положительных и четырех отрицательных примеров. Положительные приперы Огприцотельные примеры Рис. В качестве признаков выступают четыре независимых признака, которые нам для простоты записи удобно обозначить через а, Ь, с и d. Все признаки принимают двоичные значения, и эти значения приписываются им следующим образом: а=1 (шляпа есть), а=0 (шляпы нет), Ь = 1 (глаза круглые), Ь=0 (глаза-щелочки), с=1 (нос широкий книзу), с=0 (нос узкий книзу), d=l (рот «веселый») d =
§4.3- ОБОБЩЕНИЕ ПО ПРИЗНАКАМ I73 = 0(рот «печальный»). Метод Бонгарда состоит из многократного повторения процедуры случайного формирования элементарного разделяющего правила в виде некой логической функции, проверке этого правила на эффективность разделения на обучающей выборке и накопления таких эффективных разделяющих правил, которые после объединения их через дизъюнкцию дадут глобальное разделяющее правило. Пусть в результате работы некоторого случайного механизма были выработаны следующие функции от признаков: fed, с\/а, аЬСу abed. Что можно сказать об эффективности порожденных правил? Стоит ли их сохранять для дальнейшего? Функция bd соответствует набору признаков глаза круглые и рот «веселый». На отрицательных примерах обучающей выборки соответствующая функция принимает на всех примерах значение 0. Для положительных примеров функция bd принимает значение 1 на трех примерах из пяти. Это позволяет оценить элементарное правило разделения М=1 как весьма эффективное. Функции cVfl^ соответствует нос широкий книзу или шляпы нет. На множестве отрицательных примеров эта функция трижды обращается в 1, а на множестве положительных примеров — все пять раз. Однако правило с\^а=1 не обеспечивает высокую эффективность разделения и его не оставляют для дальнейшей работы. Функция аЬс требует, чтобы у персонажа была шляпа, глаза-щелочки и нос, широкий книзу. Среди положительных примеров есть два таких персонажа. Среди отрицательных примеров подобных персонажей нет. Значит, элементарное разделяющее правило аЬс=1 эффективно. Наконец, функция abed обращается в 1 только для тех персонажей, у которых есть шляпа, круглые глаза, нос, широкий книзу, и «веселый» рот. Среди положительных примеров в обучающей выборке есть один такой персонаж, а среди отрицательных примеров таковых вообще нет. Это значит, что правило разделения abcd^l можно сохранить для дальнейшей работы. Таким образом, мы решили сохранить три правила разделения. Если считать, что процедура поиска элементарных правил разделения завершена, то можно образовать глобальное правило, которое будет иметь вид bd\/abc\/abcd=^\. Для того чтобы данное правило можно было считать окончательным, оно должно абсолютно правильно классифицировать персонажей, входящих в обучающую выборку. Это требование выполняется. Но само правило получилось у нас избыточным. Элементарное разделяющее правило abcd=l явно лишнее, потому что правило bd\fabc~ \ уже правильно классифицирует всех персонажей, входящих в обучающую выборку. Формально это можно было бы обнаружить, проведя известные из теории функций алгебры логики преобразования: bdyаЬсуobcd^bd{\\/ос)\/abc=bd\/оЬс, На вопрос о том, насколько правильно построено разделяющее правило можно ответить лишь на основе экзаменационной выборки,
174 ГЛ. 4. ОБОБЩЕНИЕ Н КЛАССИФИКАЦИЯ СИТУАЦИЙ ^) По своему функционированию этот элемент есть элемент типа И, но мы сохраняем его название, данное ему авторами РПС-метода. Обычно под ассоциативным элементом понимают элемент, реализующий некоторую пороговую функцию. которая не пересекается с обучающей выборкой. Если и на экзаменационной выборке правило разделения работает эффективно, то значит мы удачно его построили. В противном случае эта выборка рассматривается как дополнительная часть обучающей выборки и процедура поиска решающего правила повторяется заново. В заключение опишем еще один метод формирования понятий на основе призначной структуры, отличающийся по своей идее от ранее рассмотренных. Этот метод носит название метода растущих пирамидальных сетей (РПС-метод). Для нас он интересен не только в качестве еще одного метода обобщения по признакам, но и потому, что он может использоваться при планировании многошаговых решений, И в соответствующей главе книги мы об этом будем говорить. Растущая пирамидальная сеть — динамический объект, ее конфигурация меняется в процессе функционирования. Она состоит из вершин двух типов, показанных на рис. 4.5 квадратиками и кружками. Вершины первого типа называются рецепторами, вершины второго типа — ассоциативными элементами Каждый рецептор соответствует некоторому фиксированному значению определенного признака. Таким образом, число рецепторов в РПС равно произведению числа признаков на суммарное число принимаемых ими значений. Любой элемент РПС может быть в двух состояниях — возбужденном и невозбужденном. Для всех элементов РПС зафиксировано некоторое определенное число тактов Tj, характеризующее период, в течение которого возбужденные элементы сохраняют свое возбуждение и передают его через свои выходные дуги. Для возбуждения рецепторов требуется специальный внешний сигнал, а ассоциативные элементы переходят в возбужденное состояние, если на всех их входах в течение определенного числа тактов сохраняется возбуждающий сигнал. Таким образом, хотя передача возбуждения по дугам РПС происходит мгновенно, каждый ассоциативный элемент выступает еще и в виде задержки, величина которой зависит от длины пути, проходимого сигналом возбуждения. Во всяком случае величина должна быть мала по сравнению с Xj. Набор возбужденных рецепторов в некоторый момент времени образуется в результате подачи на вход РПС в данный момент описания некоторого объекта через значения его признаков. Интервал между сменами описаний объектов, подаваемых на вход РПС, всег-
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 175 да превосходит интервал, в течение которого РПС возбуждена. Это означает, что при подаче любого описания на рецепторы РПС лаходится в невозбужденном состоянии. Если имеется некоторый ассоциативный элемент, то субмножество этого элемента образуют все те элементы, от которых имеются пути, ведущие ко входам данного элемента. Субмножество определяется вполне корректно, если учесть, что в РПС запрещены связи, которые могут привести к возникновению петель и циклов; иными словами, ни один ассоциативный элемент не может быть соединен своим выходом со входом самого себя или входами каких-либо элементов, входящих в его субмножество. Нулевой слой субмножества некоторого элемента образуют те элементы, выходы от которых непосредственно поступают на входы данного элемента. Аналогично люжно определить и супермножество данного ассоциативного элемента, как множество тех элементов, к которым имеется путь, ведущий от выхода данного элемента. Те элементы, для которых этот выход непосредственно является входом, образуют нулевой слой супермножества. Динамика изменения (роста) РПС задается с помощью специальных правил. 1. Пусть при возбуждении некоторой комбинации рецепторов в существовавшей до этого РПС имелись ассоциативные элементы, у которых в нулевом слое субмножества возбудилось не менее двух элементов. Для всех таких элементов происходит следующее. Выходы всех возбужденных в нулевом слое субмножества элементов Рис. 4.6 становятся входами нового ассоциативного элемента, вошедшего в РПС; выход нового элемента становится входом исходного ассоциативного элемента; все непосредственные связи, существовавшие у него до этого с возбужденными элементами из нулевого слоя субмножества ликвидируются.
176 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Выполнение этого правила иллюстрирует рис. 4.6. Те рецепторы, которые возбудились, зачернены. На рис. 4.6, а показана РПС до применения правила, а на рис. 4.6, б — после его применения. После того, как в соответствии с правилом 1, введены все новые элементы, проверяются условия для применения правила 2 и если они удовлетворяются, то это правило реализуется. 2. Пусть при возбуждении некоторой комбинации рецепторов произошло возбуждение определенной части элементов в РПС. Если множество возбужденных элементов, в котором остались невозбужденными все элементы, входящие в нулевой слой их супермножества, состоит более чем из одного элемента, то вводится новый элемент, входами которого служат выходы всех упомянутых возбужденных элементов. Выполнение этого правила иллюстрируется ситуацией, изображенной на рис, 4.7. На рис. 4.7, а показаны два возбужденных элемента: ассоциативный элемент 2 и рецептор 5, для которых в нулевом слое их супермножеств нет возбужденных элементов. Тогда вводится новый ассоциативный элемент 4 и РПС приобретает вид, показанный на рис. 4.7, б. Перейдем теперь к процедуре формирования понятий с помощью РПС. В обучающей выборке с двоично кодированными значениями признаков рецептор РПС, соответствующий данному значению некоторого признака, возбуждается, если это значение актуализируется, и не возбуждается в противном случае. На вход РПС последовательно подаются все значения признаков объектов из обучающей выборки как из группы положительных примеров, так и из группы отрицательных примеров. При подаче каждого значения происходит переформирование РПС в соответствии с описанными правнлами. Каждому ассоциативному элементу будем приписывать два параметра m и /, значения которых могут меняться в процессе работы
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 177 РПС. Параметр т есть суммарное число возбуждений ассоциативного элемента при подаче на рецепторы РПС последовательности примеров. Параметр / характеризует число рецепторов, входящих в субмножество данного ассоциативного элемента. В процессе преобразования РПС в множестве ее ассоциативных элементов выделяются специальные элементы, носящие название положительных и отрицательных контрольных элементов для данного понятия. Формирование понятий происходит за счет выполнения трех специальных процедур. 1. Если на рецепторы подается описание объекта обучающей выборки, который является положительным примером, и в РПС не выделен положительный контрольный элемент понятия, то находится ассоциативный элемент, у которого максимальны т и L Такой элемент становится положительным контрольным элементом понятия. Если в группе элементов с одинаковым максимальным значением пг ил1еется несколько элементов с одинаковым максимальным значением /, то в качестве положительного контрольного элемента понятия берется любой из них. 2. Если на рецепторы подается описание объекта обучающей выборки, который является отрицательным примером, и в РПС имеются положительные контрольные элементы понятия, не содержащие в своих супермножествах других возбужденных контрольных элементов, то в каждом из этих супермножеств в качестве отрицательных контрольных элементов выбираются элементы, имеющие минимальное значение /. Если таких элементов несколько, то выбирается любой из них. 3. Если на рецепторы подается описание объекта обучающей выборки, который является положительным примером, и в РПС имеются отрицательные контрольные элементы, не содержащие в своих супермножествах других возбужденных контрольных элементов, то в каждом из этих супермножеств в качестве положительных контрольных элементов выбираются элементы, имеющие минимальное значение /. Если таких элементов несколько, то выбирается любой из них. Выполнение всех трех процедур иллюстрируется ситуациями, показанными на рис. 4.8. На рис. 4.8, а показана РПС, в которой около всех ассоциативных элементов проставлено значение т, накопленное до этого такта. На вход РПС подан положительный пример. В соответствии с первой процедурой на рис. 4.8, б отмечен элемент 2, который будет на следующем такте играть роль положительного контрольного элемента понятия. На рис. 4.8, в показана РПС, на вход которой поступает отрицательный пример. На рис. 4.8, г показан результат применения второй процедуры. Если теперь для РПС, приведенной на этом рисунке, на рецепторы поступит описание положительного примера, то за счет срабатывания третьей процедуры получится РПС, изображенная на рис. 4.8, д.
It 78 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Контрольные элементы играют важную роль в процессе формирования ПОНЯТИЙ. С помощью положительных контрольных элементов выделяются те сочетания рецепторов (значений признаков), которые с частотой т встречались в обучающей выборке на положительных примерах. С помощью отрицательных контрольных элементов выделяются сочетания значений признаков объектов, входящих в группу отрицательных примеров обучающей выборки. Но не для всех таких объектов, а только для тех, в которых сочетание значений признаков возбуждает положительные контрольные элементы, что соответствует наличию у отрицательного примера такого сочетания значений признаков, которое до этого было выделено в качестве важного (контролируемого) для формирования правила отнесения объектов к формируемому понятию. При формировании РПС обучающая выборка используется многократно. Как только в РПС в соответствии с одной из описанных выше процедур происходит появление нового контрольного элемента, начинается новый просмотр примеров из обучающей выборки, начиная с первого. Обучение считается завершенным, если они-
§4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ I79. сания всех объектов, входящих в обучающую выборку, при подаче их на рецепторы РПС не вызывают появления новых контрольных элементов. Когда понятие сформировано, то РПС дает возможность пользоваться следующим правилом отнесения объектов к сформированному понятию. Объект ai входит в понятие, если при введении его они* сания в рецепторы РПС в ней нет возбужденных отрицательных контрольных элементов понятия, в супермножестве которых не имелся бы хотя бы один возбужденный положительный контрольный элемент. Объект at не входит в данное понятие, если при введении его описания в рецепторы РПС в ней нет возбужденных положительных контрольных элементов, которые не содержали бы в своих супермножествах хотя бы одного возбужденного отрицательного контрольного элемента. Если ни одно из условий, сформулированных выше, не выполняется, то относительно объекта не высказывается окончательных утверждений. Можно показать, что три процедуры перестройки РПС, которые используются в процессе работы с обучающей выборкой, всегда за конечное число шагов приводят к завершению формирования понятия. При этом все положительные и отрицательные примеры из обучающей выборки распознаются РПС правильно. Описанный нами способ формирования понятий обладает несколькими достоинствами. Все понятия, формируемые с его помощью, допускают содержательную интерпретацию, так как задаются через логическую функцию, в которую в явном виде входят значения исходных признаков. Метод хорошо автоматизируется при работе на ЭВМ. После сформирования окончательной РПС ту ее часть, которая не содержит контрольных элементов и не оказывает влияния на их возбуждение, можно ликвидировать, что во многих случаях позволяет использовать память ЭВМ весьма экономно. Для задач типа, характерного для систем ситуационного управления, весьма часто встречается ситуация, при которой из-за неполноты знаний об объекте управления и методов управления обучающая выборка может быть противоречивой. В этом случае одни и те же описания в ней могут входить и в группу положительных примеров и в группу отрицательных примеров. Этот важный для нас случай может быть реализован в методе РПС с помощью некото- рой модификации процедур ее построения, В силу противоречивости обучающей выборки решение о включении или невключении объекта в сформированный класс должно быть недетерминированным. Эта недетерминированность должна отражать те частоты, с которыми в обучающей выборке объект относится к множеству положительных и множеству отрицательных примеров. В РПС сформированные пирамиды могут быть теперь трех типов: П 1, соответствующие положительному объекту, т. е. объекту, сформированному на основании тех примеров обучающей выборки.
180 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ которые входят только в класс положительных примеров; П 2, соответствующие отрицательному объекту, т. е. объекту, сформированному на основании тех примеров обучающей выборки, которые входят только в класс отрицательных примеров; П 3, соответствующие бивалентному объекту, сформированному на основании примеров из обучающей выборки, которые одновременно входят в оба класса примеров. Опишем теперь процедуры, характерные для этого случая. Процедура 1 не изменяется. Процедуры 2 и 3 имеют теперь следующий вид. 2. Если на рецепторы подается описание объекта обучающей выборки, относящегося к отрицательным примерам, пирамида не отлична от пирамиды типа П 3 и среди возбужденных положительных и бивалентных контрольных элементов есть такие, что в их супермножествах нет других возбужденных контрольных элементов, то в каждом из этих супермножеств выбирается элемент с наименьшим значением / (или любой из них, если их несколько), который становится отрицательным контрольным элементом понятия. 3. Если на рецепторы подается описание объекта обучающей выборки, относящегося к положительным примерам, пирамида отлична от пирамиды П 3 и среди возбужденных отрицательных или бивалентных контрольных элементов есть такие, что в их супермножествах нет других возбужденных контрольных элементов понятий, то в каждом из этих супермножеств выбирается элемент с наименьшим значением / (или любой из них, если их несколько), который становится положительным контрольным элементом. Кроме того, добавляются новые процедуры, связанные с появлением бивалентных понятий. 4. Если на рецепторы подается описание объекта обучающей выборки, относящегося к положительным или отрицательным примерам, пирамида есть пирамида типа П 3 и среди возбужденных контрольных элементов есть такие, которые не содержат в своих супермножествах других возбужденных контрольных понятий (кроме, может быть, самой вершины пирамиды), то в пересечении этих супермножеств находится элемент с минимальным значением / (или любой из них, если их несколько), который становится двузначным 'контрольным элементом. 5. Если при восприятии некоторого объекта в вершинный элемент пирамиды, образованной возбужденными элементами, вносится признак П 3 (это происходит тогда, когда эта вершина соответствовала П 1, и поступил отрицательный пример, либо когда она соответствовала П 2, и поступил положительный пример), то эта вершина становится бивалентным контрольным элементом. При работе с бивалентными понятиями возникает возможность выделять в РПС отдельные пирамиды, которые соответствуют положительным подпонятиям, отрицательным подпонятиям и бивалентным подпонятиям. Эти пирамиды могут вкладываться друг в друга
; 4.3. ОБОБЩЕНИЕ ПО ПРИЗНАКАМ 181 произвольным образом. Для двузначных элементов надо запоминать пару параметров т+ и т'' вместо одного т. Они отражают число положительных и отрицательных примеров обучающей выборки, при которых данный элемент возбуждался. Правила отнесения объектов at к сформированному понятию или их исключение из него остается прежним. Но к решающему правилу добавляются еще два случая. Объект ai включается в сформированное понятие, если бивалентный контрольный элемент, возбужден, не имеет в своих супермножествах других возбужденных контрольных элементов и если выполняется неравенство: /1+ 2 (^')у / = 1 > 1. /1- 2 ^- /=1 Рис. 4.9 Здесь /г+ и /г" — цены ошибки нераспознавания соответствующего объекта как положительного или как отрицательного, as — число бивалентных контрольных возбужденных элементов, в супермножествах которых нет других возбужденных контрольных элементов. Если ap<l, то элемент at не включается в сформированное понятие. Можно доказать, что с ростом объема обучающей выборки решающее правило в пределе дает известное правило Байеса, минимизирующее риск ошибки при классификации объектов. В заключение рассмотрения РПС отметим, что на практике часто встречаются случаи, когда необходимо формировать понятия, имеющие динамическую природу. Для таких понятий значения определяющих их признаков появляются с определенной закономерностью во времени. Для формирования подобных понятий, по-видимому, можно использовать РПС с несколько видоизмененными условиями возбуждения ассоциативных элементов. А именно, будем считать, что элемент возбуждается, если сигналы на его входах появляются в определенной временной последовательности. Для этого на множестве входов таких элементов можно установить отношение строгого порядка, например, перенумеровав их. На рис. 4.9 показана некоторая РПС. Если рецепторы этой сети возбуждаются последовательно, то возбуждение ассоциативных элементов зависит от последовательности возбуждения рецепторов. Например, элемент 3 возбудится только в том случае, если сначала на его вход придет возбуждение от элемента 1, затем от рецептора 4, а после этого от элемента 2. Это произойдет, если последовательность возбуждения рецепторов будет иметь вид 1—2—3—4—5 или
182 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ 1—2-^4^3—5. При других последовательностях возбуждения рецепторов элемент 3 не возбудится. В языке ситуационного управления призначные структуры объектов в описаниях задаются с помощью отношений г? — иметь признаку Tg — признак — значение, — признак — мера и Гю — мера — значение. Эти отношения позволяют описывать все необходимые знания о признаках и их значениях. После проведения обобщения по признакам можно переформировать исходные описания в описания, оперирующие с вновь сформированными пoнятия^ш. Возможны процедуры обобщения по признакам, которые ориентированы непосредственно на язык ситуационного управления. Здесь мы не будем о них говорить, так как ниже мы рассмотрим эту проблему с более общих позиций. Теперь перейдем к другому виду обобщения, учитывающего не только признаки, присущие объектам, но и те отношения, которые между этими объектами существуют. § 4.4. Обобщение по структурам * Этот вид обобщения для ситуационного управления наиболее важен. Так как в задачах ситуационного управления для описания ситуаций используется язык отношений, именно в структуре последних чаще всего и кроется то, что объединяет в один класс описания ситуаций, в которых для объекта управления принимается одно и то же решение. Задача обобщения по структурам тесно связана с активно развивающимися в последнее время методами поиска закономерностей, опирающихся на аппарат логики, а не на традиционный для этого класса задач аппарат математической статистики и теории вероятностей. При наличии хорошо собранных сведений об интересующем исследователя или систему управления процессе, удовлетворяющих известным статистическим требованиям, можно применить много хороших методов, позволяющих описать все те закономерности, ко- торые можно из этой статистики извлечь. Но, как уже неоднократно говорилось, «бедой» тех объектов, для которых строятся системы управления, опирающиеся на семиотические ^юдeли, является либо полное отсутствие наблюдений, которые были бы статистически достоверны, либо наличие лишь косвенных наблюдений, из которых нужную информацию можно извлечь лишь после проведения логического вывода. Эти обстоятельства привели к тому, что в последнее десятилетие- активно развиваются работы в области построения закономерностей, опирающихся лишь на небольшое число подтверждающих и опровергающих примеров. По своим постановкам такие задачи похожи, с одной стороны, на традиционные задачи распознавания образов на обучающих выборках, а, с другой стороны,— на задачи, возникающие в индуктивной логике.
<5 4.4. OBOBUIEI-IHE ПО СТРУКТУРАМ 183 В начале настоящего параграфа мы опишем процедуру выдви« жения гипотез и построения закономерностей, в основе которой ле* жат схемы индуктивной логики, предложенные еще в прошлом веке С. Миллем. Эти схемы, названные у него методами индуктивных рассуждений, имеют следующий вид. i. Метод сходства. Рассмотрим следующий вывод: а, Ь, с =:>d, а, е, f =^dy а, g-, h:=^d. а, /, m=^dy a=^>d ' Число посылок тут не определено. Во всяком случае их достаточно для того, чтобы лицо, реализующее индуктивный вывод, убедилось в том, что именно а есть посылка, в результате которой реализуется следствие d. Конечно, этот вывод не бесспорен. На самом деле может оказаться, что d возникает вовсе не из-за а. Причинами d могут быть, например, Ь, е, g",. . Но вывод о том, что именно а есть причина d, кажется куда более обоснованным, чем любые другие предположения. 2. Метод различия. Он характеризуется следующей схемой вывода (знак ^ трактуется как «не выводится»): а, Ь, с—> а, е, f=^d. а, /, mz=pd, е. f~>d, /, m^d a=^d Этот метод как бы включает в себя предшествующий, усиливает его. В более простом варианте схема метода различий может содержать совсем немного строк, используемых в методе сходства. Например, всего одну такую строку. 3. М е т о д «о с т а т к о в». В данном методе используется следующая схема вывода: а, 6, c=zyd, е, /, b =:>е, '
184 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ ^) Это название образовано из инициалов Джона Стюарта Милля. 2) Заметим, что в ДСМ-методе оценки обоснованности довольно грубые (они выражаются рациональными числами). Можно, конечно, вместо рациональных чисел использовать нечеткие интервалы или функции принадлежности. Как и предшествующие схемы, данную схему нельзя считать абсолютно достоверной. На самом деле / может возникать вовсе не из-за с, а определяться, например, совместным появлением а и с. 4. Метод сопутствующих изменений. Пусть имеются два множества А и В. Тогда схему вывода можно записать так: ai,c=zyb^, а^еА, i = l,2, ...,т, Аз, с=^Ь^, Ь^^В, ^ёл, ат^с^Ь^, сев, А=уВ С помощью этого метода делается привычный индуктивный шаг. От подтверждающих примеров мы переходим к обобщенному утверждению, касающемуся всех объектов некоторого класса. Опишем теперь специальный метод формирования гипотез на основе имеющихся в распоряжении системы наборов примеров, подтверждающих и отрицающих формируемую гипотезу (положительные и отрицательные примеры). Этотметолбыл назван его авторами ДСМ'методом Введем два множества — множество причин C={ci, С2, ... . . ., Сп, ...} и множество следствий А = {аи ^2, . .., ат» • • Гипотезой будем называть выражение вида Jmici'^^'^^i)^ где — специальный квантификатор оценки обоснованности (достоверности) гипотезы о том, что Ct есть причина ai. Одновременно с положительной гипотезой J;i[{ci^^ai) будем рассматривать отрицательные гипотезы Jm{ci=^'~cLi)y В которых С обоснованностью считается, что Ci не является причиной а^. Эти две гипотезы формируются в ДСМ- методе независимо. Поэтому оценки У+ и J~ могут быть, например, одновременно высокими, или одновременно низкими, или одна из них может быть высокой, а другая — низкой. В ДСМ-методе оценки обоснованности принимают рациональные числовые значения. Для удобства интерпретации будем считать, что некоторая гипотеза имеет оценку обоснованности, равную т. Верхний индекс у оценок обоснованности опускаем, поскольку для положительных и отрицательных гипотез оценки берутся из одного и того же множества 2). Значения и образуют две прямоугольных матрицы У + и J", На пересечении i-и строки и /-го столбца первой матрицы стоит оценка обоснованности гипотезы Ci-=^"'aj, а на том же месте во второй матрице — оценка обоснованности гипотезы с^=Ф~а;.
§4.4. обобщение по структурам 185 Основная процедура ДСМ-метода заключается в нахождении на основе работы с положительными и отрицательными примерами новых гипотез, т. е. элементов указанных нами матриц и размерность которых в процессе работы метода увеличивается, а также в пересчете элементов этих матриц на основании анализа подтверждения или отвергания соответствующей гипотезы. Кроме того, в ДСМ-методе имеются правила для перенесения найденных правилами первой группы гипотез на другие «аналогичные» случаи. Таким образом, правила в ДСМ-методе бывают двух типов: правила выделения закономерностей, построенные по типу индуктивных правил Милля, и правила распространения найденных закономерностей на те случаи, для которых пока подобные примеры не найдены. Важно подчеркнуть, что как правила первого типа, так и правила второго типа являются правилами не точного, а правдоподобного вывода. Пусть J принимают значения (О, 1/(п—1), 2/(п—2)/ {п—1), 1}. Тем самым множество ^ = {co^j} = {c^=^a;} разбивается на (п+1) подмножество. В подмножество Qq входят те элементы Q, для которых оценка обоснованности равна 0. Относительно этих гипотез точно известно, что они неверны. В подмножество Qi входят абсолютно достоверные гипотезы, так как их оценка обоснованности равна 1. В подмножества Qr/(„_i), где f=2, 3,...,п—2 входят соответственно гипотезы, для которых степень обоснованности равна числу, равному индексу у подмножества. Подмножество с индексом \1{п—1) — особое. Входящие в него гипотезы считаются неисследованными и оценка соответствует значению недоопре- делено. Используем правило вывода первого типа. Оно могло породить новые положительные или отрицательные гипотезы, которым на основании некоторого правила приписаны оценки обоснованности. Кроме того, выясняем, подтвердился или не подтвердился ряд ранее найденных гипотез (положительных и отрицательных). Для этих гипотез пересчитываются оценки обоснованности. Если правило подтвердило некоторые гипотезы, то пересчет происходит следующим образом. Множества Qg и Qi сохраняются. Всем подтвердившимся гипотезам, входящим в подмножества где г=2, 3,..., п—2, присваиваются оценки {i^\)ln, С помощью правил аналогии (см. ниже) часть элементов h3,Qi/(;i_i) получает некоторые оценки обоснованности. Те элементы из подмножества которые не получили таких оценок, переходят в подмножество Qi/^ и считаются на следующем шаге снова недоопределенным. Если некоторые гипотезы не подтвердились, то их оценку обоснованности следует уменьшить. Пересчет происходит следующим образом. Множества Qq и Qi сохраняются. Всем неподтвердившимся гипотезам, входящим в множества Qi:^n-\)y где г=2, 3,..., п—2, присваиваются оценки (г—1)/п. С помощью правил аналогии часть оценок переносится на гипотезы, которые входили в множество Те из них, для которых новая информация не возникла, образуют множество fii/n.
186 ГЛ, 4. ОБОБЩЕНИЕ и КЛАССИФИКАЦИЯ СИТУАЦИЙ Процедура ДСМ-метода завершается в двух случаях: если новые гипотезы не порождаются и если не происходит изменения оценок обоснованности ранее найденных гипотез. Заметим, что в рамках логики на каждом шаге ДСМ-метода происходит переход от логики одной значности к логике другой знач- ности (значность логики увеличивается). Наименьшая значность логики, с которой ДСМ-метод начинает свою работу,— троичная логика. В этом случае значения 1 и О трактуются как абсолютная оценка истинности гипотезы (она приписана положительным примерам) и абсолютная оценка ложности гипотезы (она приписана отрицательным примерам), а значение V2 приписывается всем тем (если они уже есть) гипотезам (или примерам), относительно которых нужная информация отсутствует. Последнее, что нам еще нужно рассмотреть, это как устроены правила порождения новых гипотез и приписывания им некоторой оценки обоснованности и правила аналогии. Будем считать, что в качестве исходных объектов выступают описания ситуаций на некотором реляционном языке, например, на языке ситуационного управления. Пусть S* — некий фрагмент описания ситуации. Если известно, что для какой-то ситуации S надо принимать решение U, а фрагмент S* входит в описание ситуации S, то гипотеза имеет право на существование. Если на основании анализа положительных примеров мы убеждаемся, что фрагмент S"" имеется в большинстве описаний ситуаций, для которых принимается решение то достоверность гипотезы S*=:>+f/ должна увеличиваться. Она растет особенно сильно, если этот фрагмент отсутствует в отрицательных примерах, соответствующих случаю принятия других решений по управлению, отличных от U. Если же это не так, то можно считать, что принятие других решений, отличных от и у при наличии фрагмента S*, влияет на некоторый фрагмент S**, играющий роль «тормоза» для S*, Идеология такого типа может распространяться на тормоз второго и более высоких уровней (тормоз тормоза и т. д.). Тормозы порождают отрицательные гипотезы S**=>"f/. Таким образом, в рассматриваемой нами предметной области и при выбранном языке описания объектов и гипотез правила выработки гипотез связаны с нахождением фрагментов в описании ситуаций, которые могут оказаться причиной выработки тех или иных решений. Общая схема для правила сходства, используемого в ДСМ-мето- де, имеет следующий вид: (r^iz:>"fly); У^М {с^.а^) ^ J,;n(s^i-=>^ aj) Jj ^n-~i){Ci=>^aj)\ JiM {c^, aj) hi^D.n (c,--=>+ay)
§ 4,4. ОБОБЩЕНИЕ ПО СТРУКТУРЛ\\ 187 Здесь M{Ci, aj) есть предикат сходства, а его оценка показывает, что его истинность абсолютна. Сам предикат сходства определяется следующим образом: Параметрический предикат сходства а^, k) становится истинным при определенном значении параметра k, который определяет необходимое число примеров, используемых для выявления сходства. Этот параметрический предикат сходства определяется следующим образом: // ^ \ / / k \ , V,, , [((/ ^ 9) (1 < /, 9 < k)) (х, = Л',) (у^ = У,)] {{J, (z и) (с. ^ г)) ((а,. ^ ц) (ау = 0)) Для тех, кто не привык к символике математической логики, сделаем необходимые пояснения, связанные с интерпретацией этого предиката. Первая часть выражения, стоящего справа от знака равенства, говорит о том, что по прошлым наблюдениям связь Xi=>yi реализовалась/г раз. При этом Jb означает, что эта связь действительно существовала, так как индекс b выделяет на множестве значений логической переменной какое-либо, выделенное для фиксации истинных значений значение (в эти выделенные значения могут не входить, как у нас например, значение О, трактуемое как ложь, и значение 1/(/г—1), которое мы трактуем, как неопределенность). Скобка, в которой имеется знак пересечения, соответствует утверждению, что во всех наблюдавшихся случаях связи Xi—>yi в левых ее частях имелось нечто общее, некий фрагмент описания Ct и этот фрагмент не пуст. Выражение в первых квадратных скобках интерпретируется как утверждение о том, что среди наблюдавшихся k интересующих нас случаев взаимосвязи Xi с yi^e было абсолютно одинаковых. Наконец, последняя квадратная скобка выделяет само утверждение о наличии связи между Ci и ау, полученное на основе наблюдений. Условие V (г = л',)есть условие полного исчерпывания всего множества примеров. Если к описанному нами предикату добавить еще одно условие, присоединенное к M(q, ay, k) с помощью операции конъюнкции^ V,^, ((^„ {г, => и,) (ау ^ и,)) {с, ^2,)),
188 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ '^и,Ш^я){^<и q<k))~^{x,^х^){у,=у,)] У,,„[((У,(г=>/.)(с,^г))-. ^{{aj^u){^;^)(\J {z = x,))) = V^~C.) (t^2 = Xl)^Jb {^2 => "2)] ^гз, «3, v, [((^3 = V,~Q) ( {Vs = X,) ) Jb{^s=>Us))~^{aj^u,)] (k^2), В записи этого предиката его начальная часть совпадает с предикатом сходства. Пояснения требует лишь последняя часть записи, начиная со скобки (zg^fz—Cf). Знак минус, который здесь и далее используется, это знак теоретико-множественной операции, порождающей разность двух соответствующих множеств. Вся эта часть записи формализует утверждение о том, что, при исключении из ^) М и л л ь Д. С, Система логики силлогистической и индуктивной,—М.: Книжное дело, 1900, с, 313. ^) М и л л ь Д. С. Система логики силлогистической и индуктивной,— М.: Книжное дело, 1900, с. 314. ТО МЫ получим предикат, отражающий сильное положительное сходство между Ci и а_/. В этой записи У„ означает, что г^^и^ имеет невыделенную оценку. Метод сходства был предложен Миллем в следующей словесной формулировке: «Если два или более случая подлежащего исследованию явления имеют общим лишь одно обстоятельство, то это обстоятельство, в котором только и согласуются все эти случаи, есть причина (или следствие) данного явления» i). Метод сильного положительного сходства, который мы получили из простого метода сходства, у Милля отсутствует. Второй основной метод, который вытекает из схем индуктивных рассуждений Милля,— метод различия. Сам автор так сформулировал его суть: «Если случай, в котором исследуемое явление наступает, и случай, в котором оно не наступает, сходны во всех обстоятельствах, кроме одного, встречающегося лишь в первом случае, то это обстоятельство, в котором они только и разнятся, есть следствие, или причина, или необходимая часть причины» 2). Схема правила вывода по методу различия такая же, как и для вывода по методу сходства. Разница состоит только в том, что вместо предиката M{ci, aj, k) используется предикат различия N, имеющий следующий вид: Л^(с;, aj, ife)-3,^^^^3,^,^^...3,^,^
§ 4.4, ОБОБЩЕНИЕ ПО СТРУКТУРАМ 189» рассмотрения общего, содержащегося в левых частях Xf^tji в исследуемых примерах, корреляция между Xi и tji исчезает. Так как предикат различия N{ci, aj, k) содержит предикат сходства уЙ (сь /г), то метод различия оказывается более сильным, чем метод сходства. Факты, устанавливаемые по методу различия, более обоснованы, чем те, которые были найдены лишь на основании выделения сходства. Подобно предикату сильного положительного сходства можно построить предикат сильного положительного различия. Наконец, можно ввести еще методы сходства и различия не для множества положительных примеров, а для множества отрицательных примеров. Вид соответствующих правил вывода и предикатов отрицательного сходства и различий как в слабой, так и в сильной форме, имеет вид, подобный тем записям, которые мы уже привели. Поэтому не будем утомлять читателей. Отметим только явную связь приемов, используемых в ДСМ-методе, с теми приемами, которые встречались нам при использовании пирамидальных растущих сетей. Как уже говорилось, ДСМ-метод состоит не только из уже рассмотренных правил поиска закономерностей, но и из правил распространения найденных результатов по аналогии на другие случаи. Возможны два типа выводов по аналогии: с помощью положительной аналогии и с помощью отрицательной аналогии. Правило вывода по методу положительной аналогии имеет вид Здесь Л+—предикат положительной аналогии, Ji означает, что истинность этого предиката установлена, а 6' — характеризует оценку из множества выделенных истинных значений, в которое не входит единица, т. е. вывод о связи C|=>aj не носит абсолютного характера. Предикат А'^ задается в следующем виде: Л + (С;, aj) =4,^^iJb^ (г =yu)J^ {с^ =ф Uj) {2 ^ с,) {и ^ aj)) V,, ^ [((г ^ X) {{у ^и)\у \/{u^y)))-^J,^ {{х^г)=^у)1 Сделаем некоторые пояснения. В качестве исходных посылок в методе полол^ительной аналогии выступает утверждение о том, что с некоторой достоверностью, характеризуемой оценкой истинности из Ь\ имеется связь г=>гг, а относительно связи Cj=>ay пока ничего не известно (значение т есть значение недоопределенности, которое, например, может быть 1/(/г—1), как в нашем случае).Известно также, что Z входит в Ci как подструктура, а и есть подструктура для aj. Тогда утверждается, что при исключении z иЗ посылки вывод [х— —г)=>у будет оцениваться как недостоверный. Множество невыделенных оценок истинности н' может определяться тремя различными
190 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ способами, что дает три версии предиката положительной аналогии и, следовательно, три версии правила вывода по положительной аналогии. В первой версии в качестве н' берется множество, состоящее лишь из значения 0. Во второй версии это множество расширяется на все невыделенные истинные значения, кроме значения т. В третьей версии в н' включается и т. Ясно, что эти три версии упорядочены по своей силе. Вывод, сделанный, например, по первой из них, влечет за собой и два остальных вывода. Предикат отрицательной аналогии, входящий в правило вывода по отрицательной аналогии (вид того, что осталось, совпадает с правилом положительной аналогии) записывается следующим образом: А - (с^, ау) = 3,, „ (У„ (г u)J, aj) (г ^ с,) {и ^ а,.)) V,, ^ [((г ^ х) {{у ^ и) \/ \/{u^y)))~.Jb^^{{x-z)=.yy)l Как видно из записи предиката отрицательной аналогии, внешне он почти ничем не отличается от предиката Л"^. Только вместо множества Ь' взято множество н, состоящее из всех невыделенных элементов, кроме О и т, а вместо множества н' — множество 1У\ Если в качестве fc" взять 1, то мы получим первую, наиболее сильную версию вывода по отрицательной аналогии, при отождествлении Ь" с множеством всех выделенных элементов получается вторая версия, а при добавлении еще элемента т — третья версия. В заключении самого правила вывода по аналогии с помощью предиката А~ вместо Jb' стоит /„, где н—множество невыделенных оценок истинности, в которое не входят значения О и т, Л\ы ввели, следуя авторам ДСМ-метода, несколько правил вывода, формирующих гипотезы и ряд правил вывода, распространяющих по аналогии накопленную информацию на пары (с^-, ау), для которых гипотеза непосредственно не выведена. Поскольку порядок применения правил первой группы не фиксирован, то вполне воз- \южно, что на некотором шаге в памяти системы возникнет противоречивая информация. Например, относительно некоторой гипотезы Ci=>aj будут существовать два утверждения, одно из которых «голосует» за наличие связи Ct с aj, а другое отрицает ее. Однако можно показать, что непротиворечивости можно добиться, если избегать комбинации пар правил вывода первой группы, относительно которых известно, что хотя бы одно из них является сильным, если одновременно применяются правила по сходству и по различию. Можно вообще не заботиться о противоречиях, тем более, что относительно комбинаций правил вывода по аналогии с правилами первого и второго типов проблема порождения противоречивых утверждений не исследована. Практическим выходом из той ситуации, когда возникает противоречие, является исключение этой пары (ct, aj) из множества выработанных гипотез и присваивания Ci^yaj значения оценки т.
§4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 191 При практическом применении ДСМ-метода появляются два важных вопроса. Как оценивать достоверность той или иной полученной гипотезы? Как организовать последовательность применения правил вывода новых гипотез и правил аналогии для достижения наиболее эффективных гипотез при условии принятой оценки их достоверности? Ответ на эти вопросы весьма важен. Но, к сожалению, сегодня его получить еще не удается. Авторы ДСМ-метода в качестве оценки достоверности гипотез предлагают векторную оценку вида v = <n, т, 1у, где п — число шагов ДСМ-метода, которое потребовалось для вывода данной гипотезы, т — характеристика ъ.то- жества правил, использованных при данном выводе; / — характеристика, зависящая от того, какие именно множества использовались при выводе (т. е. каковы были индексы у / в предикатах, использованных при выводе). В оценке v учтены, по-видимому, все необходимые сведения, способные повлиять на достоверность окончательной гипотезы. Но беда заключается в том, что сейчас нет соображений о процедурах, позволяющих вычислять m и /, а также нет никаких методов (что, впрочем, общая беда всех задач с векторной оптимизацией) сравнения между собой оценок v в области множеств Парето. Для решения проблем, связанных со вторым вопросом, можно использовать некоторые частные соображения, полученные авторами ДСМ-метода. Обозначим через Rf некоторое правило вывода^ причем R^j — положительное правило, г Rj — отрицательное правило, /?сс» Rail) — соответственно правила сильного и слабого сходства и правила аналогии версии i (г = 1, 2, 3). Их суперпозиция означает последовательное применение правил вывода. Доказываемые в рамках ДСМ-метода соотношения, связывающие между собой правила вывода, имеют вид (1) Rt{Rt{Qi)) = Rtm. (2) Rtc{R'^cm) = Rtcm^ (3) ^?г(^г(^/))=-^?J(^£), (4) Я7с{Я7сШ = ^сЛ^1У Эти четыре свойства отражают то обстоятельство, что последовательное применение двух одинаковых методов сходства не приводит к появлению новой информации. Поэтому такие последовательности правил вывода нерациональны. Кроме того, используются еще шесть соотношений (5) ^^.{{Яи{Я1{й^))фЯ1{^,))), (6) Rl{Qi)^Rl,,,{Rl{Qi)), (7) 1^.т{Я1{^1))фЯ^{^,))), (8) RtiSid^^t (9) (10) 3^.iRi{Qi)^RtaARii^t))-
192 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ В ЭТИХ соотношениях индекс р означает сильное или слабое сходство, а индекс h — сильное или слабое различие. Последние соотношения показывают, что применение правил аналогии приводит к расширению множества гипотез, которые, таким образом, считаются доопределенными. Использование приведенных отношений между Выбор гипоп?езь(\^ Поиск пар у для которых Проверка условия с X Поиск: остатка Поиск поры Hpoch'omp и выдор (z^u), для которых 1 Вь/дача результатов оывода JL Есть ли ещё гипотезы ^ Т Конец процедуры Рис, 4,10 правилами вывода, по-видимому, в будущем сможет помочь при построении более эффективной процедуры нахождения гипотез, чем та которая выполняется в существующей сейчас программной реализации ДСМ-метода. То, что есть сейчас, требует многократного просмотра совокупностей из k пар, поиска пересечений в левых и правых элементах этих пар и выделения описаний, входящих в эти пересечения. Непустые пересечения будут соответствовать и и образовывать гипотезу с^^а^. В методах, основанных на различии, кроме этой процедуры, требуется еще найти контрпример, воз-
§4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 193 7 д. А. Поспело» никающий при отсутствии в пересечении левых частей гипотезы с^. Для устранения факториальной сложности по^, которая появляется при прямом поиске всевозможных пересечений описаний по k штук (величина k меняется от 2 до п, где п — число описаний, хранящееся в исходном множестве), можно применять различные приемы уменьшения числа реализаций пересечения одного и того же описания с другими. Но мы на этом останавливаться не будем. При реализации правил аналогии также требуется перебор, но не по k элементов, как для правил формирования гипотез, а лишь по k=2. Однако и в таком случае при большом объеме исходного множества и множества порожденных гипотез прямой перебор по парам для выявления условий применимости того или иного метода аналогий также имеет полиномиальную сложность высокого порядка. Поэтому и здесь нужны специальные приемы, уменьшающие число сравниваемых пар описаний. Хотя сущность процедуры, реализуемой на ЭВМ, достаточно ясна из вида записей предикатов сходства, различия и аналогий, проиллюстрируем одну из этих процедур блок-схемой программы, показанной на рис. 4.10. На нем приведена блок-схема для правила положительной аналогии версии 3. На рис. 4.11 в весьма схематической форме показана общая блок- схема программы, работающей в соответствии с ДСМ-методом. Прежде чем завершить рассказ о ДСМ-методе, сделаем одно важное замечание, имеющее большое значение для использования методов структурного обобщения в системах типа систем ситуационного управления. Как следует из описаний основных предикатов, входящих в правила и процедуры ДСМ-метода, этот метод успешно работает лишь при наличии непустых пересечений Ci и aj. Другими словами, предполагается, что причина, порождающая связи вида Xi^tji, Х2^У2, Хг^^Ути единственна. На самом деле такое допущение слишком жестко. Оно может часто приводить к появлению пустого пересечения из-за того, что причина не единственна. В других случаях оно может приводить и к неверным выводам относительно истинных причин. Например, обобщая подобным образом два высказывания «Сегодня прекрасная погода, я в отпуске — поеду на дачу» и «Сегодня прекрасная погода, воскресенье — поеду на дачу», система придет к выводу, что причина поездки на дачу — наличие хорошей погоды, т. е. будет считать достоверной гипотезу: «Сегодня хорошая погода — поеду на дачу». На самом деле причиной может быть некоторая логическая функция от фрагментов описаний, входящих в xj, т. е. вместо простой гипотезы С1=Фа^ введена гипотеза вида f{c}, с], cT)^aj, Вид этой функции может быть произволен. Например, функция вида f=c]c] говорит о том, что связь fz^aj имеет место лишь тогда, когда в описании присутствует с\ и отсутствует фрагмент с]. Таким образом, с] играет здесь роль тормоза, запрещающего появление следствия aj даже при наличии
194 гл. 4. обобщение и классификация ситулцип причины с\. В случае же f=c\{c\\^c^d фрагмент может рассмат- риваться как тормоз для тормоза с?, так как наличие с} даже при начичии с? создает условия для возникновения связи /=:>ау. 1 ввод исходной троичной матрицы С мноместЗами й^, Й,. 1 Выбор правило ^ поромиьния гипотез Rj Применение бь/бранного прибила * — dbfdop прибила бывода по иналоеии a(L) Припенение выдранного пробила Возможно ли дальнейшге применение поло?нител!зНЬ/;( пробил? ' \нет ' Выбор правила поро}ндеиия гипотез Rj -JL Применение выбранного правила Выбор прадила вывода по аналогии X Применение выдранного пробила Возможно У7и далы/ейшее применение отрис^ательных правил^ ' I \Иет Сроднете полученной матрицы с предшестЗующеи матрицей 1 1 Вдод новой матрии^ы 1^ б каиеслпбе исходной Конец процедуры Рис. 4.11 Переход от принципа единственной причины к рассмотрению совокупности причин вместе с тормозами и тормозами на тормозы резко расширяет возможности метода формирования гипотез. В этом
§ 4.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 195 • ] 1 1 I •■5 ^5 Рис. 4.12 случае можно рассматривать обобщенные правила вывода типа правил положительных и отрицательных сходств и различий и модифицированные правила вывода по аналогии. В настоящее время в ДСМ-методе нет реально действующих процедур такого типа, но создание их не представляется слишком сложным. Интересна и не решена пока еще и задача установления соответствия между правилами вывода по аналогии, применяемыми в обсуждаемом нами методе обобщения по структурам, и методами вывода по аналогии, о которых шла речь в § 3.7. Кроме того подхода к обобщению понятий по структуре, который основан на идеях, высказанных еще Ф. Бэконом и С. Миллем, можно построить и другие процедуры, не опирающиеся в явной форме на идею индукции. Рассмотрим в связи с этим ряд примеров. Пример 4.3. На рис. 4.12 показана некоторая структура, состоящая из однотипных объектов с именами ii, 1*2, Ее можно рассматривать, например, как игровое поле для известной всем с детских лет игры в крестики-нолики. Сплошным стрелкам на этом рисунке соответствует отношение г^^ — быть справа, а пунктирным стрелкам — отношение г^^ — быть снизу. Всю показанную структуру можно описать на языке ситуационного управления следующим образом: ШРЧ) ^32 (^РЧ)) ((^Р^'з) ^32 (^РЧ)))' (((^РЬ) ^32 Шх)) ((^Pifi) ^32 (^Pi's))). ((Ms) ^32 Wh)) iim^) ^32 M'g))). r,, (api,)) {{api,) r,, (api,))). (((^Pi'e) ^41 (^Р^з)) ((^Pig) ^41 (^Pi'e)))' Тройными скобками в этой записи выделены однотипные структуры. Первые три и соответственно последние три структуры отличаются друг от друга лишь использованными в атомарных формулах именами. Установим между первыми тремя фрагментами отношение изоморфизма: i2^ib^h\ h'^h'^h', h^h^h- Если для изоморфных троек ввести обозначение ^2, li и то все три первых фрагмента станут одинаковыми и примут вид (i2^32?i) (?з^з2?2)- Это описание можно считать новым понятием — горизонтальный ряд из трех элементов. Его черезвычайно легко обобщить на случай, когда в ряду имеется п элементов. Описание этого понятия записывается следующим образом: (^.''32^1) (?з^32У-- - (^л^зг?»-!)- 7*
196 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП Рассмотрим теперь три последних фрагмента в исходном описании. Введем следующий изоморфизм для имен: i4<->i5<->ie; ii<->i2<-> ч->/з; i\<->ig<->i9. Если для изоморфных имен ввести обозначения i^ia, 111 и г]з, то все три последних фрагмента примут вид (г]2 r^i r\i) [ц^ Г41'П2)- Это описание можно считать новым понятием — вертикальный ряд из трех элементов. Его также нетрудно обобщить на случай, когда в вертикальном ряду имеется п элементов: Установим теперь изоморфизм Hi<->r|i; ^^^-^Лг; ^:з^г|з; ^з2<->^41 и обозначим отношение, характеризующее последний изо.\юрфизм, через со. Тогда получим запись, в которой есть обозначения изоморфных h и r]i: (V2COV1) (Vgcovg). Смысл этого понятия — ряд иЗ трех элементов. Для произвольного п — ряд из п элементов вида Для более полного определения последнего понятия надо в изоморфизм между отношениями включить еще отношение быть слева и быть сверху. Сделаем некоторые замечания в связи с только что приведенным примером. С помощью операции изоморфизма мы ввели в описание • ^/ • с) • 4 • • hi • h • • Рис. 4.13 некоторые новые элементы; их можно считать классами, в которые входят все элементы, изоморфные между собой. Такие классы принято называть классами эквивалентности. В ходе формирования окончательного описания мы последовательно увеличивали мощность этих классов. На рис. 4.13 показана получившаяся иерархия.
§4.4. ОБОБЩЕНИЕ по СТРУКТУРАМ 197 Это типичная родо-видовая иерархия, которая упоминалась в §4.2. Пример 4.4. Пусть дано следующее описание ситуации на языке ситуационного управления: {{api,)r,,d){(apQ r^^{api,)), ((ар/О г, {vr,0)) {{api,)rAvr,0))... Здесь приняты следующие обозначения: а — автомобиль, ij{j = = 1,2,...,40) — различные государственные номерные знаки, d — заправка автомобиля, v — скорость, г^^ — совершать действие, Гз4 — быть сзади, — иметь признак, — признак — значение. После пояснений обозначений ситуация, описанная выше, становится ясной. В некотором месте на заправку имеется очередь из 40 автомобилей с конкретными государственными номерными знаками. Автомобиль с номерным знаком ii в данный момент заправляется топливом. Будем постепенно проводить обобщение нашего описания. Прежде всего введем свободные номера Hi, ^2,...,?4о, которые будут соответствовать любым попарно различным государственным номерным знакам. Автомобиль {apli) имеет некоторый, точно не названный номер. Кроме того, не будем фиксировать число автомобилей в очереди. Для этого введем кроме свободных имен еще и свободный порядковый номер б. Значениями б могут быть любые элементы натурального ряда. После этого находим ((apli) r,,d) ((арУ r,,{apl^))... iiaph) Г34 {aph-i)) {{apli) r, {vr,0))... ((apSfi) r, {vr,0)). Это описание может рассматриваться, как структура понятия «очередь автомобилей на заправку». Если теперь исключить из описания первую скобку, то оставшуюся часть можно считать структурой понятия «стоящая колонна автомобилей». Если же вместо значения скорости О в описании присутствует некоторое ненулевое свободное значение Я, то полученная структура может интерпретироваться как «движущаяся колонна автомобилей». Если, наконец, вместо а в описание подставить свободную переменную г], интерпретируемую на множестве объектов, способных к движению, то находим ((ЛР^г) ^Я4 (ЛР^О). • . ((ЛРЫ ^34 (ЛР^в-О) ((ЛР^О г, {vr,X))... ((лр^б) г, {vr,X)). Это описание отражает структуру понятия «движущаяся колонна объектов». Если из него исключить информацию о скорости, заменить атомарные тройки с именами {^pli) на Vj, а отношение г..^
198 гл. 1. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУЛЦИП заменить на со, то мы получим (V2COVJ (VgCOV,). . .(VfiCOVfi^O- Если это описание сравнить с тем, которое мы получили в предшествующем примере, то при отождествлении б с п мы увидим их полное совпадение. И действительно колонна неподвижных объектов вполне может трактоваться, как ряд из п элементов. Пример 4.5. Рассмотрим следующее описание ситуации: ИМ) г,,с),.Л{М) г,,с). Здесь — сокращенная запись атомарного описания вида (ёРЧ)^ где g — станок, ij — индивидуальные номера станков, / — фрезерный станок, с — состояние быть свободным, г.^ — быть элементом класса, Гг,д — находиться в состоянии. Напомним еще раз, что между всеми скобками имеется отношение быть одновременно. Таким образом, здесь описана ситуация, что в некоторый момент времени б фрезерных станков свободны. Обобщим это описание с помощью квантификатора >|, интерпретируемого как некоторые из. Новое описание будет иметь вид {(у{ёУ4)г^^^с. Смысл этой записи такой же, как и исходной, ибо значение б не определено. Если же, например, мы располагаем априорной информацией о количестве фрезерных станков на данном предприятии и значение б указано конкретно, то в зависимости от б и общего числа фрезерных станков квантификатор >| может принимать значения: лииль нюольилая часть, примерно половина, почти все и т. п. Обсудим еще два небольших примера. Пример 4.6. Рассмотрим описание ((/ip/J г, {сг,Ь,)) {{hpU) г, (сгЛ)) ((/ip/з) ^ (сг,Ь,)), где Л —кран, 1^, 1^, /^j —индивидуальные номера кранов, с —цвет, &ь b-z, &.3 — конкретные значения цветов. Отношения имеют тот же смысл, что и в примере 4.4, Заменим это описание описанием, в котором ^юдификaтop т имеет значение цветной: {{mh)pii) ((m/Op/2) ((m/i)p/;i). Смысл его состоит в утверждении о существовании трех кранов, окрашенных в некоторые цвета. Пример 4.7. Пусть а —молоток, /; — пила, с —клещи, d —стамеска, ^—рубанок, Г47 —бь/ть инструментом для, pi — забивание гвоздей в дерево, рз —разрезание дерева на части, рз — вытаскивание гвоздей из дерева, Ра — создание углублений в дереве, рг, — выравнивание поверхности дерева. Рассмотрим описание, в котором точки с запятой, стоящие между скобками, соответствуют отсутствию между ними отношения быть одновременно, (ari-^pi); фг^-р^У, {cr^-jp^)\ (^^47/^4); {егх-!Р:У Введем понятие z — инструмент и понятие р — процесс обработки дерева. Тогда описание (zr^-^p), которое заменяет предшествующее, можно интерпретировать, как понятие столярный инструмент.
§ -1.4. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 199 О чем говорят приведенные нами примеры? Скорее всего о том, что способов обобщения по структуре довольно много. В примере 4.3 обобщались объекты, участвующие в описании, их имена и от- ногиения. И это обобщение происходило за счет установления некоторого-изоморфизма. В примере 4.4 кроме обобщения по именам использовалось еще обобщение по значению признака у, а также за счет введения неопределенного количественного показателя б, В примере 4,6 обобщающим фактором было введение модификатора цветной вместо конкретного указания на цвет. Наконец, в последнем примере использовано обобщение по процессам с обобщением по объектам. Для каждого вида обобщений нул<но иметь специальные средства. Однако для многих из них существует общая модель, связанная с моделью представления описаний в виде семантического графа. Каждый семантический граф (СГ) представляет собой взвешенный мультиграф, причем веса могут приписываться как вершинам СГ, так и его дугам. Будем рассматривать СГ, в которых используется пять типов вершин. Вершины первого типа носят название объектных. Вес объектных вершин имеет вид </г, т>. Здесь п — число однотипных объектов, приписываемых данной вершине или некоторый квантификатор, оценивающий это число, т — тип объекта (некоторый класс, к которому принадлежат объекты, соответствующие данной вершине). Вершины второго типа называются призначными. Вес таких вершин имеет вид <(л;1, ПО, (Яг, П2)...(л^^, П;,)>, где л,- — имена признаков, а П^^ — значения признаков. Вершины третьего типа называются предикатными. В качестве их веса выступает имя некоторого предиката Pi с указанием его местности. Функциональные вершины составляют четвертый тип вершин в СГ. В качестве их веса выступает тот функциональный символ, который определяет суть этой вершины. Для функционального символа указывается его местность. Наконец, последний тип вершин вСГ — именные вершины; их вес выражается через некоторые символы из множества имен. Опишем теперь правила проведения дуг в СГ. Начнем с при- значных вершин. В них могут входить дуги, помеченные весами, которые соответствуют именам признаков, имеющимся в весе данной вершины. Из призначной вершины всегда исходит лишь одна дуга, которая ведет к некоторой объектной вершине. Для предикатных вершин число входных дуг должно соответствовать местности данного предиката. Эти дуги идут от объектных вершин и имеют веса, определяющие положение соответствующих значений в структуре предиката. Их можно рассматривать как определенные указания на те роли, которые они играют в предикатном выражении. Выходные дуги для этих вершин могут идти к объектным или функциональным вершинам. Для функциональных веришн входными дугами могут служить дуги, идущие от объектных, предикатных и функциональных вершин. Веса дуг определяют либо значения со-
200 ГЛ, 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ ответствующих аргументов, либо возможность или невозможность выполнения той или иной последовательности операций в зависимости от значений, выдаваемых предикатными вершинами. Но для каждой функциональной вершины заведомо существует хотя бы один путь, ведущий от некоторой объектной вершины к другой объектной вершине. Наконец, именные вершины не имеют входных дуг, а единственная их выходная дуга связана с некоторой объектной вершиной. Для объектных вершин единственным ограничением на входные дуги является то, что у нее может быть только одна дуга, идущая от призначной вершины. Между СГ и описаниями на языке ситуационного управления существует прямая связь. Проиллюстрируем ее на примере. Пример 4.8. На рис. 4.14 показан СГ, который соответствует описанию, приведенному в примере 4,4, На нем объектные вершины □ ? 1^ Г Р <иХ'У L Г 4 1' Рис. 4.14 обозначены двойными кружками, предикатные — обычными кружками, именные — маленькими зачерненными кружками, признач- ные — квадратиками. Роли R' и R" — соответственно получатель и отправитель. Роли Q' и определяют соответственно тех, кто стоит слева неправа в отношениях Г34. На рис. 4.14, б показан один из этапов обобщения, когда произошло обобщение всех автомобилей с номерами от 2 до б в одну объектную вершину. Такое обобщение вызывает много вопросов, связанных с однозначной интерпрета-
§4.-1. ОБОБЩЕНИЕ ПО СТРУКТУРАМ 201 цией тех знаний, которые содержатся в обобщенном СГ, в частности, знаний о выборе аргументов для предикатной вершины, связанной с обобщенной объектной вершиной, знаний о приписывании имен объектам, входящим в обобщенную вершину и т. п. Для ответа на подобные вопросы необходимо сначала сформулировать более точно понятие обобщенной вершины того или иного типа. Начнем с объектных вершин. Будем говорить, что объектная вершина Vi является более общей чем объектная вершина Кг, если выполнены следующие условия. 1. Составляющая веса п для Vi больше, чем для l/g- Это соответствует тому, что объект, сопоставляемый вершине Vu содержит больше однотипных элементов, чем такой же объект, сопоставляемый вершине l/g. На рис. 4.14, б вершина с весом ,6, а} играет в частности именно такую роль по отношению к вершине с весом ч1, 2. Составляющая веса т для Vi включает в себя как подлшоже- ство составляющую т для V^- Примером такого обобщения ^южeт служить переход от вершины, для которой т — класс aвтo^юбплeй, к вершине, для которой т — класс с именем «транспортные средства». Это обобщение есть по сути приписывание данной объектной вершине другого имени, хотя имя, сопоставляемое ей именной вершиной, может и сохраниться. 3. Призначная вершина, приписываемая Vi, включает в себл весь набор значений признаков в прнзначной вершине, приписываемой Т/'г, причем все области значений признаков для Vi не меньше, чем области значений признаков для и содержат в перечне признаков в своей призначной вершине еще хотя бы один признак. Если же наборы признаков для Vi и одинаковы, то область значений хотя бы для одного признака для Vi включает в себя область значений этого признака для Эти три условия отражают различные способы обобщения, которые мы рассмотрели в примерах 4.3—4.7. Так, первое условие есть обобщение по квантификатору. В частности, при объединении в одну вершину неопределенного количества объектов (примером этого служит СГ на рис. 4.14, б) вместо количественного значения для составляющей веса п дюжно использовать качественный квантификатор количества. Второе условие есть обобщение по имени, так как т связаны некоторой иерархической связью родо-видового типа. В § 2.9 мы уже говорили о иерархиях типа АКО-связи, которая как раз и задает условия для обобщения, выполняемого по такому принципу. Наконец, третье условие есть условие обобщения по модификаторам, проиллюстрированное нами в примере 4.6. Рассмотрим теперь вершины других типов. Для именных вершин Vi и V2 вершина l-'i будет более общей, если имя, представляемое V2, входит в имя, представляемое Vi. Вхождение имен надо понимать двояко, с одной стороны, Vi может соответствовать множество имен, а V2 — подмножество имен (в частности, одно имя), входящее в множество имен \\. Пример такой ситуации демонстрирует нам
202 ГЛ. 4. ОБОБЩЕНИЕ п кллссиФИклш:я cит^-лцип рис. 4.14; так, на рис. 4.14, б соответствующая обобщенная объектная вершина более общая, чем любая из именных вершин на рис. 4.14, а, приписываемых тем объектным вершинам, которые потом вошли в состав обобщенной вершины на рис. 4.14, б. С другой стороны, ^юж■eт существовать естественная иерархия имен. Примером могут служить мужские и женские имена, характерные для каждого языка и в частности русского. С их помощью образуются два обобщенных имени — мужское имя и женское имя, относительно мощности которых информации может п не быть. Другой пример — класс детское имя, элементы которого в русском языке получаются за счет использования уменьшительных суффиксов от многих мужских и женских имен. Аналогично существует определенная традиция в выборе имен для футбольных команд, пароходов, гор, кошек, собак и т. п. Для призначных вершин, обобщение уже описано условием 3 для объектных вершин. Для предикатных вершин обобщение достигается за счет перехода от одного веса вершины к другому. Предикатная вершина Vi является более общей, чем l/g, если из истинности предиката, приписываемого всегда следует истинность предиката, приписываемого V^. Наконец, функциональная вершина Vi является более общей, чем функциональная вершина Уг, если при реализации функции, соответствующей реализуется и функция, соответствующая l/g. Будем считать, что Cfi есть обобщение СГг, если в CFi есть хотя бы одна вершина, являющаяся обобщением одной или нескольких вершин из СГ2, а в СГг нет таких вершин. Будем также говорить, что в этом случае СГ2 наложим на Cfi. Теперь можно связать описанный нами аппарат обобщения, опирающийся на представление информации с помощью семантических графов, составляющих определенный подкласс семантических сетей, с аппаратом, развитым в ДСМ-методе. Пусть имеется некоторая обучающая выборка, содержащая как положительные, так и отрицательные примеры. Пусть в множество положительных примеров, характеризующих формируемое понятие, входят описания в виде семантических графов СГ^, CFg, СГ/,. Тогда задача обобщения может быть сформулирована следующим образом. Найти такую совокупность семантических графов СГ\ CГ^ СГ'", которая была бы наложима на СГ^, СГг, СГ^ и не была бы наложима на семантические графы, входящие в множество контрпримеров. В простейшем случае, эквивалентном случаю существования единственной причины для гипотезы >ау в ДСМ-методе, требуется найти один СГ *, который был бы наложим на любой из семантических графов, представляющих класс положительных примеров обучающей выборки, и не был бы наложим ни на один граф, характеризующий класс отрицательных примеров обучающей выборки. В более общем случае, когда множество покрывающих СГ для всех положительных примеров содержит более одного элемента, возникает ситуация, по-
§4.3. «СЛОЕНЫЙ ПИРОГ» 203 добная той, которая в ДСМ-методе привела к появлению обобщенных правил. Не желая утомлять читателей изложением соответствующих процедур поиска СГ * или некоторого дизъюнктивного представления из покрывающих СГ, которые во многом аналогичны процедурам ДСМ-метода, отсылаем читателя к работам Н. П. Викторовой, указанным в списке литературы к данной главе. В этих работах описан весь спектр необходимых процедур работы с семантическими графами. § 4.5. «Слоеный пирог» Мы рассмотрели методы, позволяющие формировать обобщенные описания ситуаций в соответствии с теми решениями, которые были приписаны ситуациям, входившим в обучающую выборку. В процессе функционирования системы ситуационного управления работа по формированию классов ситуаций и уточнению ранее сформированных классов происходит постоянно, так как обучающая выборка может не исчерпывать всего богатства возможных ситуаций, складывающихся на объекте управления. Обобщение может происходить на многих этапах, и поэтому исходные описания ситуаций и обобщенные их описания образуют иерархическую структуру, в каждом слое которой находятся описания, полученные из исходных с помощью тех или иных процедур обобщения. Если исходные описания принять за нулевой уровень, то на первом уровне будут находиться описания, полученные непосредственно из описаний ситуаций, лежащих на нулевом уровне. На второй уровень попадут описания, которые возникнут за счет применения процедур обобщения к описаниям первого уровня и т. д. Так возникает «слоеный пирог», показанный на рис. 4.15. Ситуации на всех уровнях обобщения соответствуют некоторым решениям по управлению. В идеальном случае на самом верхнем Рис. 4.15
204 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ уровне системы классификации возникают описания, каждому из которых соответствует определенное решение по управлению. В более частых случаях при недостаточной обучающей выборке окончательное разделение классов может и не произойти. Оно никогда не наступает при недетерминированном процессе формирования обобщенных ситуаций. Если решения по управлению сами обладают некоторой структурой, то при формировании «слоеного пирога» требуется соотнести уровни управления в структуре принимаемого управленческого решения с уровнями классификатора. Для осуществления этого мол<но использовать следующий прием. Пусть в некоторой ситуации необходимо принять решение U, которое само распадается на три самостоятельных решения по управлению Uu О2 и [/3, связанные с решением U следующим образом. Прежде всего принимается решение Uu а затем по результату его реализации необходимо выбрать либо решение t/2, либо решение f/з. При классификации ситуаций это означает, что имеется некий класс ситуаций, которому соответствует решение f/2. другой класс ситуаций, которому соответствует решение U3 и, наконец, класс ситуаций, которому соответствует решение и. Именно и, а не Uu так как Ui может определять совершенно другой класс ситуаций, для которых одношаговое решение Ui окончательно. Это приводит к необходимости разнесения описаний обобщенных ситуаций для U и для f/2 и U3 на разные уровни обобщения, так как для С/гИ t/g обучение формированию обобщенных ситуаций должно происходить лишь на множестве ситуаций, относящихся к решению U, Кроме того, на том же уровне, что и для и, могут существовать классы ситуаций, для которых одно- шаговые решения U2 и U3 окончательны. Если имеется управление (решение) U, которое состоит из п последовательных управлений, то в «слоеном пироге» возникает п уровней классификации. Иерархичность управления позволяет формировать обобщенные описания за существенно меньшее число шагов, чем в общем случае. Рис. 4Л6
§ 4.5. «СЛОЕНЫЙ ПИРОГ» 205 Столь же полезны и иерархические описания ситуаций на объекте управления, что определяется структурой самого объекта. Иерархические описания помогают каждый раз выделять общие части сравниваемых описаний (и именно эта процедура является центральной во всех методах обобщения в ситуационном управлении) за меньшее число операций, так как граф описания естественным образом распадается на графы меньшей размерности. Во многих-задачах, важных в теории ситуационного управления, все эти иерархии имеют специальный вид /-графа. Общий вид /- графа показан на рис. 4.16. Такие иерархические графы обладают следующими свойствами. 1. /-граф состоит из некоторого числа подграфов Gj, которые не пересекаются между собой. На рис. 4.16 показано три таких подграфа. 2. Подграфы Gi могут быть упорядочены по уровням при усло- ьии выполнения следующего условия: любая вершина подграфа Gi связана дугой с какой-то одной вершиной G,-^i. Подграф Gi всегда состоит из одной вершины, с которой связана одна или несколько вершин подграфа Gg. Направление дуг, связывающих вершины разных подграфов, всегда таково, что дуга направлена из подграфа с большим номером в подграф с меньшим номером. 3. Если в некотором подграфе Gi две вершины связаны дугой, то они соединены с одной и той же вершиной подграфа Gi_^i. Пример 4.9. На рис. 4.17 показана структура семантического графа, описывающая знания о некотором участке энергосистемы, где приняты следующие обозначения: П — потребитель, СТ — станция, СВ — линия связи. Обозначения на третьем уровне идентифицируют конкретных представителей классов, показанных на втором уровне этого /-графа. Для /-графов решение задачи поиска общих фрагментов в семантических графах требует существенно меньшего времени, чем для СГ произвольной структуры. Поэтому желательно стараться Рис. 4.17
206 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ представлять описание ситуаций на объекте управления и общих знаний о структуре управления в виде /-графов. При построении «слоеного пирога», составляющего сущность Классификатора, выполняется следующая последовательность процедур. Сначала исходное описание текущей ситуации пополняется всеми дополнительными сведениями за счет работы процедур пополнения описаний, о которых шла речь в гл. 3. Затем к полученным описаниям применяются процедуры обобщения. Полученные результаты, относящиеся к первому уровню «слоеного пирога», рассматриваются снова, как исходное описание. К ним вновь применяются методы пополнения и происходит очередной шаг обобщения. Так продолжается до тех пор, пока на очередном уровне к полученным фрагментам нельзя будет применить ни процедур пополнения, ни процедур обобщения, не приводящих к противоречивым управленческим решениям. Когда Классификатор сформирован, то его работа заключается в следующем. Если на вход системы управления поступает некоторая конкретная ситуация, то она обогащается за счет работы процедур пополнения описаний ситуаций и поступает на нулевой уровень «слоеного пирога». С помощью вертикальных связей она обобщается до наивысшего возможного уровня. Если на этом уровне ей соответствует решение по управлению, то оно поступает из Классификатора в Коррелятор. Если же при невозможности дальнейшего обобщения данному уровню не соответствует никакого решения, то Классификатор переходит в стадию обучения. Иерархическая структура, формируемая в Классификаторе в процессе обучения, отражает ту ситуативную классификацию, о которой речь была в §4.2. § 4.6. Некоторые сведения о классифицирующих системах ** Здесь мы постараемся сообщить некоторые сведения о системах классификации, которые могут оказаться полезными при построении Классификаторов систем ситуационного управления, В самом общем виде система классификации определяется следующим образом. Пусть задано некоторое множество М и определена на нем система подмножеств Mi, М2, М^. Эта система образует либо разбиение М, либо его покрытие. В первом случае, для любой пары подмножеств Mj имеем Mi oAlj^0 и и Mi = M. Пoд^шoжecт- ва Mi в таком случае называются классами эквивалентности. Во втором случае, имеется хотя бы одна пара таких подмножеств Mt и Mj, что при (Ф1 Mi()Mj^0, но \jMi=^M. Подмножества A4i в этом случае называются классами толерантности. Подмножества Mi можно в свою очередь представить системами своих подмножеств, которые могут давать либо разбиение /И/, либо его покрытие. И т. д. Так возникает классификация ситуаций, в
§4.6. О КЛАССИФИЦИРУЮЩИХ СИСТЕМАХ 207 которой одновременно отражена и родо-видовая классификация и та ситуативная классификация, которая определяется выбором тех или иных подмножеств Мь образующих классификационную структуру. Возникает естественный вопрос — как сравнивать между собой различные классификации для одного и того же множества? Конечно, их сравнение во многом определяется целью классификации. Например, для ситуационного управления нужно располагать классификацией, которая давала бы наиболее быстрые и однозначные ответы по поводу рекомендаций тех или иных решений по управлению. Поэтому классификация будет наилучшей, если множества верхнего уровня «слоеного пирога» дают разбиение множества исходных ситуаций таким образом, что каждому классу эквивалентности данного верхнего уровня соответствует одно решение по управлению. А среди всех таких классификаций, очевидно, наилучшей будет та, которая содержит минимальное число уровней, т. е. является наиболее «быстрой» при поиске ответа. Но уже неоднократно отмечалось, что классификации такого типа построить практически невозможно. Большинство классификаций будет содержать классы толерантности, а не классы эквивалентности. В таком случае вопрос о выборе наилучшей классификации становится уже не столь тривиальным. Рассмотрим задачу о качестве описания некоторого подмножества Mi признаками, характерными для множества М. Под признаками здесь и далее мы будем понимать как признаки в обычном смысле, так и структурные признаки, т. е. фрагменты структуры, задаваемой на объектах, входящих в М (например, в качестве таких объектов могут выступать описания ситуаций на языке ситуационного управления). Если бы речь шла о характеристике Mi каким- либо набором наилучших признаков, то можно было бы ввести признак я, который есть 1, если объект принадлежит М^, и О — если он не принадлежит М^-. Если Mi — класс эквивалентности для М, то справедлива теорема, доказательство которой здесь не приводится. Она говорит о том, что признак ic, если он не является признаком для М, можно выразить в виде двоичной логической функции от тех признаков, которые используются в М для организации классификационной структуры. Недостаток этой теоремы состоит в том, что она лишь декларирует существование этой двоичной логической функции, но не дает возможности получить ее конструкцию. Второй недостаток — требование принадлежности Mi к классу эквивалентности, что ограничивает классификационные структуры лишь такими, в которых все Mi — классы эквивалентности. Пусть для классификации множества М используется набор из п признаков л;, / = 2,..., п. Тогда Ml соответствует некоторая конъюнкция из части Ki. Если классификация такова, что среди М^ имеются множества, которые отвечают любым таким возможным конъюнкциям, то решение, следующее из приведенной теоремы, будет един-
208 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИИ ственно возможным. На рис. 4.18 показан такой случай классификации для двух признаков, определяющих объекты множества М, Однако в практически важных случаях имеется довольно много признаков, используемых для классификации, и далеко не все их комбинации встречаются в тех подмножествах, на которые можно декомпозировать М, И, кроме того, в классификациях могут встречаться классы толерантности. Поэтому несколько изменим постановку задачи. Будем искать такие множества Мь набор характеристик которых «достаточно похож» на не- )л^л^л^ которую систему признаков, определенных на М с целью классификации. От- jz^^j метим, что классы, показанные на рис. 4.18 на одном уровне, могут считаться попарно «достаточно похожими», так как они отличаются друг от друга всего .одним признаком. Назовем а-эталоном для множества Mi такой набор признаков, что для любого объекта X из Mi справедливо неравенство - Здесь — множество признаков, которыми Рис. 4Л8 описывается Y, |К| означает число элементов множества Y. Смысл а-эталона состоит в том, что с его помощью выделяется такой набор признаков, что для любого элемента, включенного в М^-, относительная доля его признаков, общих со всеми остальными признаками множества Mi, не меньше а. Если существует такой объект л: g М^-, что все его признаки входят в состав а-эталона, то он назьшается а-эталонным объектом. Очевидно, что 0<а<1. При а=1 все объекты, входящие в Ml, обладают некоторыми общими признаками. В качестве 1-эта- лонного объекта в этом случае можно брать любой объект из Mi. При 0<а<1 существование эталонного объекта не обязательно, так как признаки, приписываемые различным М{ из М^-, могут и не пересекаться так, чтобы выполнялось условие существования а-эталонного объекта. В этом случае а-эталон дает представление о некотором «идеальном объекте». Подобная ситуация часто возникает в жизни. Когда вы участвуете в обмене своей квартиры, то даже при условии четкого перечисления всех признаков, которыми должна характеризоваться квартира, вряд ли обязана существовать идеальная квартира, удовлетворяющая всем выдвинутым вами требованиям. А то, что обмен все же происходит, говорит о том, что для процедуры классификации квартир и выбора в соответствии с этой классификацией устраивающего вас варианта реальное существование эталонного объекта вовсе не обязательно. Теперь можно определить понятие меры общности для множества Mi. Будем говорить, что Mi имеет меру общности е, если е есть
§4.6. О КЛАССИФИЦИРУЮЩИХ СИСТЕМАХ 209 максимальное значение, при котором для этого множества существует а-эталон. Такой е-эталон называется также полным эталоном для множества Mi, Для одного и того же множества Mi может су- ществовать несколько полных эталонов. Набор признаков, который входит в какой-либо а-эталон, будем называть максимальным, если любое расширение набора приводит к тому, что он перестает быть а-эталоном. Пусть теперь /е = шах|п?| — максимальное количество признаков в полных эталонах (kJ есть число признаков, входящих в /-Й полный эталон для Mi). Пусть кроме того 1^ — максимальное число признаков, которые используются в Mi для характеристики какого-либо объекта, входящего в это множество. Тогда мерой сходства для множества Mi будем называть величину ^j^^=le ' 'м^. Нетрудно видеть, что p^j^ изменяется от О до 1. При ^^.=0 в полных эталонах нет признаков, т. е. полные эталоны не существуют. Все объекты в Mi описываются различными признаками. При = \ все объекты в Mi описываются одними и теми же наборами признаков. Таким образом, чем больше (i^j^, тем больше сходства между элементами в Mi. Можно считать лучшей ту классификацию, для которой величина min больше. Прежде чем высказать некоторые другие сообра* жения, связанные с качеством классификаций, покажем, как можно использовать понятие а-эталонов при решении задач классификации и образования понятий более высокого уровня. Пусть имеется два множества Mi и My, характеризуемые эталонами ai и а^, которые эти множества различают. Такие эталоны называются эталонами различия. Для них справедливо следующее положение: для любого x^Mi имеет место Пп-^Ка;|я^/|^ а для любого y^Mj имеет место \тс^1 Пзх>'|<а^|л'^^*|. Тогда можно предложить следующие условия принадлежности некоторого элемента Z к множеству Mi или М^, 1. Если при добавлении z к Mi сохраняются а^-эталоны этого множества (заметим, что добавление новых элементов к некоторому множеству может только уменьшить сходство, но не увеличить его) и остается справедливым неравенство In"^/n^^l<ctj|n*'^V|, то объект Z относится к множеству М^, 2. Если при добавлении z к Mj сохраняются а^-эталоны этого множества и остается справедливым неравенство П^^\< <а^|я'^М, то объект z относится к множеству Mj. 3. Если не выполнены условия 1 или 2 (одновременное их выполнение, как нетрудно видеть, невозможно), то объект z нельзя включить в эти множества. Для него либо должно существовать другое множество Mj^ в М, либо он является представителем нового множества, которое необходимо выделить в М.
210 ГЛ. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ Рис. 4.19 Можно использовать полные эталоны и при выборе характеристических признаков, определяющих принадлежность объектов к некоторому сформированному ранее обобщенному понятию, которому соответствует множество М^. Если Mt имеет единственный полный эталон и мера общности для данного множества достаточно велика, то этот эталон можно считать признаком для данного множества, т. е. считать, что «удовлетворение» эталону есть причина отнесения проверяемого объекта к данному множеству. Укажем теперь еще ряд характеристик, которые можно использовать при оценке качества классификации. Прежде всего,эти оценки оказываются связанными с эффективностью решений тех задач, ради которых производится классификация. Для нас такими задачами являются задачи поиска решения по управлению для ситуации, описание которой в данный момент поступило в систему управления. Рассмотрим множество возможных решений по управлению U={Ui, U2, и^^}. Каждая проверка, связанная с анализом описания ситуации S, позволяет произвести в множестве U разбиение, при котором из U выделяется подмножество U' решений, которые можно применить в данной ситуации. Если через v' обозначить число элементов, входящих в U\ то чем меньше у' тем более точные рекомендации по управлению мы получим на данном шаге. В идеален' должно быть равно единице. В этом случае решение по управлению будет однозначным. Постепенное уточнение U' есть некоторый процесс проверок, связанных с анализом и. Каждая такая проверка имеет некоторую цену iV, выражаемую, например, числом операций, которые надо на нее затратить. Если представить себе всю процедуру перехода от U к одноэлементному U' (или U' с наименьшим возможным для данного способа классификации числом элементов) в виде некоторого древовидного графа, то получим граф, показанный на рис. 4.19. На нем вершины соответствуют тем классам, которые выделены в «слоеном пироге», а дуги — проверкам описания S, позволяющим переходить от одного обобщенного описания к другому. Эти дуги нагружены, как уже говорилось, весами i]', а вершинам сопоставлены веса v'. Структуры такого типа в теории диагностики получили название вопросников. Для получения интересующего нас ответа — множества рекомендаций по управлению, мы как бы задаем вопросы, которым в нашем случае соответствуют проверки описания S. Каждому
§4.6. О КЛАССИФИЦИРУЮЩИХ СИСТЕМАХ 211? вопросу соответствует на графе дуга. Параметр v' в теории вопросников называется основанием вопроса^ а параметр —ценой вопроса. Введенные параметры позволяют ставить задачу об оптимизации графа классификации, а так как вид его прямо связан со структурой «слоеного пирога»,— то и об оптимизации структуры, формируемой Классификатором. Легко видеть, что средняя цена обхода вопросника зависит от порядка вопросов, а значит, ее можно изменить приписыванием некоторых приоритетов тем или иным вопросам. Если, например, цена вопроса, ведущего от корневой вершины к вершине 2, не превосходит суммарной цены вопросов, ведущих от этой корневой вершины к вершине 7, а затем к вершине 2, то для движения к вершине 2 выгоднее задать этот один вопрос. Но движение к вершине 1 позволяет при определенном описании S сразу следующим вопросом придти к конечной вершине f/g, что может оказаться более выгодным, чем движение к вершине 2, Эта дилемма может быть разрешена только в том случае, если кроме параметров и г\' системе известна еще некоторая информация о частоте отнесения S при решении задач по управлению к тому или иному классу UI Но, как мы уже неоднократно подчеркивали, такая информация отсутствует. Вместо нее можно попытаться использовать информацию, связанную со структурой вопросника, введя понятие веса вершин. Весами концевых вершин остаются v), соответствующие числу элементов, входящих в U), весами промежуточных вершин — суммы весов тех концевых вершин, которые достижимы с помощью вопросов из данной промежуточной вершины. Таким образом, вес корневой вершины вопросника есть число всех возможных решений по управлению. Более удобно использовать относительный вес вершин, равный частному от деления веса данной вершины на сумму весов всех вершин, образующих вопросник. Если, например, для вопросника, показанного на рис. 4.19, считать, что веса концевых вершин в том порядке, как они проиндексированы, равны соответственно 1, 2, 2, 1, 1, то веса промежуточных вершин в порядке их номеров, начиная с последнего, будут равны: 3, 5, 2, 7, 7, 7, а относительные веса будут получаться делением этих значений на 38. Введенные нами параметры вопросников можно использовать при таком преобразовании их структуры, при котором уменьшается цена их обхода, определяемая как ^ = 2л(0^(0- Здесь Т1 (/) — цена пути, ведущего из корневой вершины в вершину /. Если этот путь единственный, то ti(/) есть сумма цен вопросов, образующих его. Если путей несколько, то берется путь с минимальной ценой. Параметр со(/) есть сумма весов всех вершин, которые достижимы из вершины /. Вопросник называется оптимальным, если I минимальна. Минимизация I достигается за счет преобразования вопросника с помощью четырех групп правил.
212 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИП 1. Величину I можно уменьшить, если можно так перераспределить цены путей к двум вершинам вопросника (ни одна из вершин вопросника не является предком или потомком другой) или веса двух вершин, чтобы вершина с более высоким весом имела бы более низкую цену пути, ведуш,его к ней, и наоборот. 2. Величину | можно уменьшить, если можно перераспределить цены или веса двух вопросов таким образом, чтобы вопрос с более высоким весом имел более низкую цену, и наоборот. 3. Величину I можно уменьшить, если возможно такое перераспределение оснований и цен путей для вершин, соответствующих двум вопросам, при котором цены путей к потомкам вершины с меньшим основанием оказались бы больше цен путей к потомкам вершины с большим основанием, и наоборот. 4. Величину | можно уменьшить за счет перераспределения весов потомков вершин, для которых одинаковы длины путей, ведущих к ним из корневой вершины. Это перераспределение должно быть таким, что потомкам вершин, расположенным в невозрастающем порядке их оснований, будут приписаны веса в невозрастающем порядке. Затем надо применить первое правило для пары подвопрос- яиков, входящих в вопросник, полученный на предыдущем шаге. Такая пара подвопросников выбирается так, что для первого из них корень есть вопрос с наименьшим основанием, а для второго — потомок с наибольшим весом. Применяя перечисленные правила, можно прийти к оптимальному вопроснику. Каждое правило связано с требованием переформирования структуры «слоеного пирога». Недостаток всей процедуры оптимизации — ее ненаправленность. Достижение наилучшего результата обеспечивается некоторой последовательностью применения правил преобразования, но выбор этой наилучшей последовательности не формализуем, что делает задачу оптимизации вопросника комбинаторной по своей сложности. Именно этим, по-видимому, объясняется, что проблема оптимизации классификаций и структуры «слоеного пирога» остается на сегодняшний день достоянием теории классификации, а не практики построения эффективных систем обобщения и классификации описаний в ситуационном управлении. § 4.7. Дополнительные замечания При работе с отдельными структурными описаниями в виде семантических графов или формул языка ситуационного управления часто возникает задача выполнения теоретико-множественных операций над этими описаниями. Другими словами, хотелось бы иметь возможность получать объединение, пересечение и разность для таких объектов. Рис. 4.20 иллюстрирует выполнение операций объединения и пересечения для сетей, отображающих записи на языке ситуационного управ^чения. Эти операции выполняются обычным образом и никаких трудностей не вызывают. Операция определения разности не столь проста. Если мы имеем ситуацию 5, показанную на рис. 4.21, а и из ее описания выделено описание
§4.7. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 213 ситуации Si, изображенное на том же рисунке пунктиром, то возникает вопрос, что считать дополнением к 5i в 5? Если дополнением считать только то описание, которое получается после удаления со всеми связями, которые имелись у вершин в ситуации Si с оставшимися вершинами (.S2), то такое дополнение при объединении с S.2 не даст исходного описания S, так как все связи между S^ и S2 потеряны. Поэтому при образовании дополнения нужно вводить фиктивные вершины, одинаковые в 5i и S2 и такие, что при объединении эти фиктивные вершины налагаются друг на друга и исчезают и сохраняются лишь дуги, маркерами концов которых они были. На рис. 4.21, б эти дополнительные вершины заштрихованы. Введенные операции позволяют, в частности, сокращать время на получение обобщенных опнсаннй для случаев SiU52, S^fiSz и 5i\S2, когда обобщенные описания для S^ и S2 найдены. Если ограничиться случаем конъюнктивного обобщения, которому в ДСМ-методе соответствовала идея единственной причины, то обобщенное представление объединения, пересечения и разности будет получаться с помощью соответствующих операций над обобщенными представлениями тсх'описании, которые входят в операцию, если эти обобщения получены для класса положительных примеров обучгтющей выборки. Если нас интересуют отрицательные понятия, сформированные на основе класса обучающих примеров, носящих негативный характер, то лри объединении, пересечении и взятии разности положительных обобщенных описаний для S^ и .S2 нужно брать соответственно пересечение и объединение, иллюстрируемое рис. 4.21, б, обобщенных описаний отрицательных понятий, соответствующих рассматриваемым положительным понятиям. Если нас интересуют дизъюнктивные обобщенные описания, т. е. описания, в которых общие фрагменты описаний, полуненные в ходе формирования обобщенного описания, объединены друг с другом знаком ИЛИ, то для 5iU'^2. '^1Л'52 и Si\52 получение обобщенных описаний несколько усложняется. Для нахождения ^111*^2 необходимо проделать следующие операции. 1. Ввести множество W=Di\JD2, где и D2— соответственно обобщенные описания для классов S^ и ^2. полученные по множествам положительных примеров в результате процедур, описанных в § 4.4. 2. Ввести множество п. В него включаются такие семантические графы .S*, которые удовлетворяют следующим свойствам. Для каждого 5* в и ^2. которые Рис. 4.20 Рис. 4.21
214 гл. 4. ОБОБЩЕНИЕ И КЛАССИФИКАЦИЯ СИТУАЦИЙ представляют собой обобщенные описания классов отрицательных примеров из обучающей выборки, соответствующей классам Si и Sg, найдутся такие S и что выполняются следующие два требования. 2а. S* изоморфно наложим на5 при условии, что типы совмещаемых вершин совпадают и между весами этих вершин имеются отношения по включению, рассмотренные в § 4.4. 26. S* изоморфно наложим на S" при тех же условиях. Если, кроме того, S' сам изоморфно наложим на S" при тех же условиях, то в Я включается S". 3. К полученным множествам W и Н применить метод нахождения обобщенного описания; им может быть любой из методов, описанных в том же § 4.4. Если необходимо найти обобщенное описание для ^^П'^г при наличии дизъюнктивных обобщений, то процедура их нахождений сводится к процедуре вывода обобщения для ^^У'^г. где Si и S2 соответственно классы отрицательных понятий для Si и Sg. Можно построить процедуру нахождения обобщенного дизъюнктивного описания и для S^XSg. В этом случае последовательность необходимых шагов имеет вид: 1. Вводится множество W=Si\jD.^. 2. Вводится множество Я, которое строится в результате следующей процедуры. Составляется список L, в который в начальный мсмент помещаются элементы из Di- "Для очерелного элемента из этого списка берется очередной элемент из D2 и для полученной пары проверяется условие изоморфного наложения S' на S", где S' — СГ из списка Di, а S" — из Dg, если выполнены условия, сформулированные в пункте 2а для процедуры нахождения обобщенных дизъюнктивных описаний для объединения. Если это условие не выполнено, то берется следующий элемент из Dg. Если все элементы из D2 уже использованы, то берется следующий элемент из списка Л, а S' из L вычеркивается и с ним снова сравниваются последовательно все элементы из Dg. Если же для некоторой пары S' и S'' условие изоморфного наложения выполнены, то для этой пары образуют новое описание, в котором вершина Vij соответствует паре вершин Vi и Vj из S' и для которых произошло наложение, причем весом этой новой вершины будет разность весов, которые соответствовали У( и Уу. В семантическом графе S' вместо вершины Vi используют вершину а остальные вершины сохраняют. Так поступают для всех пар вершин, что приводит к образованию новых описаний, где Л' — число вершин в S (в S'' столько же вершин). Все эти новые описания помещают в список L, а S' из него вычеркивают. Если после появления первого изоморфного наложения для S' все элементы из D2 уже с ним сравнены, то S' становится элементом Я. Процесс заканчивается, когда список L оказывается пустым. Введение теоретико-множественных операций, применяемых к описаниям, оказывается полезным и в задачах, связанных с классификацией. Если 5^ и 5^— классы эквивалентности или классы толерантности, то S^n^^^ и S^U'^^ также являются такими классами. Наконец, определенные нами операции над описаниями весьма полезны при представлении информации в современных базах данных реляционного или сетевого типа. В таких базах данных операции пересечения, дополнения, объединения и разности структурных описаний являются базовыми и выполняются средствами, встроенными в эти базы данных, т. е. «ничего не стоят». Отметим еще некоторые свойства классов толерантности, полезных при по- построении классификаторов, для которых разбиение на классы эквивалентности по управлению оказывается невозможным из-за недостатка информации в обучающей последовательности. Пусть имеется множество описаний ситуаций S и множество признаков, по которым эти ситуации классифицируются. Два описания Si и S2 оказываются связанными отношением толерантности, если у них имеется какая-нибудь совокупность общих признаков. Если зафиксировать ее, то максимальное подмножество S , в котором любые два описания связаны отношением толерантности по выбранной группе признаков, образует класс толерантности. Так как отношение толерантности является ре|флексивным. то любой элемент S, если он не похож ни на какой другой из выбранной совокупности признаков — все равно образует класс
§4.7. ДОПОЛНИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 2l5 толерантности сам с собой, т. е. класс, состоящий из одного этого элемента. Рассматривая все комбинации классифицирующих признаков и образуя системы классов толерантности по этим созокупностям. мы получим пространство толерантности. Олно и то же описание в этом пространстве может входить в несколько классов толерантности. В пространстве толерантности можно ввести некоторое подобие метрики, если присвоить классифицирующим признакам веса, отражающие меру сходства. Тогда мерой сходства описаний, попавших в один класс толерантности, можно считать взвешенную сумму признаков, характеризующих этот класс. Можно доказать, что во всяком пространстве толерантности существует множество классов толерантности, которое образует базис. Свойством базиса является его минимальность. Для любых двух толерантных описаний, найдется в базисе класс, куда они оба попадут. Но при удалении любого из классов толерантности, входящих в базис, исчезает свойство полноты. Всегда найдется такая пара описаний, толерантная по какой-то совокупности признаков, для которой не найдется класса толерантности в множестве классов, полученном из базиса выбрасыванием какого-либо класса. Переход к базису позволяет минимизировать описание в «слоеном пироге», но не дает возможности эффективно использовать меру сходства. И, наконец, последнее замечание. При формировании обобщенных описаний при малых объемах обучающих выборок возможно возникновение «заблуждений», связанных с тем, что используемые для классификации решающие правила не отражают классификации описания технологом-управленцем. Это делает интересным исследование того, какими функциями от признаков пользуется человек в своей повседневной практике, когда он формирует новые для себя понятия. В экспериментах было показано ^), что имеется вполне определенная приоретет- ность этих функций для человека, имеющего, по крайней мере, школьное образование. Наиболее простыми классифицирующими функциями для него являются конъюнкции признаков или дизъюнкции одиночных признаков. С функциями, содержащими четыре — пять признаков, человек работает свободно, при возрастании числа классифицирующих признаков сверх этого сложность задачи классификации для него начинает возрастать. Значительно сложнее для человека оказываются те ситуации, где приходится применять функции, в которых одновременно используются операции конъюнкции и дизъюнкции. Но еще более трудными, практически не встречающимися в практике человеческой классификации, являются случаи, когда классифицирующая функция включает в себя не только факт наличия какого-то признака, но и факт отсутствия некоторого признака. Примером такой_«нечеловеческой» функции классификации может служить функция вида: y^XiX^Mх^х^, где Xi и х^ — некоторые признаки. ^) Эти эксперименты проводились Е. В. Романовой и Н. В. Чудовой со студентами технических учебных институтов и научными сотрудниками.
ГЛАВА 5 ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ Если бы это было так, то это бы еще ничего, а если бы ничего, оно бы так и было, но так как это не так, то оно и не этак. Такова логика вещей! Л. К эр рол §5Л. Цели, ситуации и планы В настоящей главе мы рассмотрим процедуры, используемые при семиотическом управлении для формирования последовательности решений, с помощью которых можно перевести текущую ситуацию в некоторую целевую. В общей схеме ситуационного управления эту задачу совместно решают Коррелятор, Классификатор и Экстраполятор, показанные на рис. 1,7, Системы, обеспечивающие решение данной задачи, принято называть планирующими системами или планировщиками. Планировщики сначала формируют план, затем проверяют его выполнимость и эффективность, отбирают среди сформированных наилучший план, начинают его выполнение и при необходимости корректируют план при поступлении дополнительной информации от объекта управления и окружающей среды. Обычно различают два вида планирования: планирование по состояниям и планирование по подзадачам. В первом случае вводится понятие состояния, которое складывается из состояния объекта управления, состояния окружающей среды и состояния системы управления. Построение плана происходит в пространстве состояний таким образом, что каждое одноразовое решение по управлению переводит всю систему из одного состояния в другое в пространстве состояний. План представляется в этом случае некоторой траекторией в пространстве состояний. Во втором случае предполагается, что имеется некоторый набор модулей, способных решать определенные задачи. Процесс планирования состоит в поиске такой декомпозиции исходной задачи, элементами которой оказались бы готовые модули. Тогда план представляет собой деревообразную структуру, двигаясь по которой можно постепенно получить из решения более частных задач решение исходной задачи. Несмотря на некоторое различие в формулировках этих двух задач планирования, их можно описать некоторой общей моделью, показанной на рис. 5.1. На нем приведена сеть, состоящая из 15 вершин. Заштрихованная вершина ) — начальная. Она символизирует либо текущую ситуацию или состояние в пространстве состояний, либо исходную задачу, которую необходимо решить. Вершины 13, 14 и 15 (на рисунке они заштрихованы) символизируют либо те це-
§5.1. ЦЕЛИ, СИТУАЦИИ И ПЛАНЫ 217 левые ситуации или конечные состояния в пространстве состояний, в которые необходимо перевести объект управления и систему управления, либо готовые модули для решения задачи, уже имеюш.иеся в системе. При планировании в пространстве состояний необходимо найти путь, ведуш.ий из вершины 1 в какую-нибудь из заштрихо- Рис. 5.1 ванных вершин. При постановке оптимизационной задачи можно, например, искать кратчайший путь такого вида. Или, если переходы по дугам требуют некоторого расхода ресурсов, приписанных этим дугам, можно ставить задачу достижения конечной ситуации с минимальным расходом ресурсов или ставить более сложные задачи: нар1ти путь с минимальным расходом ресурсов, но такой, что число шагов (время в пути) будет не больше заданного, или найти путь, минимальный по числу шагов, но не минимальный по ресурсам, хотя и удовлетворяющий верхним ограничениям по ресурсам. При планировании по задачам необходимо пройти весь веер путей, ведущих от исходной вершины с номером 1 к модульным заштрихованным вершинам, обеспечивающий решение исходной задачи. Таким образом, при поиске плана в пространстве состояний все разветвления в вершинах считаются альтернативными. Надо выбрать одно (любое) продолжение движения. При работе же в пространстве задач все дуги, выходящие из данной вершины, должны быть пройдены, если они интерпретируются как отношения часть — целое. Конечно, и тогда можно рассматривать не единственную декомпозицию исходной задачи на подзадачи, а альтернативное ее
218 i л. 5. формирование решений ио управлению разбиение. В этом случае требуются специальные указания о характере выходящих из вершин дуг: являются ли они альтернативными (ИЛИ-дуги) или обязательными для совместного прохождения (И-дуги). Сеть с такими двумя видами дуг обычно называют И-ИЛИ-сеть или И-ИЛИ-граф. На рис. 5.1 использованы дворшые дужки, которые объединяют мелсду собой И-дуги. Это значит, что исходная задача, соответствующая вершине У, декомпозируется на подзадачи 2 и 5. Задача 2 сводится к задаче 3 или к задаче 4, которая однозначно сводится к задаче 5. Задача 5 может быть сведена либо к задаче б, либо к задаче 9. Задача Р декомпозируется на задачи 10 и 13. Задача 10 сводится к решенной в системе задаче 14, а задача 13 декомпозируется на уже реилеиные задачи 12 и 15. Таким образом, в случае пространства подзадач план решения задачи 1 имеет следующий вид: используя решенную задачу 14, решить задачу 10. Используя решенные задачи 10, 12, 15, решить задачу 9. Используя решенную задачу 9, решить задачу 5. Используя решенную задачу 4, решить задачу 2. Используя решенные задачи 2 и 5, решить задачу 1. Для случая пространства состояний на той же сети план достилсения целевого состояния мог бы быть таким: У—5—9—10—14. На этом примере видна разница рассмотренных выше двух задач планирования. Поэтому мы будем говорить о задаче планирования вообще, не указывая ее вида, только тогда, когда излагаемые положения будут верными и в том, и в другом случае. Прежде чем рассматривать сами задачи планирования, полезно ввести некоторые классы сетей типа сети, показанной на рис. 5.1. Во-первых, разделим такие сети замкнутые и открытые. Сеть замкнута, если число ее вершин и дуг фиксировано и не меняется в процессе планирования. Так^е сети наиболее просты, но, к сожалению, редко встречаются на практике. Возможность построения замкнутой сети для систем ситуационного управления означала бы, что число полных ситуаций конечно и заранее перечисленно. Тогда, анализируя сеть, построенную на этих ситуациях, можно было бы искать план перевода текущей ситуации в ту, которая нас интересует. Тогда дуги можно было бы интерпретировать как управляющие воздействия, под влиянием которых осуществляется переход. Ясно, что подобная конечная модель практически нереальна. Как правило, число полных ситуаций столь велико, что можно рассматривать его как счетное. Кроме того, наши знания об объекте управления и окружающей среде обычно неполны и, следовательно, не позволяют считать, что сеть для планирования нам априорно дана. В открытых сетях могут появляться новые вершины из-за возникновения новых (нештатных) ситуаций. В них могут появляться и новые дуги, если в процессе функционирования системы управления нам удастся найти новые связи между управленческими решениями и сменой ситуаций.
§5.1. ЦЕЛИ, СИТУАЦИИ И ПЛАНЫ 219 Можно ввести еще одну характеристику сети планирования, которая делит такие сети на детерминированные и недетерминированные. В детерминированных сетях принятое решение, соответствующее некоторой дуге, точно реализует переход к новой вершине, указанный в сети. В недетерминированных сетях этого нет. При реализации какого-либо одношагового решения переход в то или иное, состояние определяется либо некоторым распределением вероятностей, либо оценивается качественно с помощью частотных квантификаторов или функций распределения. Такая ситуация весьма типична для систем управления сложными объектами, когда технология управления зависит от уровня обученности управленца или от полноты знаний об управлении, хранящихся в памяти системы управления. Приведенная нами классифи^сация сетей планирования верна и для планирования в пространстве задач. Открытость в такой системе связана, например, с введением новых методов декомпозиции и переводу некоторых задач в типовые модули, решение которых известно, т.е. с расширением библиотеки стандартных модулей. Недетерминированность может трактоваться, например, как неточная своди.\юсть декомпозируемой задачи к совокупности тех или иных подзадач. Но, если для планирования в пространстве состояний введенные классы сетей весьма важных для методов планирования, то для планирования в пространстве подзадач подобное деление менее значимо. Можно, наконец, делить задачи планирования на одноуровневые и многоуровневые. Многоуровневое планирование возникает тогда, когда строится совокупность планов на основании информации о пространстве состояний или пространстве подзадач разного уровня детализации. Прежде чем составлять точный и подробный план, всегда желательно иметь некоторую уверенность, что конечные цели планирования достижимы. Если они недостижимы, то желательно не тратить время на планирование. Оно может оказаться весьма большим. Для этого и служат многоуровневые планы. Сначала на самом верхнем уровне выясняется возможность планирования. Если оно возможно, то строится вариант наиболее грубого плана, шаги которого должны уточняться на более низких уровнях, работающих с более подробными описаниями ситуаций или задач. Если первоначальный грубый план проходит все уровни планирования, то на самом нижнем уровне мы получаем окончательный план. Если же на некотором уровне выясняется, что переход, спланированный наверху по грубой, обобщенной, информации, нельзя реализовать, то происходит возврат наверх,, где выбирается (если он есть) другой вариант плана. В системах ситуационного управления иерархическое планирование возникает естественным образом из-за иерархичности Классификатора. «Слоеный пирог» в Классификаторе требует для возможности работы с ним такого же «слоеного пирога» в Корреляторе,
220 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ § 5.2. Стратегии планирования Мы опишем здесь несколько универсальных стратегий планирования, которые были использованы в различных планировщиках как для систем ситуационного управления, так и при решенрп! задач об автоматизации составления программ для ЭВМ или нахождения целесообразной последовательности действий для роботов. Для вопросов планирования все эти задачи имеют много общего, что позволяет рассматривать задачу построения планировщика в некотором отрыве от содержательной постановки задачи. 1. М е т о д прямой в о л н ы. Он является наиболее простым из всех методов планирования. Его суть сводится к следующему. В начальный момент возбуждаются все вершины, которые соответствуют начальным условиям задачи (например,описанию исходной ситуации). Затем, если планирование ведется в пространстве состояний, то возбуждаются все дуги, выходящие из возбужденных вершин. Если же планирование осуществляется в пространстве задач, то возбуждаются все дуги, выходящие из возбужденных вершин, но сами дуги отмечаются специальными пометками. А именно, все дуги, относящиеся к одному альтернативному варианту, снабжаются номером этого варианта. Например, для сети планирования, показанной на рис. 5.1, после возбуждения вершины 1 возбуждаются обе дуги. Им присваивается номер альтернативы 1. Далее возбуждение продолжает распространяться по сети планирования. В случае планирования в пространстве состояний распространение возбуждения либо закончится в целевых вершинах, либо перестанет распространяться, если невозможно возбудить новые вершины. При планировании в пространстве задач планирование прекращается при достижении тех же условий. Однако, если для пространства состояний достижение хотя бы одной целевой вершины служит сигналом о решении задачи, то для пространства задач надо еще проверить возбуждены ли все пути, относящиеся хотя бы к одной альтернативе, ведущие от исходных вершин к целевой. Искомый план формируется обратным просмотром возбужденных путей, ведущих от целевой вершины, которая возбудилась, к исходным вершинам. В случае пространства состояний это обычный путь (любой возбужденный путь, если не ставится задача оптимизации), а для пространства задач — совокупность путей, соответствующая некоторой альтернативе. Пример 5.1. На рис. 5.2 показано распространение возбуждения по методу прямой волны для случая планирования в пространстве задач. Сеть планирования такая же, как на рис. 5.1. Номер Только В ЭТОМ случае будет успешно использоваться вся информация, хранящаяся в многоуровневой системе обобщенных описаний, О том, как это делается, будет сказано ниже.
§5.2. СТРАТЕГИИ ПЛАНИРОВАНИЯ 221 альтернативного варианта образуется постепенным наращиванием его слева направо. Целевые вершины возбудились альтернативами с номерами 121 и 122, Для альтернативы 121 возбуждены все вершины, которые к ней относятся, и, следовательно, для этой альтернативы план есть последовательность выполнения задач 13, 12„ 15,11,14, 10,9,5,4, 2, L Для альтернативы 122 также возбуждены все вершины, соответствующие ей. План по этой альтернативе имеет вид следующей последовательности: 14, 10, 8, 7, 6, 5, 4, 2, 1. Если бы для какой-то ал ьте р н ати вы возбудились вершины, которые оказываются «виcячи^ш», т. е. из которых нет дальнейшего пути к заштрихованным вершинам, то такая альтернатива не соответствовала бы плану решения задачи. На рис. 5.2 этот случай связан с альтернативой 11. Недостаток метода пpя^юй волны состоит в том, что возбуждение распространяется по всей сети, что может потребовать большого расхода времени. 2. Метод обратной волны. Этот метод полностью подобен предыдущему. Только возбуждение начинает распространяться от тех целевых вершин, которые необходимо достичь. Прекращение распространения возбуждения происходит при достижении исходных вершин. При планировании по состояниям — при первом таком достижении, а при планировании по задачам — при достижении исходных вершин всеми ветвями какой-либо альтернативы. 3. Метод встречных волн. Для ускорения процесса поиска пути между исходными и целевыми вершинами ^южнo одновременно использовать метод прямой и обратной волн. При этом процесс возбуждения в пространстве состояний заканчивается, когда произойдет первая встреча возбужденных фронтов, а в случае прост- ванства задач такая встреча должна произойти для всех ветвей какой-либо альтернативы. Недостаток метода встречных волн может проявляться в том случае, когда фронты волн расходятся и возникает проблема определения момента прекращения процесса возбуждения. Эта ситуация показана на рис. 5.3,
222 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ Рис. 5.3 лишь в небольших детерминированных замкнутых сетях планирования. Но для подобных сетей задача планирования практически исчезает. Для любой исходной и любой конечной вершин можно заранее найти наилучший путь и записать его в памяти системы. При возбуждении соответствующей пары вершин или множества таких пар ответ получается за один шаг обращения к информации, хранящейся в памяти системы. Для случая же открытых сетей или замкнутых сетей, размерность которых не позволяет перечислить все пути, имеющиеся в сети, возникает задача типа поиска пути в лабиринте ^) при наличии М В§ 1.3 такие задачи были названы лабиринтными. Там же обсуждались пси- хологические предпосылки, лежащие в основе стратегии локальных улучше- 4. Метод локальных улучшений. Этот метод долгие годы лежал в основе многих планирующих систем. Его идея состоит в том, что в сеть планирования вводится некоторая метрика. В каждой вершине сети планирования при наличии альтернативного выбора продолжения движения по сети оказывается возможным оценить, насколько эффективно тот или иной выбор приближает к целевой вершине. Если бы такая оценка была истинной, то движение от исходной вершины к целевой не вызывало бы никаких трудностей. Достаточно было бы в каждой вершине с альтернативным выбором идти по дуге, имеющей наилучшую оценку. Такое решение возможно
§5.2. СТРАТЕГИИ ПЛАНИРОВАНИЯ 223 НИИ. И, наконец, там же был охарактеризован ОРЗ, о котором тут еще пойдет речь. Системы, основанные на модельном принципе, мы будем обсуждать чуть позже. локальной информации о степени приближения к целевой вершине при выборе того или иного преобразования, соответствуюш,его выбираемой дуге, выходящей из данной вершины. Эта идея впервые была использована в известной программе «Общий решатель задач» (ОРЗ). Метод локальных улучшений базируется на том, что в пространстве ситуаций вводится специальная метрика. С ее помощью оказывается возможным измерять расстояния между ситуациями, оценивать меру их близости. И, в частности, оценивать меру близости ситуации, соответствующей вершине сети, в которой мы находимся, с целевыми ситуациями, достижимыми из этой вершины. Для каждого преобразования, допустимого в сети планирования (т. е. перехода от одной ситуации к другой по дуге, характеризующей это преобразование), указаны те изменения в мере сходства с целевыми ситуациями, которые возникают после преобразования. И на каждом шаге метода локальных улучшений выбирается то преобразование, которое максимально уменьшает отличия получаемой ситуации от целевых. Этот метод применим при планировании как в пространстве состояний, так и в пространстве задач. Его можно также положить в основу системы установления эквивалентности описаний различных ситуаций в смысле их преобразуемости друг в друга с использованием заданного множества операторов. Пример 5.2. В программе ЛОГИК-ТЕОРЕТИК, послужившей прообразом программы ОРЗ, введена система различий и система операторов их устранения для преобразования описаний, сделанных на языке формул исчисления высказываний. Всего введено восемь различий между этими формулами. 1. Различие Pi. В проверяемом равенстве двух выражений исчисления высказываний 0)1=0)2 (т. е. при установлении эквивалентности этих двух описаний) имеется различие между o)j и cOg в том, что либо o)i, либо о)а содержит пропозициональную переменную, которой нет в другом сравниваемом выражении. Такое различие есть, например, в описаниях а и аЬ. Необходимо выбрать преобразование, добавляющее эту переменную. 2. Различие Рг. Оно аналогично Pi, но необходимо выбрать преобразование, устраняющее лишнюю переменную. 3. Р а 3 л и ч и е Рз- В одной из формул o)i или 0)3 некоторая пропозициональная переменная имеет на / вхождений больше, чем в другой. Такое различие наблюдается, например, между описаниями: а\/аЬ и аЬ. Необходимо выбрать преобразование, уменьшающее число вхождений этой переменной. 4. Р а 3 л и ч и е Р4. Оно аналогично Рз, но необходимо выбрать преобразование, увеличивающее число вхождений этой переменной в то описание, где вхождений меньше.
"224 ГЛ. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ 5. Различие Р^. Различие в самой внешней операции, имеющейся в формуле. Оно наблюдается, например, в описаниях (а\уЬ) {а\/с) и аЬ\/ас. 6. Р а 3 л и ч и е Pg. Одно из описаний содержит общий знак отрицания над всем описанием, а другое описание не имеет его. Примером могут служить описания а\/Ь и а\/Ь. 7. Р а 3 л и ч и е P^. Различие в характере группировки пропозициональных переменных в coi и cog, как, например, в описаниях aV ФМс) и {a\Jb)\/c. 8. Различие Р^. Различие в положении подформул относительно внешней операции. Примером такого различия может служить различие в описаниях аЬ-^ и с^аЬ. Введенные нами различия между описаниями, конечно, могут комбинироваться между собой. Но важно, что приведенная выше система различий образует полную базовую систему. Любое различие в двух описаниях на языке исчисления высказываний выражается некоторой комбинацией этих базовых различий. Перечислим теперь те операторы преобразования, служащие для устранения различий, которые использованы в программе ЛОГИК-ТЕОРЕТИК. Всего имеется десять групп таких операторов. Операторы, входящие в первые восемь групп, симметричны, их можно применять в любом направлении. Операторы последних двух групп несимметричны и их использование возможно только в направлении, показанном стрелкой. В описаниях приняты стандартные обозначения: ^ jaWb^bWa, ^ ja^b^b^a, '\ab^ba\ '\a^b^b^a\ '\aa^a', '\a{bc)^{ab)c\ ^ U\yb^^, ^ Ы^Ь^'^Ь, [ab^a\/b-y \ b = ab\ ^ j a\Jbc^{a\/b)(a\yc), ^ ^^^a\/bb, '\a{byc)^abyac\ ^у^^^фущ.^ Преобразования первых восьми операторных групп не меняют •истинности выражений исчисления высказываний. Последние две группы преобразований, служащие для введения и устранения пропозициональных переменных таковы, что из истинности выражения, стоящего слева от стрелки, следует истинность выражения, стоя- 1цего справа от нее, но не наоборот.
§5.2. СТРЛТЕГИИ2ПЛАНИР0ВАНИЯ 225 После введения набора различий и набора операторов для их устранения составляется специальная таблица, в которой приводятся в порядке присвоенных им приоритетов операторы, устраняющие те или иные различия. Между самими различиями также устанавливаются приоритеты по значимости того или иного из них. В нашем примере нумерация различий определяет эти приоритеты, а приоритетов на операторы нет. Сама же таблица, связывающая различия и операторы, которые их устраняют, приведена ниже (табл. 5.1). Крестиками в ней отмечены позиции, в которых применение данного оператора устраняет имеющееся различие. Таблица 5.1 Oi 0, Оь 0, 0, 0, 0,0 Pl + + + + Рз + + Р4 + + Рь + + + Рь + + Pl + + Ps + В качестве примера использования программы ЛОГИК-ТЕОРЕТИК рассмотрим задачу об установлении эквивалентности описаний (а-уЬ)с и аЬус. Будем для определенности преобразовывать второе описание, стремясь свести его к первому. Основное наблюдаемое различие состоит в наличии общего отрицания над формулой, т. е. имеет место различие Ре- Для его уст^нения применяем оператор О5 и в результате получаем описание {аЬ)с. Сравнивая получившееся выражение с непреобразуемым исходным, обнаруживаем различие в том, что появляется подформула, содержащая общее отрицание, т. е. опять имеется различие Ре- Применяем к этой подформуле тот же оператор О5 и получаем {а\/Ь)с. Теперь наблюдается различие для той же подформулы, ибо более внешняя операция у сравниваемых описаний совпадает (конъюнкция). Для устранения различия применяем оператор Об. В результате получаем {а->Ь)с. Совпадение описаний доказывает эквивалентность обоих исходных описаний. Проблемой для программы ЛОГИК-ТЕОРЕТИК и, вообще, для всех методов планирования, основанных на идее локальных улучшений, является определение неэквивалентности сравниваемых описаний. В таком случае на некотором шаге преобразований необходимо прекратить их, как неперспективные. Это может и не на- 8 д. л. Поспелов
226 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ 1) Такой программой является, например, программа FDS Квинлана п Хаита, о которой говорится в комментарии к данной главе. ступить автоматически, поскольку операторы, как было и в приведенном выше примере, могут давать циклически повторяемые описания. Подобная ситуация аналогична той, в которой при блуждании по лабиринту попавшие в него многократно повторяют один и тот же путь. Как известно, выходом является маркировка пройденного пути (нить Ариадны в известном греческом мифе о Тесее, ищущем выход в лабиринте Минотавра). Для алгоритма планирования это означает, что необходимо помнить предысторию и осуществлять операцию возвращения (back-traking) при обнаружении повторения преобразований в виде некоторого цикла. В программе ЛОГИК-ТЕОРЕТИК таблица различий и операторов их устранения задавалась заранее. Однако существуют программы, которые формируют различия в описании, полученном на данном шаге, и в целевом описании ^). 5. Метод построения доказательства. При таком подходе описания исходной и целевой ситуации рассматриваются как формулы некоторого исчисления. Все элементы, входящие в исходное описание, трактуются как аксиомы этого исчисления, а все элементы, образующие целевое описание,— как формулы, которые необходимо вывести из данного набора аксиом с помощью имеющейся системы правил вывода. Обычно в качестве такого исчисления используется исчисление предикатов первой степени. Правила вывода делятся на два типа: правила вывода универсального характера, используемые в традиционном исчислении предикатов, и правила вывода, верные только в рамках той проблемной области, которая описывает данный объект управления, особенности его функционирования и специфику управления им. Правила второго типа принято называть эвристическими правилами вывода, В качестве процедуры поиска вывода используется какая-нибудь достаточно мощная процедура типа метода резолюций или обратного метода вывода Маслова. Эти процедуры будут описаны ниже. Обычно технология планирования методом построения доказательства имеет следующий вид. Сначала делается попытка найти вывод целевого описания из исходного. Если такой вывод найден, то план построен. Если это сделать не удается, что определяется на основе некоторого принципа остановки, подобного тому, который мы указали для программы ЛОГИК-ТЕОРЕТИК, то к исходному описанию применяется некоторое эвристическое правило вывода, и процесс доказательства повторяется уже при новом исходном описании. Методы такого типа сейчас являются основными при построении планировщиков в самых различных областях. 6. Метод опережающего планирования. Эта стратегия планирования находит все большее применение в системах семиотического управления и при планировании действий ин-
§5.3. ИСПОЛЬЗОВАНИЕ МЕТОДА РЕЗОЛЮЦИИ 227 8* теллектуальных роботов. В ее основе лежит идея многоуровневого планирования, о которой мы уже упоминали. Прежде чем осуществлять окончательное планирование, например, путем поиска вывода (который может и отсутствовать), выполняется обобщенное планирование. Оно отличается от обычного планирования тем, что использует для построения планов не полные описания возможных путей достижения целей, а усеченные описания или описания, полученные из исходных путем агрегирования за счет слияния отдельных вершин в обобщенные вершины. Если обобщенное планирование позволяет построить план, то происходит переход на точный уровень планирования, где этот обобщенный план служит начальным приближением к точному плану. Сделаем еще одно важное замечание. Возможны два типа планирования: монотонное {линейное) и немонотонное {нелинейное). При планировании первого типа на каждом шаге планирования мы приближаемся к целевой вершине, как бы все время локально улучшаем свое положение в сети. Процедуры планирования второго типа этим свойством не обладают. На отдельных шагах они допускают как бы ухудшение плана, очередная вершина может оказаться более удаленной от целевой, чем найденная ранее. Но зато потом оказывается возможным резко улучшить план, т. е. ближе подойти к целевой вершине. В своей жизненной практике мы найдем немало примеров, когда такие нелинейные планы оказывались единственно возможным средством для достижения цели. Локальный неуспех (иногда создаваемый сознательно) позволял потом быстро продвинуться к намеченной цели. В заключение настоящего параграфа заметим, что планировщик может использовать не одну фиксированную стратегию, а иметь в своем распоряжении набор стратегий планирования, что может обеспечить более эффективное его функционирование. § 5.3. Использование метода резолюции при планировании ** Метод резолюции, предложен в середине 60-х годов. Он относится к той группе методов поиска вывода, которую обычно называют методами опровержения. Это название вызвано тем, что в этих методах вместо поиска вывода некоторого утверждения F ищется доказательство невыводимости отрицания данного утверждения F. Эквивалентность обеих задач вытекает из замкнутости исчисления предикатов первого порядка, в котором используется метод резолюции, т. е. в силу закона исключенного третьего в таких исчислениях из ложности f следует истинность F. Для применения метода резолюции необходимо перевести описание интересующего нас утверждения на язык логики предикатов первого порядка и представить его в нем в некотором стандартном каноническом виде. Такое представление обычно называется стан-
228 5. формирование решений но управлению дартизованным. Оно не содержит кванторов (они заменяются известными в математической логике функциями Сколема) и представляет собой конъюнкцию дизъюнкций предикатов. В качестве аргументов в предикатах могут выступать константы, переменные и функции Сколема. Стандартизация производится путем использования системы эквивалентных преобразований исчисления предикатов первого порядка. Пример 5.3. Пусть имеется описание УхЧх[[{хг,,Ь)\/{хг,ф)] (/рт)]. Здесь X—какой-то человек, имя которого не фиксировано, b — письмо, t—время, г^2—быть отправителем, r^^-s—быть получателем. Смысл этого описания состоит в том, что каждый человек в какой-то момент времени т (всегда найдется хотя бы один такой момент времени) является либо отправителем письма, либо его получателем. Перейдем от этой записи на языке ситуационного управления к записи на языке предикатов. Выражения в круглых скобках заменим на соответствующие предикаты, интерпретация которых определяется интерпретацией отношения в скобках. Тогда получим Wx4x{PAx. b, х)\/Р^{х, b, т)). В предикаты т внесено в качестве переменной. Квантор существования в этом описании находится в зоне действия квантора общности. Поэтому при исключении квантора существования вводится функция Сколема а квантор общности, как всегда, исключается без какого-либо изменения записи. После этого наше описание принимает вид Р. {X. Ь, fAx))VPAx, b, fAx)). Пример 5.4. Рассмотрим предикатную запись {РЛх)^Р. W) {Р. {X, у)^рАу))- Используя эквивалентные отношения логики предикатов, преобразуем ее таким образом, чтобы исключить из записи операцрш импликации (PAx)VP, (х)) (P,{x,y)WPAy))- Оба представления, полученные в двух последних примерах, уже стандартизованы. Для метода резолюции принято еще опускать знаки конъюнкции и записывать вместо конъюнктивной формы множество образующих ее дизъюнктов, В примере 5.3 такой дизъюнкт один, а в примере 5.4 их два. Множество дизъюнктов для формулы F будем обозначать через S^, Для опровержения формулы F достаточно показать, что хотя бы один из ее дизъюнктов невыводим. В силу конъюнктивной связи дизъюнктов при этом будет невыводима и сама формула f. Смысл всего сказанного состоит в том, что возникает возможность заменить проверку противоречивости некой формулы f,
§5.3. ИСПОЛЬЗОВАНИЕ МЕТОДА РЕЗОЛЮЦИИ 229 Если во все дизъюнкты из Sp вместо переменных подставить константные выражения из универсума Эрбрана. то в результате образуется эрбранова база. Пример 5.6. Для Sp из примера 5.3 с учетом результата примера 5.5 получаем следующую эрбранову базу: Р. (/i (а). А (/, {а))), Р, (/, (а), Ь, f, if, (а))), ^1 (/2 И. А (/2 Р^ if2 (а). Ь, /, if, (а))), PAfiifiia)). fAfAfAa)))). ... которая может быть весьма сложной, последовательной проверкой на противоречивость довольно простых по структуре формул — дизъюнктов. Но метод резолюции позволяет и этот процесс, который при большом числе дизъюнктов может оказаться громоздким, сделать более однообразным и эффективным. В чем состоит основная трудность проверки ложности или истинности предикатного выражения? В том, что необходимо проверить истинность таких выражений при комбинациях переменных, взятых из областей определения предикатов, содержащих такие переменные. Сами эти области могут быть бесконечными. Поэтому перспектива прямого просмотра всех возможных интерпретаций значений предикатов и их комбинаций кажется весьма печальной. Однако дело обстоит не так уж плохо. Показано, что существует такая область определения всех предикатов, входящих в описание, называемая универсумом Эрбрана, которая обладает для нас исключительно важным свойством, а именно: если на универсуме Эрбра- на Sp противоречиво, то выводима F, Универсум-Эбрана строится с помощью специальной процедуры. Если в Sp имеется / констант, то образуется нулевое множество Яо, состоящее из этих констант. Если в Sp нет констант, то в качестве нулевого множества эрбрановой базы берется некоторая произвольная константа. Далее множества эрбрановой базы строятся индуктивно. Множество получается объединением Н И тех пропозициональных переменных f{wuW2, . . .,^n)» для которых Wi есть элементы множества Я^. Пример 5.5. Рассмотрим предикатное описание, полученное в примере 5.3. Если для него построить Sp, состоящее из одного дизъюнкта, то видно, что в этом дизъюнкте нет константы. Введем произвольную константу х=а. Тогда для этого дизъюнкта универсум Эрбрана примет вид Нг-{С1, fAa), 1Ла). [гИЛа)), !ЛШ), !Л!Ла)). fAfM)],
230 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ Если вместо переменных в дизъюнкты подставить какой-то элемент из универсума Эрбрана, то получится некоторая интерпретация Sp. В нашем примере в явном виде выписаны три интерпретации и приведено одно выражение, относящееся к четвертой интерпретации. Таким образом, эрбранова база содержит все интерпретации дизъюнктов Sf на универсуме Эрбрана. Число этих интерпретаций может быть конечным, когда конечен универсум Эрбрана, или бесконечным, как в нашем примере. Каждой эрбраиовой базе можно однозначно сопоставить некоторое семантическое дерево. Его построение мы проиллюстрируем на примере. Пример 5.7. Для эрбраиовой базы, построенной в предыдущем примере, семантическое дерево имеет вид, показанный на рис. 5.4. Рис. 5.4 На нем Р{ и означают предикаты Pi и с порядковыми номерами /, ky присвоенными им порядком записи в примере 5.6. Так, предикат Р1 имеет вид в семантическом дереве пути, ведущие от корневой вершины вниз, соответствуют интерпретациям S> на универсуме Эрбрана. Полное дерево содержит все такие интерпретации. Пример 5.8. Пусть Sj.= {P,{x)y Р,{а)уР,{у)у Р,(х)УЫх), Р1{х)\/Рз{а)}, Для этого множества дизъюнктов универсум Эрбрана очень прост. Он состоит лишь из одной константы Но={а}, Тогда эрбра1юва база также конечна и имеет вид 1 = {РАа). РАа)УРЛа). Р,{а)\/РАа)г PA^jVPsia)}. Или, опуская для простоты записи а I-{Pi> РгУР.^ P^WP^r PiVPs}-
; :..з. использовл}1ИЕ метода резолюции 231 Этой эрбрановой базе соответствует самантическое дерево, показанное на рис. 5.5. Рассмотрим те восемь интерпретаций, которые это дерево задает для 5/.. Для интерпретаций с номерами 5—5 множество дизъюнктов неудовлетворимо уже потому, что при ложном Pi первый дизъюнкт 5/. будет ложен независимо от интерпретации и Рз. Поэтому правую часть семантического дерева, показанного на рис. 5.5, можно дальше не анализировать, т. е. можно не проводить дальнейшего движения вниз по ветвям дерева от этой вершины, что позволяет резко сокращать перебор и проверку выполнимости для множества допустимых интерпретаций 5/7. Таким образом, необходимо еще проверить те интерпретации, в которых Pi принимает истинное значение. При этом условии первый дизъюнкт Sp- истинен. Для истинности третьего и четвертого дизъюнктов в 5/7 необходимо, чтобы одновременно Рз п Р^ были бы ложными. Но выполнение этого условия приводит к ложности второго дизъюнкта bSf, откуда следует, что все допустимые восемь интерпретаций таковы, что ни одна из них не приводит к удовлетворению 5/7. Поэтому F, невыводимая, а F — выводимая формула. Вершины семантического дерева, в которых впервые обнаруживается непригодность данной интерпретации для вывода F (удовлетворения 5/7), обычно принято называть неблагоприятными. Если все дуги, выходящие из некоторой вершины дерева, оканчиваются в неблагоприятных вершинах, то говорят, что для данной вершины дерево замкнуто. Если оно замкнуто для корневой вершины, то это свидетельствует о невыполнимости 5/7, т. е. о невыводимости F. Метод резолюции состоит в том, что имеется процедура постепенного подъема вверх по семантическому дереву, в результате которой неблагоприятные вершины поднимаются вверх по ярусам дерева. Подъем происходит до тех пор, пока это возможно. Если таким путем удастся дойти до корневой вершины, т. е. сделать все исходное семантическое дерево замкнутым, то тем самым будет доказана невыводимость F. Эта процедура основана на поиске резольвент. Резольвентой двух дизъюнктов называется та часть описания, которая остается, если из этих двух дизъюнктов удалить дополнительную пару. Дополнительной парой называется два выражения, в которых используются одни и те же предикаты, но в одном выражении они входят Рис. 5.5
232 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ без отрицания, а в другом с отрицанием. Аргументы предикатов роли ие играют. Примером дополнительной пары могут служить два следующих дизъюнкта: Р, {х)УР2{у)Рз{г)\ Р,{х, у)\/Р^Щх)) Р,{г), Резольвента этой дополнительной пары имеет вид Pi{x)\/Р^{х, у). Чем хороша резольвента? Если два дизъюнкта, содержащих дополнительную пару, таковы, что они приводят к неудовлетворению Sp, то и их резольвента обладает тем же свойством. Это и учитывается в процессе доказательства невыводимости f. Если пара дизъюнктов не содержит дополнительной пары, то резольвента может отсутствовать. Если пара дизъюнктов такова, что оба они целиком образуют дополнительную пару, то резольвента для них равна нулю. Возможность не обращать внимания при поиске дополнительных пар на их аргументы основана на том, что замена переменных в предикате, если он ложен в некоторой области значений, не может при замене переменной и сохранении или уменьшении этой области значений сделать его истинным. Теперь можно описать суть процедуры метода резолюции. В множестве дизъюнктов ищут такие два дизъюнкта, которые содержат дополнительную пару. В множество добавляется резольвента этих двух дизъюнктов. Процесс повторяется до тех пор, пока в множестве Sp не появится «пустой» дизъюнкт, т. е. нулевая резольвента. Это будет свидетельствовать об окончании процесса доказательства невыводимости F. Пример 5.9. Рассмотрим множество S f.= {Pi{x)\/Pzix), Piifi^)yVP2{x)\ P2{y)VPs{f{y)). P,{x)}. Для двух дизъюнктов резольвента есть Pzix). Вместе с третьим дизъюнктом эта резольвента порождает новую резольвенту Рз{[{у))> Наконец, резольвента этой вторичной резольвенты с последним дизъюнктом дает нулевой дизъюнкт. Теперь можно утверждать, что F в нашем примере невыводима. Мы изложили лишь суть метода резолюций. При проведении процедуры последовательного поиска резольвент возможны различные неприятности, когда очередная резольвента не порождается, или когда процесс зацикливается. Кроме того, при большом количестве исходных дизъюнктов (а их может быть и бесконечно много) требуются специальные меры для ускорения процесса поиска пустого дизъюнкта. И, наконец, как и во всех методах опровержения, для метода резолюции возникает проблема прекращения поиска нулевого дизъюнкта, когда на самом деле опровержение из-за вы- водилюсти F в множестве 5/. получить нельзя. Существует большая литература, посвященная всем этим проблемам, но обсуждение подобных вопросов, важных для повышения эффективности работы планировщиков, опирающихся на реализацию данного метода поиска вывода, выходит за границы нашей книги. Заинтересованные в детальном изучении этих проблем могут ознакомиться с литературой, указанной в комментарии к данной главе.
1^5.3. ИСПОЛЬЗОВАНИЕ МЕТОДА РЕЗОЛЮЦИИ 233 В заключение настоящего параграфа отметим несколько особенностей систем планирования решений, опирающихся на вывод в формальной системе. Во-первых, сам план, найденный с полющью логического вывода, реализуется в реальном времени и пространстве. И особенности этой реальной среды необходимо учитывать при планировании. Следующий пример иллюстрирует те неприятности, которые могут возникнуть при их игнорировании. Пусть в некоторый момент планирования, анализируя имеющуюся ситуацию, оказалось возможным выработать два независимых друг от друга решения: U^— «Продвинуть кран на 200 м вперед по причалу» и и2— «Повернуть стрелу крана на 90" влево». Однако из вывода этих двух решений совершенно не следует вывод о возможности ИХ совместной реализации, хотя в обычных дедуктивных системах из выводимости t/i и t/g следует выводимость их конъюнкции Uj&Ui' «Продвинуть кран на 200 м вперед по причалу, поворачивая одновременно его стрелу на 90° влево». В реальной ситуации это может привести к аварии. Может оказаться, что по ходу движения крана через 50 м от точки, где он находился, расположен другой кран, о корпус которого может задеть стрела нашего крана при noBopoie. Другими словами, планирование требует учета выводимости того или иного решения в связи с динамикой изменения ситуации, возникающей от реализации некоторого другого выведенного решения. Есть и еще одно замечание, связанное с формированием планов, в основе которых лежит идея локального улучшения движения к цели. Во многих задачах цель может быть достигнута только в том случае, если на некотором шаге решения необходимо на какое-то время как бы отойти от цели, сделать свое положение «хуже чем было», что позволит на следующем шаге значительно приблизиться к конечной цели. Теория таких немонотонных планов пока находится в зачаточном состоянии и не разработаны сколь-нибудь общие подходы к их формированию. Метод резолюции, конечно, не единственный метод дедуктивного вывода, который может использоваться в системах семиотического управления. Существуют и другие методы планирования, в основе которых лежит логический вывод. О них говорится в частности в комментариях к данной главе. Но у всех подобных методов есть один общий недостаток. Он заключается в том, что в качестве исходных аксиом, с помощью которых будут делаться выводы, необходимо располагать достаточно полным описанием проблемной области. А это вызывает большие трудности и часто приводит к непоправимым ошибкам из-за неполноты исходного описания. Кроме того, отмеченные перед этим трудности, связанные с динамичностью проблемных областей, также ограничивают возможности использования чисто дедуктивных систем формирования решений. Ниже мы расмотрим тот путь, по которому пошли системы планирования решений в практических системах управления.
234 гл. 5. формирование решении по управлению Лманировщии- Подель проблемной области (база знаний) (база daHHt^x) Данные "РисГб.б § 5.4. Функциональные модели для планирования При поиске решения, связанного с управлением каким-либо объектом, естественно использовать те сведения, которые известны системе управления как о самом объекте управления, так и о процессах, протекаюи;их в нем. Эти сведения, как уже говорилось неоднократно, хранятся в памяти управляющей системы в виде базы знаний. Знания о каждой текущей ситуации должны наполняться конкретными характеризующими ее данными. База знаний оказывается как бы погруженной в базу данных, она «подпитывается» данными. И в зависимости от наполнения конкретными данными планировщи'к вырабатывает те или иные решения, выраженные в планах воздействия на объект управления. На рис. 5.6 все сказанное изображено в виде ставшей стандартной схемы планирования поиска решений. На этом рисунке не показаны связи, которые имеются у базы данных с объектом управления, и связи планировщика с остальными подсистемами системы управления. Для иллюстрации того, как устроена модель проблемной области и как планировщик может использовать ее при поиске решения для достижения поставленной цели управления, рассмотрим один класс таких моделей, часто встречающийся на практике. Это так называемые функциональные модели. Всякая функциональная модель представляет собой сеть без ориентации, включающую в себя вершины двух типов: дескрипторы и спецификаторы. При графическом изображении функциональных моделей дескрипторы принято обозначать кружками, а спецификаторы — прямоугольниками. Всякому спецификатору сопоставляется некоторое функциональное выражение вида /(Xi, . . а:„)=0, причем предполагается, что f допускает явное разрешение хотя бы относительно одного из аргументов xi. Другими словами, хотя бы для одного Xt это уравнение можно переписать в виде: Xi=f' {х^, . . Ar^.i, x^+i, . . ., л:^). Такая операция называется допустимым разрешением спецификатора. Допускается, что для одного спецификатора может быть от 1 до п допустимых разрешений. Со спецификатором /(xi, a:^, . . Хп)=0 связано п ребер функциональной модели, каждое из которых соединено с одним из дескрипторов множества {х^ Xg, . . Два спецификатора в функциональной модели соединены друг с другом некоторым дескриптором, если последний определяет аргумент, общий для обоих спецификаторов. Пример 5.10. На рис. 5.7 показан фрагмент функциональной модели, относящейся к предметной области «Планиметрия треугольника». На рисунке элементы треугольника обозначены, как при-
§5.4. ФУНКЦИОНАЛЬНЫЕ МОДЕЛИ ДЛЯ ПЛАНИРОВАНИЯ 235 нято в школьном курсе: а, р и v — У^^ы треугольника; а, b и с — его стороны (связь между обозначениями углов и сторон иллюстрируется чертежом в верхней части рисунка); R п г — соответственно радиусы описанной около треугольника и вписанной в него окружностей; р — полупериметр треугольника, а s — его площадь. Внутри каждого спецификатора записано соотношение, ^ coscos COS ■ = о 'i-job sin у-о '^-\ ^ ^0 а-д-с-2с =0 Рис. 5.7 связывающее между собой те или иные дескрипторы. Максимальное число возможных разрешений каждого спецификатора совпадает с числом связанных с ним ребер. Например, для спецификатора с. соотношением s—гр=0 таких возможных и допустимых разрешении три: s=rp; r=slp и p=s/r. Функциональные модели, подобные рассмотренной только что в примере 5.10, позволяют описать целый комплекс процедур, связанных с определением одних дескрипторов через другие. Для этого достаточно лишь задать исходное множество дескрипторов и целевые дескрипторы и найти с помощью планировщика такие допустимые разрешения для спецификаторов, которые образовали бы ориентированный путь, ведущий от исходных дескрипторов к целевым. Поиск такого пути (хотя бы одного из возможных) и есть основная задача планировщика. Пример 5.11. Пусть на вход планирующей системы поступило задание «Найти площадь треугольника, если даны его стороны а, b
236 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ И о>. По тексту задания планировш^ик возбуждает в функциональной модели дескрипторы, соответствующие а, b я с, я начинает поиск пути, ведущего к целевому дескриптору s. Поиск протекает в соответствии с одной из стратегий, о которых говорилось в § 5.2. Пусть для определенности это будет стратегия прямой волны. Тогда процесс поиска плана будет протекать так, как показано на рис. 5.8. Р ^С0$~- 005 j- COS^ = О Рис. 5.8 На первом шаге планировщик убеждается в том, что допустимое разрешение обеспечивает только спецификатор, помеченный на рисунке цифрой /. Разрешение для него дает возможность найти значение дескриптора р, если известны значения а, b w с. Далее оказывается возможным разрешение спецификатора, отмеченного цифрой 2, что позволяет определить значение дескриптора г. Наконец, на третьем шаге планирования разрешается спецификатор, отмеченный цифрой 5, что приводит к определению значения дескриптора s. Так как дескриптор s является целевым, то планировщик заканчивает свою работу. После нахождения ориентированного пути, ведущего от исходных дескрипторов к целевым, необходимо сформировать программу вычислений. Это возможно, если в памяти управляющей системы имеется заранее заготовленный набор стандартных программных модулей, каждый из которых соответствует тому или иному допустимому разрешению определенного спецификатора. При наличии набора таких модулей найденный планировщиком путь указывает последовательность выполнения модулей друг за другом. Описанная процедура планирования решает только первую часть задачи поиска решения — формирует программу, после чего
§5.4. ФУНКЦИОНАЛЬНЫЕ МОДЕЛИ ДЛЯ ПЛАНИРОВАНИЯ 237 необходимо произвести наполнение программы конкретными данными. На этом этапе также приходится обращаться к базе знаний о проблемной области, ибо только в ней содержатся закономерности, позволяющие судить о допустимости того или иного сочетания данных. Например, если мы пользуемся функциональной моделью, описанной в примерах 5.10 и 5.11, то при поступлении на вход системы планирования задания «Найти площадь треугольника, если даны его стороны а^ЮО, Ь = 1 и с=20», будет построена программа, соответствующая пути, найденному в примере 5.11. Далее она начнет выполняться для конкретных значений сторон треугольника, зафиксированных в задании. Но выполнение программы успешно не завершится. Произойдет аварийный останов, так как при вычислении радиуса вписанной окружности в соответствии со спецификатором, помеченным на рис. 5.8 цифрой 2, под корнем будет получено отрицательное выражение. Для того чтобы исключить подобные случаи в модели проблемной области заранее предусматриваются закономерности, выполнение которых должно быть обязательным при работе с конкретными данными. В нашем случае в модели проблемной области должны храниться такие закономерности, «Сумма длин двух сторон треугольника всегда больше длины третьей стороны», «Разность длин двух сторон треугольника всегда меньше длины третьей стороны», «Сумма углов треугольника всегда равна 180°» и т. п. Эти предварительные проверки должны выявить все случаи недопустимости исполнения программ при таких фиксированных исходных данных, которые нарушают основные закономерности проблемной области. Совокупность дедуктивного вывода, обеспечиваемого планировщиком на функциональной модели, описание самой модели, связанных с ней программных модулей и закономерностей данной проблемной области вместе с процедурами их проверки образуют то, что сейчас принято называть интеллектуальным пакетом при- кладных программ. Именно в виде такого пакета выступает в ситуационном управлении Коррелятор. Основная его компонента — набор логико-трансформационных правил D Здесь Si— описание фрагмента текущей ситуации, наличие которого определяет применимость логико-трансформационного правила, Sa—описание преобразуемого фрагмента, а S3—результирующее описание нового фрагмента описания. Если рассматривать Si, S2 и S3 как дескрипторы, а => как некоторый спецификатор, D ТО легко установить соответствие между функциональными моделями и набором логико-трансформационных правил. Поэтому можно считать, что методы, традиционные для ситуационного управления, предвосхитили идею работы с функциональными моделями.
238 ГЛ. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ В реальных задачах часто встречается случаи, когда переходы между состояниями в пространстве состояний или между подзадачами в пространстве подзадач недетерминированы, что отражает неполноту наших знаний о возможностях таких переходов. В этом случае дуги сети, на которой производится планирование, взвешиваются, например, значениями функции принадлежности. Общая оценка найденного плана вычисляется по оценкам этих значений на отдельных дугах разными способами. В частности, общая оценка может совпадать с минимальной оценкой, встречающейся на данном пути, или быть средней арифметической этих оценок. §5.5. Сценарии и логики действий* При поиске решений в системах ситуационного управления используются не только функциональные модели, но и другие способы нахождения решений. В § 5.4 мы уже упоминали о логико-трансформационных правилах, лежащих в основе многих реальных систем ситуационного управления. Использование подобных правил предполагает, что вся необходимая информация для вывода решения хранится в специально организованной базе знаний (см. рис. 5.6). Эта организация заключается в разбиении всей базы знан1п1 на отдельные, возможно пересекающиеся участки, называемые сферами. Каждая сфера содержит знания, между которыми существует тесная семантическая, прагматическая или ситуативная связь. Сфере приписано определенное имя. Каждый факт, хранящийся в памяти системы управления, содержит информацию об именах тех сфер, в состав которых он входит. Кроме того, факт имеет собственное, присущее только ему, имя. Наконец, для факта указываются списки отношений, которыми он связан с другими фактами, и типов (имен) этих отношений. В зависимости от конкретной используемой базы данных, в которую погружена база знаний, оформление факта может быть различным. Например, он может быть описан в виде ролевого фрейма. Пример 5Л2. При создании системы управления погрузкой и разгрузкой вагонов на железнодорожной станции может потребоваться описать в виде факта знание о технологии разгрузки вагонов. Это знание можно представить следующим ролевым фреймом: {<РАЗГРУЗКА) <МЕСТО> <3начение слота) <ТИП ВАГОНА) <3начение слота) <ТИП ГРУЗА) <3начение слота) <СРОЧНОСТЬ) <3начение слота) <ВРЕМЯ ПРИБЫТИЯ) <3начение слота) <ПОЛУ- ЧАТЕЛЬ) <Значение слота)}. Такой ролевой фрейм может иметь вложенную структуру. Другими словами, отдельные слоты, соответствующие ролям, определяемым их именами, сами могут быть именами других ролевых фреймов. Например, слот МЕСТО сам может задаваться в виде следующего фрейма:
§ 5.5. СЦЕНАРИИ И ЛОГИКИ ДЕЙСТВИЙ 239 {<МЕСТО> '^ОТКУДА) Оначение слота> <КУДА> <3начение слота) <ТИП ВАГОНА) <3начение слота) <СРЕДСТВО) <3начение слота)}. В свою очередь слот ТИП ВАГОНА также может иметь вид некоторого ролевого фрейма. {:ТИП BArOHAN <СРЕДСТВА ПОГРУЗКИхЗначение слота) <СРЕДСТВА РАЗГРУЗКИ) ^Значение слота) <УСЛОВИЯ) <3на- чение слота/}. При заполнении слотов приведенных ролевых фреймов конкретными данными из базы данных возникают конкретные фреймы, получающиеся из этих фреймов-прототипов. Например, {РАЗГРУЗКА) <МЕСТО) <Платформа № 2) <ТИП ВАГОНА) <Тип 4> /ТИП ГРУЗА) гПесок) <СРОЧНОСТЬ) <Первая) <ВРЕМЯ ПРИБЫТИЯ^ <25 декабря 1985 г.) <ПОЛУЧАТЕЛЬ) <Кирпичный завод № 68>); { МЕСТО > <ОТКУДА) <Платформа № Ь <КУДА) <Платфор- маХ9 2)<ТИП ВАГОНА) <Тип 4)<СРЕДСТВО)<Тепловоз 02652 }; (ТИП ВАГОНА > <СРЕДСТВА ПОГРУЗКИ^ <Любые> <СРЕД- СТВА РАЗГРУЗКИ) <Любые) <УСЛОВИЯ) <Длина платформы не менее 50 м, высота платформы не более 0,5 м)}; {<ПЕСОК) <СРЕДСТВА ПОГРУЗКИ-РАЗГРУЗКИ) <Тран- спортеры типа 1, 4, 7; кран типа 6; ручная погрузка-разгрузка) <МЕСТОНАХОЖДЕНИЕ МЕХАНИЗМОВ) <Транспортеры типа 1, 4 на платформе № 2; транспортер типа 7 и кран типа 6 на платформе № 7)}. Что дают эти описания? Они содержат в себе информацию о том, что 25 декабря 1985 г. железнодорожный вагон типа 4 с песком, прибывшим для использования на кирпичном заводе № 68, находится около платформы № 1. Однако на этой платформе нет механических средств, пригодных для разгрузки песка. Поэтому с помощью тепловоза 02652 вагон может быть доставлен к платформе № 2, на которой имеются транспортеры типа 1 и 4, пригодные для выгрузки песка. При проведении в жизнь этого решения необходимо еще проверить выполнение условия, связанного с типом данного вагона, касающееся длины платформы № 2 и ее высоты. Если эти условия выполнены, то решение задачи найдено. Если они не удовлетворяются, то необходимо искать другой вариант разгрузки, связанный, например, с перегонкой вагона с песком к платформе № 7. Как видно из приведенного примера, в памяти системы хранятся два типа описаний: интенсиональные и экстенсиональные. Интенсиональные описания — это описания чистых знаний об объекте управления и протекающих в нем процессах. Ролевой фрейм, в котором роли только названы, но не заполнены, представляет собой пример такого интенсионального описания. При заполнении же ролей возникает множество экстенсиональных описаний — конкретных фактов, дающих в совокупности описание текущей ситуации.
240 гл. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ Как интенсиональные, так и экстенсиональные описания могут быть связаны между собой различными отношениями. В нашем примере для большей наглядности эти отношения, как и имена сфер, в которые входят эти факты, не были указаны. Наиболее важны для интенсиональных описаний классифицирующие отношения, характерные для Классификатора, т. е. отношения типа класс — элемент класса. Эти отношения описывают структуру объекта управления и структуру процессов принятия решений по управлению данным объектом. Отношения же на множестве экстренсиональных описаний являются ситуативными. Они связывают отдельные конкретные факты между собой в единую ситуацию. Связывая между собой описания двух типов, можно получить сценарий принятия решений. Рис. 5.9 Пример 5.13. На рис. 5.9 приведен фрагмент сценария для случая управления водопользованием и водопотреблением в некотором регионе. На первом уровне этого сценария выделяется семь классов ситуаций, при появлении которых необходимо управление. Эти классы интерпретируются следующим образом: О — необходимо
§5.5. СЦЕНАРИИ И ЛОГИКИ ДЕЙСТВИЙ 24», изменение работы системы водопотребления, 1J — из-за состояния^ погодных условий, 1,2 — из-за воздействий сельскохозяйственно га водопотребления, У.З —из-за воздействий водного транспорта, 1.4 — из-за воздействий коммунально-бытового потребления, 1,5 — из-за воздействий гидроэнергетических сооружений, 1.6 — из-за воздействий промышленности, 1.7 — из-за воздействий индустрии туризма. Далее анализируется лишь та часть сценария, которая связана с необходимостью управления в результате требований, предъявляемых к системе управления коммунально-бытовым потреблением. Оставшиеся на рис. 5.9 вершины сценария интерпретируются следующим образом: 2.1 — увеличение количества потребляемой воды, 2.2 — увеличение количества уходящей воды и ухудшение ее качества, 3,1 — анализ причин нарушения баланса,. 4.1 — прогноз дальнейших изменений, 5.1 — изменения носят временный характер, 5.2— изменения носят постоянный характер, 6.1 — моделирование влияния изменений на состояние окружающей среды, 6.2 — определение недостающего количества воды, 5.5 — моделирование влияния изменения качества стоков на состояние окружающей среды, 7,1 — оценка результатов моделирования, 7,2 — анализ влияния водохозяйственного баланса на перспективу, 8,1 — оценка возможности увеличения водопотребления, 8.2 — оценка результатов моделирования, 9,1 и 9.2 — определение решений на основании проделанного анализа. Далее следуют сами решения, обозначенные на рис. 5.9 цифрами: 1 — введение режима экономии воды, 2 — увеличение нагрузки на водохозяйственные предприятия, 3 — ввод в действие резервных мощностей, 4 — строительство водопроводов, 5 — модернизация оборудования имеющихся очистных сооружений, 6 — строительство новых очистных сооружений, 7 — перераспределение стоков с дальнейшим их использованием, 8 — увеличение нагрузки на очистные сооружения и использование резервных мощностей. Таким образом, сценарий содержит в себе самые разнородные элементы, связанные с проверкой условий, требующих вмешательства системы управления, анализом текущей ситуации, прогнозированием ее развития и собственно принятием того или иного решения. Но сценарий, рассмотренный в нашем примере 5.13,—это только верхний уровень системы принятия решений. На нижних уровнях решение должно быть конкретизовано. Конкретизация может потребовать нескольких этапов, включающих в себя процедуры анализа, имитационное моделирование (экстраполяцию) или оптимизацию. В ряде систем ситуационного управления, созданных в нашей стране, системы принятия решений имеют три уровня конкретизации. На самом верхнем уровне происходит выявление конфликтных ситуаций, требующих принятия решений по управлению. На втором уровне вычленяются все допустимые решения и для них осуществляется экстраполяция и, если возможно, оптимизация. Наконец, на третьем уровне найденная схема решения (интенсис-
242 ГЛ. 5. ФОРЛШРОВАНИЕ РЕШЕНИИ ПО УПРАВЛЕНИЮ нальное описание сценария решения типа ролевого фрейма из примера 5.12 или логико-трансформационного правила) наполняется конкретным содержанием из базы данных и превращается в экстенсиональное описание сценария принятия решения, которое и реализуется покомандно. Переход со второго уровня на третий сопряжен с возможной неоднозначностью конкретной схемы реализации интенсионального описания из-за неоднозначности последовательности срабатывания логико-трансфэрмационных правил. Для устранения этих коллизий вводятся специальные метаправила, с пo^ющью которых выбираются допустимые последовательности применения логико-трансформационных правил. Рассмотрим еще один подход, связанный с принятием многошаговых решений, когда в качестве аппарата принятия решений используется логика действий. Рассмотрим фрагмент такой логики, связанный с частичной упорядоченностью во времени действий, составляющих в совокупности реализацию некоторого решения. Пусть di—элементарные действия, для которых управляющая система имеет стандартные приемы реализации; D;—сложные действия, состоящие из цепочек действий Лд. — субъекты, способные выполнять действия di из некоторой совокупности таких действий. При этом в роли субъектов могут выступать как люди, так и всевозможные механизмы и аппараты. Через Тд. будем обозначать интервалы времени, в течение которых действует субъект Af^. Наконец, От— объекты, испытывающие воздействие. Введем теперь основные базовые тройки, характерные для логики действий во времени. При обозначении отношений, входящих в них, будем пользоваться отношениями из табл. 2.1 и табл. 2.2, а именно: d-j^Dj— элементарное действие di есть часть действия Л/1^76^—субъект Aj, выполняет действие A^^r-.^Dj— субъект А]^ выполняет действие Dy, dfriT/i—действие di реализуется в интервале Т^^ DjKiTh —действие Dj реализуется в интервале Th. Ah^'iTk — субъект Ah действует в интервале времени Thy On/iT'ft— объект От испытывает воздействие на интервале Т^, diKedi — действия di и di могут быть выполнены друг за другом в произвольном порядке, не примыкая друг к другу, dir^^di—действия di и di должны быть выполнены, примыкая друг к другу, в указанном порядке, DjK^Dra — действия Dj и могут быть выполнены, примыкая друг к другу, в любом порядке, Df2c.Dm— действия Dj и должны быть выполнены, примыкая друг к другу, в заданном порядке, ^/^21^;—действия di и di выполняются одновременно, DfiiPm—действия Dj и выполняются одновременно, dfr-jiOm— действие di выполняется на объекте От- Приведем еще примеры правил вывода, используемых в такой логике действий.
§5.6. ЭКСТРАПОЛЯЦИЯ РЕШЕНИЙ 2\3 1. Всякий субъект может выполнять некоторое действие (dt ияп Dj) лишь на том временном интервале, на котором он может это делать. Для действий dt это правило имеет вид {А,г,Т*) {A,r,,di) {dirJ**)^{T**r,,T*). 2. Время, в течение которого субъект совершает действие на каком-либо объекте, и время, в течение которого объект испытывает воздействие от этого действия {dt или Dj) должны быть одинаковы. Для действия dt это правило имеет вид {d.rj*) {A^r,,d,) {d,r,fij (О^г^Т**) ^ {T*r,J**). 3. Элементарные действия, входящие в сложное, должны иметь интервалы реализации, содержащиеся в интервале реализации сложного действия. Для действия dt это правило имеет вид idfr.Dj) [d^rj*) (Djr.T**) ^ 4. Для непосредственно примыкающих друг к другу действий (di или Dj) интервалы их реализаций должны находиться в отношении примыкания. Для dj это правило имеет вид (d,r,,J,) idtr.T*) id,rJ**)^{T*r,J**). 5. Если некоторое действие {dt или Dj) совершается раньше другого действия {dj или D^), то такое же отношение имеется и между интервалами, на которых они реализуются. Для dt это правило имеет вид (d.r.A) WJ*) {d,rj**) ^ {T*r,,T**). 6. Если два действия {dt или Dj) выполняются одновременно, то их интервалы выполнения совпадают. Для dt это правило имеет вид (d^r.id,) {d,rJ*)[(d,r,T**) ^ (TV.iT**). Аналогичным образом можно построить фрагмент логики действий, связанный с пространственной реализацией действий. Для этого из табл, 2.1 и табл. 2.2 надо выбрать соответствующие пространственные отнэшения. Подобные фрагменты логики действий можно использовать при построении сложных решений из элементарных и проверки условий возможности их совмещения во времени и пространстве. § 5.6. Экстраполяция решений Сложность объектов, для которых обычно используются методы ситуационного управления, требует при поиске решения по управлению имитации возможных последствий принятия того или иного решения. Проблема имитационного моделирования не относится к какой-то особой проблеме, связанной именно с ситуационным уп-
244 ГЛ. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ равлением. Существует много методов такого моделирования, позволяющих экстраполировать динамику состояний объекта и процессов, протекающих в нем. Разработаны специальные языки имитационного моделирования и созданы пакеты программ, позволяющие такую имитацию осуществлять. Однако при использовании методов семиотического типа и тех языков описания ситуаций, которые в них применяются, возникают особые требования к системам моделирования. Эти требования связаны с тем, что в идеале хотелось бы получить прогноз развития событий на уровне описаний тех ситуаций, которые могут возникнуть в будущем. Другими словами, хотелось бы получить экстраполяцию в виде перевернутого дерева, показанного на рис. 5.10. Его корень соответствует ситуации (описанию ситуации) на объекте в данный момент времени. Если в качестве решения планируется Л*=^1^2^з, то последующие ярусы дерева показывают те ситуации, в которые может попасть объект в результате реализации именно данного решения. Ветвление дерева соответствует той неопределенности, с которой можно представить себе процесс развертывания событий. Около каждой ситуации, лежащей на концевых ветвях дерева, проставлены оценки gi, характеризующие возможность такого исхода (они показаны заштрихованными кружками). Эти оценки могут иметь экспертный, вероятностный или размытый характер. Если в исходной ситуации, кроме решения D* можно использовать некоторые другие решения, то для всех них строится имитационный процесс, порождающий свое дерево такого же типа, как и на рис. 5.10. Далее по некоторому решающему правилу оцениваются полученные в результате моделирования оценки gi и выбирается то решение D*, для которого решающее правило дает наилучший результат. Важная особенность приведенного выше метода состоит в том, что при моделировании мы каждый раз имеем описание получаемой ситуации, а, значит, может классифицировать ее с помощью Классификатора и оценивать ее конфликтность или неконфликтность для управления объектом. Это приводит к имитационному моделированию как бы на двух уровнях: на уровне динамики самого объекта управления и на уровне описания складывающихся на нем операций с учетом возможностей (например, ресурсов) самой системы управления. Таким двухступенчатым образом и формируются значения оценок gi. Рис. 5.10
§5.6. ЭКСТРАПОЛЯЦИЯ РЕШЕНИЙ 245 Следующая особенность имитационных процессов в системах принятия решений при управлении, в основе которых лежат логико- лингвистические модели, состоит в том, что интерес представляют не только статистические данные, накапливаемые в процессе моделирования (например, средние времена ожиданий или длины очередей объектов, ждущих обслуживания), но и динамика одной конкретной ситуации, причем изменяются не только (и не столько) какие-то числовые параметры, но и структурные описания (например, отношения, реализуемые между отдельными элементами, входящими в описание ситуации). Все это приводит к необходимости при построении Экстраполятора для систем ситуационного управления использовать возможности, содержащиеся не только в традиционных языках для имитационного моделирования, но и в языках, характерных для описания и трансформации описаний ситуаций. И, наконец, еще одна особенность Экстраполятора — его работа должна быть тесно увязана с работой других блоков системы ситуационного управления и прежде всего с работой Классификатора и системы выбора решений. Это означает, что имитационный процесс в системах ситуационного управления протекает таким образом, что движение по дереву типа дерева, показанного на рис. 5.10, осуществляется не только с учетом самого объекта, но и с привлечением процедур к:Г1ассификации ситуаций, возникающих по ходу моделирования, и применения процедур формирования решений на основе результатов этой классификации. В § 2.7 мы ввели представление объектов управления в виде дискретной ситуационной сети (ДСС). Подобная модель позволяет весьма просто продемонстрировать сущность процесса имитационного моделирования в Экстраполяторе системы Трансп-i ^ ситуационного управления. [^J—^^(ff)—"^^^^ К^)-^^ Напомним, что ДСС Заготовки Детат включает в себя элементы ' Станок четырех типов: истоки, сто- р^^с. 5.11 ки, пассивные решатели и активные решатели. По ДСС перемещаются в дискретные моменты времени объекты, каждый из которых задается набором характеристик. Характеристики бывают двух типов: статические, характеризующие сущность данного объекта, и динамические, связанные с временными оценками, приписываемыми объекту в данном конкретном процессе, реализуемом на ДСС. Каждый элемент, входящий в состав ДСС, можно представить некоторым детерминированным или вероятностным автоматом. Эти автоматы можно даже схемно реализовать, но в системах ситуационного управления предпочитают иметь их программно реализованные модели. Пример 5.14. Рассмотрим ДСС, показанную на рис. 5.11. Как мы видим, ДСС имеет один исток, функционирование которого по-
246 гл. 5. формирование решений по управлению рождает объекты двух типов: заготовка^ и заготовкаг. Объекты поступают в пассивный решатель, а затем в решатель, в KOTopo\t объединены пассивный и активный решатели АР+Р. Наконец, после этого объекты попадают еи;е в один пассивный решатель и уходят в сток. Первый и последний пассивные решатели имитируют транспортеры трансп-1 и трансп-2, подают заготовки решателю АР+Р, который имитирует станок, и передают готовые детали в- бункер, показанный на ДСС в виде стока С. Обработка объектов заготовка! и заготовкаг на станке требует определенного времени, что меняет динамические характеристики этих объектов. Сама же обработка на станке меняет их статические характеристики. При имитации процесса движения заготовок и обработки их на станке введем следующие процессы. 1. УСТАНОВКА. Этому процессу соответствует логико-транс- формапионное правило (ЛТП) следующего вида: если станок свободен и заготовка^ находится на трансп-1, то следует поместить объект заготовка^ на станок, убрав его с трансп-1, и затем перевести станок в состояние занят. 2. ВКЛЮЧЕНИЕ. Соответствующее ЛТП имеет вид. Если станок занят, то перевести его в состояние включен. Отметим, что состояние свободен имеет неопределенный по времени интервал актуализации. Состояние же занят в зависимости от TJHia объекта заготовка,- (i=l, 2 для нашего примера) актуализу- ется на определенный период времени (например, для i = l на 10 мин, а для i=-2 на 45 мин). 3. ПОДАЧА ЗАГОТОВКИ. Соответствующее ЛТП имеет вид. Если на трансп-1 нет объектов вида заготовка ^, то передать управление истоку и ждать появления первого объекта заготовка^, после чего функционирование истока прекращается до освобождения трансп-1. Такие условия срабатывания ЛТП для процесса подача загото> вок, конечно, на практике могут и не выполняться. Исток может функционировать независимо от наличия или отсутствия заготовок^ на транспортере, подающем детали к станку. 4. ВЫКЛЮЧЕНИЕ. Соответствующее ЛТП имеет вид. Если счетчик астрономического времени для состояния занят достиг границы, соответствующей объекту заготовкаj, то перевести станок: в состояние свободен и поместить готовую деталь на трансп-2. 5. ПОДАЧА ДЕТАЛИ. Соответствующее ЛТП имеет вид. Если деталь находится на трансп-2, то включить его и через заданное астрономическое время / выключить. Это правило соответствует перемещению детали от станка в. выходной бункер (сток ДСС). Описанные нами пять ЛТП содержат в себе условия применимости, выполнение которых допускает изменения в ситуации, описанные в этих ЛТП. Условия применимости вводятся маркером. Если, а операторы преобразования — маркером то.
§5.6. ЭКСТРАПОЛЯЦИЯ РЕШЕНИЙ 247 Приведенный чрезвычайно простой пример показывает, что описание текущей ситуации и описание ЛТП для сколь-нибудь сложного реального объекта будут весьма громоздки, а сама работа по формированию нужного списка ЛТП представляет очень нелегкую задачу. В реальных объектах по ДСС будут перемещаться многие весьма разнотипные объекты и ЛТП для их переработки в активных решателях будут многочисленны и взаимосвязаны по условиям своей применимости. Пример 5.16. Для иллюстрации сказанного приведем в качестве примера табл. 5.2, в которой перечислены виды и количество объектов, перемещающихся по ДСС и образующих ее активные решатели, для Калининградского морского рыбного порта. Таблица 5.2 Количс^ство, встречаОбъекты и активные решатели ющееся н рамках ОДНО!! ситуации Эстакадные краны 2 Портальные краны 36 Причалы Индустриальная гавань 8 Лесная гавань 7 Нефтебаза 2 Мелькомбинат 1 п/п Светлый 1 Газационный 1 Электропогрузчики 115 Автопогрузчики 28 Суда портфлота Холодильники 45 3 Склады крытые 13 Площадки открытые 30 Железнодорожные пути 7 Рабочие 2459 Бригады 32 Суда Калининградской приписки более 400 Виды судовых лебедок 25 Виды твиндеков 126 Виды грузовых помещений 63 Типы вагонов 17 Ассортимент грузов около 500 Типы автомашин 7 iMbi здесь не разделяем объекты и активные решатели, так как в зависимости от желания их можно превращать друг в друга. Анализ таблицы показывает сколь сложным может оказаться система ЛТП, учитывающая все виды объектов, ресурсов и синхронизирующих процессы параметров. Оценка числа ЛТП, характерных для систем моделирования таких объектов, лежит в пределах 200— 400. Количество решений, принимаемых при обработке судов в порту типа морского рыбного порта также весьма велико. Практиче-
248 ГЛ. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ ски каждое такое решение является многошаговым. В его состав входят следующие основные операции: погрузка, выгрузка, перевалка, буксировка; дислокационные: постановка первым бортом, постановка вторым бортом, перетяжка, раскантовка, отшвартовка,. перешвартовка; бункеровоч- ные: заправка топливом, заправка маслом,заправка мазутом, заправка водоГь отстой, перевозка; вcпo^югaтeльныe: газация, дератизация, дезактивация, дезинфекция,зачистка, мойка и сушка, затарка,. судоремонт, очистка, противопожарные операции, водолазные операции, пассажирские операции. С грузами также связан целый спектр операций. Ряд операций (например, погрузка или буксировка) сами состоят из ряда более простых операций. Эти операции связаны между собой сценариями, определяющими необходимые и допустимые последовательности Рис. 5.12 Рис. 5.13 выполнения отдельных операций. Примером может служить сценарий, показанный на рис. 5.12. Здесь, как и всегда, отношение Г21 есть отношение одновременно, а отношение г^г— быть раньше. Цифрами обозначены следующие операции: 1 — передача карго- плана, даты прихода, 2 —подготовка к обработке судна, 5 — переход судна в порт, 4 — оформление прихода, 5 — обработка судна, 6 — оформление грузовых документов и отхода. Конечно, каждая вершина сценария сама является именем некоторого сценария, и та-
§5.7. особенности рассуждений у человека 249 кая «вложенность» сценариев может быть достаточно глубокой. В качестве параметров, меняющих вид сценариев или их последовательности, выступают конкретные характеристики типов судов, причалов и других элементов, перечисленных в табл. 5.2. Кроме тех решений, которые связаны с учетом совокупности сценариев, определяющих технологические требования к реализации решений и входящих, как правило, в условия применимости тех или иных ЛТП, имитируются и принимаются решения, определяемые лишь теми критериями управления, которыми руководствуется сама система управления. Эти критерии, как правило, противоречивы, так как они затрагивают интересы различных ведомств. План разгрузки и отправления грузов всегда рождается в результате некоторого компромиса, оцениваемого в процессе имитации последствий принимаемых решений. За простотой окончательного решения, иллюстрируемого, например, рис. 5.13, скрывается реализация весьма громоздкой процедуры имитации и принятия решения. § 5.7. Особенности рассуждений у человека В процессе первоначального заполнения памяти системы управления семиотического типа и в процессе обучения, когда технолог-управленец формирует для системы основные стратегии управления, а также обучающие выборки, он невольно вносит в эту информацию те особенности своего мышления, которые присущи ему как человеку. В данном параграфе мы постараемся перечислить приемы мышления, охотно используемые человеком в ходе своих рассуждений и не укладывающиеся в традиционные рамки логики. Цель настоящего раздела — насторожить специалиста по управлению, который зачастую легкомысленно относится к тому уровню строгости, который на самом деле характеризует позицию и высказывания эксперта- управленца. Вторая цель излагаемого ниже — дать набор некоторых рекомендаций по построению систем, имитирующих человеческие способы рассуждений. Необходимость в этом вызывается не собственно задачами имитации человеческих способностей искусственными системами, а тем, что в системах общения между человеком и интеллектуальной системой необходимо создать уровень взаимопонимания и доверия, возникающий при общении двух людей. Дальнейшее изложение будет носить конспективный характер. Более развернутое рассмотрение тех или иных проблем, связанных со способами рассуждений человека, можно найти в книгах и статьях, о которых говорится в комментарии к данной главе. Порядок рассмотрения особенностей рассуждений и выводов, делаемых человеком на основе этих рассуждений, отражает ту значимость, которую сегодня им можно приписывать при решении управленческих задач. 1.Шкалированность выводов. В §4.2 мы много говорили о шкалах, образующих пространство, в котором осуществляется классификация объектов и явлений окружающего мира у человека. Понятно, что его рассуждения и формируемые им выводы не могут не учитывать эти шкалы. Однако шкалирование выводов происходит, как правило, как бы вне их вербального выражения, остается «за кадром», хотя и осознается при необходимости. Но иногда такая шка- лированность выступает в явной форме. Пусть мы имеем две шкалы: шкалу причин и шкалу следствий. На каждой шкале определено некоторое отношение пооядка. Обозначим через а^<а2 то, что причина меньше причины ag, а через Pi<P2» что следствие р-^^ меньше следствия Рз- Пусть известно, что справедлив вывод ai=:>p^. Что можно сказать о выводе а.2—>Р2, для которого известно, что а^<а2? Нас будет интересовать тот случай, когда из данной информации можно сделать либо вывод Pi<P2, либо вывод P2<Pi- В первом случае мы будем говорить, что шкала
250 ГЛ. 5. ФОРМИРОВАНИЕ РЕШЕНИЙ ПО УПРАВЛЕНИЮ причин и шкала следствий согласованы, а во втором,— что они обратно согласованы. Представляется, что для человека эти два случая согласованности шкал причин и следствий практически всегда имеют место. Рассмотрим следующий пример. Пусть шкала а есть шкала уголовных преступлений. Тогда отношение меньше может интерпретироваться, как «быть легче с точки зрения нанесенного ущерба». Пусть шкала Р есть шкала наказаний, опре^ деляемых за преступления. Ясно, что шкалы аир согласованы. За более тяжелое преступление полагается и более тяжелое наказание. Если же в качестве шкалы Р рассмотреть шкалу, на которой отмечается вероятность исправления преступник ка, то можно считать, что она обратно согласована со шкалой а. 2. Некорректное использование причин. При выводах вида а—>р в рассуждениях человека весьма часто встречаются случаи, когда их реализация обусловлена некоторыми условиями. Другими словами, вывод имеет вид 7: а=:>Р, где предикату характеризует возможность выводаа=г>р. Однако очень часто7 оказывается «забытым» и вывод а=>р делается «по традиции». Это тот пласт знаний, которые принято называть родительскими. Подобные знания усваиваются человеком некритично, без оценки их достоверности. В первобытном мышлении, в мифах, обрядах подобные выводы используются повсеместно. И в наши дни вы- ражения «Принято считать, что...» или «В соответствии со сложившейся традицией...» и т. п., демонстрируют тот же способ рассуждения. Однако часто такие выводы оказываются неверными вследствие ложности в данной ситуации предиката у. Другой пример некорректного использования причин — случай, когда в выводе принимает участие детский пласт знаний. Выводы, основанные на подобных знаниях, как правило, опираются на рассуждение типа «Мне хочется Р но для того, чтобы было Р нужно а. Пусть а имеется» ^). Далее происходит вывод а=^Р, хотя а может и не существовать. Наконец, очень часто в качестве причины Р выбирается ие та истинная причина, которая вызывает Р, а какая-либо лежащая на поверхности квазипричина. Это наиболее часто встречающееся чисто человеческое заблуждение. Именно из-за него, например, Наполеон считал, что пароходы не могут плавать: они должны потонуть, потому что железо, из которого они сделаны, тонет в воде. 3. Незаинтересованность в следствиях. Очень часто в выводе а=:>Р человеку довольно безразлично, что именно выводится из а. Такая ситуация в некотором смысле противоположна рассуждениям на основе детского пласта знаний. Часто в ответ на вопрос «Что из этого следует?» или «Зачем это сделано?», следует ответ «Не знаю». Рационализм, обычно приписываемый человеческому мышлению и человеческим рассуждениям, на самом деле встречается не столь уж и часто. Поэтому многие выводы Р, которые следуют из а, на самом деле носят случайный и непрагматический характер. 4. Традуктивность выводов. В практике человека вывод чаще всего является традуктивным, т. е. выводом от частного к частному. В детском мышлении процент таких выводов близок к 100. Их примерами могут служить рассуждения типа «Этот дядя плохой, у него грубый голос» или «Эта вещь красная, значит она вкусная». Но выводы такого типа и в рассуждениях взрослых людей встречаются чрезвычайно часто. 5. Субъективное использование квантификаторов. Квантификаторы всегда субъективны и отражают личный опыт лица, использующего их в рассуждениях. Об этом мы уже говорили, обсуждая квантификаторы. Здесь же мы отметим несколько иной аспект этой субъективности, играющий важную роль при оценке информации, получаемой от экспертов-управленцев. При использовании ими квантифицированных рассуждений всегда необходимо помнить, что на оценку квантификатора огромное влияние сказывает .личная заинтересованность употребляющего его. Если, например, многие люди покупают билеты денежно-вещевой лотереи или спортлото, то мало бы нашлось желаюпшх участвовать в этих мероприятиях, если бы условия их были изменены следующим образом: с той вероятностью, близкой к нулю, с которой реализуется максимально возможный выигрыш, купивший данный билет подвергался бы очень тяжелому ^) Вывод такого типа принадлежит математическому фольклору.
§5.7. ОСОБЕННОСТИ РАССУЖДЕНИЙ У ЧЕЛОВЕКА 251 наказанию, а во всех случаях, соответствующих проигрышу, платился бы неболь- «юй выигрыш. Потому что, когда последствия для личности могут быть тяжелыми, то и вероятность риска субьективно возрастает. Грубо говоря, с ростом возможных неприятностей растет априорная оценка субъективной вероятности ожидания этого события. Традуктивные выводы с такими квантификаторами — обычное явление. 6. Сценарный вывод. В практике человека часто встречаются выводы, опирающиеся на некоторые временные ряды, каузальные сценарии или сценарии других типов. Примерами подобных выводов могут служить «Электричка приближается к станции, перрон безлюден, у дверей вагона скопилось много народа. Счедовательно, на перроне будет много людей». «Лектор вошел в аудиторию и стал писать на доске формулы. Следовательно, слушатели записывают в свои конспекты то, что написано на доске». Заметим, что в подобных рассуждениях большое значение играют знания о ролевых структурах, о которых шла речь в § 2.2. В частности, именно знанием ролевой структуры объясняется такой вывод: «Человек колол дрова топором; топор был острым. Следовательно, колоть было легко». 7. Парадоксальность и абсурдность рассуждений. Это свойство человеческих рассуждений менее значимо для нас, чем остальные. Поэтому мы ограничимся лишь примерами, показывающими, что человек в ряде случаев идет на нарушение даже основных законов логики. Особенно часто это происходит в пословицах и поговорках. Например, в известных пословицах «Не сжег, а спалил» или «Не полсорока, а двадцать», нарушается логический закон тождества. В пословицах «Умный был бы человек, кабы не дурак» или «Сыта Уля, когда не хочет есть» с точки зрения логики не должно содержаться никакой информации, ибо в них утверждается, что А=А. Для нас особенно интересны квазивыводы, основанные на том, что при ложной посылке можно выводить в импликации любое следствие «Коли найдешь у коровы гриву, так и у кобылы будут рога». Интересной модификацией таких выводов является пословица «Мерин гнед, а шерсти на нем нет» и прекрасный текст Д. Хармса, построенный на той же идее «Был один рыжий человек, у которого не было глаз и ушей. У него не было и волос, так что рыжим его называли условно».
ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ Любая программа, как только закончена ее отладка, становится никому не нужной. Программистский фольклор Книга подходит к концу, а многие вещи, связанные с созданием и функционированием систем ситуационного управления, остались вне ее рамок. Не все получилось так, как задумывалось. Но, по-видимому, это удел всех работ, в тесные рамки которых приходится «втискивать» обширные области знаний. Но остается надежда, что читатель все же увидел тотБоробудур ситуационного управления, который был анонсирован в предисловии к нашей книге. Завершая изложение метода ситуационного управления, хотелось бы перечислить основные этапы проектирования и разработки подобных систем, которые всегда необходимо пройти их создателям. 1. Принятие решения о применимости метода ситуационного управления для управления данным объектом. Это решение должно опираться на два исходных принципа. А. Не существует традиционного метода управления, опирающегося на какую-либо аналитическую модель процессов, протекающих в объекте, либо размерность такой модели такова, что ее практическая реализация невозможна. Б. Объект управления изучен настолько, что его можно описать на языке ситуационного управления, а методы управления им также допускают описание на этом языке. 2. Обследование объекта и методов управления им с целью создания словарей понятий и отношений, характерных для данного случая. Создание языка описания ситуаций, складывающихся в системе объект — управляющая система. Выявление общих критериев управления и выделение уровней управления с локальными критериями. Взаимоувязка критериев между собой. Построение целевых структур. 3. Выявление и описание конфликтных классов ситуаций, в которых требуется принимать решения. Создание глобального сценария решений на множестве конфликтных ситуаций. Декомпозиция решений на элементарные. Создание сценариев для принятия решений в подситуациях, входящих в конфликтные ситуации. Создание списка ЛТП. 4. Выработка принципов композиции решений в цепочки. Создание правил имитации ситуационных описаний при изменениях на объекте и при реализации решений. Создание динамической модели типа ДСС и Экстраполятора. 5. Создание списка правил обобщения и процедур обобщения для Классификатора.
ЗАКЛЮЧИТЕЛЬНЫЕ ЗАМЕЧАНИЯ 2Ъ'3 6. Выбор программных средств для реализации системы ситуационного управления, включая язык программирования, язык представления знаний, базу данных. 7. Создание программной версии системы. Автономная и общая отладка системы программ на реальной задаче. 8. Пробная эксплуатация системы и выявление требований к корректировке и модификации системы. За каждым из этих этапов стоит множество реальных задач и проблем, частично обсуждавшихся в нашей книге. И понять их сложность и трудоемкость можно лишь в том случае, если начнется реальный процесс создания системы ситуационного управления, ибо уникальность каждого сложного объекта управления будет сказываться на создаваемой системе куда больше, чем общие идеи, лежащие в основе описанного нами подхода. Все это лишь посох, облегчающий долгий и не всегда проходимый путь к работающей «не в принципе», а реально системе управления. И лишь то, что некоторые коллективы одолели этот путь,, позволяет сказать решившимся — «В добрый путь!».
ПРИЛОЖЕНИЕ За возом воз, обоз громаден, И прямо диво посмотреть На то, что за день, только за день Отжить успело, устареть. Везут, как трухлые поленья. Как барахло, как ржавый лом, Ошибочные представленья И кучи мнимых аксиом. Л. Мартынов В начале шестидесятых годов в моде была бионика. Ее основная цель — использовать при создании технических устройств то, что реализовала природа в растениях и животных,— казалась весьма заманчивой. Созывались конферен- дии и симпозиумы по бионике. Биологи, инженеры, математики и кибернетики учились слушать и понимать друг друга. Шло формирование специалистов, способных работать на стыке весьма разнородных научных дисциплин. И на этом фоне вполне естественно встал вопрос о содружестве кибернетиков и психологов. Использовать знания, накопленные психологами, при создании интеллектуальных систем было не менее интересной целью по сравнению с целью бионики. По аналогии с бионикой новое направление было названо психоникой. Название это оказалось не слишком удачным и не привилось. Но семинар с таким названием функционировал почти 10 лет. Создан он был в Московском энергетическом институте. Основными его участниками, состав которых менялся с течением времени, были специалисты, работавшие в МЭИ и Институте общей и педагогической психологии. Постоянным руководителем семинара был автор настоящей книги. Именно на этом семинаре впервые были сформулированы принципы модельного метода решения задач человеком. Отказ от господствовавшей в психологии теории лабиринтного мышления, о котором мы говорили в гл. 1 нашей книги, ^переход к теории мышления, где доминировала процедура построения лабиринта, приводящего после поиска к решению, неоднократно декларировались в выступлениях В. Н. Пушкина и его учеников. Идеи структуризации исходного описания задачи и взаимосвязи этой структуры со структурой целевой ситуации были понятны кибернетикам. Вместо эвристических процедур перебора, имитирующих поиск по лабиринту возможностей, новый подход требовал создания процедур, опираю- ющихся на работу со структурированными описаниями. А это в свою очередь требовало создания новых моделей представления объектов управления и разработки специальных языков для описания ситуаций, складывающихся на объекте управления и в системе управления им. Эти две проблемы получили свое решение 3 первых диссертациях, защищенных в области ситуационного управления в 1967 г. В работе Ж. Железова была развита теория дискретных ситуационных сетей, послуживших хорошей моделью объектов управления для многих последующих разработок по ситуационному управлению. Дискретные ситуационные сети были описаны в гл. 2 этой книги. Другой аспирант автора настоящей книги 'Ю. И. Клыков, опираясь на известный в то время язык /?Х-кодов (краткие све дения о нем приведены в гл. 2 этой книги), разработал специальный модельный -язык, названный им позже языком синтагматических цепей. Этот язык описан в гл. 2. На долгие годы он стал основным языком описания ситуаций и принятия решений в ситуационном управлении. Результаты 1967 г. подвели прочную базу под концепцию модельного управления, активно развивавшуюся В. Н. Пушкиными Д. А. Поспеловым. Появление ИСТОРИЧЕСКИЙ ОЧЕРК РАЗВИТИЯ СИТУАЦИОННОГО УПРАВЛЕНИЯ
ИСТОРИЧЕСКИЛ ОЧЕРК РАЗВИТИЯ СИТУАЦИОННОГО УПРАВЛЕНИЯ 255 В 1972 г. их совместной монографии «Мышление и автоматы» завершило начальный этап развития нового подхода. Сам термин ситуационное управление возник не сразу. В работах начального периода новый подход к управлению сначала назывался модельным. Потом возник, термин ситуационная модель. И лишь с появлением в 1971 г. статьи Д. А. Поспелова «Принципы ситуационного управления» (Изв. АН СССР. сер. Техническая кибернетика, ЛЬ 2) это название окончательно вытеснило все остальные. Одновременно стало ясно, что принципы ситуационного управления (описанные выше) не являются обязательными и всеобщими для методов, использующих логико-лингвистические модели. Это послужило толчком к возникновению нового те-рмина: семиотическое управление (иногда говорят семиотическое моделирование). Впервые этот термин был использован в названии семинара, организованного в Московском доме научно-технической пропаганды в 1971 г. Семинар, руководителями которого были Л. Т. Кузин и Д. А. Поспелов, носил название «Семиотические методы управления в больших системах». Во вступительном докладе организаторов семинара «Проблемы семиотического управления» впервые было сформулировано положение о том, что использование логических и лингвистических, средств в задачах управления, которые рассматриваются в ситуационном управлении, и задачах, возникающих в других областях, имеют много общего. Другими, словами, идеи, используемые в ситуационном управлении, на самом деле имеют более общий характер. Следствием такого взгляда на логико-лингвистические модели было возникновение двух новых научных направлений, отличных от ситуационного управления, но использующих в своих исследованиях многие идеи, первоначально возникшие в среде специалистов в области ситуационного управления. Одно из этих направлений —характеризационное управление, активно развиваемое В. А. Горбатовым и его учениками. Они создали принципиально новые методы решения традиционных задач синтеза дискретных систем управления, опирающиеся на принцип «семантического эквивалентирования», структурированные описания схем и заданий на их функционирование. В Московском инженерно-физическом институте под руководством Л. Т. Кузина стали активно развиваться идеи управления в АСУ различной природы, опирающиеся на логико-лингвистические модели, отличные от ситуационного управления. Такие исследования закономерно привели к решению проблем построения интеллектуальных банков и языков представления знаний и манипулирования ими. К 1971 г. сложился коллектив исследователей, увидевших в методе сит\аци- онного управления способ преодолеть те трудности, с которыми они сталкивались при проектировании систем управления сложными объектами. Этот коллектив был не слишком большим, ибо непривычность нового подхода, опирающегося на иные идеи, резко отличные от традиционных методов автоматического управления, создавала психологический барьер, который сейчас вряд ли уже можно почувствовать. Но тогда критиков было куда больше, чем последователей. В 1970 г. Л. С. Загадская защитила диссертацию, в которой новый метод послужил основой для создания экспериментальной программной системы для управления грузовыми операциями в морском порту. Эта программа мало чем напоминала простенькие программы 1967, 1968 гг., в которых метод ситуационного управления использовался для управления движением судов на шлюзованных уча'стках каналов. В программной системе Л. С. Загадской уже присутствовали все основные блоки ситуационного управления: Анализатор, Классификатор, Коррелятор и Экстра- полятор. Начали складываться свои территориальные школы в области ситуационного управления. В Одессе школа возглавлялась Л. С. Загадской, в Грозном — Л. А. Афониным, в Калининграде — В. Ф. Пономаревым. Несколько позже появились группы специалистов по ситуационному управлению и в других городах: Риге (под руководством Я- А. Гельфандбейна), Устинове (под руководством А. Ю. Левиатова), Баку (под руководством Р. 3. Гаджиева). Эти коллективы были нацелены па использование метода ситуационного управления для решения конкретных задач, стоящих перед ними. В Одессе и Калининграде это была задача
256 ПРИЛОЖЕНИЕ оперативного диспетчерского управления погрузочно-разгрузочными операциями в морском порту, в Грозном — задача оперативного управления перемещением по буровым специальных установок для производства тампонажных работ и буровых установок по пунктам бурения, в Риге решался комплекс задач, связанных с АСУ гражданской авиации, в Устинове —с оперативным управлением производственными участками на приборостроительных предприятиях, в Баку — с оперативной диагностикой заболеваний и назначением лечения. Такой широкий спектр приложений естественным образом заставлял в каждом конкретном случае развивать и модифицировать те методы и модели ситуационного управления, которые родились в первоначальном коллективе исследователей. Участники этих работ были полны энтузиазма и оптимизма. Им казалось, что принципы ситуационного управления будут реализованы в создаваемых ими системах легко и эффективно. И не их вина, что дело оказалось значительно сложнее, чем они думали. Существовавшие в то время отечественные ЭВМ по своим техническим возможностям и математическому обеспечению никак не соответствовали тем требованиям, которые к ним предъявляли методы ситуационного управления. И понятно это стало не сразу. Нужно было на практике почувствовать, что скрывается за тем новым подходом, который они используют. Поэтому первые программные системы так и остались чисто экспериментальными. В том же важном для ситуационного управления 1971 г. было принято решение о проведении Всесоюзных симпозиумов по ситуационному управлению большими системами. Первый такой симпозиум состоялся в Одессе в 1972 г. С тех пор Одесса стала на долгое время традиционным местом проведения симпозиумов; лоследний (шестой по счету) состоялся в 1981 г. В пленарном докладе, сделанном на первом симпозиуме Ю. И. Клыковым, Д. А. Поспеловым и В. Н. Пушкиным, который назывался «Зачем нужно ситуационное управление?» его авторы попытались впервые четко наметить место ситуационного управления среди других методов управления сложными объектами. Отвечая на вопрос, поставленный в названии доклада, авторы сформулировали тезис о том, что Ситуационное управление в отличие от других методов управления решает не только задачу управления на основе некоторой заранее известной модели управляемого объекта, но и строит саму эту модель. Построение модели объекта управления, построение процедуры управления им и поиск целесообразных решений по управлению неразрывно связаны в методе ситуационного управления. А именно эта его особенность позволяет надеяться на его применимость в тех случаях, когда сложность объекта управления не позволяет строить его формальную математическую модель и ставить задачу управления в традиционном духе. За первым симпозиумом последовало еще два, в 1973 и 1974 гг. На втором сим- нозиуме центральной обсуждавшейся проблемой была проблема построения многоуровневого Классификатора. Идея «слоеного пирога», возникшая еще в модели гиромата (устройства, способного подстраивать свою структуру под структуру решаемой задачи), впервые предложенная на семинаре по психонике в середине шестидесятых годов, получила на этом симпозиуме поддержку и одобрение со стороны его участников. Было предложено несколько принципов формирования такого Классификатора, описанных на страницах настоящей книги. На третьем симпозиуме в центре внимания были проблемы, связанные с оозданпем математического обеспечения для систем ситуационного управления. Именно этот вопрос был тогда самым актуальным, ибо от решения его зависела сама возможность применения идей ситуационного управления в системах управления реальными объектами. Участники дискуссий по этим проблемам указывали на необходимость использования языков, способных работать с данными, обладающими сложной внутренней структурой и ориентированных на такие прогрессивные в то время ЭВМ, как БЭСМ-6 и ЕС РЯД. Было высказано немало предложений, многие из которых существенно позже реализовались в языках представления знаний типа реляционных или фреймовых языков. Необходимость в расширении сферы применения метода ситуационного управления, передаче другим организациям созданных к тому времени методов и программ, поставили задачу о разработке специальных типовых методик. Эта ра-
ИСТОРИЧЕСКИЙ ОЧЕРК РАЗВИТИЯ СИТУАЦИОННОГО УПРАВЛЕНИЯ 257 бота, активно проводившаяся в начале 70-х годов, завершилась успехом. Были созданы первые типовые методики по проектированию ситуационных моделей управления (Л. С. Загадская, О. В. Соколова, 1973 г.), формированию модели описания объекта управления на языке синтагматических цепей (В. Ф. Пономарев, А. В. Колесников, 1973 г.), разработке программного обеспечения моделей ситуационного управления (О. В. Соколова, Л. С. Загадская, Ю. И. Клыков, 1973 г.). Эти первые методики, несмотря на их несовершенство, сыграли определенную роль в развитии метода и доведения его до практических программных моделей. В 1974 г. вышел первый сборник работ по ситуационному управлению, за которым последовало еще три сборника (1975, 1977 и 1980 гг.) Все сборники были изданы Научным Советом по комплексной проблеме «Кибернетика» при Президиуме АН СССР. Для координации всех исследований по ситуационному управлению и использованию его для решения практических задач был создан проект «Ситуация», организационно входивший в Научный Совет по проблеме «Искусственный интеллект» Комитета системного анализа при Президиуме АН СССР. Начиная с 1975 г. рабочий совет этого проекта координировал все исследования в области ситуационного управления, проводившиеся в СССР. В 1974 г. вышла в свет первая монография по ситуационному управлению (Клыков Ю. И. Ситуационное управление большими системами — М.: Энергия, 1974), сыгравшая наряду со сборниками по ситуационному управлению важную роль в популяризации и распространении метода. К 1975 г. метод ситуационного управления в своих основных частях уже сформировался, появилась устойчивая, общепринятая терминология, был создан комплекс базовых методов и процедур. Начиная с этого года коллективы, в которых использовался новый подход, стали переходить от экспериментальных систем и модельных задач к построению реальных систем управления, базирующихся на идеях ситуационного управления. Это потребовало координации усилий ряда коллективов и обмена накопленным при создании реальных систем опытом. Так родилась идея проведения совещаний, посвященных «технологии» систем ситуационного управления. Всего было проведено пять таких совещаний (Грозный, 1975 г., Устинов, 1977 г., Калининград, 1979 г., Куйбышев, 1982 г., Каунас, 1982 г.). Количество организаций, заинтересованных в применении метода ситуационного управления, стало быстро расти. Для популяризации метода проводятся учебные школы, на которых читаются лекции по всем основным проблемам, связанным с ситуационным управлением и его использованием при разработке различных реальных систем (Москва, 1974 г.; Баку, 1975 г.; Ташкент, 1977 г.; Москва, 1979 г.; Куйбышев, 1982 г.) С той же целью издательство Знание в 1975 г. издало популярную книгу Д. А. Поспелова «Большие системы. Ситуационное управление». К этому моменту стало ясно, что кроме традиционных задач диспетчеризации и оперативного управления техническими и организационными системами, ситуационное управление может применяться и в тех случаях, когда традиционные подходы не дают решения из-за размерности решаемой задачи. В таких случаях вместо точного решения, получение которого становится практически невозможным, методом ситуационного управления удается получить приближенные решения, приемлемые по своему качеству. Первыми примерами подобных задач были задача о распределении программ в комплексах ЭВМ (Д. Боев, 1974 г.) и задача о разрезании графа со взвешенными ребрами на компоненты с минимизацией суммарного веса ребер, попавших на линию разреза (Н. Георгиева, 1977 г.). Обе задачи хорошо известны в дискретной математике. Для них предложено немало методов решения. Но из-за времени, затрачиваемого на поиск их решений, эти методы непригодны в операционных системах, в задачу которых входит сегментирование программ и распределение сегментов на параллельно работающие ЭВМ. Использование метода ситуационного управления позволило создать процедуры решения указанных задач, выполнимые в реальном масштабе времени. В середине 70-х годов Ю. И. Клыков стал активно использовать метод ситуационного управления при моделировании процесса обучения людей. Со временем 9 д. А. Поспелов
258 ПРИЛОЖЕНИЕ под его руководством возникла школа, в которой стали развиваться методы моделирования познавательной деятельности человека и способы управления ею. Характерной особенностью конца семидесятых годов стало существенное расширение понимания ситуационного управления. Фактически ситуационное уп-. равление стало рассматриваться с единых позиций семиотического моделирования и управления. Причиной этого послужило бурное развитие в теории искусственного интеллекта той области, которая носит название представление знаний. Ситуационное управление на десяток лет предвосхитило развитие этой области, впервые начав работать со структурированной информацией. В ситуационном управлении были созданы первые модели представ*7ения знаний и языков представления и манипулирования знаниями. Поэтому новые веяния в области искусственного интеллекта, активное развитие теории семантических сетей и фреймовых представлений были восприняты коллективами, накопившими большой опыт в области ситуационного управления «с ходу», позволили воспринять новые идеи и использовать их в своих разработках. Столь же безболезненно произошел переход к языкам программирования нового типа (ЛИСП и его расширения ФРЛ). В этом плане специалисты, овладевшие принципами ситуационного управления, оказались на передовых рубежах работ в области искусственного интеллекта. Начиная с 1980 г. уже практически невозможно отделить развитие собственно ситуационного управления от развития семиотического управления, органично включившего в себя своего исторического предшественника. И весьма символично звучат названия пленарных докладов, сделанных на VI Всесоюзном симпозиуме по ситуационному управлению большими системами (Одесса, 1981 г.) «Ситуационный анализ» (Л. С. Загадская), «Ситуационное программирование» (В. С. Лозовский), «Схема выводов в семиотических моделях» (Д. А. Поспелов). Логика развития науки жестка и не подчиняется ничьей воле. Ситуационное управление сыграло роль катализатора, вызвав к жизни новые идеи и принципы построения моделей действительности и деятельности человека, столь широко развившиеся в широком потоке исследований по искусственному интеллекту. Но хочется верить, что в рождающейся на наших глазах теории семиотических моделей результаты, полученные в неарах ситуационного управления, займут подобающее им место.
КОММЕНТАРИИ К главе I Схема управления, описанная в 1.1, конечно, не единственно возможная. Типология схем управления, иллюстрирующая постепенный переход от простейших регуляторов к схемам, основанным на логико-лингвистических моделях, имеется в первой главе книги [1.1]. Несколько иной взгляд на схему управления и ее функции, может быть небесполезный для читателей, содержится в [1.2]. Появление объектов управления качественно нового типа было замечено многими специалистами. Среди тех, кто уделил этому вопросу немало внимания, отмечу лишь работы [1.3—1.6]. В них можно иайти и другие особенности, присущие новым объектам, а также иные, чем на страницах этой книги, соображения о методах управления ими. Модели управления, опирающиеся на стимульно-реактивную теорию, известны под названием «модели коллективного поведения автоматов». Создание этого научного направления связано с именем Михаила Львовича Цетлина. много сделавшего для развития кибернетики в нашей стране. Монографии [1.71; 1.83] могут дать достаточно полное представление об этом направлении. Схема автомата, приведенная на рис. 1.2, предложена В. Крыловым, как обобщение автомата с линейной тактикой, придуманного М. Л. Цетлиным. Лабиринтная модель в психологии восходит еще к проведенным в начале этого века опытам по научению крыс движению в лабиринте американского психолога Смолла [1.9]. Использованию этой идеи в эвристическом программировании для ЭВМ посвящено весьма много работ. Укажем лишь на такие монографии, как {1.10—1.13], в которых идея поиска в лабиринте является центральной для задач принятия решений и решения других многочисленных задач. Система ОРЗ описывалась во многих работах. Сошлемся, например, на [1.14—1.16]. Отметим, что блестяще проявив себя при решении задачи установления эквивалентности двух формул в исчислении высказываний (программа ЛОГИК-ТЕОРЕТИК) ОРЗ оказался бессильным при попытке играть в шахматы. И это объясняется тем, что в случае исчисления высказываний имеется полный и исчерпывающий перечень различий и устраняющих их операторов, а в случае шахмат списка различий, который обеспечивал бы монотонное приближение позиции к выигрышной, нет и его, по- видимому, невозможно создать. О трудностях эвристического программирования <в частности о проблеме гомоморфизма описаний исходной и целевой позиций) впервые говорилось, по-видимому, в работе [1.17]. Четкое понимание недостатков стимульно-реактивной и лабиринтной теорий для объяснения феномена метода решения задач человеком, в частности, решения управленческих задач при наличии объектов управления нового типа, возникло из развития работ по психологии мышления, которые вел блестящий советский психолог В. Н. Пушкин и возглавляемый им коллектив. Под его руководством была создана модельная теория мышления. Совместная работа кибернетиков и школы В. Н. Пушкина позволила использовать принципы модельной теории мышления при создании систем ситуационного управления, а позже и систем семиотического управления. В работах [1.18—1.22] заинтересованный читатель найдет для себя немало интересного и поучительного, что возможно, еще не нашло применения в системах управления. Исследование процесса управления динамическими объектами также было проведено В. Н. Пушкиным и его учениками (по крайней мере» 9*
260 КОММЕНТАРИИ В ТОМ объеме, как это отражено в § 1.3). Дополнительный материал можно получить в [1.23; 1.24]. Принципы ситуационного управления обсуждались не один раз. В связи с этим можно рекомендовать читателю познакомиться с работами [1.25—1.28], а также с гл. 1 книги [1.29] и гл. 6 книги [1.1]. Понятие логико-трансформационного правила впервые в ситуационном управлении возникло в г. Одессе в коллективе исследователей, работавших в тогдашнем Одесском отделении Института экономики АН УССР. Почти одновременно такая форма, которая показана в соотношении Si; QjZ=^Qi: 1была использована в известной американской системе планирования действий для работы STRIPS. Материал, вошедший в § 1.6, представляет собой переработанный вариант доклада автора книги, прочитанный им на IX Симпозиуме по кибернетике, состоявшемся в 1981 г. в Сухуми. К главе 2 На важное значение понятия «роли» в процессе познания действительности обратили внимание уже давно. Фактически еще Аристотель, вводя свои знаменитые десять категорий классификации (сущность, количество, качество, соотнесение, место, время, положение, состояние, действие, претерпевание), указал тем самым основные роли сторон связей, которые необходимо учитывать при описании действительности. Естественно, что в естественных языках, предназначенных для описания действительности, эти роли нашли свое отражение, что неоднократно отмечалось в литературе. Укажем лишь на монографию [2.1], специально посвященную исследованию этой проблемы. В ней любопытствующий читатель может найти обширную библиографию. К проблеме ролей и ролевых структур и ее важности в задаче построения систем, понимающих естественный язык, пришел несколько лет назад коллектив исследователей из Тартуского университета, возглавляемый И. Я. Сильдмяэ. В работах [2.2; 2.3] можно познакомиться со взглядами этого коллектива на проблему ролей в искусственном интеллекте. Исследование по глубинным падежам, которые велись в лингвистике (см. [2.4, 2.4а]) также имеют своим истоком все те же десять аристотелевых категорий. И, наконец. Универсальный Семантический Код, описанный нами в § 2.8, автором которого является известный советский лингвист В. В. Мартынов [2.5—2.7], также опирается на ролевую структуру описания действительности. При описании лексических единиц естественного языка для классификации действий частично были использованы работы [2.1; 2.8]. Некоторые тонкие сооб- )ажения, связанные с квантификаторами даже и только, можно найти в работах 2.9] и [2.10]. Язык ситуационного управления (язык синтагматических цепей) впервые был разработан в Московском энергетическом институте в конце шестидесятых годов под руководством автора данной книги. Основные идеи этого языка, первоначальным толчком для развития которых явилось изучение языка /?Х-кодов [2.11; 2.12], были разработаны Ю. И. Клыковым. Эволюцию взглядов на ЯСУ можно проследить по литературе [2.13—2.16]. Пути уточнения лексики ЯСУ методологически во многом опираются на логико-философскую традицию (см., например [2.17, 2.18]). Конкретный пример, использованный в § 2.5 для иллюстрации пути формирования лексики ЯСУ. принадлежит разработчикам АСУ семиотического типа для управления операциями в рыбном порту Калининграда (В. Ф. Пономарев, А. В. Колесников). Соответствующий материал почти без всяких особых изменений заимствован из их работы [2.19], хотя табл. 2.3 и не полностью совпадает с классификацией, принятой в этой работе. Модель объекта в виде ДСС также была разработана в МЭИ в конце шестидесятых годов. С некоторыми свойствами ДСС, не отраженными в § 2.7, можно познакомиться в работах [2.20; 2.21]. Методы синтеза детерминированных конечных автоматов хорошо известны (см., например [2.22]). С синтезом вероятностных автоматов можно познакомиться по монографии [2.23].
КОММЕНТАРИИ 261 Сопоставление особенностей представления ситуаций в ЯСУ и яьыке RX- кодов впервые было проделано Л. Б. Ь^исенбоймом. Сопоставление ЯСУ и языка исчисления предикатов было начато (но не закончено) в работе [2.24]. Более подробное знакомство с использованием языка исчисления предикатов для целей управления можно осуществить по монографии [1.1], а также по монографии [2.25]. Формализация понятия семиотической модели была сделана Г. С. Ослповым. Подробное изложение его исследований приведено в [2.26; 2.27]. Положения вещей Kawecmda, сбоистб'а^ , у пени я, род занятий Примерь/ ■■ про и унелезный, ducaemt/ep олытен Динапические явления Примерь/' /<ран с у? о/^ он, но дороге мало авто/^ашин^ на г,7лан/<е' деталь, ведомость у Саши Прои^ессы^ деятельность Гомогенные процессь/ Содь/тия, nocmy/iKu | Результаты Проис/иествия Примеры: '^шуметь, дарить, делать, с делать, регулироЗоть^ отрегулировать^ находит:^, достигать. Рис. КЛ Топология фреймов в задачах управления и пример 2.13 заимствованы из диссертационной работы В. Ю. Мачераускаса. Параграф 2.10 дает лишь самое общее представление о проблеме перевода текстов на естественном языке во внутренние представления. Важные соображения относительно перехода от текстов на естественном языке к записи на ЯСУ, в виде /?Х-кодов, в виде формул на УСК, а также в виде предикатных выражений вы- сказагны в работах [2.7; 2.12; 2.28—2.32]. Хорошее освещение проблем, связанных с построением диалоговых систем, дано в монографии [2.33]. В ней описаны отечественные системы подобного типа, отличающиеся между собой как по выбранным формам внутреннего представления информации, так и по способам построения лингвистического процессора. Обширная библиография, приведенная в монографии, поможет заинтересованному читателю продолжить знакомство с вопросами, относящимися к этой проблеме. Укажем еще на сборник [2.34], в котором помещены доклады с описанием различных подходов к построению систем общения, опирающихся на естественный язык.
262 КОММЕНТАРИИ Идея, высказанная в § 2.10 относительно принципиального отличия диалоговых систем в системах управления от информационных диалоговых систем и систем машинного перевода, фактически реализована в системе ДИСПУТ [2.33] и в системе ДАТУМ [2.35]. Методология их построения опирается на соображения, высказанные нами в§ 2.2. Те же вопросы обсуждаются в работах [2.2, 2.3, 2.36, 2.37]. Основной трудностью на пути построения систем перевода во внутренние представления такого типа является необходимость в составлении словарей-таблиц, подобных тем, которые были рассмотрены в примере 2.15. В настоящее время такие словари-таблицы создаются авторами систем перевода, исходя из здравого смысла и знания npo6vieMHOH области. Однако такого эмпирического подхода явно недостаточно. Очевидно, что при организации трансляции текстов во внутренние представления необходимо учитывать и специфику последних. Знакомство с работами [2.38—2.44] поможет читателю уловить высказанную здесь мысль. Некоторую помощь при составлении необходимых словарей-таблиц могут оказать словари, подобные [2.45]. В основном тексте гл. 2 мы уже отмечали, что в настоящее время, к сожалению, нет хорошо разработанной схемы классификации предикатов естественного языка и, в частности, действий. Это вызывает большие трудности при создании систем ситуационного управления. На рис. К1 мы приводим некоторую достаточно общую классификацию предикатов, заимствованную нз работы [2.46]. Возможно, что она сможет помочь разработчикам реальных систем управления. Основные понятия, связанные с нечеткостям.!, имеются в [2.47]. В работе [2.48] приведен пример построения шкалы пространственных отношений с помощью экспертов. Универсальная шкала впервые была введена в [2.49] для случая нечеткой шкалы частотных отношений. Нечеткая диаграмма моделирования введена А. Н. Аверкиным [2.50]. Ему же принадлежит формулировка гипотезы 2.4 в той форме, в какой она приведена в §2.11. К главе 3 Проблема, затронутая во вводном разделе данной главы, сейчас находится в центре внимания лингвистов и психо-лингвистов. Идет активное создание теории дискурса, в рамках которой исследователи намереваются отразить ту внеязы- ковую информацию, которая используется участниками диалога для понимания друг друга. В качестве примера можно указать на работу [3.1], в которой каждый речевой акт задается специальным фреймом. Слотами этого фрейма являются слоты с названиями: цель говорящего, пресупозиция говорящего, признак успеха для говорящего, показатель отношения к слушающему, выгодность для говорящего, показатель сотрудничества, кодексные ограничения. Для слушающего фрейм имеет аналогичную структуру. Взаимодействие содержимого слотов этих фреймов позволяет по мнению автора работы [3.1] описывать внеязыковую дополнительную информацию второго рода. Определенный интерес представляет и работа [3.2], в которой обсуждаются общие проблемы, связанные с моделью дискурса. Проблеме пополнения описаний, выявления той информации, которая прямо не выражена в тексте, посвящено много работ. Укажем лишь на работы [3.3—3.5]. В первой из них описана по сути первая попытка увязать текст описания сознаниями, хранящимися в системе. Во второй работе дано освещение современного состояния дел в этой области. Идея сценариев, развитая в [3.5]. использована в несколько переосмысленном виде в § 3.2. Пример, относящийся к медицине в §3.3, заимствован из книги [3.6]. Псевдофизические логики активно изучаются в нашей стране и за рубежом в течение последних десяти лет. В [1.1] сформулированы общие принципы построения логик такого типа, которые в несколько иной форме изложены в настоящей книге в §3.4. Библиография по псевдофизическим логикам весьма обширна. При написании соответствующих разделов данной книги были использованы в основном результаты, имеющие прямое отношение к проблемам ситуационного управления. В параграфе, посвященном временной логике, использованы работы [3.7—3.11]. Отметим, что описанная в нем модель времени, может оказаться неудовлетворительной при применении в других областях, например, для интеллекту-
КОЛ\МЕНТАРИИ 263 ального робота. Связано это с тем, что ряд основных допущений о времени может оказаться иным. Например, во многих задачах управления экономикой может быть полезной модель времени с циклической шкалой. Такая же шкала может оказаться полезной в социологических или исторических моделях. Деление времени по совокупности выполняемых работ, характерное для всех первобытных земледельческих культур, носило ЯЕНО выраженный циклический характер. Один сельскохозяйственный год как бы накладывался на другой. Повторяемость времени характерна для многих художественных произведений древности, например, мифов. Особыми свойствами обладает время в волшебных сказках. Оно как бы растворяется в цепочке событий, составляющих их сюжет. Во многих приложениях приходится учитывать неоднородность прошедшего и будущего времени. Ясно, что линейность, столь характерная для прошлого, в зоне будущих событий не реализуется. Время как бы «ветвится» в будущем, ибо развитие'событий в нем носит модальный характер. При рассужданиях о субъективном времени может оказаться неприемлемой гомогенность времени. Мы различно оцениваем одни и те же временные интервалы даже в зависимости от эмоционального состояния или возраста. Все это касается и модели пространства, а также соображений о каузальных рассуждениях, которые приведены в § 3.6 и § 3.7. В рамках данной книги мы лишены возможности обсуждать эти весьма важные, но побочные для наших целей вопросы. Описание пространственной логики в § 3.6 в основном опирается на работу [2.47]. Мне неизвестны работы, в которых рассматривались бы какие-либо модели динамических пространственных отношений. Те же соображения, которые связаны с развитием действий в пространстве, будут рассмотрены в комментарии к соответствующей главе. Однако в отличие от работы [2.47] в § 3.6 иначе ведется работа с отношениями на плоскости. Результаты экспериментов, отраженные в этом параграфе, принадлежат С. О. Варосян. Ей же принадлежат результаты, касающиеся учета направлений на плоскости. Кроме того материала, который приведен нами в §3.6, посвященном пространственной логике, в диссертационной работе С. О. Варосян имеется достаточно законченный фрагмент, посвященный логике взаимного расположения предметов. Пять понятий причинной связи, обсуждающиеся в §3.7, впервые сформулированы польским философом В. Краевским в 1965 г. Частотные квантификаторы, используемые в данном параграфе, встречались нам еще в § 2.11. В связи с этим еще раз повторим ссылку на работу [2.48]. Правила вывода, опирающиеся на принцип суперпозиции, обсуждались в работах [3.12, 3.13]. Другие правила вывода, опирающиеся на вероятностные соображения и соображения, связанные с учетом частотных кванторов, заимствованы нами из работы [3.14]. Подробное рассмотрение детерминаций, тщательный анализ понятия и областей их приложения дан в монографии С. В. Чеснокова [3.15]. Силлогистические схемы, расширяющие понятие силлогистики Аристотеля на случай работы с частотными квантификаторами, заимствованы из работы [3.16]. В последнее время на основании этой модели Е. И. Ефимовым предложена другая конструкция для расширения понятия силлогизма Аристотеля. В его конструкции используются не условные вероятности, как в конструкции Чеснокова, а вероятности совместных событий. Это позволило Е. И. Ефимову построить процедуру оценки истинности силлогизма (т. е. нахождения границ интервала, в которых находится значение соответствующих вероятностей для заключительной детерминации), которая не требует для своего осуществления решения громоздкой задачи дробно-линейного программирования. Однако до настоящего времени не удалось доказать эквивалентность определения понятия истинности силлогизмов, используемых в моделях Чеснокова и Ефимова. Интересные соображения о способах вычисления истинности для полисиллогизмов, интерпретируемых в виде причинно-следственных сетей, можно найти в работе [3.17]. В известной монографии [3.18] приводится еще ряд схем, позволяющих делать правдоподобные выводы при наличии посылок, которые не могут быть признаны абсолютно истинными. Знакомство с этой книгой для тех читателей, которы- заинтересованы в создании каузальных логик, является, по-видимому, необходимым.
264 КОММЕНТАРИИ То, о чем говорилось в §3.8, пока еще находится в стадии изучения. Однако уже сейчас можно ознакомиться с рядом важных результатов и положений, связанных с решением проблемы работы с неполными и противоречивыми базами знаний. Укажем для начального ознакомления работы [3.19—3.23]. Необходимые сведения об особенностях логики Навья-ньяя приведены в монографии [3.24]. Возможно, читателям будет небезынтересно узнать, что многие проблемы, возникающие при работе с причинно-следственными деревьями и сетями, хорошо исследовались совершенно в другой области, связанной с диагностикой неисправностей технических систем или с причинами заболеваний у человека. В связи с этим можно рекомендовать познакомиться с работой [3.25], в которой излагается специальная теория вопросников, близкая по духу к тем идеям, которые мы обсуждаем в разделе о каузальной логике. В монографии [3.26] вводится модель обратимого конечного автомата, которая позволяет делать определенные выводы о причинах, приводящих к тому или иному следствию. Использование причинно- следственной сети в [3.27] для выявления причин заболеваний и постановки диагноза в экспертных медицинских системах может служить еще одной иллюстрацией применения каузальных логик д^тя пополнения знаний. Имеется сравнительно небольшое число исследований, в которых причинно- следственные отношения и каузальная логика рассматриваются в более широком контексте правдоподобных выводов индуктивного типа. Наиболее интересная попытка такого рода сделана в монографии [3.28]. В ней для всякого следствия, выводимого индуктивным путем, рассматриваются причины (автор называет их условиями) трех типов: необходимые, достаточные и необходимые и достаточные. Другими словами, достаточные причины всегда в совокупности вызывают данное следствие. Если следствие реализовано, то обязательно реализовано множество необходимых причин. Множество необходимых и достаточных причин по сути включает в себя все множество причин, вызывающих данное следствие. Г. фон Врнгт сформулировал конструктивные теоремы, позволяющие находить множества необходимых, достаточных, а также необходимых и достаточных причин на основе наблюдаемых с.1едствий. К главе 4 Проблемы формирования понятий и классификации многократно служили объектом обсуждений и у философов, и у логиков, и у психологов. По этому вопросу существует громадная литература. Укажем поэтому лишь те работы, которые оказали влияние на написание данной главы, либо впрямую использованы в ней, а также некоторое количество фундаментальных работ в данной области. В § 4.2 источниками высказанных там положений в основном послужили работы отечественных психологов. Эго преж^^е всего фундаментальные исследования, выполненные Л. С. Выготским и А. Р. Лурия, которым отечественная психология обязана очень многим. Для выводов о характере детской эволюции в формировани и понятий и классификации были использованы работы [4.1—4.5] и ряд статей, приведенных в библиографии к этим источникам. С проблемой формирования понятий и классификаций у взрослых в тех ее аспектах, которые затронуты в §4.2, читатель может более подробно познакомиться по работам [4.6—4.8]. Сводку философско-логических концепций, связанных с формированием понятий, , можно ятпи в [4.9, 4.10]. Собственно проблеме фэрмировния понятий так, как она понимается в задачах распознавания образов и понималась на первом этапе развития теории искусственного инте.1лекта, посвящено огромноэ количество работ. Сошлемся прежде всего на источники, уже упоминавшиеся ранее, где обсуждаются эти проблемы в рамках, близких к задачам данной книге [1.1. 1.11, 2.16]. Упомянем еще две монографии Э. Хаита [4.11,4.12], который много занимался проблемой формирования понятий. В § 4.3 мы использовали прежде всего методы разделения в пространстве признаков, описанные, например, в [4.13]. Монографию [4.14] можно использовать для ознакомления с процедурами порождения новых методов, в которых разделение осуществляется на основе значений некоторой специально конструируемой функции фу (см. §4.3). Наконец, методы кластерного анализа, о которых в этой
КОММЕНТАРИИ 265 книге практически ничего не было сказано, так как языки типа ЯСУ дают достаточно априорной информации для разделения, также хорошо описаны в литературе. Для ознакомления с этими методами можно рекомендовать читателям обратиться к монографии [4Л5] и сборнику [4.16], в котором помещены многие основополагающие для кластерного анализа статьи. Метод Бонгарда, описанный в § 4,3, подробно изложен в монографии [4.17], а метод пирамидальных сетей — в работах [4.18—4.20]. Ряд черезвычайно полезных соображений для случая формирования понятий в пространствах двоично-кодирсванных признаков можно найти в монографии [4.21]. В нашей стране создано немало программ, которые решают задачу формирования понятий по признакам. Укажем, например, на программу «анализатор», достаточно подробно описанную в монографии [4.22]. Эта программа реализована на ЭВМ БЭСМ-6 и использует для формирования понятий растущие пирамидальные сети. С помсщью такой программы удалось решить немало важных задач и, в частности, задачу о прогнозировании химических соединений с заданными структурами, задачу медицинской диагностики, задачу прогнозирования сильных вспышек на Солнце* и многие другие задачи. В связи с обобщением по именам большой интерес представляют работы, относящиеся к проблемам выбора терминов для тех или иных понятий, и проблемы, связанные с классификационными возможностями имен. К сожалению, исследования такого типа очень далеки от тех задач, которые стоят в области формирования обобщений за счет имен в системах управления. Тем не менее укажем для интересующихся этой проблемой работы [4.23, 4.24]. Списки приведенной в них литературы позволяют читателям найти очередную «порцию» работ в этой области. Параграф, посвященный методам обобщения по структуре, основан на результатах, полученных в трех коллективах, активно работающих в этой области. ДСМ-метод разработан группой сотрудников ВИНИТИ под руководством В. К. Финна. Дополнительные сведения об этом методе, в частности, о логической модели, лежащей в его основе, оценках эффективности его применения и описании применения его для прогнозирования биологической активности вновь синтезируемых фармакологических средств можно найти в работах [4.25—4.27]. Укажем еще на метод, разработанный чешскими учеными П. Гаеком и Т. Гав- ранеком, в котором гипотезы формируются на основании совместного использования логических и статистических средств. Этот метод, названный его создателями ГУХА-метод, описан в монографии [4.28]. Он был первым в мировой практике, в котором логика при формировании гипотез заняла подобающее ей место. Сходные методы формирования индуктивных понятий с учетом структуры предложены в работах [4.29—4.32]. Такие методы характеризуются алгоритмами, строящими функции принадлежности к некоторому классу ситуаций, что и позволяет вводить обобщенные понятия. В какой-то мере указанные методы соприкасаются с недетерминированным вариантом РПС-метода, о котором шла речь в §4.3. В работах П. Гаека и Т. Гавранека, а также в исследованиях Г. Плоткина были сформулированы основные вопросы, которые всегда возникают при использовании индуктивных методов. Они сводятся к поиску ответов на следующие пять вопросов: 1. Как соотносятся между собой средства языка, на котором сформулированы определенные экспериментальные утверждения, и языка, на котором формулируется теоретическое утверждение? 2. Когда можно считать, что теоретическое утверждение есть аналог эмпирического утверждения и какими средствами это можно проверить? 3. Можно ли построить рациональные процедуры, проверяющие обосновгнность теоретических утверждений? 4. Какие теоретргческие утверждения можно считать важными для данного научного исследования? 5. Существуют ли достаточно мощные средства, с помощью которых можно порождать важные теоретические утверждения и отсеивать утверждения, имеющие малую значимость? Авторы ДСМ-метода считают, что построенные ими модели и процедуры позволяют ответить на все эти вопросы с достаточной полнотой. И хотя подходы создателей ДСМ-метода, ГУХА-метода или того метода, который предлагает Г. Плоткин, различны (например, в ГУХА-методе вводятся нестандартные кванторы, связанные с частотными квантификаторами, отражающими статистические
266 КОММЕНТАРИИ данные, а в примере Шоткина используется спец гальный алгоритм аитиунифика- ции, порождающий по множеству дизъюнктов наименьшее общее обобщение, которое является дополнительным понятием к известному по методу резолюций понятию наибольшего общего унификатора), окончательные результаты всех исследований обоснованности и эффективности методов автоматизированного формирования гипотез совпадают. Идея выделения в множестве структурных описаний, которые необходимо отнести к одному классу, в ситуационном управлении возникла практически сразу. В работах [1.25—1.29] об этом постоянно говорится. Там же приводятся простейшие приемы, пригодные для реализации процедур выделения общей части в описаниях на языке ситуационного управления. Однако до середины семидесятых годов Эта задача не имела общего мощного метода своего решения. Лишь с появлением работ в области логических методов формирования гипотез возникли хорошие программные системы типа ГУХА, системы, реаллзующей ДСМ-метод, или системы обобдения по структурам, описанные в работах [4.33—4.35]. Внимательный читатель найдет много общих идей, реализованных в процедурах ДСМ-метода и процедурах обобщения и классификации, созданных Н. П. Викторовой. В конце раздела о структ^фных методах обобщения мы воспользовались рядом идей, вы:казанных в ее работах. Ей же принадлежит введение понятия /-графов. Созданный ею программный комплекс применялся при решении задачи оперативного диспетчерского управления в энергосистеме. Отметим еще монографию [4.36], авторы которой разработали метод классифик:ации, совмещающий в себе основные идеи метода Бонгарда с некоторыми положениями, близкими по духу к индуктивным схемам Милля, Завершая описание метода, основанного на использовании растущих пирамидальных сетей, мы упомянули о такой его модификации ассоциативных элементов, которая способна учитывать временную компоненту процессов, формировать гипотезу о явлениях, развертывающихся во времени. Такая трактовка индукции не нова. Многие исследователи предлагали рассматривать индуктивные схемы вывода, подобные схемам Милля, как утверждения о появлении или непоявлении определенных событий в данный момент и будущие моменты времени. С подобным подходом можно познакомиться, например по работам [4.37, 4.38]. При использовании в практике ситуационного управления систем, опирак>- щнхся на индуктивные методы Милля, необходимо учитывать ту критику, которая неоднократно высказывалась по их поводу. Вез основные концепции Милля, связанные с методами сходства и различия, верны, строго говоря, лишь в статике, без учета динамики развития ситуаций. Для иллюстрации этого положения рассмотрим следующий пример, опровергающий метод различия Милля. Как следует из его словесной формулировки или логической записи, приведенной при описании ДСМ-метода, а считается причиной если в отсутствии а не имеет места, а при его наличии h имеет место, а все остальные условия ситуации сохраняются одинаковыми. Рассмотрим теперь две страны А\\ которых совпадают все условия, но люди говорят на разных языках и кроме того в А развод разрешен, а в В он запрещен. Тогда по методу различия Милля необходимо следует, что либо развод есть причина отличия языка жителей страны А от языка жителей страны В. либо, наоборот, различие языков служит причиной различия законов о браке. Ясно, что дело совсем не в этом. Могло оказаться, что ранее существовала единая страна С, часть которой была завоевана и отторгнута от С. Так образовались страны А w В. В завоеванной стране захватчики насадили свой язык и свое отношение к браку, 1{е изменив больше ничего и растворившись среди жителей этой страны. Так возникла ситуация, описа1{ная нами. Аналогичную критику можно высказать и в отношении метода сходства и метода сопутствующих изменений. Критика же в отношении метода остатков основана на том, что при его формулировке Милль неявно предполагает, что все сопричины аддитивны, что не всегда справедливо. Хорошую критику законов Милля можно найти, например, в монографии [4.39], из которой мы и заимствовали пример со странами А w В. Значительная часть материала параграфа, посвященного проблемам классификации, в частности, относящаяся к использованию призначных эталонов, заимствована нами из работы [4.40]. Некоторые соображения, относящиеся к оценке
КОММЕНТАРИИ 267 качества классификации, навеяны работами [3.25] и [4.41]. Многие дополнительные аспекты проблемы классификации, не затронутые в этом параграфе, можно найти в работах [4.42] и [4.43]. Алгоритмы обобщения на основании использования теоретико-множественных операций, о которых шла речь в последнем параграфе главы, предложены Н. П. Викторовой. В ее программной системе для обобщения описания ситуаций подобные процедуры использовались в режиме диалога с технологом-управленцем при корректировке описаний, помещаемых в память системы до обучения и после формирования результатов на основе обучающей выборки. Укажем еще на некоторые работы, важные и интересные для тех, кто собирается реализовать Классификатор для систем типа систем ситуационного управления. Сошлемся на работу [4.44], в которой делается попытка формализовать процедуру индуктивного обобщения при формировании описаний. Несмотря на некоторую узость темы, идеи, высказанные в этой работе, могут оказаться полезными и при построении понятий в классификационных системах, пригодных для поиска управления. В работе [4.45] под понятием понимается некоторая формула узкого исчисления предикатов, записанная в предваренной нормальной форме. Задача формирования понятия рассматривается в виде двух последовательно решаемых задач: формирование префиксной части формулы, т. е. определение объема понятия, и формирование матричной части формулы, т. е. определение содержания понятия. В работах [4.46, 4.47] затрагивается чрезвычайно важная проблема существования запретов на комбинации классифицирующих признаков, возникающих лишь из семантики тех объектов, для которых производится обобщение. Совокупность признаков, приписываемых некоторому понятию или классу эквивалентности, или классу толерантности, должна иметь нечто семантически общее. Ке имеет, например, смысла одновременно рассматривать признак длина крыла i: наличие крыльев. Такие семантические запреты должны играть значительную роль при построении реальных классификаций. Пространства толерантности можно модифицировать за счет введения нечетких квантификаторов в комбинации признаков, определяющих классы тслерант- ности. Примером того, как это можно сделать, является мажоритарное пространство и классификация с квантификатором большинство, описанная в [4.48]. Дальнейшее развитие таких подходов должно оказаться чрезвычайно полезным в Классификаторах для систем семиотического управления. К главе б Проблема построения планировщиков, которая возникла еще на заре развития метода ситуационного управления, сейчас активно исследуется не только для этих целей. Создание ЭВМ пятого поколения поставило задачу прямого контакта между ЭВМ и непрограммирующим пользователем. Решение ее означает, что в ЭВМ будущего должны присутствовать специальные встроенные средства, которые позволяли бы строить программу решения задачи, интересующей пользователя, по ее описанию на языке той проблемной области, в которой данный пользователь является специалистом. А это означает, что в ЭВМ кроме стандартных для нее блод<ов и устройств должны быть, по крайней мере, три новых устройства: устройство для коммуникации с пользователем на его профессиональном языке, которое может воспринять описание задачи на этом языке и преобразовать его во внутреннее представление, принятое в данной ЭВМ; база знаний, содержащая достаточный набор сведений о проблемной области; планировщик, способный на основе поступившего в ЭВМ описания задачи и тех знаний, которые хранятся в базе знаний, составить машинную программу из готовых стандартных модулей, решающую поставленную задачу. Все рассмотренные нами подходы к планированию можно обсуждать и под этим углом зрения, но задача нашей книги несколько иная, чем планирование вычислений. Поэтому мы рассматривали принципы построения планировщиков под углом зрения поиска многошаговых решений по управлению объектами сложной природы.
268 КОММЕНТАРИИ Программа ЛОГИК-ТЕОРЕТИК, которая приведена нами в качестве примера системы планирования, ориентированной на локальное улучшение плана для достижения поставленной цели, нами уже упоминалась в предшествующейх главах [1,15]. Идеи этой программы, развитые в программе GPS (ОРЗ), имевшей много модификаций, привели к созданию уровня опережающего планирования [1.14]. Программа FDS, позволяющая автоматически порождать оценки различий в доказываемых утверждениях, описана в [5,1], В этой программе имеются специальные универсальные средства, ориентированные на язык исчисления высказываний, которые позволяют проводить синтаксический анализ двух сравниваемых выражений и формировать список различий между ними. Среди планирующих систем, ориентированных на работу в заданной проблемной области и применявших для нахождения планов логический вывод с использованием метода резолюций, в начальный период особенно известной была система STRIPS, предназначенная для нахождения целесообразного поведения интеллектуального робота. Эта система описана, например, в работах [5,2, 5,3], Как и для системы GPS, для системы STRIPS имеются многочисленные модификации, в которых число стратегий планирования расширено. Например, в системе ABSTRIPS использована стратегия опережающего планирования. При создании системы STRIPS впервые проявились особенности, присущие планировщикам, работающим с описаниями, заданными на языке исчисления предикатов. Основные продукционные формулы в системе STRIPS имели вид Q; Л=>В, Я, В них, кроме самой продукции Л^В, имелись еще предикат условия применимости продукции Q и предикат «чистки», определявший аксиомы или уже выведенные ранее формулы, которые необходимо после данного шага вывода убрать из памяти системы, т. е. перевести в тип невыведенных. Об этой проблеме мы уже упоминали в основном тексте данной главы. В системе STRIPS введение Q и Н происходило с помощью создателей системы планирования. Автоматическое формирование их в процессе планирования — пока еще нерешенная задача. Модификации системы STRIPS, система ABSTRIPS, а также дедуктивные воп- роспо-от?5етные системы QA-3 и QA-4, идеи которых легли в основу многих планирующих систем, описаны в монографии [5.4]. Пионерской работой в области метода резолюции была работа [5.5]. Различные способы повышения эффективности стратегий, используемых при нахождении резольвент, описаны в монографии [5.6]. Поиск таких улучшений все время продолжается, так как метод резолюции остается одним из самых популярных среди разработчиков многих практических систем. Однако он не единственно возможный или самый эффективный. Например, обратный метод поиска доказательства, предложенный в свое время известным советским логиком С. Ю. Масловым [5.7], во многих отношениях превосходит метод резолюции. Этот метод реализован, например, в системе планирования СФИНКС, описанной в уже упоминавшей:я монографии [5.4]. Трудности, характерные для имеющихся сейчас процедур вывода, и возможность совмещения этих процедур с некоторыми эвристическими приемами обсуждалась многими авторами. Сводка соответствующего материала приведена в [5,8] и [5.9]. В монографии [5.4] проводится сравнение чисто логических стратегий планирования с теми стратегиями, которые мы обсуждали в § 5.7. Некоторые дополнительные соображения по поводу методов планирования, опирающихся на вывод в исчислении предикатов, можно найти в работе [1.1]. Рассуждения о необходимости нелинейных планов, приведенные в конце§5.2, заимствованы из работы [5.10], где излагается описание планирующих систем, допускающих построение немонотонных планов. Функциональные модели под названием «вычислительные модели» впервые были введены Э. X. Тыугу в работе [5.11]. В той же работе были сформулированы следующие основные проблемы, связанные с вычислительными моделями. 1. Узнать", имеет ли решение данная задача. 2. Если задача имеет решение, то найти ориентацию в модели, которая обеспечит путь от исходных дескрипторов к целевым. 3. Указать, совпадают ли множества решений для двух данных задач, для которых имеется решение в рамках данной функциональной модели. 4. Найти для данной задачи минимальный в некотором определенном смысле путь, ведущий от исходных дескрипторов к целевым.
КОММЕНТАРИИ 269 Большим достижением в области функциональных моделей явилось доказательство разрешимости для вычислительных моделей, описанных в [5,11] и реализованных в виде тиражируемой системы планирования ПРИЗ [5.12], а также получение весьма обнадеживающих оценок сложности решения указанных выше четырех основных проблем, связанных с функциональными моделями. В специальном языке описания спецификаций все эти задачи можно решать с линейной сложностью [5.13; 5.14]. Отметим, что функциональные модели в последнее время активно используются при решении важной для приложений задачи — автоматического синтеза программ по исходному описанию, которая ставится в более общем виде, чем в рассмотренных нами функциональных моделях [5,15]. Вне поля нашего зрения остался цикл работ, развивавшихся в течение ряда лет в Институте кибернетики АН УССР, по созданию системы планирования, которая ищет планы в человеко-машинном режиме. Такой подход может оказаться полезным при решении задачи управления объектами, для которых создание полной функциональной модели оказывается нереальным. Прямое обобщение схем планирования в пространстве состояний и в пространстве подзадач на случай, когда дуги сети планирования имеют размытые оценки, содержится в работе [5.16]. В монографии [5.17] приведена схема ситуационного управления, в которой нечетким может быть как задание текущей ситуации и степень ее принадлежности к тому или иному классу, так и оценка истинности и выполнимости выработанного в процессе планирования решения в заданное время. Развитый авторами монографии подход дает полное решение задачи планирования в классе нечетких схем принятия решений. Иллюстративный пример сценария, приведенного на рис, 5.9, и пояснения к нему заимствованы из работы [5,18]. Аналогичные сценарии, предназначенные для*^выявления конфликтных ситуаций при управлении отгоном самолетов гражданской авиации, можно найти в работе [5,19]. Методика их построения подробно изложена в работах [5.20—5.22]. Другой подход к построению сценария выявления конфликтных ситуаций содержится в [5.23]. Однако этот подход, дающий весьма эффективные схемы принятия решений, пригоден лишь для объектов уп- оавления не слишком сложной структуры. Фрагмент логики действий, описанный в § 5.5, заимствован из работы [5.24]. Ряд соображений, связанных с организацией поиска решений с использованием сценариев, логико-трансформа1щонных правил и имитационного моделирования, приведен в статье [5.25], Из этой же статьи заимствован пример 5.15. Использование детерминированных и вероятностных автоматов для описания процессов, протекающих в элементах ДСС, описано в работах [2,21—2.23], приведенных в списке литературы к гл. 2 книги. Укажем еще на монографию [5.26], в которой автоматы применяются для имитационного моделирования систем, структура которых близка к ДСС. Примеры, связанные с моделированием процесса обработки судов в Калининградском морском рыбном порту, заимствованы из работ группы специалистов (И. А. Кириков, А. В, Колесников и др.), создавших под руководством В. Ф. Пономарева систему ситуационного управления этим сложным реальным объектом [2.19, 5,27—5.29], В § 5.7 использованы фрагменты из работы [5.30]. Многие интересные соображения на тему об особенностях человеческих рассуждений имеются еще в монографии [5.31], а также в тех работах, которые указаны в списке литературы к этим двум книгам.
список ЛИТЕРАТУРЫ К главе 1 1Л. Поспелов Д. А. Логнко-лингвистические модели в системах управления.—М.: Энергия, 1981.— 231 с. 1.2. Захаров В. Н., П о с п е л о в Д. А., X а з а ц к и й В. Е. Системы управления. Задание. Проектирование. Реализация.—М.: Энергия, 1977.— 423 с. 1.3. Моисеев Н. Н. Математик задает вопросы...—М.: Знание, 1974.— 190 с. 1.4. Кини Р. Л., Р а й ф а X. Принятие решений при многих критериях: предпочтения и замещения.—М.: Радио и связь, 1981.- 560 с. 1.5. Проблемы программно-целевого планирования и управления Под ред, Г. С. Поспелова.—М.: Наука, 1981.- 460 с. 1.6. Б л а у б е р г И. В., Ю д и н Э. Г. Становление и сущность системного подхода.—М.: Наука, 1973.— 270 с. 1.7. Ц е т л и н М. Л. Исследования по теории автоматов и моделированию биологических систем.— М.: Наука, 1969.— 316 с. 1.8. Варшавский В. И. Коллективное поведение автоматов.— М.: Наука, 1973.— 407 с. 1.9. В у д в о р т с Р, Решение проблем животными.— В кн.: Хрестоматия по общей психологии: психология мышления. М.: Изд-во МГУ, 1981, с. 228— 234. 1.10. Первозванский А. А. Поиск.— М.: Наука, 1970.— 262 с. 1.1 К Слэйгл Дж. Искусственный интеллект.—М.: Мир, 1973.- 319 с. 1.12. Нильсон Н. Искусственный интеллект.— М.: Мир, 1973,— 270 с. 1.13. Рейтман У. Познание и мышление: моделирование на уровне информационных процессов.—М.: Мир, 1978.— 400 с. 1.14. Ньюэлл А., Саймон Г. GPS-программа, моделирующая процесс человеческого мышления.— В кн.: Вычислительные машины и мышление. М,: Мир, 1967, с. 283—301. 1.15. Ньюэлл А., Шоу Дж., Саймон Г, Эмпирические иccv^eдoвaния машины «Логик—Теоретик»: пример изучения эвристики.— В кн.: Вычислительные машины и мышление. М.: Мир, 1967, с. 113—144. 1.16. Ньюэлл А., Ш о у Дж., Саймон Г. Программа для игры в шахматы и проблема сложности.—В кн.: Вычислительные машины и мышление. М.: Мир, 1967, с. 33—71. 1.17. П о с п е л о в Д. А., П у ш к и н В. Н,, С а д о в с к и й В. Н. К определению предмета эвристики.— В кн.: Проблемы эвристики. М,: Высшая школа, 1969, с. 5—19. 1.18. П у ш к и н В. Н. Оперативное мышление в больших системах.— М.; Л.: Энергия, 1965.—375 с. 1.19. Пушкин В. Н. Эвристика — наука о творческом мышлении.—М.: Изд-во политической литературы, 1967.— 270 с. 1.20. Пушкин В. Н. Психология и кибернетика.— М,: Педагогика, 1971.— 230 с, 1.21. Поспелов Д. А., П у ш к и н В. Н. Мышление и автоматы.— М.: Советское радио, 1972.— 222 с.
список ЛИТЕРАТУРЫ 271 1.22. Пушкин В. Н. Психологические возможности человека.— М.: Знание, 1972.- 63 с. 1.23. Пушкин В. Н. Психологические основы построения обучаюш^их систем.— В кн.: Вопросы кибернетики. Человеко-машинные обучаюш^ие системы. М.: Научный совет по ко.мплексной проблеме «Кибернетика» при Президиуме АН СССР, 1979, с. 8—ЗЭ. 1.24. Пушкин В. Н. Принципы математического моделирования познания и пути построения систем искусственного интеллекта.— В кн.: Вопросы кибернетики. Ситуационное управление. Теория и практика, М.: Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 5-33. 1.25. П о с п е л о в Д. А. Принципы ситуационного управления.— Изв. АН СССР, Техническая кибернетика, 1971, Kg 2, с. 10—17. 1.26. Клыков Ю. И., П о с п е л о в Д. А. Ситуационное управление в .ЛСУ.— Управляющие машины и системы, 1972, № 1, с. 27—34. 1.27. Клыков Ю. И., П о с п е л о в Д. А., П у ш к и н В. Н. Зачем нужно ситуационное управление? — В кн.: Вопросы кибернетики. Ситуационное управление. Теория и практика. М.: Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1974, с. 7—15. 1.28. Поспелов Д. А. Большие системы. Ситуационное управление.— М.: Знание, 1975.— 62 с. 1.29. Клыков Ю. И. Ситуационное управление большими системами.—М.: Энергия, 1974.— 134 с. К главе 2 2.1. Степанов Ю. С. Имена. Предикаты. Предложения.—М.: Наука^ 1981.— 360 с. 2.2. Сильдмяэ И. Я- Значение, смысл и мысль.— В кн.: Ученые записки Тартуского государственного университета. Вып. 551. Тарту, 1980, с. 12! — 127. 2.3. Сильдмяэ И. Я- О когитологии.— В кн.: Ученые записки Тартуского государственного университета, вып. 594. Диалоговые системы и представление знаний. Тарту, 1981, с. 126—133. 2.4. Ф и л л м о р Ч. Дело о падеже.— В кн.: Новое в зарубежной лингвистике. Вып. 10. Лингвистическая семантика. М.: Прогресс, 1981, с. 369—495; Дело о падеже открывается вновь. Там же, с. 496—530. 2.5. Мартынов В. В. Семиологические основы информатики.— Минск: Наука и техника, 1974.— 191 с. 2.6. Мартынов В. В. Универсальный семантический код.— Минск: Наука и техника, 1977.— 190 с. 2.7. Мартынов В. В. Человеко-машинные методы решения задач в системе УСК-— В кн.: Вопросы кибернетики. Человеко-машинные обучающие системы. М.: Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН^СССР, 1979, с. 49—65. 2.8. Апресян Ю. Д. Экспериментальное исследование семантики русского глагола.—М.: Наука, 1967.- 251 с. 2.9. Р е в 3 и н И. И, Современная структурная лингвистика: проблемы и методы.—М,: Наука, 1977.— 283 с. 2.10. Богуславский И. М. Семантика частицы «только».— В кн.: Семиотика и информатика. Вып. 14, М,: ВИНИТИ, 1980, с. 134—158, 2.И. Пшеничная Л, Э,,СкороходькоЭ, Ф. Единицы информационного языка в сопоставлении с единицами естественного языка.— В кн.: Труды HI Всесоюзной конф. по информационно-поисковым системам и автоматизированной обработке научно-технической информации. Т. 2. М.: ВИНИТИ, 1967, с. 187—191. 2.12. С к о р о X о д ь к о Э. Ф. и др. Информационно-поисковая система БИТ.— Киев: Наукова думка, 1968.— 120 с.
272 СПИСОК ЛИТЕРАТУРЫ 2ЛЗ. Клыков Ю. и. Моделы1ый язык.— В кн.: Труды III Всесоюзной конф. по информационно-поисковым системам и автоматизированной обработке научно-технической информации. Т. 2. М.; ВИНИТИ, 1967, с. 360—371. 2.14. Клыков Ю. И. Язык ситуационного управления,— В кн.: Семиотические .методы управления в больших системах. М.: Моск. дом научно-технической пропаганды, 1971, с. 67—81. 2.15. Кузнецов И. П. Механизм обработки семантической информации.— М.: Наука, 1978.— 175 с. 2.16. Нисенбойм Л.Б. Некоторые модели обобщения понятий языка ситуационного управления.— В кн.: Вопросы кибернетики. Проблемы искусственного интеллекта. М.: Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 131—136. 2.17. У е м о в А. И. Вещи, свойства и отношения.— М.: Изд-во АН СССР, 1963,— 184 с. 2.18. Уемов А. И. Логические основы метода моделирования.—М.: Мысль, 1971.—311 с. 2.19. П о и о м а р е в В. Ф., К о л е с и и к о в А. В., К и р и к о в И. А. Об одном подходе в семиотическом моделировании состояния транспортных систем.—В кн.: Вопросы кибернетики. Ситуационное управление. Теория и практика.— М.; Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 109—130. 2.20. Железов Ж. Й.,Поспелов Д. А. Дискретните ситуационни мрежи — подкласс на големити системы.— Автоматика и изчислителна техника, 1969, №2, с. 5-12. 2.21. Ж е л е 3 о в Ж. Й., Поспелов Д. А. Об одном классе больших систем. - Изв. АН СССР: Техническая кибернетика, 1970, № 2, с. 49—53. 2.22. Лазарев В. Г.,Пийль Е.И. Синтез управляющих автоматов.— М.: Энергия, 1978.— 408 с. 2.23. Поспелов Д. А. Вероятностные автоматы.— М,: Энергия, 1970,— 87 с. 2.24. Б и б и и Г. Б. Применение метода автоматического доказательства теорем в ситуационном управлении.—В кн.: Теоретические проблемы ситуационного управления, М.: Научный совет по комплексной проблеме «Кибернетика» при Президиу.ме АН СССР, 1975, с. 28—34. 2.25. Александров В. В., Б у л к и и Г. А., П о л я к о в А. О. Автоматизированная обработка информации на языке предикатов.— М.: Наука, 1982.— 103 с. 2.26. Осипов Г. С. Две задачи теории семиотических моделей управления. I. Представления семиотических моделей.— Изв. АН СССР: Техническая кибернетика, 1981, №6, с. 100—110. 2.27. Осипов Г. С. Две задачи теории семиотических моделей управления. II. Семантический анализ.—Изв. АН СССР: Техническая кибернетика, 1982, No 1, с. 131—137, 2.28. П а д у 4 е в а Е. В, Семантический анализ естественного языка при переводе на языки математической логики.— В кн.: Труды III Всесоюзной конф. по информационно-поисковым системам и автоматизированной обработке научно-технической информации. Т. 2. М.: ВИНИТИ, 1967, с. 156—169. 2.29. Попов Э. В.,Родионов Е.В. Алгоритм синтеза предложений ограниченного русского языка из семантической сети.— Изв. АН СССР: Техническая кибернетика, 1978, №6, с. 44—51. 2.30. Брябрин В. М.,Сенин Г. В. Анализ естественного языка в ограниченном контексте.— В кн.: Вопросы кибернетики. Проблемы искусственно- ного интеллекта.— М.: Научный совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 111 — 117. 2.31. П а д у ч е в а Е. В. Проблемы логического анализа местоимений.— В кн.: Семиотика и информатика. Вып. 15. М.: ВИНИТИ, 1980, с. 125—153. 2.32. Попов Э. В. Общение с ЭВМ на естественном языке.—М.: Наука, 1982.— 360 с. 2.33. Диалоговые системы в АСУ/Под ред. Д. А. Поспелова.—М.: Энергоатом- издат, 1983,- 204 с.
список ЛИТЕРАТУРЫ 273 2.34. Диалог в автоматизированных системах.— М.: Моск. дом научно-технической пропаганды, 1981.— 160 с. 2.35. С и л ь д м я э И. Я. Действительность — текст — знания.— В кн.: Ученые записки Тартуского государственного университета. Вып. 621. Тарту, 1983, с. 118—134. 2.36. Ф а й н В. С. Новые аспекты понимания машинных сообщений.— Изв. АН СССР: Техническая кибернетика, 1982, №5, с. 100—112. 2.37. Ф а й н B.C. Содержательный аспект информационного обмена в диалоге.— М.: Ин-т проблем передачи информации АН СССР, 1983, препринт № 1.— 33 с. 2.38. Плесневич Г. С. Представление знаний в ассоциативных сетях.— Изв. АН СССР: Техническая кибернетика, 1982, Ло 5, с. 6—22. 2.39. Лозовский В. С. Экстенсиональная база данных на основе семантических сетей.—Изв. АН СССР: Техническая кибернетика, 1982, №5, с. 23—42. 2.40. Клещев А. С, Черняховская М. Ю. Системы представления проблемно-ориентированных знаний.— Изв. АН СССР: Техническая кибернетика. 1982, № 5, с. 43—63. 2.41. Александров В. В.,Булкин Г. А., Поляков А. О. Автоматизированная обработка информации на языке предикатов.— М.: Наука, 1982.— 101 с. 2.42. С к р э г г Г. Семантические сети как модели памяти.— В кн.: Новое в зарубежной лингвистике. Вып. 12. М.: Радуга, 1983, с. 228—271. 2.43. Преображенский А. Б. Лингвистический процессор для реализации общения с базами данных.— Изв. АН^СССР: Техническая кибернетика, 1982, №5. с. 121-129. 2.44. К о р д ь е М. О. Использование знаний о предметной области в системе управления роботом на естественном языке: эксперимент с кулинарными рецептами.— В кн.: Лингвистические процессоры и представление знаний. Новосибирск: ВЦ СО АН СССР, 1981, с. 5—21. 2.45. Русский семантический словарь.—М.: Наука, 1982.- 564 с. 2.46. Семантические типы предикатов.—М.: Наука, 1982.-365 с. 2.47. Заде Л. Понятие лингвистической переменной и его применение к принятию приближенных решений.— М.: Мир, 1976.— 165 с. 2.48. Варосян С. О., Поспелов Д. А. Неметрическая пространственная логика.—Изв. АН СССР: Техническая кибернетика, 1982, №5, с. 86—99. 2.49. Ежкова И. В., Поспелов Д. А. Принятие решений при нечетких основаниях. 1. Универсальная шкала.—Изв. АН СССР: Техническая кибернетика, 1977, №6, с. 3—11. 2.50. А в е р к и н А. Н. Нечеткое отношение моделирования в системах планирования поведения робота.—В кн.: Artificial Intelligence and Information- Control Systems of Robots, October 18—22, Smolenice, 1982, p. 6—10. К главе 33^^ 3.1. Дебрей н М. М., Нариньяни А. С. Речевой акт как элемент диалогового взаимодействия.— Ученые записки Тартуского государственного университета. Вып. 654. Тарту, 1983, с. 39—48. г'^-!^ ^- 3.2. Виноград Т. Об одном подходе к изучению дискурса.—В кн.: Взаимодействие с ЭВМ на естественном языке, Новосибирск, ВЦ СО АН СССР, 1978, с. 11—47. 3.3. Виноград Т. Программа, понимающая естественный язык.— М.: Мир, 1976.- 292 с. 3.4. Черняк Ю. Умозаключения и знания.— В кн.: Новое в зарубежной лингвистике. Вып. 12: Прикладная лингвистика. М.: Радуга, 1983, с. 171—207; 272—317. 3.5. Шеи к Р. Обработка концептуальной информации.— М.: Энергия, 1980.— 358 с.
274 СПИСОК ЛИТЕРАТУРЫ 3.6. Черняховская М. Ю. Представление знаний в экспертных системах медицгьтской диагностики.— Владивосток: Ин-т автоматики и процессов управления с вычислительным центром ДНЦ АН СССР, 1983.— 212 с. 3.7. Поспелов Д. А. Элементы аксиоматики временных отношений.— В кн.: Ситуационное управление. Теория и практика. М.: Советское радио, 1975, с. 15-21. 3.8. Кандрашина Е. Б., Очаковская О. Н., Голубева Л. А. Экспериментальная вопросно-ответная система, включающая простую модель времени с элемзнтамл логического вывода.— В кн.: Взаимодействие с ЭВ.М на естественном языке. Новосибирск, ВЦ СО АН СССР, 1978, с. 207— 222. 3.9. Дембовская В. Н. Логика времени для структурирования связного текста.— В кн.: Вопросы кибернетики. Проблемы искусственного интеллекта. М.: Наука, 1980, с. 144—158. 3.10. Литвинцева Л.В., Поспелов Д. А. Время в роботах и диалоговых системах.— В кн.: Вопросы кибернетики. Проблемы искусственного интеллекта.—М.: Наука, 1980, с. 62—70. 3.11. Кандрашина Е. Ю. Время в представлении знаний: Соотношения между единичными событиями.— Препринт. Проект ВОСТОК- Вып. 7. Новосибирск, 1983.— 25 с. Вып. 8. Новосибирск, 1983.—32 с. 3.12. Е ж к о в а И. В., П о с п е л о в Д. А. Принятие решений при нечетких основаниях. Правила вывода.— Изв. АН СССР: Техническая кибернетика, 1978, №2, с. 5—11. 3.13. Еж ко в а И. В. Обобщение схем принятия решений с использованием нечеткой логики.— В кн.: Информационно-программное обеспечение систем искусственного интеллекта. М.: Моск. дом научно-технической пропаганды, 1978, с. 102—111. 3.14. Рга de Н. Data bases with fuzzy information and approximate reasoning in expert systems. — В кн.: Труды Международного симпозиума по искусственному интеллекту ИФАК- Ленинград, 4—6 октября 1983 г.— 20 с. 3.15. Ч е с н о к о в СВ. Детерминационный анализ социально-экономических данных.—М.: Наука, 1982.— 168 с. 3.16. Чесноков С. В. Силлогизмы в детерминационном анализе.— Изв. АН СССР: Техническая кибернетика, 1984, № 5, с. 55—83. 3.17. Закревский А. Д. К формализации полисиллогистики.— В кн.: Логический вывод. М.: Наука, 1979, с. ЗЭО—ЗЭЭ. 3.18. П о й а Д. Математика и правдоподобные рассуждения.— М.: ИЛ, 1957.— 535 с. 3.19. Нариньяни С. Нзтоэпреде1енные множества — новый тип данных для представления знаний.— Препринт ВЦ СО АН СССР, № 232, Новосибирск, 1980.—26 с. 3.20. Нариньяни А. С. Средства моделирования неполноты данных в аппарате представления знаний.— В кн.: Представление знаний и моделирование процесса понимания. Новосибирск: ВЦ СО АН СССР, 1980, с. 153— 162. 3.21. Разлогова Е. Э. Логические отношения между смыслом и его компонентами.—Научно-техническая информация, Сер. 2, 1981, № 1, с. 14—20. 3.22. Шокин Ю. И. Интервальный анализ.—Новосибирск: Наука, 1981.— 111 с. 3.23. Нариньяни А. С. Недоопреде1енные модели и операции с недоопреде- ленными значениями.— Препринт ВЦ СО АН СССР, № 400. Новосибирск, Г982.—33 с. 3.24. Инголлс Д.-Г.-Х. Введение в индийскую логику Навья-ньяя.—М.: Наука, 1975.-237 с. 3.25. Пархоменко П. П. О технической диагностике.— М.: Знание, 1969.— 64 с. 3.26. Новорусский В. В. Конечно-автоматные системы управления»— Новосибирск: Наука, 1982.- 269 с.
список ЛИТЕРАТУРЫ 275 3.27. Ковригин О. В., С м о л я н и н о в Н. Д., Ч м ы р ь А. Я. Экспертные медицинские диагностирующие системы.—Изв. АН СССР: Техническая кибернетика, 1982, №5, с. 199—216. 3.28. Wright von G. Н. А treatise on induction and probability.- Paterson^ N. Y.: Littlefield, Adams a. Co., I960.—3l0 p. К главе 4 4.1. Леонтьев A. A. Языкознание и психология,—М.: Наука, 1966.— 80 с. 4.2. Выготский Л. С. Собр. соч. Т. 2. М.: Педагогика, 1982.— 502 с. 4.3. Зубкова Т. И. Об одном направлении развития детской речи.— В кн.:: Структурная и прикладная лингвистика, Л.: ЛГУ: 1983, вып. 2, с. 53—57. 4.4. Негнев нцкая Е. ИмШахнарович А. М. Язык и дети.— М.: Наука, 1981.— 110 с. 4.5. Пиаже Ж- Избранные психологические труды.—М.: Просвещение, 1969.— 659 с. 4.6. Л у р и я А. Р. Об историческом развитии познавательных процессов.— ^\.: Наука, 1974.— 171 с. 4.7. Л у р и я А. Р. Язык и сознание.— М.: Изд-во МГУ, 1979.— 319 с. 4.8. К о у л М., С к р и б н е р С. Культура и мышление.— М.: Прогресс, 1977.— 261 с. 4.9. Лосский Н. О. Логика. Ч.1.— Берлин: Обелиск, 1923.— 166 с. 4.10. В о й ш в и л о Е. К. Понятие.— М.: Изд-во МГУ.—285 с. 4. И. Хаит Э., Марин Дж., Стоун Ф. Моделирование процесса формирования понятий на вычислительной машине.—М.: Мир, 1970.-301 с. 4.12. Хаит Э. Искусственный интеллект.— М.: Мир, 1978.— 558 с. 4.13. А р к а д ь е в А. Г., Б р а в е р м а н Э. М. Обучение машины классификации объектов.— М.: Наука, 1971.— ПО с. 4.14. А й 3 е р м а н М. А., Б р а в е р м а н Э. М., Р о з о н о е р Л. И. Метод готенциальных функций в теории обучения машин.— М.: Наука, 1970.— 384 с. 4.15. Александров В. В., Горский Н. Д. Алгоритмы и программы структурного метода обработки данных.—Л.: Наука, 1983.- 207 с. 4.16. Классификация и кластер.—М.: Мир, 1980.— 389 с. 4.17. Бон гард М. М. Проблема узнавания.—М.: Наука, 1967.- 320 с. 4.18. Г ладу н В. П. Формирование понятий путем обучения растущих сетей.— Кибернетика, 1970, №2, с. 99—104. 4.19. Г л а д у н В. П., В а щ е н к о Н. Д. Методы формирования понятий на ЦВМ.— Кибернетика, 1975, №2, с. 107—112. 4.20. Г л а д у н В. П., Е ф и м е н к о О. М., Р а б и н о в и ч 3. Л. Выделение характерных сочетаний признаков объектов на ЦВМ.— Управляющие машины и системы, 1972, №2, с. 34—37. 4.21. К а м и л о в М. М., Ж у р а в л е в Ю. И. и др. Алгоритмы вычиапения оценок и их применение.— Ташкент: Фан, 1974.— 120 с. 4.22. Г л а д у и В. П. Эвристический поиск в сложных средах.— Киев: Наукова думка, 1977.— 166 с. 4.23. Старченко А. А., КалайджиеваМ. А. Понятийный аппарат тезаурусов и операции на ЭВМ.— В кн.: Логико-методологические исследования.-М.: Изд-во Л\ГУ, 1980, с. 109—129. 4.24. Резников Л. О. Понятие и слово.— Л.:— Изд-во ЛГУ: 1958.— 124 с. 4.25. Финн В. Км 3 а б е ж а Р1 л о М. И. Логические проблемы автоматического формирования гипотез.— В кн.: Тезисы докладов IX Всес. симп. по кибернетике, Сухуми, 10—15 ноября 1981 г., т. 2, с. 54—61. 4.26. Финн В. К. О машинно-ориентированной формализации правдоподобных рассуждений в стиле Ф, Бэкона — Д. С. Милля.— В кн.: Семиотика и информатика. Вып. 20. М.: ВИНИТИ, 1983, с. 35—101. 4.27. 3 а б е ж а й л о М. И., Ф и н и В. К-, К о з л о в а С. П. и др. Об одном методе автоматического формирования гипотез и его программной
276 СПИСОК ЛИТЕРАТУРЫ реализации.— Научно-техническая информация. Сер. 2, 1982, № 4, с. 20—26. 4.28. Г а е к П., Г а в р а н е к Т. Автоматическое образование гипотез.— М.: Наука, 1984.—277 с. 4.29. Р 1 о t к i п G. D. А note on inductive generalization.—Machine Intelligence, 1970, V. 5, p. 153—164. 4.30. P 1 о t к i n G. D. .\ further note on inductive generalization. — Machine Intelligence, 1971, V. 6, p. 101 — 124. 4.31. Жуков Л. Г. Об одном алгоритме индуктивного формирования понятий.— В кн.; Вопросы кибернетики. Теория и практика ситуационного управления. М.: Советское радио, 1977, с. 167—171. 4.32. ВагинВ. Н. О дедуктивных и недедуктивных системах принятия решений.— В кн.: Вопросы кибернетики. Ситуационное управление. Теория и практика.—М.: Советское радио, 1980, с. 45—59. 4.33. Вагин В. Н., Викторова Н. П. Вопросы структурного обобщения и классификации в системах принятий решений — Изв. АН СССР: Техническая кибернетика, 1982, №5, с. 64—73. 4.34. Викторова Н. П. Два подхода к решению задачи классификации древовидных структур.—Научно-техническая информация, Сер. 2, 1981, №9, с. 17—21. 4.35. Викторова Н. П. Разработка алгоритмов структурного обобщения.— В кн.: Труды МЭИ, 1981, вып. 533, с. 49—53. 4.36. Голендер В. Е.,Розенблит А. Б. Вычислительные методы конструирования лекарств.— Рига: Зинатне, 1978.— 231 с. 4.37. М а г и н с к а с Ю. А. Об одном подходе к анализу причини ости. — В кн.: Проблемы логики, М.: Изд-во АН СССР, 1963, с. 144—150. 4.38. Los I. The fundation of a methodological analisis of Mill's methods.— In: 25 years of logical methodology in Polland. Waгsza^va, 1977, p. 291—325. 4.39. Джини К. Логика в статистике.— М.: Статистика, 1973.— 128 с. 4.40. трейдер Ю. А. Математическая модель теории классификации.— Научно-техническая информация. Сер. 2, 1968, № 10, с. 7—24. 4.41. Найденова К- Х- Реляционная модель анализа экспериментальных данных.— Изв. АН СССР: Техническая кибернетика, 1982, № 4, с. 103—119. 4.42. трейдер Ю. А. Равенство. Сходство. Порядок.—М.: Наука, 1971.— 254 с. 4.43. та ров А. А. Осмысленность признаков и теория классификации.— В кн.: Семиотика и информатика. Вып. 11. М.: ВИНИТИ, 1979, с. 37—51. 4.44. П о г о с я н Э. М. К теории автоматического синтеза понятий.— В кн.: Семиотика и информатика. Вып. 8. М.: ВИНИТИ, 1977, с. 125—152. 4.45. Ефимов Е. И. Автоматическое формирование понятий, описываемых замкнутыми формулами узкого исчисления предикатов.— В кн.: Семиотика и информатика. Вып. 13. М.: ВИНИТИ, 1979, с. 86—108. 4.46. Заренков Н. А. Лекции по теории систематики.— М.: Изд-во МГУ, 1976.— 140 с. 4.47. Панова Н. С, трейдер Ю. А. О знаковой природе классификации. Научно-техническая информация, Сер. 2, 1974, 12, с. 3—10. 4.48. Виленкин Н. Я., трейдер Ю. А. Мажоритарные пространства и квантор «большинства».— В кн.: Семиотика и информатика. Вып. 8. М.: ВИНИТИ, 1977, с. 45-82. К главе 5 5.1. Quinlan J., Hunt Е. А formal deductive problem-solving system.— J. ACM. 1968, V. 15, N 4, p. 625—646. 5.2. Ф a Й к с P. Механизмы поиска вывода для моделей, описывающих состояния.— Труды IV Объединенной международной конференции по искусственному интеллекту. Вып. 3. Методы поиска решений, эвристические методы. М.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1975, с. 206—226.
СЛИСОК ЛИТЕРАТУРЫ 277 5.3. Ф а й к с Р., Н и л ь с о н Н. Система STRIPS — новый подход к применению методов доказательства теорем при решении задач.— В кн.: Интегральные роботы.— М.: Мир, 1973, с. 382—403. 5.4. Ефимов Е. И. Решатели интеллектуальных задач.— М.: Наука, 1982.— 320 с. 5.5. Робинсон Дж. Машинно-ориентированная логика, основанная на принципе резолюции.— В кн.: Кибернетический сборник. Новая серия. Вып. 7. М.: Мир, 1970, с. 194—218. 5.6. Чень Ч.,Ли Р. Математическая логика и автоматическое доказательство теорем.—М.: Наука, 1983.—358 с. 5.7. М а с л о в СЮ. Обратный метод установления выводимости в классическом исчислении предикатов.—ДАН СССР, 1964, т. 159, № 1, с. 17—20. 5.8. Мае л ов С. Ю. Поиск вывода, как модель эвристического процесса.— Кибернетика, 1972, №5, с. 74—78. 5.9. Мае лов СЮ. Теория поиска вывода.—Кибернетика, 1975, №4, с. 134—144. 5.10. С а к е р д о у т и Э. Нелинейная природа планов.— В кн.: Труды IV Объединенной международной объединенной конференции по искусственному интеллекту. Вып. 4: Обучение, отладка и автоматическое программирование. М.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1975, с. 99—133. 5.11. Т ы у г у Э. x. Решение задач на вычислительных моделях.— ж- мат. и мат. физ., 1970, №3, с. 716—733. 5.12. К а X р о М. И., К а л ь я А. П., Т ы у г у Э. x. Инструментальная система программирования ЕС ЭВМ (ПРИЗ).— М.: Финансы и статистика, 1981.— 157 с. 5.13. М и н ц Г. е., Т ы у г у Э. x. Структурный синтез и неклассические логики.— В кн.: Применение методов математической логики: Тезисы докладов. Таллин, 1983, с. 52—60. 5.14. Д и к о в с к и й А. Я. Оценки эффективности алгоритмов, связанных с вы числительными моделями.— В кн.: Применение методов математической логики: Тезисы докладов, Таллин, 1983, с. 42—51. 5.15. Т ы у г V Э. x. Вычислительные фреймы и структурный синтез программ.— Изв. АН СССР: Техническая кибернетика, 1982, №6, с. 176—182. 5.16. Аверкин А. Н.,Гвида Дж., Поспелов Д. А.,Сомальви- к о М, Обобщенные стратегии в решателях проблем.— Изв. АН СССР: Техническая кибернетика, 1978, N9 5, с. 71—83. 5.17. Б о р и с о в А. Н., А л е к с е е в А. В. и др. Модели принятия решений на основе лингвистической переменной.—Рига: Зинатне, 1982.- 256 с. о. 18. Колесников А. В., П о н о м а р е в В. Ф. и др. Системы ситуационного управления: Предварительная публикация.— М.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1978.— 43 с. 5.19. Вишняков Н. А.,Гельфандбейн Я. А.,Мамонтов А. И. Базис-граф топологической модели оперативного управления авиаремонтом.— В кн.: Вопросы теории и практики создания АСУ в гражданской авиации. Труды ГосНИИ ГА. Вып. 143. М., 1976, с. 25—34. 5.20. Вишняков Н. А.,Гельфандбейн Я. А. Механизм разрешения конфликтных ситуаций на базе модели конструирования решения.— В кн.; Вопросы теории и практики создания АСУ в гражданской авиации. Труды ГосНИИ ГА. Вып. 143. М., 1976, с. 35—43, 5.21. Вишняков Н.А.,Зенкович Ю. А. Применение принципов ситуационного управления для решения задач оперативного управления деятельностью гражданской авиации.— В кн.: Вопросы теории и практики создания АСУ в гражданской авиации. Труды ГосНИИ ГА, вып. 173, М., 1979, с. 201—207. 5.22. Вишняков Н. А., Гельфандбейн Я- А., Цветков Г. С. . Функционально-структурный подход к моделированию объекта управления в задачах автоматизации управленческой деятельности. Предваритель-
278 список ЛИТЕРАТУРЫ ная публикация. Научный Совет по комплексной проблеме «Кибернетика»- при Президиуме АН СССР, М., 1978.— 29 с. 5.23. Загадская Л. С,Соколова О. В, Методика проектирования ситуационных моделей управления.— Препринт. Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, М., 1973.— 40 с. 5.24. Жолондзь В. Я. Использование закономерностей времени и действия в ситуационном управлении дискретными объектами.— В кн.: Вопросы кибернетики. Ситуационное управление. Теория и практика. ^\.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 60-69. 5.25. Загадская Л. С., Лозовский В. С, Сокольников А. И.» Горячук В.Ф. Реализация базовых процессов в системе ситуационного управления. В кн.: Вопросы кибернетики. Ситуационное управ.тение. Теория и практика.— М.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1980, с. 94—108. 5.26. Бакаев А. А., Костина Н. М.,Яровицкий Н. В. Автоматные модели экономических систем.— Киев: Наукова думка, 1970.— 191 с. 5.27. Пастин Ю. Я.,Пожидаев В. Г. О взаимосвязи методов моделирования диспетчерского управления в морском рыбном порту. В кн.: Автома- тизированные системы управления в рыбной промышленнссти. Калининград, АтлантНИРО, Труды, Вып. 55, 1974, с. 40—46, 5.28. Гельфандбейн Я. А., Колесников А. В., Рудин- с к и й И. Д. Семиотико-статистическая модель поведения траиспортнога узла.— В кн.: Ситуационное управление и семиотическое моделирование. М.: Научный Совет по комплексной проблеме «Кибернетика» при Президи- уме АН СССР, 1983, с, 40—49, 5.29. К и р и к о в И. А. Использование ППП Моделирование состояния и поведения большой системы — МОСОП в АСУ морским рыбным портом,— В кн. Экономические проблемы развития советского рыболовства в Атлан- тике. Калининград: АтлантНИРО, 1981, с. 82—84, 5.30. П о.с п е л о в Д. А. О «человеческих» рассуждениях в интеллектуальных системах.— В кн.: Логика рассуждений и ее моделирование. М.: Научный Совет по комплексной проблеме «Кибернетика» при Президиуме АН СССР, 1983, с. 5-37. 5.31. Клике Ф. Пробуждающееся мышление: у истоков человеческого интеллекта.—М.: Прогресс, 1983.—302 с.
ИМЕННОЙ УКАЗАТЕЛЬ Аверкин А. Н. 2б2 Аристотель 248, 260 Асмус В.Ф. 160 Афонин Л. А, 255 Байес (В ayes) 181 Бинэ А. (Binet А.) 164 Боев Д. 257 Бонгард М. М. 168, 171, 266 Бэкон Ф. (Bacon F.) 195 Варосян С. О. 263 Викторова Н. П. 203, 266, 267 Вригт Г. фон (von Wright G. Н.) 264 Выготский Л. С. 264 Гавранек (Havranek Т,) 265 Гаджиев Р, Э. 255 Гаек П, (Hajek Р.) 265 Гельфандбейн Я. А. 255 Георгиева Н. 257 Гийома 14 Горбатов В. А. 255 Дур асов 124 Ежкова И. В. 143 Ефимов Е. И. 263 Железов Ж. 254 Загадская Л. С. 255, 257 Катаев В. 161 Квинлан (Quinlan J.) 226 Кириков И. А. 269 Клыков Ю. И. 254, 256, 257, 290 Колесников А. В, 260, 269 Кондратов А. М. 163 Краевский В. 263 Крылов В. 259 Кузин Л. Т, 255 Левиатов А. Ю. 255 Лейбниц (Leibniz G. W.) 154 Линней (Linnaeus С.) 165 Лозовский В. С. 258 Лурия А. Р. 164, 165, 264 Мартынов В. В. 260 Маслов С. Ю. 226, 368 Мачераускас В. Ю. 291 МилльС. (Mills.) 183, 184, 188, 195,266 Нисенбойм Л. Б. 291 Осгуд Ч. (Osgood Ch,) 165 Осипов Г. С. 291 Пётшке Д. (Potschke D,) 155 Плоткин Г. 265 Пономарев В. Ф. 255, 260 Поспелов Д. А. 254—258 Праде А. (Prade Н,) 153 Пушкин В.Н, 254, 256, 259 Сент-Экзюпери А. де (Saint-Exupery А. de) 14 Смолл (Smoll) 259 Соколова О. В. 257 Соколянский А. Н. 84 Сильдмяэ И. Я. 260 Тыугу Э. X. 368 Фаррени А. 153 Финн В. К. 265 Хант Э. (Hunt Е.) 226. 264 Цетлин М. Л. 259 Чесноков С. В. 146, 263 Эйдельман Н, Я. 116
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ «Абсурдность» знаний 156 — рассуждений 251 Автомат конечный вероятностный 18, 20 детерминированный 245 АКОсвязь 81 Алгоритм унификации 266 Анализ кластерный 166, 168 — семантический 83 Анализатор 27, 83 Аналогия 153 — отрицательная 189 — по Лейбницу 154 — положительная 189 База данных 214 — знаний 157 — эбранова 229 Базис в пространстве толерантности 215 Бионика 254 Бихевиоризм 17 Блок случайного выбора 27 — прагматического анализа 84 Вершина дискретной семантической сети 63 — семантического графа 199 объектная 199 предикатная 199 — призначная 199 функциональная 199 дерева неблагоприятная 231 Вопросник 210 — оптимальный 211 Выборка обучающая 168 Гиперплоскость разделяющая 169 Гистограмма 88, 167 Грамматики формальные 35 Граф иерархический (/-граф) 205 — семантический (СГ) 199 ГУХА-метод 265 Данные 39, 42 ДАТУМ 262 Действие 52 — квантифицированное 62 — «модализированное» 62 Действие модифицированное 62 Действие-состояние 52 Дерево 82, 83 — семантическое замкнутое 231 Дескриптор 234 Детерминация 146 Детство, психология 162 Дизъюнкт 228 Дискретизация 112 ДИСПУТ 262 ДСМ-метод 184 Дуга в семантическом графе входная 199 выходная 199 Задача лабиринтная 222 Замещение 51 Знаки 37 Знания 39, 40, 42 —, логическая противоречивость 39 — родительские 250 Значение интерпретируемое 35 Игра в «крестики-нолики» 21, 195 — в пять 22 — в шахматы 19 — позиционная 19 И-дуга 218 И-ИЛИ-граф 218 И-ИЛИ-сеть 218 Императивы 52 Имя 47 Интеллект искусственный 32 Интенсионал 41 Информация 50 Исток 63 Исчисление высказываний 34 — предикатов 35 первого порядка 69, 226 Квантификаторы 53, 61 — временные 124 — нечеткие 54 — размеров 127 Кванюр существования 53 Кванторы частотные нечеткие 145 Класс толерантности 206, 214, 267
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 281 Класс эквивалентности 197, 206, 214 Классификатор 27, 159, 206, 216, 244, 255, 256, 267 Классификация 26, 48, 159 и д., 165 Кластер 166 Код универсальный семантический 69, 260 Конкатенация 62 Конструкция ядерная простая 55, 62 синтаксически правильная 63 сложная 63 Конъюнкция 62 Коррелятор 27, 216, 237, 255 «Крестики-нолики» 19, 21, 195 Лабиринт 19, 222 Лексика языка ситуационного управления 57 ЛИСП ЕС 77 Лицо, принимающее решение (ЛПР) 9 ЛОГИК-ТЕОРЕТИК 223, 368 Логика временная 138 — каузальная 136, 138 — Навья-ньяя 157 — псевдофизическая 107 временная 109, 111 действия 109, ПО каузальная 109, ПО оценок 110 пространственная 109, ПО статическая 125 целей 110 — четырехзначная 158 Маркер 115 Мера общности 208 — сходства 209 Метафора 49 Метка ролевая 72 Метод Бонгарда 171 — встречных волн 221 — гиперплоскостей 169 — градиента 23 — ГУХА 265 — индуктивных рассуждений 183 — локальных улучшений 222 — обратной волны 221 — опережающего планирования 226 — опровержения 227 — «остатков» 183 — планирования 220 — построения доказательства 226 — потенциальных функций 168 — прямой волны 220 — разделения в пространстве признаков 168 — различия 183, 188, 266 — растущих пирамидальных сетей 174 — резолюции 227 Метод ситуационного управления 29 — сопутствующих изменений 184 — сходства 183, 186 сильного положительного 188 — управления логико-лингвистический 29 Множество базовых понятий ЯСУ 61 — действий (операций) ЯСУ 61 — имен понятий ЯСУ 61 — истоков 63 — квантификаторов ЯСУ 61 — квантифицированных свойств ЯСУ 62 — «модализированных» действий ЯСУ — модальностей ЯСУ 61 — модификаторов ЯСУ 61 — модифицированных действий ЯСУ 62 — модифицированных понятий ЯСУ 62 свойств ЯСУ 62 — неопределенное 157 — отношений ЯСУ 62 — оценок ЯСУ 61 — Парето 191 — простых ядерных конструкций ЯСУ 62 — решателей 63 — свойств понятий (Объектов) и дейст^ ВИЙ ЯСУ 61 — сложных ядерных конструкций ЯСУ 63 — стоков 63 Модальности 54, 61 Моделирование нечеткое 94, 116 — семиотическое 29, 255 Модель коллективного поведения автоматов 259 — лабиринтная 19 — логико-лингвистическая 255 — порождающая 98 — проблемной области 84 — семиотическая 33, 37, 38, 45, 55 — ситуационная 255 — формальная 32 интерпретируемая «36 конструктивная 33 разрешимая 33 семантическая 44 синтаксическая 43 прагматическая 44 — функциональная 234 Модификаторы 54 Модусы силлогизмов Аристотеля 248 Момент времени 111 Мотивация 50 Мультиграф взвешенный 199
282 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Набор признаков максимальный 209 Неполнота знаний 156 — описания 14 Норма 87, 88 «Общий решатель задач>> 21 Обобщение 159, 162 — по имени 201 — по квантификатору 201 — по модификаторам 201 — по признакам 167 — по структурам 182 — семантического графа 202 Объект 63, 65 — обобщенный 167 — управления 9, ! 1 — а-эталониый 208 Описание объекта 10 Оптимизация графа классификации 211 Отношения 45 — временные 50 — динамические, таблица 53 — замещения 51 — инструменгальные 50 — инфо])Манионные 50 — каузальные 50 — классификации 48 — количественные 49 — неопределенные 157 — нечеткие моделирования 94, 116 — порядковые 50 — признаковые 49 — принадлежности 50 — пространственные 50 — сравнения 49 — статические, таблица 51 Отрицание 62 Оценки 54, 61 Пакет прикладных программ интеллектуальный 237 Пара дополнительная 231 Парадоксальность рассуждений 251 Переменная неопределенная 157 Переоиределенность 157 Персептрон 19 Планировщик 216, 267 Планирование многоуровневое 219 — монотоннее (линейное) 227 — немонотонное (нелинейное) 227 — обобщенное 227 — по подзадачам 216 — по состояниям 216 Подграф 205 Позиция 64 Полнота детерминации 146 Понятие 47, 49, 165 — бивалентное 180 — квантифицированное 63 Понятие модифицированное 62 Пополнение описания 97 Порядок 50 Правила вывода 33 семантические 122 синтаксические 122 универсального характера 226 эвристические 226 — логико-трансформационные (корреляционные, ЛТП) 26 адаптивные 38 — отображения 35 — продукционные 85 — семантические 32 — синтаксические 32 Правило Байеса 181 — решающее 167 — сходства 186 Предикат аналогии Лейбница 154 — неопределенный 157 отрицательной 190 положительной 189 — различия 189 — сходства 188 параметрический 187 Представление знаний 258 ПРИЗ 369 Признак 49 Признаки классификации прагматические 160 Пример отрицательный 168 — положительный 168 Принадлежность 50 Приоритетность различий 22 Продукция 85, 97 — дедуктивная 97 — индуктивная 97 — традуктивная 97 Проецирование событий на шкалы 122 ПРОЛОГ 98 Пространство признаков 168 — семантическое Осгуда 166 — состояний 216 — толерантности 215, 267 Процедура классификации 26 — экстраполяции 27 Процессы 52 Псевдопонятие 160, 163 Псевдопричины 138 Психология ребенка 162 — решения задач 17 Психоника 254 Путь индикаторный 77 «Развал на кучи» 168 Разрешение спецификатора допустимое 234 Рассуждения 249 — по аналогии 153
ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ 283 Реакции 17 Редискретизация 112 Резольвента 231 РЕФАЛ 77, 98 Рефлекс условный 20 Рецептор 174 Решатель активный 64 — «общий» 21 — пассивный 64 Решение одношаговое 26 Роль 45, 72, 260 Свойство квантифицированное 62 — модифицированное 62 — монотонности 22—23 Связи причинно-следственные 50 Связь неориентированная 63 — ориентированная 63 Семинар по психонике 254 Сеть планирования детерминированная 219 замкнутая 218 — — недетерминированная 219 открытая 218 — семантическая 74, 202 интенсиональная (ИСС) 74 экстенсиональная (ЭСС) 74 — ситуационная дискретная (ДСС) 63 Силлогизм 248 — Аристотеля 152 Синтаксис языка ситуационного управления 61 Система знаковая (семиотическая) 37 — классифицирующая 206 — планирующая 216 Системы классификации 207 Ситуация полная 26, 29 — текущая Сколема функции 228 Словарь действии (операций) 57 — имен 57 — отношений 57 — понятий 57 «Слоёный пирог» 203, 219 Слой нулевой субмножества 175 супермножества 175 Сют 91, 262 События 111 — интервальные 111 — точечные 111 — цепочечные 111 Совокупность семантически правильная 33 — синтаксически правильная 33 Сопричины возможные 138 — дополнительные 137 — необходимые 137 Состояние 52, 216 Спецификатор 234 Сток 63 Стратегии планирования 220 Субмиожество 175 Супермножество 175 Сфера знаний 238 СФИНКС 368 Схема вывода нечеткая 141 Сходство сильное положительное 88 Сценарий 99, 240 Теория автомагического управления 9 — дискурса 262 — искусственного интеллекта 32 — лабиринтная 19 — модельная 24 — распознавания образов 168 — стимульно-реактивная 17 Толерантность, класс 206, 214 , 267 —, пространство 215 Точность детерминации 146 Традуктивность выводов 250 Универсум Эрбрана 229 Управление семиотическое 29 , 255 — ситуационное 29, 254, 255 — характеризационное 255 Уровень отсечки 90 Утверждение о согласованности 92 Формирование гипотез автоматизированное 266 Фрейм 72, 102 — абстрактный 82 — базисный 82 — декларирующий 82 — индивидуальный 82 — конкретный 72 — конфликтности 73 — показателя 73 — продукции 73 — ролевой 238 — технологии 73 Фрейм-отношение 82 Фрейм-прототип 72 Фрейм-условие 83 Фрейм-специализация 82 Функции Сколема 228 Функция принадлежности 89 — решающая 167 Характеристика 63 — объекта динамическая 245 статистическая 245 — понятия квантитативная 49 Цель 10, 50 Черный ящик 17
284 ПРЕДМЕТНЫЙ УКАЗАТЕЛЬ Шахматы 19 Шкала 107 — абсолютная 107, 113, 114 — активности 160 — метрическая 107, 114 — относительная 107, 114 — оценок 166 — причин 249 — размытая (нечеткая) 116 — силы 166 — следствий 249 — топологическая 107, 108, 115 — универсальная 91 Шкалированность 166, 249 Эквивалентность, класс 197, 206, 214 Экспликация смысла полная 70 Экстенсионал 41 Экстраполятор 27 , 216, 245 , 255 Экстраполяция решений 243 Элемент ассоциативный 174 Элемент базовый 32 — контрольный бивалентный 180 — — отрицательный 177 — — положительный 177 Эрбрана универсум 229 Эталон полный 209 — различия 209 Язык естественный 46 — представления знаний (ЯПЗ) 71 — — фреймов (ФРЛ) 76 — реляционного типа 48 — ситуационного управления (ЯСУ) 55, 155, 186, 197 — фреймовый 73 ABSTRIPS 368 RX-ход 67 STRIPS 368 а-эталон 208
Дмитрий Александрович Поспелов СИТУАЦИОННОЕ УПРАВЛЕНИЕ: ТЕОРИЯ И ПРАКТИКА Серия ^Проблемы искусственного интеллекта», выпуск Хо 7 Редактор Г. С. Осипов Художественный редактор Г. М. Коровина Технический редактор Е. В. Морозова Корректор В. П. Сорокина ИБ Л1; 12023 Сдано в набор 29.07.85. Подписано к печати 04.02.86. Т-03388. Формат 6 0x9 0i/ie. Бумага книжно-журнальная. Гарнитура литературная Печать высокая. Усл. печ. л. 18. Усл. кр.-отт. 18. Уч.-изд. л. 20,8'). Тираж 63 00 экз. Заказ № 1412. Цена 2р.70 . Ордена Трудового Красного Знамени издательство «Наука» Главная редакция физико-математической литературы 1 17071 Москва В-'71, Ленинский проспект, 15 Ордена Октябрьской Революции и ордена Трудового Красного Знамени МПО *Первая Образцовая типография» имени А. А. Жданова Союзполиграфпрома при Государственном комитете СССР по делам издательств, полиграфии и книжной торговли. 1 13054 Москва, Валовая» 28 Отпечатано во 2-й типографии изд-ва «Наука» 121099 Москва Г-99, Шубинский пер., 6. Зак, 2295