/
Text
Я. Qi ИОбАЧКОВ ИНФОРМАЦИОННЫЙ АНАЛИЗ В УПРАВЛЕНИИ Киев «Технпса» 1977
6Ф6.5 К59 УДК 658.4:001.89 Информационный анализ в управлении. К о з а ч • ков Л. С. Киев, «Техн1ка», 1977. 240 с. Изложены вопросы системного анализа, в котором сов- местно используются точные экономико-математические и качественные методы (экспертные оценки, диалоговые режимы общения с ЭВМ). Методы системного анализа иллюстрируются на примерах автоматизированных систем программно-целевого планирования и управления качест- вом, прогнозирования и управления научно-исследователь- ских работ и опытно-конструкторских разработок, инфор- мационного обеспечения АСУ различных назначений. Описаны проблемно-ориентированные и универсальные информационные языки. Предназначена для инженерно- технических работников, занимающихся разработкой и эксплуатацией АСУ и информационно-поисковых систем, а также может быть полезна студентам вузов соответствую- щих специальностей. Ил. 14. Табл. 8. Список лит.: 94 назв. Рецензент канд. техн, наук Ю. А. Михеев Редакция литературы по энергетике, электронике, киберне- тике и связи Зав. редакцией 3. В. Божко М 202 (04)-77 (с) Издательство «Техшка», 1977
ПРЕДИСЛОВИЕ Настоятельное требование времени — качество и эф- фективность — в полной мере относится и к задачам уп- равления. Эффективность управления — это переход на качественно новый уровень, связанный с существенным рас- ширением сферы приложения автоматизированных систем управления (АСУ): АСУП, ОАСУ, АСУ — здравоохра- нение, АСУ — торговля, АСУ — спорт, АСУ — наука, АСУ — театр, ... «Компьютеризация» управления позволяет не только автоматизировать так называемые рутинные расчеты, но самое главное — эффективно решать задачи выбора наи- лучших альтернатив. При этом создаются условия для мак- симального использования на всех уровнях управления воз- можностей человека, его интуиции, способности быстро рас- познавать и оценивать варианты. Особую актуальность в автоматизированных системах управления приобретают такие модели и методы управ- ления, которые ориентированы на широкое использование человеко-машинных режимов при анализе ситуаций и при- нятии решений. Среди них важное место принадлежит сис- 1£мному анализу и его информационному обеспечению. В соответствии с решениями XXV съезда КПСС в деся- той пятилетке повышение эффективности управления будет определяться последовательным объединением отдельных АСУ в общегосударственную систему сбора и обработки информации. Это объединение требует общности принци- пов методологического, информационного, математического обеспечения. 3
В числе актуальных теоретических и прикладных вопросов информационного анализа, связанных с объедине- нием АСУ, находятся проблемы информационных языков (ИЯ). Проблемы информационных языков не новы, ИЯ раз- вивались столетиями для целей библиографического поис- ка, а в последние десятилетия в связи с созданием авто- матизированных информационно-поисковых систем (ИПС) по научно-технической информации. Однако только в по- следнее время ИЯ стали использоваться в информационном обеспечении АСУ. Описанный в книге подход к разработке информационного языка логических категорий является од- ной из попыток использовать достижения в области библио- течных классификаций и информационно-поисковых язы- ков для целей системного анализа. Описанные в книге вопросы прикладной семантики так- же в основном рассматриваются в теории ИПС по научно- технической информации, хотя их актуальность при разра- ботке эффективных систем управления очевидна. Сегодня невозможно решать вопросы информационного обеспечения задач управления без участия в их разработке специалистов различных направлений: математиков, линг- вистов, инженеров, экономистов, врачей, социологов, системных программистов. Отзывы и пожелания просим направлять по адресу: 252601, Киев, 1, ГСП, Пушкинская, 28, издательство «Техшка».
ГЛАВА ПЕРВАЯ ИНФОРМАЦИОННЫЕ МОДЕЛИ СИСТЕМНОГО АНАЛИЗА 1.1. НЕКОТОРЫЕ ПРИНЦИПЫ УПРАВЛЕНИЯ В СИСТЕМАХ СОЦИАЛЬНОГО ТИПА Сложные системы можно разделить на социальные и несоциальные. В свою очередь, несоциальные системы раз- деляются на технические (тепловоз, ЭВМ) и естественные (солнечная система, живая клетка). Законы функционирова- ния и управления техническими и естественными системами описываются физикой, химией, биологией, научно-техничес- кими дисциплинами, теорией механизмов и машин и др. Важное место в анализе задач управления техни- ческими системами принадлежит теории автоматического управления и регулирования. Основу социальных систем, определяющим элементом которых является человек, составляет коллектив (предприя- тие, учебное заведение, НИИ, спортивный коллектив и т. п.). Законы функционирования и управления социальны- ми системами описываются философией, политэкономией, педагогикой, науковедением, а также множествсм производ- ственных, экономических, гуманитарных и спортивных дисциплин. Важное место в анализе задач управления соци- альными системами принадлежит кибернетике как науке об общих законах сбора, хранения и преобразования информации в сложных управляющих системах. Киберне- тика, обобщая свойства организации социальных и несо- циальных (естественных и технических) систем, является в то же время наукой об управлении. х Для описания и анализа систем любой природы широко используется математичесий аппарат — язык алгебраиче- ских, логических, дифференциальных и других уравнений 5
При анализе сложных систем математический аппарат хотя и высокоэффективный, но все-таки вспомогательный инструмент исследования. Например, на основе методов математической статистики была высказана известная ги- потеза о существовании генов (законы Менделя). Но даль- ше, как известно, расшифровка кода наследственности про- исходила на основе законов и методов физики, химии, био- логии, теории информации с использованием современных технических и математических средств обработки инфор- мации. Управление в таких социальных системах, как общест- венно-экономическая формация или экономика отдельной страны, определяется закономерностями различной приро- ды и уровнями абстрагирования — от законов историче- ского материализма и политэкономии до научной организа- ции труда, календарного планирования и различных наук о человеке. При поиске оптимальных решений в таких многоуровневых системах недопустимы как замена специ- ального управления общими рекомендациями, так и обрат- ное — технократизм и игнорирование общественно-эконо- мических, моральных, правовых, психологических аспек- тов. Учет всех этих факторов — основное требование, вытекающее из принципов системного анализа. Многие специалисты-практики, знакомясь с литерату- рой по системному анализу, приходят к заключению, что системный подход — это, по сути, тот образ мышления, которым столетиями пользовались хорошие руководители. Требование системного анализа рассматривать для принятия решения взаимодействие и взаимозависимость всех сущест- венных факторов не является чем-то новым. Вопрос состоит в том, каким образом эти общие методологические принци- пы реализовать в конкретных методах и методиках при ис- следовании и управлении систем различной природы. Одним из средств проведения системного анализа для принятия решения и управления сложными системами яв- ляется информационный анализ. Важная особенность ин- 6
формационного анализа при изучении системы, выработке и обосновании управляющих воздействий — совместное использование как количественной информации, допускаю- щей нахождение «точной» (оптимальной) траектории, так и качественной для нахождения альтернативных траекто- рий, имеющих вероятностный характер. В связи с этим проблемы разработки информационных систем, методов и средств информационного анализа занимают одно из пер- вых мест в общей задаче планирования и управления. Имен- но поэтому важнейшая составная часть любых АСУ — спра- вочно-информационные системы, которые, однако, до самого последнего времени выполняли в АСУ лишь вспомо- гательные функции. Академиком В. М. Глушковым пред- ложен путь повышения эффективности автоматизированных справочно-информационных систем на основе объединения их с обобщенными динамическими моделями [14]. Человек всегда пользовался в единстве как расчетными критериями «что такое хорошо и что такое плохо», так и ка- чественными, основанными на неполной информации, мо- ральных, правовых оценках, интуиции и т.п. Это утвержде- ние относится не только к повседневной личной деятельности человека, его поведению на улице, дома, но и в органи- зации и управлении производственным процессом, управ- лении общественными ситуациями. При управлении производственными коллективами всег- да пытаются учитывать «человеческие» факторы, такие, например, как психологическая совместимость, возраст, квалификация рабочего и т. п. Учет этих факторов для при- нятия решений является одной из задач информационного анализа., Подавляющее большинство оперативных и отчет- ных документов, создающих производственные информа- ционные потоки, в «домашинный» период управления были рассчитаны на непосредственный анализ документальной информации и принятия решений самим человеком, в то вре- мя как расчеты (выполняемые на счетах, арифмометрах и т. п.) носили вспомогательный характер. По существу, при 7
выработке решений и управляющих воздействий применя- лись методы информационного анализа, хотя и плохо фор- мализованные. С бурным ростом количества информации (качественной и количественной) рассчитывать только на возможности че- ловека при анализе становится практически невозможным. Применявшийся столетиями при управлении производством метод «проб и ошибок» нередко превращается, по образному выражению американцев, в метод «проб и катастроф». С появлением ЭВМ прежде всего был автоматизирован расчет количественной информации: бухгалтерский учет, финансовые операции, учет складского хозяйства, некото- рые задачи календарного планирования и внутризаводских перевозок. Однако решение только этих задач не может привести к коренному улучшению планирования и управле- ния производством на всех уровнях ввиду того, что большая часть информации, существенная для принятия решений, остается вне анализа. Сюда относятся задачи анализа люд- ских ресурсов (не по среднестатическим показателям, а с учетом множества признаков), рациональной расстановки кадров, а также оценки влияния отдельных параметров (например, формы управления оплаты, моральные факто- ры), различных рационализаторских предложений на со- стояние систему в Ц£лом ^предприятия* отрасли). Для принятия решения Й экономике Требуется разно- образная информация, большая часть которой связана с обработкой больших массивов первичных данных. При этом ответы на многие важные для управления вопросы нельзя получить прямым расчетом. Для этих целей требуется при- менение специальных методов. Вопросы, сплошь и рядом возникающие в задачах перспективного и текущего планиро- вания, следующие: сколько работников (по профессиям) понадобится через 5 лет в зоне строительства БАМа; сколько нужно подготовить системных программистов и сколько это потребует средств для разработки первой очере- ди общегосударственной системы обработки информации. 8
Вопросы могут иметь и личный характер, например: на ка- ком приборостроительном предприятии г. Киева можно токарю 5 разряда с семьей в 3 человека в течение трех лет получить трехкомнатную квартиру. Окончательное принятие решения на основе учета всех факторов (количественных и качественных) по-прежнему остается прерогативой человека, но предварительную под- готовку и анализ информации должна проводить ЭВМ, в частности при информационном анализе — специализи- рованная информационная система. Кроме того, за челове- ком по-прежнему остаются решающие функции: постановка задач, выработка критериев, вмешательство в «тупиковые» ситуации, окончательный выбор решения и придание ему юридической силы. В последнее десятилетие накоплен большой опыт ис- пользования в задачах управления точных методов мате- матического программирования. Но при использовании та- ких экономико-математических методов нередко не учиты- ваются многие «человеческие» факторы и критерии, что приводит иногда к «нежизненности» рассчитанных реко- мендаций и планов. Экономико-математические методы находят все более широкое применение в АСУ для решения малоразмерных задач и таких алгоритмов принятия реше- ния, которым придан характер юридических законов и норм. К ним относятся, например, расчеты потребностей сырья, материалов и оборудования, проектно-конструк- торские расчеты, расчеты по загрузке оборудования, рас- четы по оптимальным складским запасам, маршрутам транс- портировки продукции и др. Бесполезность (а в некоторых случаях и вредность) точ- ного решения произвольно, неточно поставленных задач особенно остро стала ощущаться, когда при внедрении АСУ перешли от решения рутинных задач бухгалтерского и другого учета к сложным задачам технико-экономического анализа. Поэтому стали усиленно развиваться методы сис- темного анализа, неизмеримо расширяющие возможности 9
использования ЭВМ и автоматизированных информацион- ных систем. Недостаточно высокая эффективность извест- ных методов математического программирования как уни- версального инструмента оптимального управления в системах социального типа объясняется следующими причи- нами: 1) большой размерностью задач, которые оказываются неразрешимыми даже для машин с быстродействием в мил- лиарды операций в секунду и с использованием эффектив- ных эвристик (эвристическое, стохастическое программирова- ние и т. д.). Число возможных состояний сложных систем достигает по некоторым оценкам 21000 [66]. Например, точ- ные методы решения задач календарного планирования ос- нованы на применении методов динамического программи- рования. По образному выражению математиков, над эти- ми методами довлеет «проклятие размерности»; 2) большим количеством неизвестных факторов, широкой областью изменения их значений, при котором известные методы принятия решения в условиях неопределенности те- ряют даже такое свое значение, как например «искусство давать плохие ответы на те практические вопросы, на ко- торые даются еще худшие ответы другими методами» [701; 3) наличием в системе в качестве его главного элемента людей, которым в определенном смысле свойственна «сво- бода воли». Поэтому стохастические характеристики систе- мы существенно влияют как на процесс ее функциони- рования, так и на выбор управляющих воздействий; 4) наличием среди основных характеристик таких, кото- рые или трудно описываются, или принципиально не, опи- сываются количественными показателями; 5) цели и задачи управления на различных уровнях, а также критерии эффективности управления выражены нечетко. Растущие объемы информации и новые требования к за- дачам управления делают невозможным принятие оптималь- ных решений в системах социального типа, ориентируясь 10
лишь на создание рациональных организационных структур коллективов. В работе [14] доказано, что после того как в экономике был достигнут второй информационный барьер, управление без ЭВМ ведет к крупным (порой недопус- тимым) потерям. Но применение ЭВМ в системах социаль- ного типа идет не по пути «освобождения» человека от труд- ных и ответственных задач управления, а на основе исполь- зования всех его лучших качеств, в «раскрепощении» че- ловека от рутинной работы, которую с успехом может вы- полнить автомат. За человеком сохраняется окончательный выбор решения и право наложения любого «вето» на реко- мендации машины. Создание эффективных систем социаль- ного управления, в состав которых входят ЭВМ, требует решения ряда методологических, математических, инфор- мационных и технических проблем [14, 30, 31, 35, 42, 78]. Ниже дано описание некоторых понятий, используемых в задачах управления системами социального типа и сис- темного анализа. Большинство из этих понятий носят ка- чественный, «неточный» характер. В каждом отдельном слу- чае задача заключается в том, чтобы придать указанным понятиям форму и содержание, допускающие количествен- ный расчет, на основе которого подбирается, если не самое лучшее, то во всяком случае достаточно приемлемое управ- ление. Уровень. Понятие уровень неоднозначно, так как можно выбрать несколько аспектов разбиения системы на уровни. В системах административного типа информационный уро- вень совпадает (или должен совпадать) с административ- ным. Определяющим аспектом выделения информационных уровней являются последовательные этапы абстрагирова- ния от единичного к общему и всеобщему. Информацион- ные уровни обобщения — это ступеньки выделения, т. е. познания сложной системы, помогающие управлять этой системой. Например, этапам обобщения и управления в производственных коллективах соответствуют следующие 11
организационные уровни: 1) рабочее место (человек + оборудование), 2) участок (бригада), 3) цех, 4) завод, 5) производственное объединение. Каждый из перечисленных организационных уровней производства и управления может быть определенной «сис- темой отсчета» в анализе ситуаций, при которой происходит их обобщение. При этом каждый из уровней имеет свою шкалу показателей, свои специфические семиотические сред- ства (словарь базовых понятий и отношений) для описания состояний системы, включая язык выдачи команд. Количество уровней в сложной системе может изменять- ся в широких пределах. (Некоторые формальные ограниче- ния на число уровней описаны в гл. 1.3). В реальных систе- мах число уровней определяется количеством первичных элементов, связей между ними и, следовательно, количест- вом разнотипной информации, которую необходимо об- работать для принятия решений. В игровой системе — шахматы (два шахматиста + 32 фигуры) гроссмейстер М. М. Ботвинник [11] различа- ет по меньшей мере 3 уровня. На нижнем уровне этой сис- темы находится каждая фигура определенного цвета (вмес- те с шахматистом), следующий уровень — группы взаимо- действующих фигур в отдельных эпизодах или зонах. Выс- шим уровнем являются все фигуры одного цвета (вместе с шахматистом). У начинающего шахматиста система одно- уровневая, так как все его фигуры не взаимодействуют, а «мыслят» лишь на один шаг в соответствии с правилами их движения. По мере роста мастерства шахматиста неизме- римо возрастают интегральные возможности фигур, число состояний, число альтернатив, методов оценок позиций, число «стандартных положений», возможных комбинаций, наступательных и защитных приемов. Короче, существен- но возрастает количество информации, которую необходи- мо переработать, чтобы не ошибиться. Возрастает число информационных уровней анализа и управления шахмат- ной позиции. И хорошего шахматиста от плохого отличает 12
прежде всего то, что плохой (как и большинство современ- ных шахматных программ) выбирает вариант игры методом простого перебора, в то время как хороший шахматист строит за доской многоуровневую информационную систе- му, которая существенно облегчает выбор лучшего хода из астрономического числа возможных. Хорошего шахматис- та от шахматиста экстракласса отличает гибкость этих многоуровневых структур анализа системы, которая поз- воляет в условиях жестких временных ограничений найти не только путь к цели, но и самый короткий (иногда еще от- личающийся подлинным изяществом). Цель. Цель — это конечный результат, на достижение которого направлена деятельность системы. Это качествен- ное определение цели заимствовано из работы [61] и, ко- нечно, весьма расплывчато. Приводимое ниже «количест- венное» определение цели, наоборот, слишком «точно» и потому бессодержательно. Цель — это одно из состояний системы, которое принимается за конечное. Очевидно, что цель относится к тем понятиям системного анализа, которые на интуитивном уровне понятны всем и которые находятся в повседневном употреблении (каждый ставит себе ближние и дальние цели), но к формализации которых следует от- носиться с большой осторожностью. Неправильная постанов- ка цели может полностью парализовать работу системы или скомпрометировать важную идею. Так, например, непра- вильно поставленные цели при разработке ряда АСУ вы- звали у их разработчиков и заказчиков разочарование. Целью разработок таких псевдоАСУ ставилась только ав- томатизация рутинных расчетов и сокращение администра- тивного аппарата. Но эта цель не была достигнута, так так управленческий аппарат вырос за счет обслуживающего персонала вычислительных центров. Затраты на АСУ оку- паются за короткий срок (1—3 г.), если целью АСУ ставится обеспечение технико-экономического анализа и оптималь- ного управления. В этом случае увеличение числа работни- ков управления за счет математиков-экономистов, системных 13
программистов оправдано, так как при этом обеспечи- вается эффективное управление в настоящем и в перс- пективе. Нередко кажется, что цель очевидна, хотя на самом деле постановка целей требует глубокого исследования. Все иг- рающие в шахматы, например, считают, что цель игры дать мат. Гроссмейстер М. М. Ботвинник на основании своего шахматного опыта и исследований, связанных с созданием «машинного» гроссмейстера, утверждает, что это ошибка. Для таких сложных систем как шахматы правильной целью является неточная (паллиативная) цель. Такой паллиатив- ной целью для шахмат является выигрыш материала, что распадается на две подцели: текущую, т. е. выигрыш мате- риала в данный момент, и перспективную, связанную с переходом на более высокий уровень обобщения, борьбой за контроль важных полей для использования их в даль- нейшем опять-таки для выигрыша материала. Очевидно, что цели на различных уровнях системы могут различаться и очень существенно, но последствия от стремления до- стичь своей цели соответствуют интегральной. В любых слож- ных системах социального типа отдельные цели обобщаются в интегральные, групповые и общесистемные. В экономических системах цели обычно задаются выше- стоящей системой или вытекают из природы социального строя. Так, для капиталистического общества целью разви- тия экономики является достижение максимальной прибы- ли. Повышение покупательной способности населения в период между кризисами является одним из средств до- стижения этих целей, так как в условиях понижения поку- пательной способности сужается база реализации товаров и увеличения прибыли. Целью социалистического общест- ва является максимальное удовлетворение постоянно рас- тущих материальных и духовных потребностей всех членов общества. И эта цель формируется в основном за предела- ми экономики, выражаясь в терминах конечного продукта. Составные части этого конечного продукта: 14
1) личное потребление граждан (одежда, жилье, питание, газеты, книги и т. п.); 2) общественное потребление (образование, здравоохра- нение, телевидение, радио, связь и т. п.); 3) общегосударственные внеэкономические расходы (обо- рона, охрана общественного порядка, развитие науки, ох- рана природы, содержание посольств и т. п.). Утверждение системы целей, их объемы и другие ха- рактеристики являются прерогативой высших органов политического управления. Выбор эффективных путей и средств достижения целей осуществляется государственны- ми плановыми органами на основе построения и анализа макроэкономических моделей и средств вычислительной техники. Всесторонний анализ таких макроэкономических моделей, обеспечивающих непрерывно действующую сис- тему перспективного планирования, постановку и уточне- ния целей, дан в работах [14, 16]. Альтернатива. Одно из определений альтернативы сле- дующее: альтернатива — это одна из двух или более воз- можностей, подлежащих выбору. Более точным определе- нием будет такое: альтернативы — это множество траек- торий последовательного изменения состояний системы, ведущих от начального состояния к конечному, называемо- му целью. Выделение альтернатив в системном анализе задача нелегкая, и формального алгоритма этого не сущест- вует, так как они могут определяться по различным аспек- там. Так, например, при проведении системного анализа тенденций развития вычислительной техники четвертого и последующих поколений выяснилось, что на каждом уров- не построения прогнозного графа (подробнее о событийном моделировании см. гл. 2) имеется несколько различающихся аспектов: структурных, материальных, функциональных. Примером структурных альтернатив, предложенных экспе- ртами, являются одно- и многопроцессорные ЭВМ; мате- риальные альтернативы, связанные с элементной базой,— это БИСы, оптоэлектроника, биологические элементы; 15
функциональные альтернативы связаны с различным соот- ношением между внешним и реализованным схемно матема- тическим обеспечением. Критерии. Критерии являются средством, с помощью которых измеряется и выбирается альтернатива. Критерии связаны с другими мерами и оценками, которые называют ограничениями, условиями. При поиске путей достижения цели только в редких случаях допускается принцип «лю- быми средствами». «Пиррова победа» — нарицательный при- мер такого достижения цели, при котором не считаются с затратами. Как правило, при выборе средств достижения цели (т. е. выбора альтернатив) учитывают ограничения: временные, стоимостные, материальные, моральные, пси- хологические и многие другие количественные и качествен- ные критерии. Длительное действие в общественно-социаль- ных системах тех или иных ограничений превращает их в правила (например, моральные законы, правила игр). Но с другой стороны, слепое следование при выборе альтернатив в экономических системах за требованиями ограничений может привести к положению, о котором говорится «фор- мально правильно, а по существу — издевательство». Сис- темный анализ допускает (даже требует) проводить анализ не только оптимальных путей достижения цели в условиях заданных ограничений, но и анализ целесообразности са- мих этих ограничений. Построение критерия (или несколь- ких критериев) — сложная ответственная задача, так как выбор неправильных критериев может привести к крупным стратегическим и тактическим ошибкам. Риск. Содержание данного понятия интуитивно очевид- но. В некоторых случаях удается придать ему количест- венный смысл — как вероятность благополучного исхода. Среди оценочных понятий, используемых в системном анализе, применяется также полезность, эффективность и другие, которым, однако, еще более трудно придать одно- значное содержание. Одно из важнейших понятий систем- ного анализа — «параметр» описано ниже. 16
Основными объектами информационного (системного) анализа являются информационные параметрические мо- дели (ИПМ) статических и обобщенных динамических систем (ОДС) [14]. Обобщенные системы характеризуются взаимосвязанной совокупностью элементов, процессов и их свойств, изменяющихся во времени. Такое определение естественно может быть отнесено к любой системе. Однако особенность обобщенных сложных систем это их стохастичес- кий характер, обобщение множества единичных свойств, про- цессов (иногда целых подсистем) до уровня отдельных пара- метров, наличие огромного числа (до десятков тысяч) из- меняющихся во времени параметров различной природы, отсутствие четко выраженной жесткой иерархии подсистем и параметров. Рассмотрим требования к информационной параметри- ческой модели, которые должны соответствовать объектив- ной природе моделируемых сложных систем. 1. Многоуровневост ь. Многоуровневость сложных систем состоит во взаимодействии содержащихся в них различных форм движения материи: физической, хи- мической, биологической и др. Примерами многоуровне- вой системы могут служить: молекула, живая клетка, сол- нечная система, общественно-экономические системы. Функ- ционирование молекулы определяется, по меньшей мере, химической и физической формами движения. Жизнедея- тельность клетки определяется физическими, химическими, биохимическими процессами. Еще более сложными по чис- лу содержащихся в них форм движения материи являют- ся общественные системы. Понятие уровень при описании систем используется и в других смыслах: энергетический уровень атома, иерархичес- кая структура коллектива, уровни классификации, уровни па- мяти. Многоуровневые системы имеют и различные способы организации и характер связи между элементами и уровнями. 2. Целостность. Построение модели системы пред- полагает прежде всего «моделирование» связей между эле- 2 6-3324 17
ментами и свойствами системы, определяющих ее целост- ность. При этом целостность системы определяется как го- ризонтальными связями между элементами (т. е. элемента- ми одного уровня, одной формы движения материи), так и вертикальными (т. е. связями между уровнями и элемента- ми, принадлежащими различным формам движения). 3. Управление. Среди множества свойств и от- ношений системы выделяются причинно-следственные за- висимости, в которых интегрируются влияния других свойств на траекторию развития системы и изменения ее состояний во времени. В отличие от классических динами- ческих систем, причинно-следственные связи недетермини- рованы и характеризуются различной степенью зависимос- ти между элементами и процессами. Это, например, может быть зависимость следующих типов: 1) если Л (О Д В (О Д С (/), то D(t + М) Е (t + + ДО A F (/ + А/) с вероятностью pf, 2) если А (0, то В (t + ДО с вероятностью р2\ 3) А (0 вызывает В (t + ДО с вероятностью р3. Допускается, что вся совокупность причинно-след- ственных отношений может быть разделена на управляющие и управляемые воздействия. В общем случае при отсутствии целевой функции управления (т. е. субъекта, который ее формулирует) выделение управляющих элементов сводится к анализу причин, оределяющих траекторию развития системы. 4. Параметризация. Параметры — это обобщен- ная и наиболее важная информация о сложной системе, ос- новной семантический элемент ИПМ. В параметрах, как в «явлении», интегрально отражается (непосредственно или опосредованно) состояние системы в дискретные моменты времени. Параметры могут относиться к различным струк- турным уровням (физика, химия, биология и т. д.). Они мо- гут быть единичными, т. е. относиться к отдельным элемен- там, свойствам, и интегральными и оценивать некоторую сложную ситуацию или подсистему. Параметры бывают 18
количественные, численные значения которых характеризу- ют состояние системы в каждый момент времени (темпера- тура, давление, скорость, масса, производительность, коли- чество работающих, зарплата и т. п.). Примеры качественных параметров — психологический климат в коллективе, самочувствие, талант и т. п. «Надо помнить,— писал в 30-е годы акад. А. Н. Крылов,— что есть множество «величин», т. е. того, к чему приложимы по- нятия «больше» и «меньше», но величин точно не измеряе- мых, напр.: ум и глупость, красота и безобразие, храбрость и трусость, находчивость и тупость и т. д. Для измерения этих величин нет единиц, эти величины не могут быть выра- жены числами,— они не составляют предмета математики» [51]. Параметры формируются на основе соответствующих показателей, используемых в различных отраслях науки и техники, а также на основе экспертных оценок. От- дельные подсистемы, входящие в состав ИПМ, описываются математическими (например, дифференциальными уравне- ниями), биохимическими, экономическими моделями и множеством качественных зависимостей, которые в силу сво- ей неопределенности и нередко противоречивости не могут составить содержание единой модели. Отсутствие единой мо- дели при описании многоуровневых и многоаспектных сложных систем особенно остро ощущается при разработке научно обоснованных управляющих воздействий на систе- му и прогнозировании возможных и желательных траек- торий ее развития. Поэтому и возникла необходимость создания такой обобщенной динамической модели сложной системы, которая бы интегрировала локальные описания отдельных уровней, свойств, аспектов в единую сеть вза- имосвязанных параметров. Такой подход соответствует иде- ям кибернетики, обобщающей локальные информационные особенности систем различной природы в общие законы преобразования информации в управляющих системах. Академиком В. М. Глушковым, предложившим ряд методов системного анализа как методов построения и ана- 2* 19
лиза ОДС, сформулированы следующие основные этапы ис- следования и управления динамическими системами: 1) определение объекта исследования, постановка целей и задание критериев управления объекта; 2) первичная структуризация и выделение изучаемой системы от внешней среды; 3) составление математической модели изучаемой систе- мы. Ключевая задача этого этапа — параметризация, т. е. выделение элементов (или групп элементов), свойств (ло- кальных и интегральных), изменение которых существен- но влияет на состояние системы. Сложность этапа параметризации определяется и тем, что в динамических системах одни параметры исчезают, другие возникают, изменяется и важность параметров для состояния сис- темы. В целом процедура параметризации, как всякая сложная семантическая задача, трудно формализуема. Обязатель- ным требованием на этапе параметризации является уста- новление области изменения. Количественные параметры могут изменяться дискретно или непрерывно. Для ка- чественных параметров, как правило, устанавливают це- лочисленные значения. После определения параметров и задания области их изменения между параметрами различ- ного рода устанавливают количественные и качественные зависимости. Для этих целей может быть использован ап- парат математики (булева алгебра, теория множеств, алгебра, дифференциальные уравнения и др.), любая таб- личная запись качественных и количественных зависимостей между параметрами, различные средства информационных языков и языки отдельных наук. При построении ИПМ информация может иметь разно- образные источники — научные тексты, данные эксперимен- та, мнения экспертов. Экспертные оценки во многих слу- чаях оказываются чуть ли не единственно возможным ис- точником информации, особенно в тех ситуациях, когда данных, содержащихся в публикациях, явно недостаточно 20
для построения цельной картины исследуемой системы. Построенная ИПМ анализируется количественными и ка- чественными методами. Методика системного анализа, ос- нованная на разделении управляющих и управляемых пара- метров и определении наиболее вероятной (или близкой к оптимальной по заданной цели) траектории системы, будет описана в последующих главах. Здесь же укажем лишь, что для построения ИПМ допускается установление раз- личных по типу зависимостей и использование различных формальных и неформальных языков: при анализе модели могут быть использованы любые специальные методы. Но наряду с этим, при анализе ИПМ предоставляются возмож- ности широкого использования коллективного разума, луч- ших качеств человека, его интуиции, фантазии, способ- ности формулировать гипотезы и промежуточные цели. Для этого создается специальное математическое обеспечение, устанавливаются технические средства (экранные пульты) для диалоговых режимов, разрабатываются информацион- ные языки, близкие по своей понятийной структуре и орга- низации естественному. Глубокая связь методов управления, основанных на построении информационных моделей сложных систем с важнейшими гносеологическими проблемами, превращает теорию познания в основной методологический фундамент управления системами социального типа. Обстоятельный анализ диалектической логики, соответ- ствующий современному уровню развития естественных и общественных наук, дан в монографии П. В. Копнина [481. Ниже рассматриваются только те гносеологические вопросы, которые в системном анализе имеют прикладное значение. В историческом развитии природы возникали различ- ные формы движения материи: физическая, химическая, биологическая, общественная. При этом чем выше органи- зованность системы, тем большее количество форм движе- ния она в себе содержит. Поэтому, чтобы познать и управ- лять сложной многоуровневой системой, нужно познать все 21
ее уровни, их единство и взаимосвязь. Вот почему самую сложную и самую организованную из ныне известных сис- тем — человека — изучает весь комплекс общественных наук, медицина, биология, физика, химия, кибернетика, т. е. по сути все науки. Систему понятий, являющихся содержанием мышления человека, можно разделить на два класса: понятия науки и понятия, служащие основой естественного языка, выпол- няющего в данном случае функции метаязыка. Систему по- нятий, входящих в эту метасистему, назовем у-ступенью (Мышление). Единство, целостность этой системы понятий обеспечивается категориями, т. е. понятиями, описываю- щими наиболее общие свойства действительности. Содержание каждой из категорий раскрывается через понятия, входящие в класс понятий наук и в класс понятий мышления. Рассмотрим несколько категорий, которые име- ют первоочередное значение при описании ситуаций и пос- роении информационных моделей сложных систем. Материя [ЛИ. Категория [М] определяет специфику объек- та исследований отдельных наук и может иметь как вещест- венный, так и невещественный характер. В физике [ЛИ представлена в форме вещества и поля, элементарных час- тиц, галактик и т. д. В химии [ЛИ представлена множеством элементов, молекулярных соединений и т. д. В биологии [ЛИ—это клетка, ее структурные составляющие, физио- логические системы и т. д. В обществе [ЛИ —это матери- альное производство (производительные силы и производ- ственные отношения), техника, экономические системы. Существенно различаются уровнем абстракции понятия, входящие в класс у-ступени (Мышление) и отражающие ка- тегорию [ЛИ. Например, на уровне естественного языка ка- тегория [ЛИ — это предметы, которые могут подразделять- ся на одушевленные, неодушевленные, искусственные и естественные. На уровне абстракции, соответствующей общ- ности диалектической логики, категория [Л1] включает в себя системы (материальные, идеальные, детерминирован- 22
ные, вероятностные и др.). На самом высоком уровне абст- ракции категория 1Л4] представлена элементами математи- ческой теории множеств, что делает совершенно необяза- тельным вещественность. Категория [Л4] может быть пред- ставлена не только предметами, но и состояниями. Причина и следствие [7?]. Особенностью параметриче- ских моделей сложных систем является то, что в них рассмат- риваются различные типы причинно-следственных отноше- ний. Это соответствует характеру качественной и количест- венной информации, содержащейся в модели, природе мыш- ления и языка. При описании различают несколько уровней абстрагирования от нестрогих качественных зависимостей до формально определяемых функциональных. Так, на пер- вом уровне абстрагирования категория причина и следствие имеет содержание типа влияние. Можно выделить следую- щие группы связей, объединенных понятием влиять, а также некоторые качественные оценки этих отношений. Общая связь (прямая, опосредованная, односторонняя, двусторонняя, активная, пассивная). Функциональная связь (источник, основа-условие, пос- ледствие, сопутствие, «руководитель», «руководимый», про- дукт — действие, «дружба», «конкуренция», «вражда»). Каталитическая связь (полностью определять, способ- ствовать, быть нейтральным, оказывать сопротивление, не допускать). Ассоциативная связь (по смежности, по сходству, по контрасту). Семантическая связь (по структуре, по функциям, по форме и т. д.). Грамматическая связь (члены предложения). Перечисленные виды связей, обобщенных понятием влия- ние, в основном соответствуют уровню естественного языка (точнее разговорного, так как язык науки тоже естественный). На более высоком уровне обобщения причинно-следствен- ные связи носят уже характер категорий, и поэтому по сте- пени общности близки категориям диалектической логики 23
(причина — следствие; необходимость — случайность; ка- тализация — сопротивление; управляющий параметр — уп- равляемый параметр и т. д.). И, наконец, на самом высоком уровне причинно-след- ственные отношения и другие виды логических связей но- сят строго формальный характер типа: отображение, функ- ция, конъюнкция, дизъюнкция, импликация и т. д. Это уже уровень математики. Классификация категорий и распре- деление их по информационным уровням дана ниже. Построение моделей систем и принятие решений проис- ходит с использованием причинно-следственных связей и отношений различных информационных уровней и обобще- ний. Это составляет основную трудность анализа и «неде- терминированность» принимаемых решений, так как при- чинно-следственные сети крайне неоднородны и не допуска- ют использование единых правил. Например, пусть х4 является условием появления х2, а х2 способствует появлению х3, а х3 является причиной х4, а из х4 следует (формально) х5. Если имеет место xlf то нельзя утверждать, что детерми- нировано следует х5. Эта цепочка в системном анализе рас- сматривается лишь в качестве одной из возможных альтер- натив. Время [Т], пространство IV] — категории, обязательные при описании ситуаций в динамических системах, так как любые процессы происходят в пространстве и во времени. Однако категория [Т] при описании многоуровневых сис- тем имеет еще значение как одна из характеристик внутрен- них свойств системы. Категория [Т] является важным ас- пектом классификации систем, так как системы существен- но различаются своими временными характеристиками и инертностью. Для каждого класса систем имеется дискрет- ный момент времени, в течение которого система сохраня- ет свое состояние, т. е. имеются системы с быстроизменяю- щимися ситуациями и сравнительно инертные. Более то- го, по чувствительности ко времени различаются и уровни одной системы: наиболее изменчив первый уровень, элемен- 24
ты с высокой степенью обобщения (верхние уровни систе- мы) более устойчивы. Обозначив число возможных состоя- ний одного уровня Sjm (т — состояние /-го уровня), можно показать, что Sx S2 так как число состояний при переходе от уровня на уровень уменьшается экспоненци- ально (см. гл. 1.З.). Для изменения состояния уровня / чис- ло состояний на уровне / 4- 1 должно увеличиться на по- роговую величину соответствующей экспоненциальной за- висимости. Этот факт определяет различие в динамичности отдельных уровней. Такая организация многоуровневых систем является приспособленным свойством, позволяю- щим принимать решения на основе анализа существенных (устойчивых) характеристик системы. Известный тезис, что все зависит от условий места и вре- мени, имеет и обратный смысл: само время зависит от ха- рактера системы, целей ее развития, применяемых критери- ев оценки. Простые системы со сравнительно небольшим числом состояний допускают за разумное время просмотр всех этих состояний. Зная желаемое конечное состояние (цель), можно найти оптимальную траекторию последовательного изменения состояний, т. е. оптимального управления. Сложные системы с числом состояний, превышающих 210Q (экономика, шахматы), не дают возможности перебрать все состояния даже на сверхбыстродействующих ЭВМ будуще- го. Более того, управление в социальных системах, как пра- вило, ограничено временными интервалами. Не только в шахматах, но и во многих других сферах человеческой дея- тельности цейтнот не такое уж и редкое явление. И это понятно: кому нужно точное предсказание погоды на пер- вый понедельник месяца, сделанное в последний понедель- ник того же месяца. Выбор метода анализа модели и управ- ления определяется в значительной мере временными огра- ничениями. «Хороша ложка к обеду», даже если она «не очень хороша», а самая «хорошая ложка» бесполезна уже после обеда. В гл. 3.2 приводятся различные единицы вре- 25
мени в зависимости от отрасли знаний и целей анализа. Для построения информационных параметрических мо- делей приведенных категорий, конечно, недостаточно. Се- мантика моделей требует использования, кроме рассмотрен- ных, таких категорий, как качество, количество, сущность, явление и многих других, входящих в состав диалектиче- ской ло! ики. Для построения динамических моделей широко используется категория движение. Каждая из входящих в состав знания категория, как уже отмечалось, имеет многоуровневую структуру и при описании модели выступает как сложное, с многочислен- ными ответвлениями дерево, как нечто органически связан- ное, создающее целостную картину мира и его отдельных систем. Известный физик Р. Фейнман, приводя пример вос- хождения по иерархической лестнице понятий, пишет: «От воды можно перейти к волнам, а затем уже и к понятию «шторм», причем слово «шторм» охватывает невероятное число различных явлений. ...Продолжая наш подъем по иерархической лестнице сложности, мы добираемся до таких вещей, как «сокраще- ние мускулов» или «нервные импульсы» — невероятно сложные явления физического мира, связанные с исключи- тельно сложной организаций материи. ...Все дальше и дальше и вот уже перед нами понятия «человек», «история», «политическая целесообразность» и другие понятия, которыми мы пользуемся для того, чтобы разбираться в событиях на еще более высоком уровне. А затем наступает черед таким вещам, как «зло», и «кра- сота», и «надежда»... 1831.
1. 2. О НЕКОТОРЫХ МОДЕЛЯХ ПОСЛЕДОВАТЕЛЬНОГО АНАЛИЗА ВАРИАНТОВ И ПРИНЯТИЯ РЕШЕНИЙ В самой общей форме задачи управления сводятся к поиску экстремального значения (или близкого к экстре- мальному) некоторого основного критерия /С, характери- зующего качество управления К ~ F (Л Л2, • • * > ^Т» ^2> • • • » где (Ль Л2, Ап ) —множество частных критериев, пороговые значения которых заданы; х2, хт ) — множество параметров, переменные значения которых мож- но выбирать для получения требуемой величины /(. В реальных задачах строгого различия между (Л^) и (Xj) может и не быть, т. е. переменными, при некоторых значениях которых достигается экстремальное значе- ние /С, становятся частные критерии. Например, пусть тре- буется достичь выпуска всей продукции со Знаком качест- ва при объеме продукции, соответствующей плановой Ль себестоимости, не больше Ла, производительности труда, не ниже Л3, и т. д. В этом случае по сути решается не одна, а несколько задач: сначала по К (для всех Ат при этом за- даются пороговые значения), затем по Л!, Л2, Л3 и т. д. В математическом анализе подробно разработаны методы решения различных вариационных задач, в которых ищет- ся экстремальное (максимальное или минимальное) значе- ние функции от многих переменных. Для нахождения экст- ремума функция дифференцируется по всем аргументам и решается полученная система управления. В реальных за- дачах управления экстремальные значения обычно дости- гаются на границах области, т. е. разыскивается условный экстремум функции, удовлетворяющий нескольким гранич- ным уравнениям. Метод поиска условного экстремума в ва- риационной задаче будет рассмотрен в гл. 3.1 при нахожде- нии распределения, обеспечивающего максимум энтропии. 27
Однако классические методы вариационного исчисления в задачах выбора тактики и стратегии управления в системах социального типа имеют ограниченное значение, основной причиной чего является большой набор переменных (xlt х2, В результате этого совместное решение системы уравнений оказывается очень трудоемкой операцией. Бо- лее того, производные, с помощью которых решаются обыч- ные вариационные задачи, могут и не существовать (если, например, xlt х2, •••» хт изменяются не непрерывно, а диск- ретно). Выбор управления в реальных системах и применение известных точных математических методов усложняются и тем, что критерии качества управления зависят не только от известных параметров (число которых, как правило, велико), но и от большого числа неизвестных. Такие зада- чи (а именно они сегодня самые распространенные) уже не являются строго математическими и требуют для решения других подходов. Сегодня уже нет сомнений в целесообразности использо- вания ЭВМ для целей управления, так как без ЭВМ управ- лять огромным числом связей и обрабатывать возникающие при этом потоки информации практически невозможно, если не хотим, чтобы экономические потери достигали не- допустимого уровня. Вызывают дискуссии лишь методоло- гические принципы разрабатываемых для реализации на ЭВМ моделей управления, их содержание и соответствие структуре моделируемых систем. Будем в дальнейшем раз- личать следующие типы моделей. Формальные модели (Ф-модели) представляют собой опи- сание объекта на языке высокого уровня и такой степени обобщения (абстрагирования), при котором одним уравне- нием можно описать многие объекты, нередко различной природы. Содержательные модели (С-модели) представляют собой индивидуализированное описание данного объекта (или вза- имосвязанной группы объектов) на языке такого уровня, 28
который соответствует как общим, так и частным свойствам объекта, специфическим особенностям его структуры. Обыч- но содержательные модели носят в основном описательный характер и выражены в естественных или близких к ним языках. Очевидно, что граница между формальными и содержательными моделями весьма условна. Не существу- ет в принципе «бессодержательных» формальных моделей, и, наоборот, содержательные модели не лишены формализ- ма, так как всегда будут некоторым обобщением, а не фото- графией объекта. Бионические модели (Би-модели) — функциональные мо- дели, основанные на отображении техническими средства- ми «механизмов» живой природы, включая и такое свойство высокоорганизованной материи как мышление. Механистические модели (М-модели) — функциональные модели, имеющие с моделируемым объектом только некото- рые общие функции, но существенно различающиеся от объекта структурой и принципами реализации этих функций (например, самолет как модель птицы). Предложенная классификация моделей не является ис- ключающей, например, конкретная Би-модель может в то же время быть и С-моделью. М-модель может оказаться при- годной для моделирования по функциям (входам и выхо- дам) группы «черных ящиков» и потому быть по отношению к ним Ф-моделью. Развитие кибернетики и проникновение ЭВМ в казав- шиеся еще вчера «святая святых» творческие процессы человека сопровождается дискуссиями о том, какие из пере- численных моделей наиболее эффективны в системах управ- ления *. Конечно, для прогноза траектории планеты сол- нечной системы эффективна только формальная модель, имеющая «содержательное» название — закон Ньютона. * Как только автоматизируется какой-либо творческий процесс, так он немедленно объявляется «рутинной» операцией, и, таким образом, граница творческого непрерывно отодвигается. 29
Для принятия решений в системах социального типа модели какого-либо одного типа недостаточно. До появления ЭВМ, математических методов исследова- ния операций и оптимального управления человек прини- мал решения в задачах управления, как правило, на основе С-моделей. В начальный период использования ЭВМ для оптимизационных расчетов в экономике и других системах социального типа предпринимались попытки полностью перейти к Ф-моделям, исключив при этом как неподдающие- ся точному количественному анализу С-модели. Достигну- тый на этом пути несомненный успех вселял надежду в реа- лизации возможности достаточно высокого уровня форма- лизации в принятии решений. И хотя эти возможности построения формальных мо- делей еще далеко не исчерпаны (скорее всего и здесь сдела- ны лишь первые шаги), становятся все более актуальными С-модели, ориентированные на ЭВМ. Примером таких эф- фективных С-моделей являются модели, используемые в ситуационном управлении. Автором работы [43] С-модели названы семиотическими, которые в то же время имеют свойства и Би-моделей, так как в них содержатся некоторые принципы анализа ситуаций и принятия решений, осу- ществляемых человеком. Это находит отображение в ис- пользуемом в задачах ситуационного управления информа- ционном языке, который, в свою очередь, является моделью естественного языка. Состояние модели представляется в виде понятий и отношений между ними, а функционирование управляемой системы рассматривается как изменения поня- тийных структур в соответствии с установленными правила- ми языка и структуры применяемого понятийного аппара- та, близкого естественному языку. Сущность управления сложными системами состоит в следующем. Пусть = {Sth Si2t ...» Sim); Ki = {Кц, Ki2» • ••» Kin} — множество состояний и решений ьго уров- ня управления. При этом анализ многих реальных систем показывает, что на каждом уровне управления между мно- 30
жеством допустимых решений и множеством состояний су- ществует соотношение | S | | К |. Даже в такой простой сис- теме как четырехсторонний уличный перекресток S « 2100, а команд управления всего две: не менять сигнал светофора и изменить сигнал светофора на противоположный [66]. В общем случае задача управления сложными система- ми сводится к поиску такого разбиения множества S, на классы, чтобы Kq, отнесенное к /-му классу, соответствова- ло оптимальному с точки зрения принятого критерия тра- ектории изменения состояний f-ro уровня на заданном вре- менном отрезке [О, Т]. Если такое разбиение произведено, то управление на f-м уровне состоит в определении для ситуа- ции Si (/) класса, к которому она принадлежит; затем вы- бирается одна (или несколько) соответствующих этому клас- су команд управления, которые переводят систему из состояния Si (t) в состояниеЗ/ (t + 1) и т. д. Команды носят иерархический характер, и цепочка команд управления на i-м уровне может обобщаться в одну команду управления для i — 1 уровня. Одна команда пред- приятию по выпуску какого-либо изделия вызывает на раз- личных уровнях тысячи команд, ведущих к поставленной цели. Только на этапе подготовки производства дается мно- жество команд: по составлению развернутой спецификации деталей, узлов и сборочных соединений на изделие, ведомос- ти покупных изделий, определению трудоемкости в нормо- часах, расчету потребности в оборудовании и т. п. Аналогич- ная дифференциация происходит на всех уровнях: материаль- но-техническом снабжении, составлении календарных планов и осуществлении непосредственного изготовления детали. Иллюстрацией иерархической организации команд мо- жет служить система математического обеспечения совре- менных ЭВМ, включающая набор макрооператоров. Зада- ния ЭВМ также являются макрооператорными, например: произвести упорядочение массива, найти документы с задан- ными признаками, сделать в чертеже разрез по главной оси 31
и т. д. Каждая из этих макрооператорных моманд распа- дается на сотни, тысячи, десятки тысяч машинных команд на нижних уровнях, вплоть до «физических сигналов», составляющих нижний (технический) уровень ЭВМ. Управление сложными системами предусматривает пост- роение для одной и той же системы ряда моделей, разли- чающихся аспектами в выделении уровней. Такими аспек- тами разбиения моделей на уровни могут быть категории (обобщение по времени, по месту, по типу причинно-след- ственных связей и т. п.), а также по специальным понятиям, характеризующим отдельные классы систем. При анализе производственно-экономической системы уровни могут вы- деляться по всем важнейшим экономическим показателям: объему продукции, качеству, ассортименту, производитель- ности труда и т. д. Таким образом, модель (точнее, система моделей) сложной системы не только многоуровневая, но и многомерная. Основанием этой модели является «фотогра- фия» первого уровня системы, а далее на этом общем осно- вании строится в зависимости от задач анализа и управ- ления множество понятийных иерархических структур. Эффективность управления зависит от числа структур, входя- щих в состав модели системы, их изоморфности объективным свойствам управляемой системы, способности с учетом вре- менных лимитов распознать текущее состояние системы и выбрать из числа управляющих команд оптимальное ре- шение. Эффективность управления в системах социального типа определяется также способностью непрерывно накапливать и хранить информацию о последствиях принятых решений, проводить их анализ, выделяя и запоминая наилучшие решения. Предложенная в работах [43, 661 система имитационных моделей (структуры и законов функционирования объек- та управления, процесса решения задачи управления и процесса управления) составляет содержание гиромата. Слово «гиромат» заимствовано у известного польскогр пи- 32
сателя-фантаста С. Лема. Гиромат — это устройство, ме- няющее свою структуру в зависимости от конкретной зада- чи, которая решается в данный момент времени. Основное качество гиромата в задачах ситуационного управления со- стоит в том, что он содержит в себе набор С-моделей различ- ного уровня обобщения системы и способен ориентироваться на решение конкретных задач методом специального обуче- ния. Предусматривается в процессе обучения гиромата оказание ему помощи учителем, который может сообщить ему свои знания и опыт, что существенно ускоряет обуче- ние. Характер применяемых моделей и участие в диалоговых режимах человека для совершенствования моделей способ- ствуют широкому использованию опыта человека в искус- стве управления, умению человека ориентироваться в ситу- ациях большой неопределенности, способности к распозна- ванию, классификации, наконец, фантазии человека, т. е. всего того, что сегодня еще не удается представить в виде М-моделей. Однако у гиромата было бы несколько «старомод- ное» воспитание, если его не обучать современным математи- ческим методам: линейному и динамическому программи- рованию, теории игр, марковским процессам, теории пла- нирования эксперимента и т. п. Игнорирование точных методов оптимального управления и полная замена их мето- дами, дающими лишь паллиативные решения (не важно, как они будут называться — системным анализом, ситуацион- ным управлением и т. д.), не менее опасно, чем отстранение от процесса принятия решения в системах социального типа человека с его содержательными моделями и эвристиками. Единственно правильным путем совершенствования управле- ния является использование в управлении всего научного багажа и опыта, которые накоплены человечеством, вклю- чая все богатство формальных, содержательных, бионичес- ких, механистических и других моделей. Покажем на нескольких простых (пусть даже искус- ственных) примерах процедуры принятия решений на основе 3 6-3324 33
совместного использования С-моделей с точными формаль- ными методами. Рассмотрим школьную задачу. Дано число abca. Извест- но, что abca = (5с + I)2. Найти число. Методом перебора искать ответ — задача безнадежная. Решение находится путем последовательного уменьшения числа вариантов. Запишем искомое число в виде 1000а + 1006 + 10с + а = = (5с + I)2. Очевидно, что 0 < а < 9, 0 < 6 < 9, 0 < с < 9. Следующий шаг в уменьшении числа вариантов состоит в утверждении того, что 9999 > (5с + I)2 > 1000. Отсюда eg {2, 3, 4, б, 6}, т е. с£{ 7,8,9). В оставшихся трех вариантах значения с должно быть выбрано такое, что- бы число тысяч и единиц в искомом числе совпадали. Этому соответствует с = 8; (5 • 8 + I)2 = 41й. Итак, решением является а = 1, b “ 6, с = 8; искомое число — 1681. Примененные процедуры хорошо известны не только со школьной скамьи, этими способами или разновидностями каждый человек пользуется для принятия решений в многовариантных жизненных ситуациях, на работе и в бы- ту, в играх (например, шахматах), при анализе как коли- чественных, так и качественных факторов. Для одного клас- са задач эти процедуры решения удается формализовать, и они возведены в ранг алгоритма, для других — это лишь эвристические процедуры последовательного анализа ва- риантов, типично «человеческий» способ поиска оптималь- ного управления, его Би-модель. Рассмотрим более сложную задачу последовательного анализа вариантов на примере весьма популярного сюже- та «Ну, погоди!» [12]. На рис. 1 изображена «местность», разделенная на 64 квадрата в соответствии с шахматной дос- кой. Волк, находясь в квадрате а/, узнает о том, что в квадрате h8 появился заяц. Время, необходимое для пере- хода из квадрата в квадрат, различное. Величина этого времени (в минутах) указана на границах между квадрата- ми. Принимается, что волк может перемещаться только по правилам передвижения шахматной ладьи. Известно, что 34
заяц через 28 мин покинет квадрат h8 и станет недося- гаем. Задача состоит в поиске пути перехода с квадрата al в квадрат h8 за минимальное время. Следовательно, одновре- abcdefgh Рис. 1. Оптимальный путь по критерию времени. менно с этим необходимо выяснить — будет ли пойман заяц. Любая траектория с al до h8 состоит минимально из 14 шагов и ее легко просчитать сложением каждого шага по всем выбранным шагам траекторий. Например, путь al — 02—b2—b3—b4—b5—c5—d5—e5—f5—f6—f7—g7—h7—h8 приводит в квадрат Н8 за Т = 108 мин. Очевидно, что эта наугад выбранная траектория не ведет к цели — поимке 3» 35
зайца. Можно было бы перебрать все траектории, но их очень много ( и в реальных задачах слишком много даже для решения методом перебора на быстродействующих ЭВМ). Наукой давно доказано, что не только человек, но и живот- ные ищут возможности сокращения числа вариантов, под- лежащих рассмотрению. Известны многочисленные опыты, подтверждающие, что крысы, помещенные в лабиринт, не только находили путь к пище, но и оптимизировали его. Займемся поиском оптимального пути. Анализ начнем с конца пути, т. е. с квадрата Н8. В него можно попасть с квадрата g8 за 3 мин и с квадрата h7 за 2 мин. Запишем это время в кружки, находящиеся в центре соответствующих квадратов. Эти цифры (3 мин и 2 мин) следует понимать так, что если на предпоследнем (13) шаге попали в квадрат g8 или Л7, то других путей к цели, кроме указанных нет. А вот из других квадратов к цели могут вести несколько альтерна- тивных путей. Так, например, с квадрата/7 можно прийти к цели через g7 (5 мин) или f8 (6 мин). Очевидно, что второй путь неперспективен, и он исключается из дальнейшего рассмотрения. Минимальное время (/min = 5 мин) записы- ваем в кружок в центре квадрата /7. Из квадратов е8, f8 в квадрат h8 минимальный путь по времени проходит по 8-й горизонтали и соответственно равен для е8—h8 (6 мин), f8—h8 (4 мин). Из квадратов h5, h6, h7 минимальный путь по времени проходит непосредственно по вертикали h и соответственно равен для h5—h8 (7 мин), h6—h8 (6 мин), Й7—h8 (2 мин). А вот, например, с квадратов g3, сЗ «выгод- нее» для экономии времени отходить влево от цели соответ- ственно на горизонтали f и b (g3—f3\ сЗ—g3—аЗ). С квадра- тов d3 и еЗ целесообразней двигаться на один шаг вниз, так как путь к цели через еЗ—е2 требует (22 мин), через квадрат е4 (33 мин), а через квадрат f3 даже (36 мин). Таким образом, последовательно переходя от квадрата к квадрату справа налево и сверху вниз, постепенно шаг за шагом находим условную оптимальную траекторию, которая показывает, каким путем нужно идти дальше, если попадем в данный 36
квадрат. При этом последовательно исключаются целые группы вариантов. На предпоследнем шаге определяем условные оптималь- ные переходы (так называемое условное оптимальное уп- равление) с квадратов, непосредственно граничащих с а/, т. е. а2—h8 (28 мин) и Ы—h8 (29 мин). Очевидно, что путь через квадрат а2 экономит 1 мин. Итак, /min = (al — а2 — аЗ — а4 — а5 — Ь5 — Ь6—Ь7~~с7 — -*<17 — е7 — е8 — Ь8 — g8 — h8) 29 мин. На рис. 1 этот путь обозначен волчьими следами. Диаго- нальный путь от al к h8, обозначенный светлыми точками, занимает 170 мин. Если данный путь вообще отбрасыва- ется, то другие, несущественно отличающиеся от опти- мального (например, отмеченный темными точками) при решении реальных задач из дальнейшего рассмотрения не исключаются. Незначительно проигрывая оптимальному пути по критерию времени (в нашем примере всего 1 мин), этот вариант может превосходить его в других отношениях. Ввиду того, что 29 > 28, то зайца и «след простыл», а волку остается произнести свое традиционное «Ну, заяц, погоди»!. Но на сей раз угроза звучит не без оснований. Волк, конечно, запомнил уроки погони, хотя не знал, что описанные выше «естественные» процедуры последователь- ного отсеивания вариантов называются методом динамичес- кого программирования. В основе метода динамического программирования ле- жит принцип оптимальности (или принцип Р. Веллмана). Некоторая политика оптимальна, если в течение данного периода, каковы бы ни были предшествующие решения, решения, которые остается принять, образуют относительно результатов предшествующих решений оптимальную поли- тику. Или, другими словами, как это видно из приведенного выше примера, на каждом шаге ищется такое управление, которое обеспечивает оптимальное продолжение процесса от- носительно достигнутого в данный момент состояния [12, 14]. 37
Одной из разновидностей динамического программиро- вания является известная задача коммивояжера [14]. Суть ее состоит в следующем: имеется п + 1 городов Со, Clt ...» Сп с заданными между ними расстояниями 1ц (i, j = О, 1, ...» п). Необходимо, отправляясь из города Со, выбрать такой маршрут, при котором коммивояжер побывал бы в каждом городе по одному разу, вернулся в Со, и при этом выбранный им путь был бы самым коротким. Рассмотрим эту задачу на следующем примере. Пусть за группой сотрудников некоторой организации (условно назовем ее «ЭВМ — техобслуживание») закреплено 5 горо- дов, в каждом из которых имеется по 5 массивов и в каждом из массивов имеется по 4 вычислительных центра и одна остановка транспорта, обеспечивающая переезд на дру- гой массив. Кроме того, в каждом городе на одном из мас- сивов остановка транспорта находится у железнодорожного вокзала, с которого осуществляется переезд в другой город. Один из городов принимается за Со, т. е. имеется типичная задача коммивояжера (рис. 2, а). Покажем способ решения задачи коммивояжера для вы- бора оптимального маршрута между городами Со, Сх, С2, С3, С4, расстояние между которыми (в километрах) заданы матрицей: Со с, с. Ср 0 150 220 180 300 Сг 150 0 350 120 200 С2 220 350 0 100 160 С3 180 120 100 0 90 С. 300 200 160 90 0 38
s Рис. 2. Маршруты коммивояжера: а — между городами; б — внутригородской для Cv
Уровни (830 км) t (790 км) C.Cj^CjC.Co t III (530 km) C0CiCtCtC< t I (610 km) C0C1C4C.C3 t I 1 | 2 3 I I I CoC.C.C^ CtCtCiCiCt СоСзС^С, (640 км) (700 km) (820 km) I (440 km) (580 km) (470 km) CoC.C.Ci C0CtC4Ct C9C4C4C1 (370 km) CoCjC.C, t I (510 km) t 6 4 (780 km) (430 km) C4C3C4Ct t I 1 2 1 2 CoGC.C, (630 km) 3 4 5 6 7 8 9 10 11 12 I I I I I 4 4 4 4 4 с0с4слс± c4c4ctc1 c9ctctct c0c4c1c1 coc4c3c2 (810 km) (510 km) (650 km) (850 km) (490 km) Рис. 3. Последовательный анализ поиска На рис. 3 показаны последовательные процедуры поиска оптимального маршрута. Вначале составляется перечень возможных вариантов маршрутов, включающих по 3 горо- да и Со (в общем случае анализ можно начинать с вариантов, включающих два, три и т. д. городов, но в нашем случае удобнее начинать с варианта, в котором четыре города, включая Со). На / уровне показаны все 24 возможных ва- риантов маршрута. Так как каждая пара вариантов (1- и 2-й, 3- и 4-й и т. д.) состоит из одинакового набора городов 40
(740 км) CnCtCiCtCiCo (740 км) t (590 км) CoC^C.Cj t (520 км) С'С'С^С, t 9 7 8 4 4 CoCjCjC,^ C0CiCtC3Ct (690 км) (540 км) 10 4 C9CiCtCtCt (750 km) 12 4 СвС,СзС4С, (610 км) (600 km) (440 km) CoCjCgC, CoCj^C, (470 km) C0C,C4C, t (660 km) WA t (360 km) СвС\СзС4 t (410 km) свслс9с< t 13 14 15 16 17 18 19 20 21 Illi 4 4 4 4 СоСз^С, СоСзС^з СвС4С.Сз СлС.С^ (690 км) (620 км) (560 км) (770 км) 22 23 24 I I t 4 СоСяС1С4 С0С,СзС4 (500 км) (440 км) Вари- анты марш- рутов оптимального маршрута коммивояжера. и заканчивается одинаковым городом, то из дальнейшего рассмотрения сразу исключается половина приведенных ва- риантов (12), имеющих сравнительно худшие показатели. На рис. 3 перспективные варианты изображены выше уров- невой линии I (в скобках указаны расстояния между го- родами для каждого варианта). На II уровне каждый из оставшихся вариантов допол- няется недостающим в нем городом, рассчитываются полу- ченные при этом расстояния маршрутов и вновь исключаются 41
худшие варианты (содержащие одинаковый набор городов и заканчивающиеся одинаковым городом). Уже на // уров- не из рассмотренных 12 вариантов перспективных осталось всего 4. Далее включаем в оставшиеся 4 варианта Со, т. е. возвращение в исходный город Со (по условию задачи коммивояжера). В результате остаются два равноценных маршрута, дающие решение задачи: C0CiCiC3C1C0'* и CoCjCsCiCjCo- Этим маршрутам соответствует минимальное расстояние 740 км (на рис. 2, б показаны найденные опти- мальные маршруты). Осталось «волевым» способом выбрать маршрут из двух возможных. Отдадим, например, пред- почтение маршруту С0С2С4СзС1С0 на том основании, что он «по часовой стрелке». Теперь, возвратившись к / уровню, видим, что отобранному маршруту соответствует начальный неполный вариант 17 (С0СаС4Са). Но предсказать этот ис- ход в начале анализа было невозможно, тем более, что на I уровне имелись маршруты со существенно лучшими абсо- лютными показателями. В нашем примере общее число возможных вариантов при п=5 невелико (120), и задачу можно было бы решить простым перебором. Применяя метод динамического програм- мирования, нам пришлось анализировать всего 40 неполных вариантов. Хотя здесь выигрыш всего в 3 раза, но при рос- те п ситуация быстро меняется. При п > 12 число вариан- тов измеряется миллиардами, а при п > 20 получаем числа, соизмеримые с числом атомов во вселенной. В общем случае применение метода динамического программирования в за- даче коммивояжера требует рассмотрения приблизительно 2” вариантов, что, конечно, существенно меньше nl. Вернемся к анализу задачи коммивояжера (рис. 2, а). Предположим, что нет естественного деления на города и массивы, а имеется « = 5x5x5=125 объектов. Не- обходимо методом, описанным выше, найти оптимальный маршрут по всем этим объектам в соответствии с условиями задачи коммивояжера. Число возможных вариантов, под- лежащих рассмотрению, составит 2128 « 10”, что практи* 42
чески неосуществимо. И тем не менее приводимый пример — сравнительно простая задача. И эта «простота» определяется участием в ее решении человека, который сразу же по- строит трехуровневую модель ситуации, что естественным образом разобьет задачу на части, в каждой из которых п = 5. Таким образом, сначала разыскивается оптимальный маршрут между городами, затем в каждом городе — марш- рут между массивами, в каждом массиве — маршрут между объектами (вычислительными центрами). Итого, общее чис- ло вариантов, подлежащих рассмотрению, составляет 103, что не представляет никаких затруднений. Основной прием решения задач динамического програм- мирования большого объема состоит в поиске таких правил доминирования, которые позволяли бы быстро исключать из рассмотрения бесперспективные варианты. Иногда удает-. ся найти столь сильные правила доминирования, что они всего за несколько шагов ведут к цели, однозначно вы- давая элементы оптимальной последовательности. Такие правила доминирования называются разрешающими прави- лами. В реальных задачах, если имеют место диалоговые режи- мы работы с ЭВМ, к правилам доминирования добавляются другие условия, которые могут быть сформулированы как до начала решения задачи, так и в процессе ее решения. Задача может естественным образом разбиваться на уров- ни, как это было показано выше, могут вводиться различ- ные «волевые» ограничения, угадываться по некоторым качественным признакам перспективные варианты и исклю- чаться неперспективные. Нам не известен механизм интуи- ции, пользуясь которым человек сразу исключает из рас- смотрения большинство неперспективных вариантов (на- пример, в шахматах), но пользоваться этими способностями человека при диалоговом решении многовариантных задач необходимо. Любопытно, что задача коммивояжера, которая на про- тяжении десятилетий ставила в тупик математиков, прак- 43
тически была решена без какого-либо формального алго- ритма, а лишь с помощью интуиции. Так, например, сотруд- ники одной из американских фирм (РЭНД) искали маршрут коммивояжера Вашингтон — столицы 48 штатов. Несмот- ря на то, что число возможных маршрутов составляет 10ва, сотрудники фирмы нашли кратчайший маршрут, как ска- зано в работе [39] «... с помощью булавок, куска веревки и своей интуиции». Человек лучше ориентируется в ситуациях, которые легко поддаются классификации по неформальным крите- риям. Например, если в задаче коммивояжера существенно различаются расстояния между объектами (или по признаку расстояния разбиваются на группы). Кроме того, в ситуа- циях, когда объекты расположены достаточно кучно, может быть угадан вариант, несущественно отличающийся от опти- мального. На рис. 2, б показано кучное расположение объек- тов внутри одного из массивов. Минимальный маршрут сос- тавляет 2,1 км. Максимальный (наихудший) маршрут — 3,6 км. Любой «угаданный» маршрут будет 2,1—2,4 км. И, очевидно, в таких случаях решающее значение для выбора варианта имеют не количественные (0,3 км), а качественные признаки. Для нашего примера это может быть красота дороги, зелень, тишина улиц и т.д. Задаче коммивояжера уделено много места, так как к ней сводятся многие важные задачи народнохозяйственно- го, оперативно-календарного и сетевого планирования, распределения ресурсов и др. Выше не обсуждались вопросы о природе информации, которая лежала в основе принятия решения, ее достовер- ности и полноте. Выбор методов информационного анализа и принятия решения нередко определяется характером ин- формации. Одно дело — принятие решения в условиях не- определенности, другое — при наличии полной и достовер- ной информации. В системах социального типа, как правило, решения при- нимаются при отсутствии полной информации, основанной 44
на прошлом опыте. По отношению к данной ситуации — это априорная информация, дающая возможность представлять ее в виде априорной вероятности наступления события. Известная теорема Бейеса, связывая априорную вероят- ность с апостериорной, позволяет уточнять степень правдо- подобия гипотезы Ht (i = 1, 2,..., п) после проведения опытов Р (Hl/А) = _Р (Hi) Р (Л/Hi)— (i = 1 2, ..., п), 2 Р (Hi) Р (А/Щ) i=I где Р (HitА) — вероятность гипотезы Н( после появления в результате опыта события 4; Р (A/Ht) — условная веро- ятность события А при гипотезе Ht. Пример. На фабрике 35% продукции производится ма- шиной Mlt 15% — машиной Мг, 50% — машиной Л43. На основании прошлого опыта известно, что брак составля- ет для Ml 1%, для М2 — 0,5%, для М3 — 2%. В течение дня произведено 10000 единиц продукции. Какова вероят- ность, что случайно выбранная единица продукции из этой дневной партии окажется бракованной? Если она окажет- ся бракованной, то какова вероятность того, что она была произведена Mlt М2 и Л43? Пусть: А — выбранная брако- ванная продукция; Hi — А произведено Нг — А про- изведено Л42; Н3 — А произведено Л43. На основании прошлого опыта (по отношению к анали- зируемой партии продукции — это априори) и условий за- дачи можно предположить, что Р (Нх) = 0,35, Р (Нг) = = 0,15, Р (Н3) = 50%. Подсчитаем значения Р (Ht f) 4), т. е. вероятности того, что отобранная единица продукции 4 произведена i-й машиной и бракована: Р (Ht П >1) = Р (#i) Р (A/HJ = 0,35 • 0,01 = 0,0035; Р (Н2 П Л) = Р (Н2) Р (A/HJ = 0,15 - 0,005 = 0,00075; Р (Н3 П 4) = Р (Н3) Р (А/Н3) = 0,5 • 0,02 = 0,01; з ^Р(Н()Р(А/Н() = 0,01425. £=1 45
В соответствии с формулой Бейеса имеем: Р (HJA) = 0,246; Р (Н3/А) = 0,054; Р (Н3/А) = 0,7. Отсюда видно, что апостериорная информация отличает- ся от априорной (в процентах): для М1 — 24,6% (было 35%), Мг — 5,4% (было 15%), М3 — 70% (было 50%). Приведем еще один пример применения формулы Бейе- са. Пусть в течение месяца от поставщиков поступило 3 партии комплектующих деталей. Из прошлого опыта извест- но, что в первой партии (1-я декада месяца) процент годных деталей равен 99%, во второй партии — 92%, в третьей партии (3-я декада) — 90%. Общее количество поступивших деталей в партиях относится как 1:3:5. Бракованные детали явились причиной брака в гото- вом изделии в 180 случаях. Какова вероятность, что при- чина брака одного из этих изделий вызвана негодными де- талями из первой партии Р (HJA), из второй партии Р (Нг/А) и из третьей партии Р (Н3/А)? Каково соотноше- ние числа бракованных деталей по партиям? На основании соотношения числа деталей в партиях мож- но выдвинуть гипотезы, что Р (НА = 4-; Р (НА = 4~. Р(Н3) = ^. Р (А/Н{) соответственно равны по условию: 0,01; 0,08; 0,1: 5 Р (Hl) Р (А/Н{) = -J-. 0,01 4- 4- • 0,08 + 4 • О,1 = 0,082. Используя далее формулу Бейеса, имеем: Р(Я,М)=4^=0.01; = 0.32; PW4)-4-^-=0,67. Априорная информация давала распределение бракован- ных деталей по партиям соответственно: 20, 60, 100. Исполь- зование столь «грустного» опыта анализа 180 бракованных изделий дало следующее распределение брака по партиям: 46
1-я партия 2 детали, 2-я партия 58 деталей, 3-я партия (3-я декада месяца!) 120 деталей. Приведенные примеры иллюстрируют одно из наиболее распространенных и важных областей применения теоремы Бейеса. Рассчитываемые значения Р (HJA) используются для принятия одной из конкурирующих альтернативных гипотез. Если рассчитанные значения апостериорных ве- роятностей не различаются настолько, чтобы отдать одно- значное предпочтение одной из альтернативных гипотез, то испытание продолжается с последовательной заменой Р на Р (Н^А). Поучительные примеры использования формулы Бейеса (которую справедливо называют также тео- ремой гипотез), в частности, для задач последовательного уточнения достоверности принятой альтернативной гипо- тезы, прогнозирования качества продукции имеются в работах 112, 59, 72]. Однако Бейесовский подход, конечно, не является уни- версальным. Выбор метода принятия решения определяет- ся, кроме других причин, еще и возможными послед- ствиями допущенных ошибок. Нередко именно эти сообра- жения при выборе метода являются решающими. Одно дело допущенная ошибка в прогнозе погоды, от которой зависит наше решение брать зонт или нет, другое дело — вероятность отказа любой детали космического корабля. В теории статистических решений принято разделять ошибки на первого и второго рода. Ошибка первого рода состоит в отклонении верной гипотезы, ошибка второго ро- да заключается в принятии ошибочной гипотезы. Службы управления качеством предусматривают прежде всего соз- дание условий для недопущения ошибок второго рода, ко- торые в условиях кооперированного производства могут при- вести к большим и трудно контролируемым последствиям. Ошибки первого и второго рода могут иметь место во всех сферах деятельности человека. Многие решения в уп- равлении сложными системами принимаются при неполной информации на основании так называемой «субъективной 47
вероятности», т. е. априорных представлений о наступле- нии того или иного события. Эти «субъективные вероятнос- ти», наряду с «объективными вероятностями», неизбежно влияют на принимаемые решения. В гл. 2 будет показан спо- соб «объективизации» этих субъективных вероятностей в моделях «коллективного разума», построенных методом экс- пертных оценок. Отметим лишь, что системный анализ является одним из эффективных способов уменьшения опас- ности допущения ошибок второго рода. Особенно важно ис- следовать ситуации на возможные ошибки второго рода при осуществлении проектов, ведущих к нарушениям экологи- ческого равновесия, создании крупных гидрокомплексов и др. Эффективное управление сложными системами, в конеч- ном счете, зависит от полноты информации, лежащей в основе принимаемых решений, от качества моделей, опи- сывающих системы, используемых для выбора варианта управления, формальных и неформальных алгоритмов, даю- щих возможность учитывать формальные и неформальные критерии, взаимозависимость между многими параметрами. Основными средствами такого системного анализа и управ- ления, осуществляемого на базе ЭВМ, являются информа- ционные параметрические модели, соединенные со специ- альными автоматизированными информационными система- ми (АИС), с обязательным участием человека в процессе выбора решения. Такой синтез моделей системы с АИС дол- жен сопровождаться более богатым набором операторов, чем это имеется. Наряду с традиционными операторами по- иска, изменения, сортировки и т. д., в такой системе долж- ны быть операторы, соответствующие методам оптимального управления. Решение задачи управления можно представить как за- дачу анализа в человеко-машинном режиме параметрической модели объекта управления, в котором параметры, распре- деленные по уровням, связаны количественными и качест- венными зависимостями. Если на каком-то шаге анализа становится очевидным, что управление расчленяется ес- 48
тественным образом на ряд этапов с аддитивным критерием, то применяется метод динамического программирования, подпрограмма для использования которого выведена в ка- честве оператора. Если показатель качества управления представляет собой линейную функцию переменных, огра- ничения на решение также имеют вид линейных равенств (или неравенств), то задача, очевидно, может быть решена (или только часть задачи может быть решена) с помощью методов линейного программирования. Если человек, участ- вующий в диалоговом выборе варианта управления, рас- познает в построенной модели ситуацию, при которой мож- но принять, что будущее развитие системы зависит только от настоящего состояния и не зависит от того, когда и каким образом система пришла в это состояние, т. е. распознает марковость, то нужно иметь возможность обратиться к опе- ратору «марковские процессы *. Выбор того или иного метода анализа вариантов управ- ления нелегкая и не формальная задача. При этом необхо- димо учитывать наличие технических средств, требуемую точность, а главное, фактор времени. Сплошь и рядом мы сталкиваемся с ситуацией, когда лучше посредственное решение сегодня, чем оптимальное завтра. 1.3. ИНТЕГРАЛЬНЫЕ СВОЙСТВА ИНФОРМАЦИОННЫХ СИСТЕМ ИЕРАРХИЧЕСКОГО ТИПА Задачей отдельных областей науки является изучение особенностей структур, свойств и динамики систем различ- ной природы. Однако можно избрать такой подход, при * В книге А. Кофмана и Р. Фора «Займемся исследованием операций» даже мексиканские продавцы кукол успешно осваивают марковские процессы. Автор рекомендует эту книгу читателям, каждый из рассказов которой в форме, полной искрящегося французского юмора, содержит весьма строгое изложение методов исследований операций, необходимых и в системном анализе [49]. 4 6-3324 49
котором с различной степенью глубины описываются общие системные свойства. Конечно, полученные при таком под- ходе выводы не могут быть одинаково полезны для всех целей анализа систем. В книге 155] по этим вопросам справед- ливо сказано следующее: «... в природе существует опреде- ленная иерархическая упорядоченность структур, много- уровневое строение естественных явлений. Что представ- ляет собой уровень, каковы главные уровни — на эти вопросы пока нет определенного ответа; на деле ответ на них в значительной степени зависит от подхода, от интере- сов исследователя и методов анализа». Интересно приве- денное вдесь же мнение по этим вопросам А. Сент-Дьердь: «Если вы попросите химика выяснить, что такое динамо- машина, то первое, что он сделает — растворит ее в соляной кислоте. Молекулярный биохимик, вероятно, разберет ее на части и подробно опишет обнаруженные при этом спи- ральные обмотки. Если же вы намекнете ему, что то, что при- водит в движение машину, возможно, представляет собой не- кую невидимую субстанцию, называемую «электричеством», он обзовет вас «виталистом» [55]. При разработке моделей системного анализа в органи- зационных структурах важнейшее место занимают анализ связей между элементами и вопросы организации управле- ния системой в целом. При этом следует учитывать, что объектом управления, в первую очередь^ являются связи [14]. Приведем пример, относящийся к количественной оцен- ке управления связями [60]. Руководитель А с двумя подчиненными В и С может иметь взаимоотношения отдельно с В и отдельно с С, а также с В и С вместе и, кроме того, должен принимать во внимание отношения, складывающиеся между В и С. Таким образом, при наличии двух подчиненных, имеется минимум 4 различных вида связей (или максимум 6), требующих уп- равления со стороны А, но не 2, как это может показаться, учитывая, что имеется всего 2 управляемых элемента. Ав- торы книги [60] приводят расчетную таблицу роста коли- 50
чества связей как функцию числа подчиненных: при коли- честве подчиненных 2 число связей, требующих управле- ния, 6; при 3—18; при 4—44; при 5—100; при 6—222; при 12—24 708. Автор считает, что эти данные вполне объяс- няют, почему число непосредственно подчиненных должно быть 4—5 чел., а максимальное — не должно превышать 7—8 чел. [60]. Многоуровневая (в частном структура позволяет преодолеть связей, подлежащих управляю- щим воздействиям. Сложность управления зависит не только от числа элементов (и возмож- ного числа связей, возникаю- щих между ними), как это по- казано в вышеприведенном при- мере, но и от разнообразия функ- ций, выполняемых управляемы- ми элементами. Сложность уп- равления должна зависеть от случае иерархическая) этот огромный рост числа at-~ Рис. 4. Схема управления: а — линеЛная; б — иерархическая. длины, структуры и сложности управляющих и управляе- мых информационных цепочек. Очевидно, что к элементу Oj предъявляются различные требования в системе управле- ния в зависимости от структуры. Для линейной системы (рис. 4, а) сложность управления соответственно в парах fli -> а2, а2 а3, • ••» Ял-i ап может различаться несу- щественно, а суммарная сложность управления этой сис- темой зависит только от длины цепочки. Если же элементы системы распределены по уровням и одинаково разнообразны на всех уровнях (рис. 4, б), слож- ность управления уровнями при росте элементов должна расти от уровня к уровню по экспоненте. Однако в реальных системах такой рост сложности управления не наблюдается. Это объясняется прежде всего тем, что элементы, распределен- ные по информационным уровням, различаются своей инфор- мативностью, т. е. своими возможностями управлять связями. 4' 51
Что такое оптимальное управление в условиях различ- ной сложности управления или какие структуры следует считать оптимальными? Это вопросы, которые возникают непрерывно на всех уровнях управления при разработке любых информационных систем. Такие структуры, достаточно близкие к оптимальным, достигались методом проб и ошибок. Например, по отноше- нию к управлению предприятием, как уже отмечалось, считается оптимальным число непосредственно подчинен- ных 4—8. Эти данные естественно относятся к периоду, когда управление осуществлялось без АСУ. Как отмечают авторы работы [60]: «Если обозначить каждый уровень управления прибавлением одной нашивки, то число нашивок у самых высших руководителей промышленности не пре- высит восьми или девяти». Многолетний опыт показывает, что при хорошей систе- ме управления меньше непосредственно подчиненных, но одновременно и меньше уровней (звеньев управления), про- ще коммуникации, больше возможностей анализировать всю информацию (если это необходимо для принятия реше- ния) и т. д. Перечисленные требования к системам управле- ния, список которых можно было бы намного продлить, не- редко являются противоречивыми. Положение существенно усложняется, так как системы управления являются не статическими, а изменяющимися во времени. Поэтому любая система управления, если она не способна совершенствоваться в соответствии с требования- ми динамических систем, ростом элементов, информации и возникающими новыми задачами, может стать тормозом в развитии самой системы. Излагаемая ниже обобщенная модель структуры много- уровневых информационных систем основана на изучении систем и информационных потоков различной природы: организационных структур, потоков научно-технической информации, языковых структур текстов, организации памяти ЭВМ и машинных массивов. 52
Для описания некоторых массивов сформулированы ко- личественные зависимости (например, закон Ципфа для рас- пределения слов и закон рассеяния информации Брэдфор- да). Однако эти зависимости являются следствием более общих информационных свойств организованных систем любой природы, что будет показано ниже при описании модели. Для построения модели многоуровневой системы вве- дем обозначения: W — число элементов системы (или раз- личных слов текста, его словарь); и — ранг (номер элемента) из общего числа W, определяе- мый числом однонаправленных связей, в которые вступает данный элемент с другими элементами системы (1 < п < N). Если подсчет числа связей элемента оказывается невозмож- ным, ранжирование элементов производится на основе дру- гого признака, о выборе которого будет сказано ниже; dlt d2t ..., dn — число однонаправленных связей элемента 1,2, ..., n-го ранга (этому соответствует число вхождений сло- ва из словаря W в текст, если распределение слбвника упо- рядочено по частоте); Ьн — общее число связей системы из W элементов (этому соответствует общее число слов текста), N Dn »= 2 dn\ л—1 рг, р„ — относительное число связей элементов, где Рп = d'JDN (этому соответствует относительная частота вхож- дения слова в текст); in — информативность одного элемента с номером п в упо- рядоченном распределении элементов по числу связей in = — —1пр; Ji — информативность уровня /, Ji = ~~In dni/DN', _____ »Gl X = 1, L — число информационных уровней системы; /->/ +1 — информационное управление элементами уровня/, 53
элементами уровня I + 1 (или для краткости — управле- ние уровнем I уровнем I + 1). В реальных системах имеют место обратные связи типа «<->», однако в нашей модели они не выделяются; Et — сложность информационного управления элемента- ми уровня (или просто управление уровнем) /, Et =— Р In 2 dnilDu, т. е. сложность управления пропорциональна суммарной ин- формативности управляемых элементов (информативно- сти уровня). При описании модели многоуровневой системы принят такой подход, который относится к описанию некоторых ин- тегральных свойств систем с четко выраженными информа- ционными связями. Существенным признаком элемента (уровня) системы является его информативность, которая в модели упрощается до формального выражения —1прп. Однако это упрощение основывается на допущении, что число связей, в которые вступает элемент с другими элементами системы, является информативной характеристикой оценки места элементов в системе. Конечно, подсчет числа единичных связей в систе- ме — задача совсем нелегкая, а нередко просто неразреши- мая. Поэтому приходится искать косвенные пути для оцен- ки информативности элементов. Почему удобны для моделирования механизма связей языковые конструкции? Прежде всего потому, что число вхождений слова в текст (частота), если и не совпадает, то имеет во всяком случае высокую корреляцию с числом свя- зей. Зависимость между уровнем и распределением слов по частоте яснее проявляется в «языковых» системах. Таблица распределения слов в работе «К вопросу о ми- нимизации микропрограмм и схем алгоритмов» дает следую- щее ранжирование по частоте некоторых слов этой работы: автомат — 46; управляющий автомат — 6; конечный авто- 54
мат — 3; автомат Мура — 2; автомат Мили — 2; операци- онный автомат — 2 и т. д. [46]. Эта упорядоченная последовательность слов по частоте и рангу позволяет восстановить некоторую многоуровне- вую классификацию понятий по принципу — чем чаще встре- чается слово, тем на более высоком информационном уровне оно должно находиться. Слово Автомат, являясь цент- ральным в семантике указанной работы, проявляет свое «лидерство» (т.е. высокую информативность) через связи, в которые оно вступает с другими, менее часто встречающи- мися в данной ситуации понятиями. Следует указать на то, что эти связи не обязательно бу- дут иметь жесткий иерархический характер. В таких мно- гоуровневых понятийных системах (тезаурусы, информа- ционные классификации, структуры текстов) жесткой ие- рархии не удается построить не потому, что не умеем это делать (или не договорились о правилах), а потому, что не существует такой жесткой иерархии. В практической работе при разработке ИПС исходят (с оговорками или без них) из наличия корреляции между ин- формативностью элемента, его местом в системе понятий и частотой встречаемости термина, т. е. числом связей, в которые элемент вступает с другими элементами. Так, на- пример, Г. Сэлтон говорит об этом следующее: «Было бы по- лезно иметь некоторый общий алгоритм построения иера- рхических предметных классификаций. Эта тема в течение многих лет привлекала внимание многих людей, включая математиков, философов и библиотекарей. Очевидно, что широкие понятия должны располагаться недалеко от вер- шины дерева (близко к «корню»), тогда как узкие поня- тия — близко к нижней части (близко к «листьям»), кроме того, по-видимому, существует какая-то связь между час- тотой встречаемости данного понятия в фонде докумен- тов и его местом в иерархии» [79]. В предложенной модели распределение элементов по уровням и выделение уровней производится лишь по 55
одному аспекту — числу связей (частоте вхождения слова из словаря W в текст). Это, конечно, не дает ответа на воп- росы о количестве элементов на уровне и пороговых зна- чений информативности для отнесения элемента, скажем, к уровню I или I + 1. Отсюда не следует прямого ответа о количестве уровней в системе и, наконец, об «истинной» а б Рис. 5. Многоуровневая система: а — иерархическая структура; б -» «гиперболическая лестница». (естественной) структуре системы. Но все перечисленные — это не формальные, а содержательные задачи, требующие исследования отдельных систем с применением специаль- ных средств, хотя при этом существенную пользу могут дать и формальные методы, включая методы моделирова- ния. На рис. 5, а показана схема многоуровневой системы с L уровнями (глубина системы). Каждой точке координаты X соответствует некоторое значение информативности -—1прх = •—lndx/Djv, wdx — число возможных связей, в которые потенциально может вступить элемент, находящийся на со- ответствующей глубине X. Многоуровневые системы часто представляют в виде распределения типа «гиперболическая лестница» (рис. 5, б), при котором элементы от 1 до W упорядочены по значению основного признака (например, по числу вхождения слова 56
из словаря в текст) или в общем случае упорядочены по числу связей. Примем, что между многоуровневой системой и «гипер- болической лестницей» можно установить некоторое соот- ветствие. Каждой точке глубины (координаты X) соответ- ствует какое-то количество элементов из W. Пусть dxn — это число однонаправленных связей эле- мента, находящегося на уровне х системы с ранговым номе- ром п в распределении. Общее число различимых структур (или состояний системы) при условии, если задано множест- во значений {dn, d12, • • • 9 ^2т 9 • • • » dxm duy] И D/у, Q — ____________, /1 1\ dul d12l ... I dxn\ ... ! dLN\ где dn + d12 + ••• + dxn + ••• + dbN = D#. (1-2) Основанием для соотношения (1.1) является совпадение числа вхождений элемента в систему (текст) и числа по- являющихся в результате этого однонаправленных связей. Для обеспечения аддитивности при «складывании» струк- турных свойств подсистем перейдем к логарифму числа структур J = In S DN J = In ----г-з—r • (1.3) du! d12! ... I dxn\ • • • ! dLN\ По формуле Стирлинга In Dn! ~ Dn In Dm — Dm- Отсюда J = Dn In Dm — Dm — d-ц In du -j- dn — di2 In d12 ~F di2" * * * ••• —dbN Ind LN + dbN9 (1.4) с учетом выражения (1.2) имеем J — Dm In Dm ~~ du In du di2 In di2 • • • — d^M In dt,M- (1.6) 57
Снова, применяя (1.2), можно записать J = (dn 4" diz 4" * * • 4" dxn 4" • • • 4" duy) In Dm —» ““* du In di2 In di2 In dt,M. (1.6) И далее J = du In Dm 4" ^12 In Dn 4~ • • • 4~ dxn In Dm 4~ • • • 4" 4” dLM In Dm — * • * — du In du — In dj2 * * * ••• —dtNlndLN- (1.7) Сгруппировав соответствующие члены и разделив их на —Dm, получим j=-DW(4Lin42-+4^,п41-+ ••• + \ UN UN UM UM I dxn . dxn . . dLN |_ dLN \ n Qx + -n~ ln“n---Ь ••• +~D~ ln-D----- ’ (L8> UN UN UN UN / Обозначая Pi^d^/Dn, где I = 1, N; X = 1, L, имеем N J = — DN^ipi\n pt. (1.9) i“l Значение J численно совпадает с энтропией в теории информации Шеннона, но, как будет показано ниже, допус- кает существенно другую интерпретацию. Выражение — Sp^lnp^ является математическим ожи- данием информативности, определенной как ixn = —\ndx/DM или средней информативностью одной связи, a J = N = DmI^ Pi-Inpt — общая информативность системы, сос- 1=1 тоящей из W элементов и имеющих Dm связей. Определим некоторые формальные свойства организо- ванных информационных систем. Каждый из уровней сис- темы (или ступенек распределения рис. 5, а) состоит из Р/Л^ элементов, где р/ — относительная частота, т. е. р/ = = Nj/N, Nj — число элементов /-го уровня. При этом jWpy = yv, так как Vp/ = I. i' / 58
Внутри уровня (или соответствующих уровню ступенек) нумерация элементов по рангам (номерам) произвольная (если нет дополнительных условий для ранжирования). Примем, что изменение места элементов в пределах рангов (номеров), которые принадлежат уровню, не приводит к су- щественным изменениям состояния системы. В пределах каждого уровня или ступеньки (хотя сле- дует оговорить, что между уровнем и ступенькой нет пол- ного соответствия) имеется (р/AZ)! возможных перестано- вок, не изменяющих состояние системы, а всего в много- уровневой системе (или распределении «гиперболическая лестница») из N элементов будет (рх N) ! ...! (plN) I та- ких перестановок. Примем в качестве одного из признаков организован- ности системы (Z) значение логарифма отношения возмож- ного числа перестановок, которые не изменяют состояния системы (т. е. перестановки только в пределах одного уров- ня), к полному числу перестановок в системе из W элемен- тов, где все элементы принимаются одинаковыми по зна- чению информативности, т. е. 7 . (Pi/V)l (P2/V)l !(Р^)1 Z = —In---------------------------(1.10) По аналогии с предыдущим выводом (1.3) получаем L z = _#2 pjnp,. (i.ii) <=i Выпишем рядом выражение (1.9) N J — Dn 2 РJn Pl. 1=1 Выражение (1.11) существенно зависит от роста числа элементов при переходе от уровня (ступеньки) к уровню, в то время как выражение (1.9) определяется информатив- ностью элементов, точнее уменьшением информативности элементов при переходе с высших уровней на низшие. 59
Организованность системы зависит от соотношения па- раметров выражений (1.9) и (1.11). Очевидно, что в выраже- нии (1.10) Z = 0 при равенстве числителя и знаменателя. Этому соответствует одноуровневая система, в которой все элементы одинаковы по величине информативности. Если задано число элементов Af, выражения (1.10) и (1.11) имеют максимальное значение при таком законе рас- пределения для р, который обращает в максимум —2pJnPp /—1 Дальнейший анализ модели многоуровневой информаци- онной системы основан на весьма сильном допущении того, что в организованной системе из W элементов имеет место следующее: 1) средняя информативность одной связи максимальна, 2) число связей в системе минимально, 3) сложность управ- ления каждым уровнем одинакова. Найдем экстремум (максимум) выражения (1.11) при условиях: 2р<=1; (1.12) i«=l L 2р/* = Л; R€(0, L]. (1.13) f=l Введение условия (1.12) очевидно, а условие (1.13) указывает, что функция Z имеет математическое ожидание, т. е. координата «центра тяжести» системы из W элементов делит систему на две части с равным числом элементов. Одновременно предполагается, что в общем случае Рх^Рг^ =/= Рд. (1.14) Для нахождения условного экстремума функции Z методом Лагранжа запишем вспомогательную функцию Д / L \ / L \ F (2) ™ — S Pi 1° Рг 12 Pil — RI 4* ^212 Pl — 11 • i=l \i=l / V=1 / (1.15) 60
Отсюда имеем систему уравнений ------1пр<-1+М + *2 = 0; (1.16) 2р(1«Я; (117) 1=1 iP/=i. еле) Из формулы (1.16) следует р< = /*'+*’-' в /«“'«А. (1.19) Подставив выражение (1.19) в формулу (1.18), получим 1=1 ex,_1 2 е1’1* = ек‘~' (?' + е2К' + езк' + • • • + eLKl). (1.20) 1=1 Учитывая, что выражение в скобках (1.20) является гео- метрической прогрессией со знаменателем, равным е\ записываем 1,_1 Л (Л£ — 1) ‘ г.._, Отсюда Подставив формулу (1.21) в выражение (1.19), получим — еХ,_1 А р‘“ Л(Л£-1) eM-i И, наконец, положив V (Хх) = ~ » имеем . (1.22) Таким образом р, (I — 1, £), доставляющее максимум Z, может рассматриваться как однопараметрическое 61
семейство функций. При этом, если Xj > О (Xj < 0), то растет (убывает) с ростом i. При описании формулой (1.22) свойств «гиперболичес- кой лестницы» (см. рис. 5, б) > 0, так как с ростом i число элементов уровня растет. Это подтверждается анали- зом статистических данных различных по типу многоуров- невых систем. Параметры экспоненциального роста числа элементов при переходе от ступеней с высоким значением dn к ступе- ням с меньшим значением можно определить, исключив используя условие (1.17). Однако в нашей задаче эти па- раметры экспоненциального роста элементов будут опреде- лены из других условий при совместном анализе выражений (1.9) и (1.11), определяющих организованность многоуров- невой системы. Приступим к анализу выражения (1.9), предваритель- но заменив операцию суммирования операцией интегри- рования и введя при этом новые пределы: оо J = — Dn j р (х) In р (х) dx. (1.23) Возможные ошибки, связанные с переходом от суммы к интегралу, а также правомочность принятых выше допу- щении оцениваются на основе сравнения следствий из мо- дели со статистическими данными. В выражении (1.23) имеется два сомножителя: Dn — общее число связей системы из N элементов; оо — j р (х) In р (х) dx — «средняя» информативность одной Q СВЯЗИ. Сформулируем задачу следующим образом. Необходи- мо найти такое распределение р (х), которое обращает в максимум среднюю информативность одной связи, обеспе- чивая минимальное значение числа связей Dn- Значение min max J (переменная у будет строго определена ниже) V Р 62
будем искать в два этапа. Сначала найдем max I — J р (х) In р (х) dx j (1.24) \ о J при условиях: j р(х) dx = 1; (1-25) о М (х) = j р (х) xdx = tn. (1.26) о А затем будем искать условия существования структуры с минимальным числом связей. Использование для дальнейших выводов заданного зна- чения математического ожидания М (х) и, следовательно, принятие в качестве случайной величины числа уровней системы опять-таки, как и в предыдущей задаче поиска вы- ражения для р(1 основано на возможности интерпретации математического ожидания как координаты «центра тяже- сти» системы. При этом точки X (хп х2....хд) соответствуют глубине многоуровневой системы, т. е. ее уровням. Таким образом, значением случайной величины X является соответствую- щая каждой точке информативность. При заданных условиях поиск р (х), обращающей в мак- симум выражение (1.24), осуществляется также методом Лагранжа [19]: -^- = -lnp — I— М-]-Х2 = 0; (1.27) Ф! = —plnp; -^-= —,np —1; (1.28) Ъ = Р-' = (1,29> 63
Фз=*р; = *; (1.30) — Inp—1 4-^i + M^O. (1.31) Отсюда р = ек‘~'ек‘х. (1.32) Подставив выражение (1.32) в формулу (1.25), получим ? eK,~leK,x dx = ^—eK,xeKt~l Т = 1; о Л'2 о — а4-1 = 1; — ^ = Л-1. (1.33) Подставив это выражение в формулу (1.26), получим оо f — K^xdx = т; ----iL(X2x— 1)Т = —j- = m (при X2<0); (1.34) ла о а2 Х2 =---(1.35) Учитывая формулы (1.33), (1.35), выражение (1.32) за- пишем в следующем виде: X 1 т р(х) = -^-е . (1.36) Выражение (1.36) является решением задачи поиска плотности распределения, обращающего в максимум инте- гральную функцию (1.24). С учетом выражения (1.22) за- висимость между числом элементов п и уровнем системы X имеет вид X = x04-rlnn. (1.37) В формуле (1.37) определим значение величин х0 и г из начальных условий и р (х)п (х) = const. Это требование 64
согласуется с нашим определением организованности си- стемы и принятыми допущениями. Принятое допущение ос- новано на анализе достаточно представительных статис- тических распределений [93]. Положим п = аех/1ХП, где ут = г. (1.38) Определяя а при х = 1, п = 1, имеем а = е~'/ут . Отсю- да X 1 1 п = е /е v'n ; р (х) п (х) = \/те т ; (1.39) соответственно x=ymlnn-|-l. (1-40) Определение значения х в выражениях (1.37) и (1.40) является по сути определением параметров найденного вы- ше экспоненциального роста числа элементов как функ- ции уровня [см. формулу (1.22)]. Учитывая формулу (1.40), записываем р = ае~. (1.41) где 1 а = 1/е V"1 ЛГ. Подставив выражение (1.40) в формулу (1.36) и приняв 1 1/те т = с, имеем __ с Рп~пу' (1.42) Или учитывая, что N — dn = -±- Dn=^-^-- (1.43) UN пУ л-1 пУ Полученные выражения (1.42), (1.43) формально совпа- дают с известным законом Ципфа [94], который на основе 5 6-3824 65
статистического анализа сформулировал зависимость меж- ду частотой вхождения слова в текст и его рангом (номером). Было показано, что формулы (1.42), (1.43) удовлетвори- тельно (хотя далеко не всегда) аппроксимируют ступенча- тую функцию, которая получается при упорядочении сло- варя (AQ по числу вхождения каждого слова этого словаря в текст. В ряде исследований высказывались предположе- ния, что в распределении Ципфа проявляются оптимизи- рующие свойства систем [45, 54, 88]. Перед определением условий существования минимума числа связей в модели системы из N элементов следует ука- зать одну из существенных причин, делающих минимальное число связей (при соблюдении других условий) важной ха- рактеристикой организованности системы. Если система построена так, что каждый элемент свя- зан с каждым, то общее число однонаправленных связей S = /V(/V—1)«М2. (1.44) Таким образом, сложность управления (объектом уп- равления является прежде всего управление связями) долж- на расти по меньшей мере как квадрат числа элементов. Но еще быстрее числа связей увеличивается количество ин- формации, требуемой для оптимального управления. В применении к экономическим системам В. М. Глушков ука- зывал, что «в современную эпоху сложность объективно не- обходимых задач управления растет быстрее, чем квадрат числа людей, занятых в экономике». И далее «суммарная сложность объективно необходимых задач управления рас- тет быстрее общего числа связей, существующих в экономи- ке» [14]. Это объясняется тем, что, кроме связей между людьми, возникают и такие задачи управления, которые не зависят от существующих организационных форм, по- скольку они определяются не этими формами, а объективно существующими материальными потоками. Примерами та- ких задач являются задачи согласования потока выпускае- мой продукции с потоками материально-технического снаб- 66
жения или задача распределения задания между отдельны- ми единицами оборудования. Первый информационный барьер в экономике был дос- тигнут тысячелетия тому назад и вызвал изменения в тех- нологии управления, основанном на изобретении двух ме- ханизмов, позволяющих распараллелить решение задач управления. Первый механизм относился к области органи- зации и состоял в использовании вместо одного руководи- теля иерархических систем управления. Второй механизм экономического характера основан на введении рыночных (товарно-денежных) отношений [14]. И это было достаточно действенно до появления второго информационного барьера. В период научно-технической революции повысить эффективность управления связями только на основе вышеприведенных изобретений уже нель- зя. Тем более, что перед управлением возникли новые зада- чи, которые ранее не ставились, что определило создание автоматизированных систем управления, поиска и анализа информации. Однако независимо от применяемых средств обработки информации, одним из критериев оптимальной организа- ции управления системой остается требование, чтобы, не ухудшая качества управления, количество необходимой для анализа информации в каждом звене управления и суммар- но в системе было как можно меньше. А это определяется числом подлежащих управлению связей системы. В представленной модели анализ условий существования минимума числа связей упрощен и сводится лишь к анализу изменений параметра у в выражении (1.42). С учетом выражения (1.42) можно записать л/ Dn ~ ф (?) ~ С U л=1 c'nN> п I N'~\ у<1; у = 1; » Т> 1. (1-45) 5* 67
Параметр у, являясь коэффициентом пропорциональ- ности в выражении X = х0 + ут\пп, характеризует в некотором смысле структуру системы, порядок «ветвления» многоуровневого дерева и, следовательно, число связей на каждом уровне и в целом в системе. Поэтому формально задача состоит в поиске такого у, N при котором Dn = 2 имеет минимальное значение. Это П=1 •начение находится путем дифференцирования функции (1.45) по у и решения полученного уравнения относитель- но у: 4г -Uh— 1п")=°- (1-4в) Отсюда V = 1 ПТУ ‘ Очевидно, что при этом значении у в соответствии с форму- лой (1.46) общее число связей системы DN имеет порядок N In N, что существенно меньше №, которое можно было бы ожидать по формуле (1.44). В соответствии с выражением (1.46) имеем при N = 10* у ~ 0,8, а при N = 106 ... 10е у « 0,9. Определим далее другие параметры модели многоуровне- вой структуры. Параметр с по определению с = —Ц—. Од- те нако получить оценку с на основе формулы (1.41) нельзя, так как не известно значение «средней» глубины системы М (X) = т. Поэтому предварительно определим с из ус- ловий нормировки /V ОО £ V1-v 1-Y, ’ 0< :т<1; 5 Рп^ \Pndn= 1 “ с In /V, у=1; (1-47) л=1 Q с Y-1 ’ ► 1. 68
С учетом выражения (1.47) имеем 1 In W у— 1, у~ 1. Так как dmln «= 1, то из выражения d лучаем грубую оценку для С с» • т= 1; (1.48) С 1 —— = 1 по- C^Ny. (1.49) До сих пор рассматривались с яг и С — cDN в качестве констант распределения и модели системы. Од- нако такая статическая трактовка модели информацион- ной многоуровневой системы не обязательна. Вполне можно принять, что С = <р (Af), т. е. информативность элемента первого ранга может увеличиваться при росте N. В этом случае статическая модель приобретает некоторые динамические свойства. Более того, если происходит изме- нение у в соответствии с формулой (1.46) и Св соответствии а (1.49), то система продолжает сохранять оптимальную орга- низацию и обеспечивать min max J. Если же С ° const, V Р то рост N приводит к ухудшению организованности системы. При переходе от статической интерпретации модели к динамической можно определить условия достижения экс- тремума информативности и числа связей и для 1. При С — const Dn никогда не достигает минимума, так как из дОкг С - ду « ( pi = 0 следует, что Dn минимально при у->оо. Если принять, что С «= Ny при у>0, то при/Zv =* «= и —(In N (у — 1) — 1 ] -0 получим V-1+тйТ- (1-50) 69
Отсюда следует, что при С = f (Af) у = 1 ± е, (1.51) где е ~ П^лГ для V < 1 и Т > 1 - Эти оценки значения у согласуются с работами ряда ав- торов, проводивших статистический анализ текста и обна- руживших, что имеют место случаи у > 1, но значение у на- ходится в пределах, определяемых выражением (1.51). Например, К. Шеннон при расчете энтропии английского текста принимал у « 1, с « 0,1 [87]. Одним из самых сложных вопросов является моделиро- вание оптимального числа уровней информационной систе- мы. «Проблема количества звеньев управления непосред- ственно связана с проблемой ограничения числа подчинен- ных, относящихся к одному и тому же начальнику, и реше- ние одной проблемы препятствует решению другой. Они на- ходятся как бы в противоречии друг с другом» [60]. Описанная ситуация является общей для всех много- уровневых систем, включая информационные классифика- ции. При организации любой системы имеет место противо- речие между «количеством звеньев» и «числом подчиненных», хотя в применении к информационным языкам это может называться «широтой и глубиной индексирования». Ч. Ми- доу, например, утверждает, что «широта может быть уве- личена или уменьшена независимо от глубины, однако глу- бина содержит в себе некоторую компоненту широты, и изменение глубины обязательно приводит к изменению широты. Если мы зададим вопрос, какую желательно иметь глу- бину и широту поискового образа, то перед нами сразу же возникает много проблем...» [57]. И разрешаются эти проб- лемы «глубины и широты» исходя прежде всего из целевой функции системы и сформированных на основе этого кри- териев оптимальности, которые, конечно, различны для различных систем. 70
Однако имеются и некоторые формальные ограничения на число уровней и число «подчиненных», вытекающие из свойств анализируемой модели многоуровневой системы. Модель информационной системы описывается двумя функциями, одна из которых р (х) убывающая, другая р (х) возрастающая. Очевидно, имеется точка x*g (1, L] (где L— число уровней системы), в которой функции р (х) и р (х) пересе- каются. Для удобства изложения положим а = Meyrn N, b — Мт и найдем координату х* точки пересечения функ- ций р = Ье~^ ир = ае^~ ; Ье~ = ае~^ • Логарифмируя левую и правую части и решая уравне- ние относительно х, получаем Х* = Т«(1п^—Ino) t (152) ИЛИ * 1 4- ут In N — ут In т 1 . 1 КТ । ч х = 1 ------~ — + -j- ym (In /V — In п). (1.53) Оценим далее предварительно значение L из условий: p(0) = p(L); p(L) = p(0); р(0) = —; р(£) = е W L т Отсюда L = 1 + mlnW— mlnm. (1.54) Сравнивая выражения (1.53) и (1.54), видим, что точка х* близка к х/2 и превращает эту точку в центр устойчивос- ти информационной системы, по обе стороны от которого (по координате х) расположены на приблизительно одина- 71
ковых расстояниях другие «центры тяжести» системы: ма- тематическое ожидание функции р (х), равное /и, и матема- тическое ожидание функции р (х), которое назовем Й. Ниже дана оценка соответственно М (р) = т и М (р) = й. 1 По определению с = \/пгет. Учитывая выражение (1.48), записываем — 1 — 1 1 С“ in Л/ “ _±_ ’ (1.55) те т Intf т,= ’ (1.56) е т В точке х* р (х*) = р (х*), поэтому L 1 еут N те 2т е т С учетом (1.55) имеем 1 In N е n L , , , КТ 1 1 л; । 1. ----:— =----т— ;-------к In In /V =---h In /V Н----; 1 L m ' m ' ym еУт e m (1.58) L — 2 [ L «In N\ —i i при 1 , (1.59) In Af — In In W r (m«l. L м (P) = s Pit «= Q. (1.60) Для получения оценки (1.60) заменим операцию сумми- рования операцией интегрирования L х х L М(Р) = 4- J ^xdx “ hsr - ') I 72
где efm N л»(Р) = -^[г’” Ц--1)- 1_ — е v- (_!-------! \ ут Приняв ут яв 1, получим м (Р) - -Vn е vm N (1-61) 1 После подстановки выражения (1.53) в формулу (1.61) имеем для М (р) « 1пЛ7, т. е. координата матожидания функ- ции р находится вблизи L-ro уровня. Оценим число элемен- тов, находящихся на уровне х ™ 2, 2 N* |ж=2 = -Ц— ; N к=2 = ф (у, т). е~у^ При у = 0,9 ... 1; т = 0,5 ... 1 имеем т = 1 « 3; m = 0,9 №"«3; 7=1 m = 0,8 /V*«4; m = 0,5iV*s=7 ... 8; m = 0,9 N* = 4; (1-62) y = 0,9 m = 0,8 N* = 5; m = 0,5 N* = 9. 73
Приведенные тривиальные расчеты показывают, что чем меньше /п,т. е. выше информативность элемента первого ранга и 1-го уровня, тем больше элементов может нахо- диться в «подчинении» на втором уровне. С учетом полу- ченных формальных оценок для т следует, что N* | х=2 на- ходится в границах 3...9 элементов. Моделирование воз- можного числа уровней основано, кроме приведенных выше формальных соображений, на следующих ограничениях. 1. Максимальное число уровней L должно быть «кратно» числу связей'/частоте) реализуемых элементом 1-го ранга « С. Отсюда Lmax = —т. е. /у1—Y 1 -Y Lmax. — I In N —Ц- = In N I Y- 1 = elnW (1.63) 2. Минимальное число уровней L = 2 (случай L = 1 не свойственен организованной системе). 3. Число уровней «регулируется» требованием соблюде- ния равенства информативности и, следовательно, равенст- ва сложности информационного управления уровнями. Проведенный анализ многих статистических данных рас- пределений типа «гиперболическая лестница», относящих- ся к различным информационным системам (распределения частот слов, журналов, публикаций, ссылок и др.), показы- вает, что в первых рангах у > 1 (иногда у 1), далее у < 1, в «хвосте» распределения у < 1, а в среднем у» 1. В связи с этим (оставаясь в рамках формальных требо- ваний модели), если d± < (d^ + d3), вместо единоличного «лидера» возникает потребность в коллективном лидере, т. е. L Du/di + d2. (1-64) 74
4. Учитывая требование оптимального значения у, обес- печивающее min Dn (т. е. у = 1--» и dmin = 1 (при этом С имеем L < AHn V L 2 ln N (1.65) Л/V 3 х ' *v+4- Число уровней при С = const L<-^-lnv/C- (1.66) □ Выше отмечалось, что одним из адаптивных свойств сис- темы является возможность осуществлять переход от струк- туры, где каждый элемент связан с другим лишь единич- ной связью, к многоуровневой, иерархической. Этот про- цесс сопровождается появлением «мультиграфной» органи- зации, при которой единичные связи синтезируются, обобщаются, и между элементами соседних уровней обра- зуются каналы связи. Особенностью такой иерархической структуры является наличие в системе каналов связи с различной «пропускной способностью», исчисляемой числом содержащихся в них единичных связей. Однако в такой высокоорганизованной системе, каким является естественный язык, сохранились единичные, не- посредственные связи между словами. Но наряду с этим, имеется нечто более существенное для выражения семанти- ки по сравнению с единичными однонаправленными свя- зями между словами — это понятия, включающие в себя коллективы слов. Система понятий — это уже иерархия или во всяком случае многоуровневая система, при которой между поня- тиями «проложены» каналы связи с различной информатив- ностью (пропускной способностью). Оценим изменение «пропускной способности» каналов связи как функцию уров- ня, определяемую Qx = D//Nxt где Di — число единичных связей, приходящих (исходящих) на уровень (Di = const 75
для организованной системы), Nx — число элементов уровня. Примем Dn « С In N при у ss 1 и L 2/3 In N. Исполь- зуя приведенные выражения и формулу (1.39), запишем 1 n _ dn _ ЗСе^ LN* = -±_ 2е т При х-1 Q1 = 4c: х=2 Q2 = — (1.67) 2е т Оценим значение Xl, при котором QL = 1 (т. е. пропуск- ная способность канала — одна единичная связь), ЭСеУ" = 1; ЗСе т в 2ет . Xl _mlnc. (1.68) 2е~ В сформулированных выше основных исходных принци- пах построения модели легко просматривается их анало- гия с термодинамическими характеристиками физических вероятностных систем. Прежде всего эти аналогии очевид- ны принципам и приемам обоснования наиболее вероят- ностных распределений в статистике Максвелла — Больц- мана [81. Эту аналогию можно продлить и дальше. На основе анализа числа и структуры связей системы определим ее некоторые «энергетические» свойства. Для этой цели введем интегральную характеристику системы, кото- рую назовем «информационной энергией» системы F. По аналогии с расчетом полной энергии сигнала в теории свя- зи примем, что N F-^d2, (1.69) л—1 76
или с учетом формул (1.43) и (1.51) N О7о> Отсюда следует, что «информационная энергия» растет пропорционально квадрату числа элементов. Этот вывод совпадает с так называемым уравнением Ланкастера, со- гласно которому эффективность боевой группы пропорцио- нальна квадрату ее величины [22]. Но это имеет место лишь для организованных систем с определенной структурой и числом связей. В противном случае уравнение Ланкастера вряд ли будет верным. Например, эффективность деятель- ности любого коллектива никогда не растет автоматически по мере увеличения числа сотрудников. Ухудшение «удель- ной» эффективности в крупных коллективах нередко объяс- няется ухудшением управления, т. е. ослаблением структур- ных связей. ГЛАВА ВТОРАЯ ИНФОРМАЦИОННЫЙ АНАЛИЗ В СИСТЕМАХ ПЛАНИРОВАНИЯ И УПРАВЛЕНИЯ 2.1. СИСТЕМНЫЙ ПОДХОД В АНАЛИЗЕ ЭКОНОМИЧЕСКИХ СИТУАЦИЙ Одним из важнейших средств повышения эффективности общественного производства является совершенствование управления народным хозяйством. Происходящая науч- но-техническая революция непрерывно усложняет задачи управления. Это связано с огромным ростом номенклатуры выпускаемых изделий, резким увеличением средней слож- ности изделий и сложности технологии их производства, 77
существенным уменьшением срока сменяемости изделий. Наконец, научно-техническая революция породила необ- ходимость управлять самим научно-техническим прогрес- сом. Может показаться, что хорошо организованное плани- рование само по себе избавляет от ошибок в принятии ре- шений. Но как справедливо утверждает Н. Н. Мойсеев, планирование — это лишь одна из процедур, которая не- обходима для реализации планомерного развития социа- листической экономики. Ошибка, допускаемая при выборе целей, не может быть исправлена хорошей системой пла- нирования. Если неправильно определен вариант размеще- ния производительных сил, то безукоризненная система планирования, положенная в основу уже заданной альтер- нативы, может привести даже к худшим последствиям, чем если бы эта система планирования была не так хороша 158]. Более общим по отношению к планированию является управление, которое включает и задачи по выбору целей, и совершенствование самих методов планирования. Если развитию экономики не сопутствует соответственное со- вершенствование управления, то устаревшие формы и ме- тоды управления неизбежно приводят к увеличению потерь. Одним из важнейших направлений повышения эффек- тивности народнохозяйственного управления является раз- работка и внедрение автоматизированных систем управле- ния. При этом главной задачей АСУ становится обеспече- ние оптимального функционирования объекта управления (завода, НИИ, отрасли и т. п.) как единого целого на основе правильного выбора целей, альтернатив их достижения, координации работы между всеми элементами и уровнями системы. В работе [181 сформулированы принципы, определяю- щие эффективность АСУ. 1. Принцип новых задач. АСУ создаются прежде всего не для автоматизации традиционных работ, а для решения 78
задач, которые без ЭВМ нельзя принципиально решать,— это задачи технико-экономического анализа, призванные обеспечить полноту, своевременность и близкое к оптималь- ному решение. 2. Принцип системного (комплексного) подхода. Внедре- ние АСУ открывает возможности для коренного усовершен- ствования системы экономических показателей, методов стимулирования путем проведения с помощью ЭВМ анали- за возможных последствий от принимаемых решений. Комплексность в создании АСУ сопровождается изменени- ем форм документов, изменением в структуре органов уп- равления, форм контроля и ответственности и т. д. 3. Принцип единства информационной базы. На машин- ных носителях в АСУ накапливается (и постоянно обновля- ется) информация, которая затем может использоваться для решения различных задач управления как непосред- ственно на предприятии, так и в отрасли, и в Госплане. 4. Принцип непрерывного совершенствования АСУ. Управление экономическими системами независимо от применяемых средств обработки информации требует соб- людения и других принципов, основанных на опыте управ- ления коллективами. К ним относятся: ограничение чис- ла подчиненных у одного руководителя, необходимость чет- кого определения функций, персональная ответственность, обеспечение правильного соотношения между централиза- цией и децентрализацией, гибкость управления, единство подчинения, создание творческой обстановки в коллекти- ве, контроль и проверка исполнения и многие другие. В системах организационного управления, основанных на широком использовании современной вычислительной техники, предпочтение дается не автоматическим (полная централизация обработки информации и управления), а автоматизированным системам, допускающим любой уро- вень децентрализации управления. Задача совершенствования управления предприятием предполагает совершенствование основных функций управ- 79
ления. На предприятии такими функциями управления являются: управление технологической подготовкой производства (конструкторская и технологическая подготовка); технико-экономическое управление, включающее тех- нико-экономическое планирование и бухгалтерский учет; управление материально-техническим снабжением; оперативное управление основным и вспомогательным производством; управление качеством; управление сбытом, кадрами, качеством и финансами; разработка нормативного хозяйства. Совершенствование управления на предприятии может осуществляться различными средствами: организация опе- ративного внедрения новой техники и технологии, осу- ществление культурно-бытовых мероприятий, система по- ощрений, внедрение современных средств переработки ин- формации и т. п. Необходимо отметить, что совершенствование управле- ния не может быть полностью решено в пределах одного уровня управления: ряд функций управления может быть усовершенствован непосредственно внутри (т. е. силами отдельного предприятия или даже цеха), другие (хотя ка- саются предприятия) могут быть решены лишь в масштабе отрасли, третьи — в масштабе страны. Например, пробле- мы регулирования цен, финансов, управление внешне- экономическими связями — это, очевидно, функции управ- ления центральных органов и совершенствование этих функ- ций выходит за пределы отдельной отрасли. Системный подход к совершенствованию управления требует прежде всего формулирования цели. Цели могут быть локальными, т. е. связанными непосредственно с од- ной функцией управления, или интегральными, т. е. тре- бующими совершенствования множества функций управле- ния. Например, такая общая цель, как достижение опреде- ленного объема производства при заданном качестве, но- 80
менклатуре изделий и производительности труда, вызывает необходимость совершенствования не только всех управля- ющих функций предприятия, но и многих управляющих функций в отрасли или даже в других отраслях народного хозяйства. Это пример интегральной цели. Управление, имеющее цель не допустить выхода недоброкачественной продукции за пределы предприятия,— это пример локаль- ной цели, так как управление этим сосредоточено в ОТ К. Другое дело, что повышение качества продукции требу- ет участия многих органов управления и производства, и тогда качество становится интегральной целью. Большин- ство целей, как правило, являются интегральными целями. При осуществлении системного анализа цель развития предприятия может включать рост количества и качества продукции, повышение производительности труда и куль- туры производства, достижение желаемых размеров при- были и др. Очевидно, что эту (безусловно интегральную) цель можно разделить на несколько подцелей (будем на- зывать их в дальнейшем условиями), которые привязаны к одной или нескольким функциям в системе управления предприятием, отраслью и т. д. Пусть, например, одним из таких условий будет ликви- дация простоев станков из-за нерационального планирова- ния производства. Очевидно, что управление этим условием, в свою очередь, относится и к номенклатуре технического отдела (разрабатывающего технологию), и к начальникам цехов, и к службам материально-технического снабжения и т. п. Можно выдвинуть и другие условия достижения це- ли: 1) внедрение математических методов оперативно-ка- лендарного планирования; 2) оперативный и своевременный анализ складских запасов; 3) бесперебойное (в соответствии с планом) поступление на предприятие комплектующих материалов от других предприятий; 4) увеличение числа лю- дей в техническом отделе и т. п. Первое условие при дальнейшем анализе может потре- бовать использование современной вычислительной техни- в 6-3324 81
ки. А это, в свою очередь, имеет несколько альтернативных путей, например, создание собственного АСУ (или ВЦ) и подразделение с математиками или решение этих задач в территориальных или отраслевых ВЦ и т. д. Третье условие связано с задачами управления, которые решаются в отрасли или в Госплане. Однако совсем не обязательно, что все выдвинутые ус- ловия по совершенствованию управления действительно являются перспективными и ведут к основной цели. В том то и дело, что оценить каждое из выдвинутых условий мож- но только, поставив их в соответствующую сложную сеть взаимосвязанных событий (системный граф) и проанали- зировав все возможные последствия от внедрения данного предложения. Например, в результате системного анализа вполне мо- жет оказаться, что четвертое условие (увеличение числа людей) излишне для достижения цели. Или более того, число людей в техотделе необходимо сократить, например, в 3 раза, так как планируемые функции управления в новой более совершенной системе управления будут ре- шаться лучше в другом подразделении. Приведем в качестве иллюстрации пример системного анализа на основе модели, принципы построения которой описаны в гл. 1.1. Пусть в отрасли или предприятии при определении уз- ких мест в качестве одной из самых острых проблем стала текучесть кадров. Обычно для выяснения причин этих и подобных явлений применяются методы социологического опроса. Однако эти методы, хотя в целом весьма полезны, дают лишь статическую картину и не определяют динамики процесса, а также сложного взаимодействия различных параметров. При анализе проблемы можно выделить следующие па- раметры, существенно влияющие на текучесть кадров (табл. 1). Опрос экспертов показал, что между перечисленными 82
Таблица 1 Параметры, влияющие на текучесть кадров Параметры Обозначе- ние Область изменения Текучесть кадров Z 0-5%, 5—10%, 10—15%, 15—20%, 25—30% соста- ва Моральный климат в коллек- тиве Хороший, удовлетворитель- ный, плохой Форма оплаты труда ха Сдельная, сдельно-преми- альная, повременная, по- временно-премиальная Перспективы обеспечения жилплощадью *3 В течение 1-го года, в тече- ние 1—4 лет, свыше 4 лет Перспективы роста Хорошие, удовлетворитель- ные, плохие Условия труда *5 Хорошие, удовлетворитель- ные, плохие Характер труда Индивидуальный, коллектив- ный Уровень культурно-социаль- ных условий *1 Хороший, удовлетворитель- ный, плохой Уровень жилищного строи- тельства 0—0,1; 0,1—0,01; 0,01—0 квартир/чел. в год Другие параметры xn-t 6Ф 83
параметрами существует следующая зависимость! Z зависит от *1, х8, ...» ХЛ_Г, *1 » •^2» ^e> *^8» х2 » » Хь и х6; *з » » 2, хъ х81; *4 » » 2, х1( х2, х6, хв. Примем, что управляющими параметрами, через которые можно воздействовать на текучесть кадров, являются уро- вень жилищного строительства (х8), культурно-социаль- ных условий (х7) и условия труда (х5). Строго говоря, х6, х7, хв не являются независимыми от других параметров системы. Уровень жилищного строи- тельства и строительства культурных учреждений определя- ется не только централизованными фондами, но и непосред- ственно накопленными прибылями предприятий, которые, в свою очередь, зависят от всех перечисленных выше пара- метров. Но в нашем примере прибыль не рассматривается как параметр, в противном случае пришлось бы включить в системный анализ все экономические категории, характе- ризующие производство (при проведении анализа реальных систем именно этого и требует системный анализ). Пусть эксперты, к которым обратились с вопросами о наличии причинно-следственных зависимостей между па- раметрами (рис. 6), высказали следующие суждения: 1. Если на предприятии жилищное строительство улуч- шить с 0,01 до 0,1 квартир/ чел. в год и ввести в ведущих цехах сдельно-премиальную оплату, а также открыть на предприятии техникум заочного обучения (т. е. улучшить перспективу роста), то в течение 3 лет уровень текучести кадров снизится с 15—20% до 5%. 2. Если провести между пунктами А и В троллейбусную линию, построить кинотеатр, кафе для молодежи, открыть спортивный комплекс в районе 2—3 км от предприятия, а также существенно улучшить условия труда путем созда- 84
ния нормального микроклимата в цехах, текучесть кадров снизится за 2 года на 20%. 3. Если в течение ближайшего года наладить бесперебой- ные поставки сырья от предприятий-смежников (и качеп- Рис. 6. Схема зависимости параметров, влияющих на те- кучесть кадров. во этого сырья будет удовлетворять ГОСТ), установить на предприятии современное оборудование, то через 3 года 90% продукции предприятия будет выпускаться со Знаком качества, моральный климат в коллективе станет хорошим, а текучесть кадров уменьшится до среднего уровня по от- расли. 4. Если создать систему, позволяющую получить опе- ративную информацию: а) о наличии необходимых материа- 85
лов и сырья на предприятиях других отраслей, б) о теку- щем спросе на изделия предприятия и его структуре, и предоставить право предприятию для оперативного измене- ния номенклатуры выпускаемых изделий и для установле- ния непосредственных межотраслевых связей между от- дельными предприятиями, то в течение 2 лет будет накоплен фонд, достаточный для строительства 3 жилых зданий (по 120 квартир в каждом), детяслей, спортзала, а текучесть кадров снизится практически до нуля. На основе таких экспертных заключений (их могут быть сотни) строится модель, анализ которой позволяет выделить с помощью ЭВМ наиболее приемлемые альтернативы до- стижения цели с учетом принятых критериев и ограничений. Рассмотрим пример применения методов системного анализа в задаче программно-целевого управления качест- вом. Категория качество органически связана со многими другими экономическими категориями. Качество — многоас- пектное, емкое понятие, одновременно является категорией экономической, технико-технологической и этической [6]. Управление предприятием и автомобильные перевозки, телевизоры и технологические процессы, научное исследо- вание и художественное произведение, сырье и готовая про- дукция— ко всем этим процессам, предметам, состояниям применима оценка понятием качество. Качество проявля- ется в отдельных свойствах (показателях), перечень кото- рых зависит не только от природы оцениваемого объекта, но и от выбранной «целевой функции» (иногда и личных вку- сов). Критерии оценки качества бывают статическими (т. е. относительно постоянными) и динамическими (т. е. сравни- тельно быстро изменяющимися). Примером такого динами- ческого критерия может служить мода. Но основной при- чиной изменения критериев оценки качества является не- прерывное совершенствование производства, что непрерыв- но отодвигает границу возможностей удовлетворения расту- щих потребностей общества. И то, что еще вчера восприни- малось как высокое качество, сегодня уже в лучшем случае 86
приемлемое, а завтра станет неудовлетворительным. Сущест- вующее разнообразие в системе показателей качества в раз- личных отраслях народного хозяйства определяется не только недостатками в планировании и управлении, но и объективными различиями в характере труда и производ- ства. При определении качества продукции используется тер- мин «признак продукции», который может быть качественным и количественным. В соответствии с ГОСТ 16431—70 к ка- чественным признакам относятся цвет металла, форма из- делия, наличие на поверхности детали определенного по- крытия, профиль проката (уголок, швеллер и пр.), способ крепления деталей изделия (сварка, клепка, склейка и пр.), а также признаки, принимающие альтернативные значения (наличие или отсутствие дефекта, покрытия и т. д.). Коли- чественные признаки продукции, будучи показателями ка- чества, являются функциями ее параметров [71]. При этом следует отметить, что свойства, основные при оценке качества одного вида продукции, могут не иметь смысла или быть второстепенными для другого вида про- дукции. Так, показатель производительности, существенный для станков, не имеет смысла для изделий трикотажной или кожевенно-обувной, или пищевой промышленности. Более того, само понятие — производительность — как оценка качества, далеко не однозначно и нередко требует для его количественного выражения специальных исследований. Примером может служить ЭВМ, для которой долгое время производительность определялась числом арифметических операций в сек. Эта характеристика использовалась для оценки производительности ЭВМ с традиционной структу- рой. В Институте кибернетики АН УССР разрабо- таны ЭВМ серии МИР (МИР-1, МИР-2, МИР-3), которые по объему оперативной памяти и быстродействию, исчисляемых числом арифметических операций, су- щественно уступают крупным вычислительным системам. Однако, благодаря своей структуре и внутреннему языку, 87
ЭВМ серии МИР при решении ряда инженерных и научных задач могут быть эффективней больших ЭВМ или во всяком случае с ними соизмеримыми. В этом случае для характерис- тики ЭВМ используется понятие аффективное быстродейст- вие, которое оценивает время решения набора эталонных задач. Как для отдельного устройства машины, так и (тем более) для предприятия и отрасли выделение и ранжирование по- казателей, характеризующих качество — это сложная за- дача, которая требует широкого использования системного подхода. При оценке качества автомобиля учитывается ма- невренность, комфортабельность, технологичность конструк- ции, удобство управления, внешний вид, экономичность двигателя и др. Очевидно, что качество грузового автомо- биля для междугородних перевозок зависит от его грузо- подъемности. Однако только определенное соотношение ско- рости и грузоподъемности обеспечивает «оптимальность» качества автомобиля, так как важнейший показатель рабо- ты транспорта — объем перевозок — зависит от интеграль- ного показателя грузоподъемность X скорость. Вот что говорит о некоторых производственных показа- телях известный авиаконструктор О. К. Антонов: «Чем плохи многие из существующих показателей? Они не толь- ко односторонни и поверхностны, но и в значительной сте- пени отражают отжившую традицию планирования в ва- ловых показателях... Так, например, планирование про- изводства бумаги в тоннах, ЭВМ — в штуках, перевозок— в тонно-километрах и т. д. представляет собой несомненный пережиток экстенсивного подхода в экономике, который противоречит всемерной интенсификации производства, скорейшему использованию достижений научно-техничес- кого прогресса в промышленности и сельском хозяйстве» [31. При анализе качества машин и систем, включающих сот- ни и тысячи параметров, без системного анализа нельзя дать однозначную оценку качества. При разработке первых 88
АСУП их эффективность пытались оценивать только лишь путем подсчета увеличения продукции после их внедрения (с учетом затрат на АСУП). Хотя даже эта, бесспорно не- совершенная методика, показала высокую эффективность АСУП, но она не отражала многих других важных факторов, связанных с расширением внедрения АСУ в народное хо- зяйство. Используемая методика оценивает (и то одно- боко) лишь эффективность АСУ в пределах одного пред- приятия. При создании АСУ отрасли (или межотраслевых АСУ) общая эффективность АСУ не является просто ариф- метической суммой значений эффективностей отдельных АСУ, а может существенно превосходить эту сумму. И про- исходит это за счет повышения общей эффективности про- изводства, ликвидации потерь из-за улучшения планирова- ния и повышения качества всей продукции. Эффективность от повышения качества может быть оце- нена в масштабах всего народного хозяйства, а не отдель- ного предприятия. В печати неоднократно приводились при- меры того, что повышение качества отдельных видов про- дукции (например, автомобильных шин) всего на несколько процентов равносильно строительству ряда заводов стои- мостью в сотни миллионов рублей. Системный подход к совершенствованию качества преду- сматривает выделение и анализ всех основных параметров, влияющих на качество и эффективность производства. Ис- тория совершенствования управления качеством в нашей стране — это, по сути, постоянное расширение числа пара- метров, включающихся в совместный анализ, выделение из их числа наиболее действенных управляющих параметров. С зарождения массового производства в промышленности сложилась служба ОТК. Но служба ОТ К, даже если она оснащена современными средствами контроля, сама по себе не гарантирует высокого качества продукции, так как она не связана непосредственно с изготовлением продукции, а направлена на то, чтобы не попал к потребителю товар, несоответствующий ГОСТу. Шагом вперед в совершенство- 89
вании управления качеством явилась система БИП (без- дефектное изготовление продукции). Авторы этой системы, впервые внедренной еще в 1960 г. в г. Саратове, видели в системе БИП средство управления качеством изделий посредством управления качеством тру- да их творцов [27]. Система БИП направлена на стимули- рование сдачи продукции ОТ К с первого предъявления. Качество труда стало измеряться, как и выполнение плана, количественными показателями. Например, один рабочий делает ва смену 30 деталей, но 8 из них бракуется ОТК. Другой только 22, но брака нет. И хотя каждый из них в итоге сделал по 22 детали, но работа второго рабочего оценивается значительно выше. Принципы саратовской системы были усовершенствованы на предприятиях г. Льво- ва, на которых возникла система бездефектного труда (СБД). Суть этого подхода в управлении качеством состоит в существенном расширении количества экономи- ческих параметров, по которым оценивается качество, в борьбе за качество участвуют не только непосредственные производители, но и инженеры, конструкторы, отделы материально-технического снабжения и т. д. Оценка ка- чества труда каждого исполнителя по каждому цеху, участ- ку, бригаде, рабочему месту и в целом по предприятию, фирме проводится с помощью специальных коэффициентов качества. Дальнейшее совершенствование управлением качества связано с созданием постоянно действующей системы ана- лиза параметров, влияющих на эффективность производ- ства и качество продукции. Создание и функционирование такой системы, начиная с отдельного предприятия, можно представить следующим образом. Вначале проводится ана- лиз серийно выпускаемой продукции на соответствие ее современным требованиям по всем показателям, преду- смотренным ГОСТ 2.116—71, включающим: показатели назначения, показатели надежности и долговечности, по- казатели технологичности, эргономические показатели, эс- 90
тетические показатели, показатели стандартизации и унифи- кации, патентно-правовые показатели, экономические пока- затели. Общий набор показателей для конкретного вида про- дукции может иметь свои характерные особенности. Так, например, для оценки качества обуви используются такие показатели как силуэт, внешний и внутренний вид, проч- ность, гибкость, масса, гарантийный срок носки. По перечисленным показателям с помощью экспертов определяется значение комплексного показателя качества серийно выпускаемой продукции, основанного на учете весов каждого показателя с последующей оценкой его зна- чения в баллах. Далее определяются значения показателей продукции, которые выводят ее на уровень мировых стан- дартов или превышают их. Полученные значения (коли- чественное и качественное) показателей качества продук- ции принимаются за исходную цель системного анализа. Дальнейшая задача состоит в построении связей между параметрами, влияющими на качество продукции на всех стадиях жизненного цикла: I. Разработка и совершенствование продукции. II. Производство продукции. III. Реализация продукции. IV. Эксплуатация или потребление продукции. Качество продукции закладывается еще на уровне на- учных исследований. По примерным расчетам неустранен- ная ошибка на этапе исследований стоимостью всего в один рубль оборачивается потерями в десять рублей на этапе конструирования, сотни рублей — при изготовлении об- разца и тысячи рублей — в процессе его освоения и эк- сплуатации. I. Разработка и совершенствование продукции. На этом этапе параметры характеризуют: 1) организацию прикладных исследований; 2) исследование современных достижений науки и тех- ники (организация информационного обеспечения ОКР, 91
выбранный уровень соотношения между стандартизацией и оригинальными решениями и т. д.); 3) проектирование (изучение и прогнозирование спроса новой продукции, соответствие разрабатываемой конструк- ции параметрам качества в сравнении с мировыми стандар- тами, использование современных средств моделирования и испытания новой техники, квалификация и заинтересован- ность разработчиков). При этом следует отметить, что в конструировании, как и в любом сложном процессе, нет «мелочей». Известен такой факт: в среднем каждые четыре часа конструктор, разрабатывающий техническую доку- ментацию, допускает ошибку. На исправление ошибки в цехах затрачивается свыше 8 ч [25]. II. Производство продукции. Особенностью современного производства является растущая зависимость качества от- дельного вида продукции от многих факторов. Даже про- дукты, которые имеют тысячелетнюю историю (железная руда, каменный уголь и т. д.), производятся сейчас на ос- нове принципиально новой более сложной технологии, включающей использование электроники, автоматики, хи- мии. Параметры, влияющие на качество продукции, можно сгруппировать следующим образом: 1) техническая подготовка производства (конструктор- ская характеристика изделия, характеристика технологи- ческого процесса изготовляемого изделия, качество рабочей документации конструкторской и технологической и т. п.); 2) изготовление [трудовые ресурсы, квалификация кадров (ИТР, рабочих), моральная и материальная заин- тересованность, применяемые орудия труда и технология, машины и оборудование, настроечно-измерительная аппа- ратура, уровень механизации и автоматизации, качество сырья и комплектующих изделий; характер и условия тру- да, контроль средств контроля и его организация!; 3) планирование и управление (применение современ- ных средств обработки информации, рациональность доку- 92
ментооборота и учета, материально-техническое снабжение, включая организацию хранения сырья и комплектующих изделий, уровень оперативно-производственного и кален- дарного планирования, обеспечение ритмичности произ- водства, организация службы стандартов, метрологиче- ской службы, организация управления качеством и т. д.) III. Реализация продукции. На этом этапе оказывают влияние на качество продукции параметры, связанные с организацией информации и рекламы, формами и методами торговли, транспортировкой, упаковкой и т. п. IV. Эксплуатация или потребление продукции. Качество продукции поддерживается на достигнутом уровне орга- низацией технического обслуживания, ремонтом, обеспе- ченностью запчастями и т. д. Перечисленные выше четыре основные класса парамет- ров являются в некотором смысле «шаблоном» при выде- лении конкретных параметров, связанных с производством определенного вида продукции. С помощью экспертных оценок строится сеть причинно-следственных зависимостей между параметрами на основе метода, описанного в гл. 1.1. В первых турах экспертизы эксперту предъявляется се- рийно выпускаемая продукция (или сообщается ее харак- теристика) и значения показателей качества перспектив- ной продукции. Эксперт должен назвать условия (т. е. перечень непосредственно связанных параметров с перспек- тивной продукцией), количественные и качественные пока- затели этих условий (стоимость, время, требования к кад- рам и т. д.). Выставляемые экспертами условия могут слу- жить основой для проведения экспертизы второго уровня и т. д. Экспертиза проводится по всем группам параметров разработки, производства, реализации и эксплуатации продукции (некоторые алгоритмы обработки экспертных оценок приведены в гл. 2.3 и 3.3 — согласованность экспер- тов). Общие методы обработки обобщенных динамических моделей описаны в работе [14]. 93
Связи между параметрами могут быть не только эк- спертными, но и расчетными. Если, например, эксперт утверждает, что достигнуть необходимого уровня качества можно лишь при установке определенного станка, то за- траты на реализацию этого условия, естественно, поддаются точной оценке. Полученная таким способом параметрическая модель хранится в памяти ЭВМ и является одним из эффективных инструментов управления качеством продукции. На моде- ли в автоматизированном режиме анализируются различ- ные «глобальные» предложения, ведущие к достижению требуемого уровня качества. При этом может оказаться, что некоторые из этих предложений при их системном рас- смотрении вообще не приводят к заданной цели, и они из дальнейшего рассмотрения исключаются. Другие предло- жения приводят к цели, но с различными траекториями, т. е. с различными значениями находящихся на пути к цели параметров, входящих в производственный цикл. Отобранные траектории подвергаются дальнейшему ана- лизу количественными и качественными методами для вы- бора траектории, близкой к оптимальной, в соответствии с основными критериями и ограничениями. Существует мнение, что необходимо совершенствовать качество не в ущерб другим показателям: себестоимости, производительности, использовании основных и оборотных средств и т. д., а наоборот, необходимо стремиться всемер- но улучшать все показатели. Такое требование недостижи- мо и может являться примером «антисистемного» подхода. В реальных условиях вполне может оказаться, что повы- шение качества ведет к увеличению себестоимости, к умень- шению производительности. Но это так называемая услов- ная производительность. Ведь существенно больший на- роднохозяйственный эффект дает одна работающая машина (высокого качества), чем несколько неработающих (низко- го качества, но определивших своим количеством большую производительность и меньшую себестоимость). Однако в 94
этих случаях для принятия экономически выгодного соот- ношения между качеством, себестоимостью, производитель- ностью и другими показателями нет однозначного ответа и необходимо проведение системного анализа. Именно этой цели служит параметрическая модель управления ка- чеством, составляющая основу автоматизированной системы программно-целевого планирования и управления ка- чеством. Такая система может успешно функционировать лишь как подсистема АСУ — предприятия (объединения). Однако растущие требования к управлению качеством продукции существенно превышают возможности современ- ных АСУ. Высокое качество изделий зависит не только от надежного их прогнозирования, быстрого и качественного проектирования, испытания опытного образца, но и опера- тивного управления (включая необходимые изменения) технологического процесса. Эффективное управление качеством неразрывно свя- зано с проблемой повышения качества самого управления. А это требует перехода к АСУ второго поколения, главной особенностью которых является объединение автономных АСУ: АСПРО (автоматизированная система проектирования), АСУП (автоматизированная система управления предприяти- ем), АСПИ (автоматизированная система планирования испытаний), АСУТП (автоматизированная система управ- ления технологическим процессом), АСАД (автоматизиро- ванная система управления административной деятель- ностью) в единую комплексную систему [73]. Только такая интегрированная автоматизированная система упра- вления может обеспечить эффективное управление ка- чеством продукции на всех этапах проектирования, изготовления, реализации и эксплуатации продукции.
2.2. АНАЛИЗ ПЕРСПЕКТИВ РАЗВИТИЯ ТЕХНИЧЕСКИХ ОБЪЕКТОВ Люди всегда пытались представить будущее состояние техники. И этим «угадыванием» будущего занимались не только писатели-фантасты. В литературе приводится много примеров ошибочных прогнозов, принадлежавших выда- ющимся ученым, конструкторам, известным писателям- фантастам. Вот, например, некоторые из этих неудачных прогнозов. «Воображение отказывается представить себе какую- либо подводную лодку, в которой не задохнулся бы экипаж, а сама она не пошла бы на дно...» Г. Уэллс (1902 г.). «Мы трудимся над тем, чтобы два любых лица на земле могли связаться между собой и увидеть друг друга менее чем за 1/24 сек. Мы никогда не достигнем этого...» Дж. Хол- дейн (1924 г.). Незадолго до полета братьев Райт американский астро- ном С. Ньюком писал: «Все данные современной науки указывают на то, что никакие возможные сочетания извест- ных веществ, известных типов машин и известных форм энер- гии не позволяют построить аппарат, практически при- годный для длительного полета человека в воздухе» 1911. В прогнозах ошибались и великие ученые. Лавуазье считал сообщения о существовании метеоритов «антинауч- ными», Г. Герц отрицал практическую пользу открытых им радиоволн, Н. Бор считал маловероятным практиче- ское использование атомной энергии. Авторов этих неудавшихся прогнозов не обвинишь ни в отсутствии должной фантазии, ни в квалификации. При- чина — невозможность, особенно в технических облас- тях, учесть при определении тенденций развития науки и техники всех факторов, используя лишь традиционные качественные методы. Эти задачи становятся под силу не отдельному ученому, как бы велик он ни был, а коллектив- 96
ному разуму на основе современных методов системного анализа и ЭВМ. Одно из приложений системного анализа — прогнози- рование и планирование научно-технических разработок. Основная задача системного анализа — подготовка ин- формации для принятия решения по определению наиболее перспективных альтернатив с целью включения их в план. Принятие решения на основе системного анализа свя- зано с построением событийной модели (прогнозного гра- фа), принципы которой описаны в гл. 1.1. Построению та- кой модели предшествуют следующие шаги. 1. Выбор и обоснование основной цели (или несколько взаимосвязанных целей), т. е. определение содержания ис- ходной проблемы. Для этого могут быть использованы различные методы анализа тенденций развития науки, тех- ники, патентной информации и научно-технической лите- ратуры, а также методы прогнозирования типа Делфи или экстраполяции. Важным средством формирования и обо- снования исходной проблемы является непосредственный анализ потребностей в развитии технического объекта, изу- чение и обоснование актуальных задач и экстраполяция потребностей. Особое место при обосновании исходной проблемы занимает ее первичная структуризация или пост- роение параметрической модели объекта. Для этого приме- няются по сути те же приемы, что и при построении парамет- рических моделей (см. гл. 1.1). Также, как и в общем случае, при построении ИПМ определяются зависимости между отдельными параметрами системы, для этого используются как инженерно-конструк- торский расчет совместимости параметров, так и эксперт- ные оценки. Созданная параметрическая модель исход- ной проблемы подвергается первичному анализу для выбора одного или нескольких вариантов структуры объекта и со- отношений между его основными параметрами. В результа- те анализа параметрической модели исходной проблемы 7 6-3324 97
формулируется несколько альтернатив исследуемой систе- мы, которые соответствуют требуемым значениям управляю- щих и некоторым управляемым параметрам. Или точнее, соответствуют основным критериям технического задания (например, скорости, грузоподъемности, производительнос- ти и т. п.). Оценки альтернатив по другим критериям произво- дятся позднее с использованием других средств событийного анализа. 2. Выбор и обоснование основных критериев (количествен- ных и качественных). Такими критериями могут, например, быть минимальные стоимость и время (или их фиксирован- ное значение), предпочтительность мнений отдельных эк- спертов, порог вероятностных оценок (например, степени уверенности) свершения событий, а также комплексные критерии. 3. Построение прогнозного графа с помощью эксперт- ных оценок. Построение прогнозного графа имеет две ос- новных цели: а) структурный анализ и оценка альтернатив параметрической модели исходной проблемы по многим критериям; б) построение сети взаимосвязанных событий, ведущих к достижению прогнозируемой цели, для после- дующего построения модели планирования и управления НИР и ОКР, перевода прогноза в план. Исходная проблема — событие дается на экспертизу специалистам: действительным или потенциальным кон- структорам системы. Эксперты должны ответить на следую- щие основные вопросы: 1) перечень научно-технических условий, выполнение которых необходимо для того, чтобы эксперт мог взяться за решение исходной проблемы в целом. При этом выдви- нутые экспертом научно-технические условия ранжируются по их важности для достижения исходной цели; 2) стоимость разработки Ср\ 3) относительное время /0, т. е. время, необходимое для решения проблемы, если названные экспертом условия вы- полнены (или будут выполнены в заданное время); 98
4) относительная стоимость разработки исходной проб- лемы (стоимость выдвинутых им научно-технических ус- ловий не учитывается) с0; 5) степень уверенности р. Кроме этих вопросов, «Таблицы экспертных оценок» предусматривают ответы на другие вопросы, кото- рые могут оказаться целесообразными при расчете отдель- ных критериев и переводе прогноза в план НИР и ОКР, а также некоторы сведения об эксперте и организации, которую он представляет. Полученные ответы от экспертов содержат информацию для формирования целей 2-го уровня (1-й уровень графа — исходная цель). Построение прогнозного графа предусматривает на всех его этапах использование методов качественного ана- лиза. Сюда входят процедуры обобщения предложенных экспертами путей достижения конечных (или промежуточ- ных) целей с обязательным выделением альтернатив, вы- деления общих и специфических условий. Общие условия по определению не зависят от альтернативы и их еще до окончательных выводов по системному анализу графа мож- но включать в план НИР и ОКР. Каждая альтернатива представляет собой мнение обоб- щенного эксперта по всем показателям выдвинутых усло- вий (время, стоимость, степень уверенности и т. д.), а также по значениям технических параметров, которые предла- гались отдельными экспертами. При этом следует подчеркнуть, что построение альтер- натив (обобщение экспертных оценок) предусматривает обязательное сохранение всех первичных экспертных зак- лючений, так как они могут понадобиться при последую- щих шагах построения и анализа системного графа. Опыт применения метода В. М. Глушкова для построения и ана- лиза системного графа на примере вычислительной техни- ки подтвердил эффективность этого метода и дал возмож- ность уточнить методику проведения событийного анализа, которая учитывает следующее. 7* 99
1. Набор условий, выставляемый отдельным экспертом, не всегда является функционально полным (т. е. реали- зуются не все основные функции технического устройства) и потому не всегда может рассматриваться в качестве самостоятельного пути достижения цели. В таких подгра- фах полученны оценки стоимости, времени и т. п. дают искаженную картину, которая может внести затем в общие оценки альтернатив недопустимую ошибку. 2. Формулируемые экспертами условия существенно различаются по объему, содержат в себе скрытые петли, многоаспектны, т. е. занимают различное место в системе наука — техника — производство. Отсутствие дифферен- цированного подхода к таким разноаспектным условиям при учете стоимостных, временных и других оценок может привести к серьезным ошибкам в общем расчете прогноз- ного графа (т. е. дерева взаимосвязанных событий) и выде- лении оптимальных путей. 3. Отсутствие каких-либо ограничений при построении графа (т. е. каждое условие, выставленное экспертом, при- нимается в качестве промежуточной цели) и целенаправлен- ного управления может привести к тому, что граф уже после первых нескольких туров экспертизы станет труднообоз- римым и уходящим отдельными «ветками» практически во все области науки. Кроме того, такой граф неравномерный и неоднородный. При разработке графов для локальных целей получить надежные выводы в неоднородном графе крайне затруднительно. В качестве узлов дерева и промежуточных целей прини- маются при таком подходе не все эксперты, а фиктивные (обобщенные). В частном случае обобщенный эксперт мо- жет состоять из одного человека («еретик»). Любое техническое устройство имеет структуру S (^, R), т. е. на множестве предметов &{plt р2, ...» Рг} заданы оп- ределенные отношения R {г8, ..., rk}. Класс —- это различные системы, устройства, элементы и (или) материалы, которые являются составной частью 100
(физической структурой) исходной проблемы. При этом са- ма исходная проблема представляет собой техническое уст- ройство или в общем случае вещественный объект, допус- кающий физическое структурирование. Класс R — это множество условий, выполнение которых обеспечивает «сборку» исходного устройства (решение ис- ходной проблемы) из отдельных элементов, разработку и доводку отдельных элементов устройства, их технологии, разработку общей схемы устройства, математического и в общем случае теоретического обоснования схемы, структуры и устройства. В свою очередь, класс R подразделяется на следующие группы: а) 7?р — обеспечивающие условия, которые пред- ставляют собой некоторое устройство, аппаратное средство и в общем случае вещественный объект; б) /?т — обеспечи- вающие условия, связанные с разработкой технологических процессов, схем и структур функционирования устройства; в) /?м — обеспечивающие условия, определяющие разработ- ку теоретических методов математического обеспечения, фундаментальных теоретических проблем, изыскание новых физических принципов; г) Ro — организационные условия и проблемы материально-технического обеспечения, включая кадровое обеспечение. В проведенной экспертизе по вычислительной технике построение прогнозного графа осуществлялось путем после- довательного структурирования класса верхним уров- ням которого соответствуют классификаторы, включающие процессор, ОЗУ, ВЗУ и т. д. (1-й уровень) и элементно- технологическая база (2-й уровень). Использование при построении прогнозного графа клас- сификационного принципа деления по аспекту «структура t?» определяет различие в характере оценок условий, при- надлежавших соответственно классам Ф и R. Структурные составляющие оцениваются экспертами относительными показателями (То, Со), а условия класса R — абсолютны- ми (Та, Са). Таким образом, общая оценка вершины дере- 101
ва, т. е. каждое складывается из относительных и аб- солютных оценок. Рассмотрим три случая: 1) условия клас- са 7? представляют собой фундаментальные проблемы; 2) условия класса /? — это сравнительно простые производ- ственные проблемы; 3) условия /? — сравнительно сложные научно-технические проблемы, в том числе, это может быть и некоторое техническое устройство. В первом случае абсолютные оценки даются в силу того, что нет возможности разделить фундаментальные проблемы на составляющие. Во втором случае условия настолько прос- ты, что без большой ошибки оцениваются абсолютными по- казателями. В третьем случае в зависимости от требований к точности прогноза и срокам на его проведение можно или оценивать условия абсолютными оценками или рассматри- вать данное условие в качестве промежуточной цели и строить для нее отдельный граф («веточку»). Однако и при этих условиях такая «веточка» обрабатывается самостоя- тельно и в результате получаются абсолютные оценки, которые входят в общую оценку вершины основного дерева. Допускается при таком подходе наличие в вершинах дерева качественных оценок, например, просто перечня фундаментальных проблем, которые принципиально не имеет смысла оценивать временем их решения и стоимостью. Необходимо уточнить понятие «заземленное условие», ко- торым заканчивается построение графа. По определению «заземленное условие» — это условие, которое не может служить исходной проблемой очередного тура экспертизы. С учетом этого «заземленными», или точнее, «тупиковыми» условиями следует считать не только простые условия кон- структорско-технологического характера, но по существу все фундаментальные научные проблемы. При описанном выше целенаправленном построении прогнозного графа, когда в качестве исходных подцелей выставляются не все условия, а лишь количество уров- ней графа становится весьма ограниченным (всего 3—5 уровней). Уже на 3-м уровне при построении графа в качест- 102
ве условий выдвигались требования создания материалов с заданными свойствами или устройства, разработка кото- рых связана с открытием новых фундаментальных законов в физике, химии и других естественных науках. Можно предположить, что в этом случае построение графов в лю- бых больших исходных проблемах будет заканчиваться одним и тем же множеством фундаментальных проблем. Выделение этих общих фундаментальных проблем — боль- шая и серьезная задача. Построенный с помощью экспертных оценок событийный граф — дерево взаимосвязанных научных, научно-техни- ческих, производственных и других условий, определяю- щих достижение исходной цели, подвергается анализу количественными и качественными методами. Цель этого анализа — выбор альтернативы или нескольких альтерна- тив (т. е. одного из деревьев, входящих в построенный сис- темный граф), соответствующих заданным критериям. При- меняемые здесь процедуры включают в себя известные при- емы исследования операций, но не ограничиваются так называемыми точными экономико-математическими метода- ми. Выбор лучшего варианта среди множества альтернатив «точными» методами нецелесообразен, хотя бы потому, что информация, содержащаяся в вершинах графа, «неточ- на», а ряд критериев (и ограничений) неформализуем. Поэтому для принятия решения выбирается в процессе анализа графа не единственная (оптимальная траектория) альтернатива, а несколько альтернатив, соответствующих, например, интервалу: [7\nln> T’mln “1“ k&t\ Cmin 4" ЛДС]. Ниже описаны процедуры расчета выделенных одно- альтернативных деревьев, вершины которых распределены по уровням. Каждая из вершин (научно-техническое условие) харак- теризуется следующими параметрами (оценками), заданными экспертами или получаемыми в результате расчета графа: 103
t°i — относительным временем достижения вершины Г, где i — порядковый номер вершины; / — номер вершины вышестоящего уровня, с которой связана вершина i\ — абсолютным временем достижения вершины i\ T*j — абсолютным временем достижения вершины Л если она принимается за исходную проблему прогнози- рования; Рис. 7. Фрагмент событийного графа: а — одноальтернативный граф; б — единичный куст; хт — порядко- вый номер уровня. — рангом вершины i по его важности для осуществления вершины /. На рис. 7, а показан фрагмент событийного графа. На рис. 7, б показан один куст дерева, на котором в целях удобства изложения проведена самостоятельная нумера- ция вершин, и оценки имеют следующие обозначения: /р.о — относительное время осуществления соответствую- щих вершин, связанных с вершиной 1* 0; &,1 »•••» — относительное время осуществления соответствующих вершин, связанных с вершиной 1*, 0; ?2i* »•••» — ранги важности вершин для осуществле- ния вершины, отмеченной звездочкой. 104
Грубая оценка абсолютного времени осуществления вер- шины может быть получена по формуле Т\*,о = max {/2,1*» • • • > /?д* “F /1\о}» (2.1) где i = 2,..., п. Однако время, рассчитанное по формуле (2.1), в общем случае является завышенным, так как предполагается, что разработка «вершины» 1*, 0 может начаться лишь пос- ле выполнения всех условий {2, 1*, ..., л, I*}. Во многих же реальных ситуациях, разработка устройства (вершина 1*, 0) может быть начата и до окончания работ по созданию комплектующих элементов и решения всех научно-техни- ческих и технологических проблем. Описываемые ниже алгоритмы расчета прогнозного гра- фа по времени пригодны для анализа степени влияния раз- личных по типу условий осуществления промежуточных целей на величину абсолютного времени достижения фикси- рованной вершины (прогнозируемой цели). В общем виде задачу можно сформулировать так: найти /пор = F (/2л *> ...» такое, что Т'р.о = /пор + /?ф,о max {/2,1*, • •. , /пл*}» (2.2) где /пор — пороговое время, определяющее начало работы над вершиной 1*, 0. Задача сводится к анализу характера функции F(/®p ...,/® р), определяющей значение /пор. При оценке экспертами времени осуществления пробле- мы (рассматривается по-прежнему один куст альтернативы) и ранжировании экспертами условий возникают 4 ситуации: 1) абсолютное время осуществления всех выставленных промежуточных целей одинаково (/!>л* = ^зл* = ••• = ^ле) и одинаковы оценки важности условий (92л* = ?зл* = =... = 2) время одинаково, а ранги различны; 105
Таблица 2 Экспертные оценки одного куста прогнозного графа №№ п/п Промежуточ- ные цели Абсолютное время Ранг* 1 Р2,1* 1982 Г. 0,30 2 Рз,|* 1977 г. 0,23 3 Р4.1- 1980 г. 0,13 4 Рм* 1979 г. 0,10 5 Р6,1* 1979 г. 0,08 6 Р7,1* 1977 г. 0,06 7 Р8,1* 1978 г. 0,05 8 Р9,1 * 1978 г. 0,03 9 Р 10,1* 1977 г. 0,02 ведаются экспертами по • Ранги условий _ ... _г__ — 100-балльной шкале, однако для проведения рас* п четов они нормируются так, чтобы Q — ^/-1. 1 — 2 Примечание. Принято, что — 4 го- да. 3) время различно» а ранги условий оди- наковы; 4) время осущест- вления условий раз- лично, и ранги также различны. Рассмотрим более общую 4-ю ситуацию. Пусть экспертами оп- ределены следующие данные для одного куста с вершиной 1*, О (табл. 2). На рис. 8 показа- но распределение ус- ловий по рангам и вре- мени. Площадь под «гиперболой» Q « S распределения (рис. 8, а) равна по опреде- лению единице. Зададимся некото- рым числом е < 1. Ос- новными условиями (вершины) куста будем называть такие, которые определяют площадь под гиперболой, численно равную е*. Суммиро- вание производится в упорядоченном по убыванию рас- пределении рангов слева направо. Соответственно неос- новные условия составят вершины при суммировании ран- гов справа налево, т. е. п k 2 qij — 2 Уч- i-k+l i—2 * Если ранги не нормируются, toS Л, и основные условия опре- деляются расчетом S = Де. 106
Примем в качестве примера, что разработка проблемы может быть начата при k S q4 > 0,5 (е = 0,5). В нашем примере Q* = 0,5 дает сумма рангов условий p2.t«, Рзл*, им соответствуют /®,1« = 1982, /3,1» — 1977. Рис. 8. Ранговое распределение экспертных оценок: а — распределение условий по рангам; б — распределение условий по времени- Отсюда Ti.,o = /пор + /?*,о = 1982 +4= 1986; /пор = max {$} = max {1982, 1977), где tij — абсолютное время осуществления основных условий. Очевидно, что полученное значение 7'{.,о является за- вышенным, так как /5.1« {/3.1». • ••. /«.!•}• При такой ситуа- ции целесообразней принять, что разработка может быть на- чата уже при условиях, определяемых путем подсчета Q = п = У qtl, где k “ 3, п = 10, т. е. справа налево (см. /-*+1 рис. 8, а). 107
При рассмотрении учитываются условия Рю,р, А,г, ^8.1*, Ртд*. P6js ^б,1% Им соответствуют времен- ные оценки: 1977, 1978, 1978, 1977, 1979, 1979, 1980: /пор = « 1978, Т\о « 1978 + 4 « 1982. Абсолютное время достижения основной проблемы Т**,о , для анализа которой строится прогнозный граф, определяется путем последовательного подсчета tq каждо- го из кустов, начиная от уровня х,п (земля) до уровня хг. Как уже отмечалось, общее требование к алгоритмам и программам расчета прогнозного графа — это быть инстру- ментом для его анализа. Они должны предоставлять воз- можность моделировать возникающие в графе ситуации (оцениваемых количественно) при варьировании парамет- ров вершин на различных уровнях и кустах. Такое модели- рование применительно к анализу прогнозного графа на- зывается «покачиванием» графа [17]. В связи с этим описанные выше алгоритмы следует рас- сматривать лишь как часть моделирующей программы. Более того, применяемые алгоритмы расчета графа не долж- ны быть единственно возможными. При расчете времени осуществления отдельных вершин и определении /пор целесообразно учитывать характер кус- тов, составляющих подграф, например: 1) если имеется большой разброс временных оценок (рассматриваются только основные или неосновные условия), целесообразно принимать Pi*,о = max {tij} + /пор = шах {/i/}; (2.3) i 2) если разброс оценок /*;- невелик, то Ti*,o t^f + /?*,о’» /пор = $/Р • (2-4) * — среднее арифметическое время, вычисленное по формуле 1 п /ср — - V /а 1ч “n-32j i=4 108
Целесообразность подсчета Q справа налево или слева направо (см. рис. 8) в реальных графах определяется путем качественной (конструктивной) оценки характера промежу- точных целей. Более того, могут иметь место случаи, когда /пор = О, т. е. разработка проблемы 1 *,0 может начинаться уже тог- да, когда еще не разработана ни одна из промежуточных целей, т. е. проблема 1*, 0 разрабатывается параллельно с промежуточными целями. При расчете Тр.о, когда после- довательно ведется расчет и алгоритмическое суммиро- вание значений /?, отдельных кустов, можно исполь- зовать один из описанных алгоритмов или дифферен- цированно к каждому кусту применять алгоритмы, соот- ветствующие характеру оценок данного куста. Следует, конечно, учитывать, что такая ситуация весь- ма трудоемка, так как требует конструкторско-технологи- ческого анализа прогнозной сети, что связано с проведением дополнительных специальных экспертиз. Описанные выше алгоритмы анализа отдельной альтер- нативы событийного графа были опробованы на экспери- ментальном графе объемом 2971 вершин, распределенных по пяти иерархическим уровням: 1-й уровень — исходная проблема; 2-й уровень — 10 вершин; 3-й уровень — 80 вершин; 4-й уровень — 480 вершин; 5-й уровень — 2400 вершин. Каждой вершине приписывались соответствующие зна- чения qq , а для вершин 5-го уровня —tq. В соответствии с формулой (2.2) основная трудность при расчете Г**,о состоит в выборе метода определения /пор. Учитывая, что анализ F (tq) для выбора метода опреде- ления /Пор требует в основном конструкторско-технологиче- ской оценки, используемые алгоритмы расчета графа долж- ны обладать необходимой гибкостью. Расчет * экспериментального одноальтернативного гра- фа на 2971 вершину проводился по основным и неосновным 109
условиям при следующих значениях /Пор- ^пор = max бтор и tij*• При этом для каждого условия принимались следующие значения Q: 0,1; 0,25; ОДО,4; 0,5; 1. В табл. 3 приведены рас- четные значения Т для восьми вершин при различных ме- тодах формулы (2.3), (2.4). В табл. 4 приведены значения tq по основным условиям, в табл. 5—расчетные значения пяти уровней графа (при Q = 1; /Пор = max {tq}; tnop = = /qp), где M (/) — математичес- кое ожидание времени каж- дого уровня; D (t) — дисперсия. Рис. 9. Распределение расчетного време- ни по уровням основных условий: / — *пор m*x Pty}’ 2 — *пор e *tyP • На рис. 9 показано распределение расчетного времени оценки tq по уровням для двух методов определения /ПоР- Изменение способа определения /Пор приводит к изменению оценки Тр.о основной цели на 5—9 лет. Очевидно, что для периода научно-технической революции, когда сроки от идеи до ее воплощения в «металле» существенно сокращают- ся, ошибки в прогнозе на 5—7 лет становятся (даже для ориентировки) недопустимыми. Поэтому при расчете как времени, так и стоимости отдельных альтернатив, необхо- димо вносить «качественные» поправки, связанные с ин- формационными особенностями графа. Например, необходимо учитывать скорость морального старения устройств или информационного старения науч- ных результатов, которые с течением времени теряют свое * В разработке программ расчета событийного графа для ЭВМ «Днепр-2» и БЭСМ-6 принимала участие инж. Т. Я- Скобец [47]. ПО
Таблица 3 Расчетные значения Т по вершинам прогнозного графа 'пор = таХ { ) *пор — с Е CQ Сумма рангов 1 X га Q к X о X а сх ф CQ 0.1 0.25 0,3 I | 0.4 0,5 1 0,1 0.25 0,3 0,4 0,5 1 II <5 Диспер 1 1993 1993 1994 1996 1996 1999 1993 1992 1992 1992 1991 1990 9 5,7 2 1939 1990 1990 1992 1992 1995 1989 1988 1987 1988 1988 1988 8 4,2 3 1987 1988 1988 1989 1992 1994 1987 1987 1987 1987 1987 1987 7 4,9 10 1986 1988 1988 1988 1989 1991 1986 1987 1987 1985 1984 1985 6 5,4 30 1987 1987 1987 1987 1987 1987 1987 1987 1986 1986 1986 1983 4 1,6 75 1984 1984 1984 1984 1984 1986 1984 1984 1984 1982 1982 1982 4 1,1 82 1983 1986 1986 1988 1988 1988 1983 1984 1984 1985 1983 1982 6 4,3 89 1980 1980 108! 1983 1983 1985 1980 1980 1980 1980 1980 1988 8 6,4
Таблица 5 Таблица 4 Расчетные значения Т по уровням прогнозного графа по основным условиям) время ветре- года н Q V 5 четное Я ь ь о es S8 зв я oj £ 0) 5 8. Я m °- 1 св " ЕГ ? Я S S3 I 1-й 1 1999 1 1999 — 2-й 1995 1 1994 3 1993 2 1993 1,4 1992 3 1991 1 3-й 1990 7 1989 7 1988 23 1987 21 1987,2 2,3 1986 8 1985 12 1984 2 4-й 1985 34 1984 54 1983 89 1982 92 1981,6 5,7 1981 87 1980 54 1979 38 1978 22 1977 10 «•л 1973 473 1974 378 1975 311 1976 476 1985,8 4,9 1977 211 1978 168 1979 163 1980 220 Расчетные значения Т по уровням прогнозного графа Уровень Расчетное время 'У Частота встре- ча емоста года Математическое ожидание М (Г) 1 J Дисперсия D (0 I 1-Й 1990 1 1990 — 2-й 1988 1 1987 3 1986 3 1986,2 1,о 1985 3 3-й 1985 2 1984 14 1983 26 1982 20 — 1981 15 1980 3 4-й 1982 14 1981 49 1980 192 1979 122 1979,3 1,7 1973 50 1974 35 1976 18 5-й 1973 473 1974 378 1975 311 1976 476 1975,8 4,9 1977 211 1978 168 1979 163 1980 220 112
специфическое назначение (и поэтому не могут включаться в стоимость прогнозируемого устройства) и становятся об- щезначимым научным фактором (или серийным устройст- вом), имеющим разнообразное применение. Учитывая сложность влияния многих факторов в ана- лизе и выборе альтернатив достижения поставленных це- лей, применение точных методов должно сочетаться в диа- логовых режимах с качественными методами оценки ситу- аций. Частично реализация этого принципа показана выше при анализе одноальтернативного графа. Окончательное принятие решений при выборе альтер- натив основывается как на количественном анализе прогноз- ного графа, так и на основе таких операторов информацион- ных систем, которые позволяют обрабатывать качествен- ную информацию. Поиск оптимального пути достижения цели проводится при некоторых ограничениях (время, стои- мость, проблемы производства, фундаментальные проблемы и т. п.). Любой из параметров (или их совокупность) может в принципе приниматься в качестве критерия. Например, вполне допустимо разыскивать путь достижения цели, на котором имеется минимум фундаментальных проблем. Трудности в разработке критериев для выбора альтерна- тив заключаются в том, что эти критерии органически за- висят от условий, места и времени и принципиально не мо- гут носить универсального характера. Наличие сложного критерия для выбора вариантов можно понимать в том смыс- ле, что он должен учитывать множество свойств, которыми характеризуются вершины графа. Но вряд ли оптималь- ный путь будет представлять среднеарифметическое всех показателей (времени, стоимости, степени уверенности и т. д.). Всегда будет существовать такое положение, при кото- ром в отдельных условиях самым важным показателем (а потому и критерием) будет время, в других — стоимость разработки и устройства, в третьих — качественные приз- наки и т. д. 8 6-3324 113
И это положение определяется не только директивными, народнохозяйственными или специальными требованиями к техническим проектам, но и объективно существующими ограничениями, которые накладываются на систему. В самом деле, пусть при анализе какой-либо альтернативы очень привлекательным по ряду показателей оказался ка- кой-либо план, требующий, однако, увеличения числа спе- циалистов по вычислительной технике в стране за 3 года в 30 раз. Ясно, что найденный путь нереален, так как требу- ет революции в методах обучения, которой нельзя ожидать в течение ближайших двух лет. Для оценки каждого пути при построении локальных прогнозных графов следует также принимать во внимание значение отдельных научно-технических условий для на- учно-технических целей, описываемых другими «локаль- ными» событийными графами. Например, какой-нибудь сверхдальний космический полет может потребовать созда- ния уникального по своим параметрам вычислительного устройства, что, конечно, связано с огромными затратами. Но такое вычислительное устройство может быстро себя окупить в решении «земных» проблем. 2.3. ИНФОРМАЦИОННЫЙ анализ В НАУЧНЫХ ИССЛЕДОВАНИЯХ Научные исследования предусматривают получение ин- формации о свойствах исследуемых объектов и ее обработку. Основным источником новой информации является экспери- мент. Информацию получают также из информационных массивов (книг, статей, Патентов и т. д.). В известном цик- ле процесса познания — «от живого созерцания к абстракт- ному мышлению и от него к практике»,— на всех его эта- пах используются уже созданные и непрерывно совершен- ствующиеся методы исследования, экспериментирования и моделирования. 114
В применяющихся методах познания аккумулированы самые последние достижения науки и техники. В связи с созданием ЭВМ, совершенствованием их математического и информационного обеспечения появилась возможность комплексного использования в задачах исследования и управления различных количественных и качественных ме- тодов, принадлежащих отдельным отраслям науки и тех- ники. Методологические и информационные вопросы этого «комплексирования» и составляют предмет информацион- ного анализа в научных исследованиях. Важное место в информационном анализе занимают во- просы поиска научно-технической информации и ее класси- фицирование. Поиск информации так же древен, как и само человечество, которому для того, чтобы выжить необходи- мо было уметь собирать информацию об окружающем ми- ре, обрабатывать ее и на этой основе принимать решения. Однако проблема поиска документальной информации возникла вместе с появлением документа. Независимо от применяющихся технических средств (каталожные карточ- ки, перфокарты, магнитные ленты, микрофильмы и др.) в состав любых информационно-поисковых систем (ИПС) входят. Информационно-поисковый язык (ИПЯ) — нормализо- ванный язык, предназначенный для такого описания до- кументов (его семантических и формальных характерис- тик), чтобы обеспечить достаточно эффективный их поиск. Поисковый образ документа (ПОД) — описание доку- мента (его семантических и формальных характеристик) на принятом ИПЯ. Информационный массив (ИМ) — множество документов и (или) ПО, описание свойств множества объектов различ- ной природы на принятом ИПЯ. Поисковое предписание (ПП) — описание запроса к ИПС на принятом ИПЯ. Критерий выдачи (КВ) (или критерий семантическо- го соответствия) — совокупность формальных правил, по 8* Ц5
которым определяется соответствие между ПП и ПОД и при- нимается решение о выдаче документа. ИПС различаются характером ИМ и запросов к нему. ИПС может осуществлять поиск полных текстов документов, вторичных документов (рефератов) или только библиогра- фических описаний. Различают документальные ИПС и библиографические. Особый класс составляют ИПС поиска данных, которые часто называют фактографическими [52]. В гл. 3 будут описаны некоторые принципы построения ИПЯ. Здесь же укажем лишь на то, что основными ИПЯ, входящими в состав большинства современных автомати- зированных ИПС, являются дескрипторные. Основу этих дескрипторных ИПЯ составляют словари, которые пред- ставляют собой упорядоченное множество, состоящее из разделов, родовых и видовых понятий, принадлежащих отдельным отраслям науки и техники. Составление ПОД или, как говорят иногда, индексиро- вание документа, осуществляется путем выбора слов или словосочетаний из словаря и включения их в ПОД. При этом необязательно, чтобы составленный таким способом ПОД давал максимально точное представление о содержании документа или тем более был его «конденсированным» со- держанием. Назначение ПОД — облегчить поиск (с использованием формальных процедур) релевантных документов, т. е. соответ- ствующих запросу. Поэтому в ПОД включают такие призна- ки, которые весьма эффективны для поиска, но к семантике документа имеют отдаленное отношение. Между ПОД и самим документом может быть такая же связь, как между отпечатками пальцев и человеком, которому они принад- лежат. Разыскать по отпечаткам пальцев человека можно, а вот составить представление о личности хозяина этих отпечатков, конечно, нельзя. Классический прием оценки эффективности ИПС — это определение коэффициента полноты т]п, характеризующего процент выданных релевантных документов к их общему 116
числу в массиве, и коэффициента точности т]т, т. е. процен- та релевантных документов по отношению к общему числу выданных документов. Критики показателей эффективнос- ти ИПС (предложенных авторами известного Кренфилд- ского проекта) указывают обычно на то, что в этих показа- телях не учитываются многие объективные параметры и субъективные факторы работы ИПС. Полнота и точность эффективности ИПС существенно зависит не только от алгоритмической структуры ИПС (алгоритмов определения семантического соответствия между запросами и докумен- том, семантическими возможностями ИЯ, качеством индек- сирования, надежностью ЭВМ и т. д.), но и от целей потреби- теля информации. Например, совершенно различны пред- ставления о полноте библиографического указателя у библиографа, аспиранта, конструктора, руководителя учреж- дения. Анализ эффективности ряда ИПС показал наличие обратно пропорциональной зависимости между полнотой выдачи и точностью. Если потребитель не желает допустить потерь, он должен смириться с растущим списком ненуж- ных ему документов («шумом»), и наоборот, при выдаче только релевантных документов («точная» выдача) заведо- мо многие документы будут потеряны. Однако и это свой- ство ИПС, если не указываются другие свойства и огра- ничения, может не иметь смысла. В принципе нельзя сформулировать универсальные критерии оценки эффективности ИПС. Для химика важны такие возможности ИПС, которые обеспечивают быструю выдачу фактографической информации о свойствах веществ. Для конструктора «шумом» может стать любая выдача ИПС, если в ней указано даже точное название документа и стра- ницы, где находится запрашиваемая расчетная формула. Релевантной является лишь такая выдача, которая содер- жит формулу в «чистом» виде. Для математика эффективной ИПС была бы такая автоматизированная информационная система (АИС), которая помогала бы в автоматизированном режиме вести доказательство теорем. У геолога и медика. 117
археолога и философа, литературоведа и физика другие требования к ИПС. Автоматизированные документальные ИПС, основан- ные на дескрипторных языках, плохо приспособлены для последующих процедур обработки информации, анализа с целью получения новых научных результатов и практи- ческих приложений. Более приспособлены для целей не- посредственного совмещения задач поиска и обработки информации фактографические ИПС, которые входят, на- пример, в состав таких комплексов, как автоматизирован- ные системы проектирования. Некоторые документаль- ные ИПС уже сегодня существенно расширяют возможности обработки информации. Так, в ИПС «Сетка», выполняющей функции информационного обеспечения НИР и ОКР, по- иск сочетается с задачами получения исходной информации для определения тенденций развития науки и анализа эф- фективности ее практического приложения [67]. Анало- гичные задачи моделировались в Институте кибернетики АН УССР на системах типа АСАНИ [46]. Современные тенденции полного совмещения поиска (или в общем случае извлечения) информации с ее обработ- кой широко реализуются в крупных ускорителях, телеско- пах, космических лабораториях, где обязательной составной частью исследовательского комплекса являются ЭВМ и си- стема датчиков, снимающие информацию с исследуемого объекта. Сейчас на стадии разработок находятся автоматизиро- ванные системы, которые должны включать все стадии ис- следования: поиск документов, извлечение из них такой количественной и качественной информации, которая до- пускала бы ее обработку и анализ наряду с эксперимен- тальной информацией, поступающей от датчиков, накоп- ленной на машинных носителях и от других источников. Самым древним аппаратом анализа информации, пред- ставленной в виде предложений естественного языка (или точнее — в виде суждений), является логика. С именем 118
Аристотеля связывают обобщение известных форм и зако- нов мышления, т. е. того аппарата, который принято на- зывать традиционной логикой. Наибольшего развития получила в этот период (да и в последующее время сред- невековья) дедуктивная логика и ее основная часть — сил- логистика. В высказываниях, анализируемых логикой, выделяется субъект и предикат (этому соответствует, как правило, группа подлежащего и группа сказуемого). Раз- личают предикаты-свойства и предикаты-отношения. Вывод или, как говорят в традиционной логике, умо- заключение осуществляется из двух посылок, в которых обязательно должен присутствовать общий термин (напри- мер, S есть Л4; М есть Р, следовательно, S есть Р). Аристотелевской силлогистике посвящена обширная ли- тература, имеющая воистину тысячелетнюю историю, оз- накомиться с основными результатами которой можно по работам [4, 38]. Дальнейшее развитие силлогистика полу- чила в математической логике, являясь частью исчисления предикатов. В логике предикатов, наряду с известными операциями булевой алгебры: конъюнкцией (Д), дизъюнк- цией (V), отрицанием (*“]), импликацией (->) и др., основ- ную роль играют кванторы: Vx — квантор общности; Vx (Р (х)) — «все х обла- дают свойством Р (х)»; Эх — квантор существования; Эх (Р (х)) — «существу- ет такое х, что Р от х». В общей форме любой силлогизм основан на имплика- циях вида (Л Д В) -> С. Исчисление предикатов позво- ляет строить логическую цепь, состоящую из п посылок (п 2), каждая из которых может иметь I предикатов (/ > 1), и в них используются связки типа Д, V» Широкое использование диалоговых режимов при при- менении ЭВМ в научных исследованиях неизбежно при- водит к возобновлению интереса к традиционной логике с ее «человеческим» характером, в то время как другие разделы математической логики и булевой алгебры полу- 119
чают все большее применение в задачах машинного проек- тирования сложных автоматов, доказательстве теорем и обоснования математики. Хотя в процессе познания эксперимент и методы его обработки всегда шли рядом, но исторически дедуктивная логика была превращена в некоторую стройную теорию намного раньше индуктивной логики, которая непосред- ственно связана с задачами постановки и анализа экспери- ментальных данных. Первое фундаментальное обобщение методов логической индукции было осуществлено в начале XVII в. Ф. Бэконом. Дальнейшее развитие эти методы получили в работах Д. С. Милля (начало XIX в.). Рассмотрим методы индукции Д. С. Милля, которые не потеряли значения и в наше время [4]. Пусть исследуется система со множеством входов X и множеством выходов Y. В общей форме задача состоит в установлении соответ- ствия между отдельными элементами этих множеств или их подмножествами. Метод сходства. Обнаружено, что в трех случаях, когда имеет место ха9 xb9 хс\ ха9 xd9 хе; ха9 Xf, xg, появляется у*. По методу сходства делается вывод, что причиной появле- ния у* служит ха, так как отсутствие xb9 хС9 xd9 хе9 Xf9 xg не влияло на появление у*. Метод различия. Обнаружено, что в двух сравниваемых случаях прихв, xb9 хС9 xd9 хе9 £/* появлялось, anpuxb9xC9xd9 хе не появлялось. Возможен вывод, что ха является при- чиной появления у*. Метод остатков. Пусть известно, что ха9 xb9 хс — един- ственные факторы, которые могут быть причиной комплек- сного события уа9 уь, ус. Обнаружено, что хь причина уь данного комплексного события и хс причина ус. Отсюда делается вывод, что ха есть причина уа. Метод сопутствующих изменений. Пусть ха9 xb9 хс вызывают появление уа\ х*а, хЬ9 хс приводят к появлению у*а (где Ха, у*а — отдельные значения факторов ха и уа). Делается вывод, что ха является причиной уа. 120
Все приведенные выше методы поиска причинно- следственных зависимостей исследуемого объекта дают лишь возможность выдвинуть гипотезу о наличии такой связи с меньшей или большей степенью вероятности. Эти методы, конечно, не учитывают взаимодействия между фак- торами, не отражают истории процесса и многих других явлений, характеризующих сложную систему. Вполне может оказаться, что причиной появления у* является не ха, а сочетание факторов (xaxb, хахс, xjce и т. д.). Кроме того, даже в тех случаях, когда удается выделить факторг являющийся причиной появления у*, этот единственный фактор может иметь, в свою очередь, сложную структуру, в состав которой входят истинные «виновники» у*. Эти факторы могли входить и в состав хь, хс и т. д., но только не было условий для проявления их влияния. По этой же причине нельзя получить достоверный вывод и по методу различия. Классическим примером возможной ошибки может слу- жить выяснение значения воздуха для жизни. Из сосуда, в котором находится животное, откачивается воздух, т. е. создается «различие» с предыдущим состоянием. Сравни- вая два различающихся состояния сосуда (с воздухом и без воздуха), делается вывод, что воздух — необходимое ус- ловие жизни. Но этот вывод, строго говоря, неверен, так как если из состава воздуха исключить лишь одну его компо- ненту — кислород, то оставшийся «воздух» уже переста- нет быть основой процесса дыхания и жизнедеятельности. Существенным недостатком приведенных методов яв- ляется то, что они основаны на использовании статических свойств системы, в то время как причинно-следственные отношения — в целом динамические характеристики си- стемы, требующие рассмотрения параметра времени и ис- тории процесса. В ограниченных пределах и при соблюде- нии необходимой осторожности эти методы могут входить составной частью в процесс изучения и управления слож- ными системами. Нередко, не давая прямого ответа на 121
причинно-следственные зависимости, описанные индук- тивные методы раскрывают так называемые отношения корреспонденции [23]. Например, наблюдая по телеви- зору футбольное состязание, по множеству открытых зон- тиков определяется не только то, что идет дождь, но и степень его интенсивности. Эффективность методов индуктивной логики существенно повышается при дополнении их мето- дами современной математической статистики. В этом отношении следует указать на работы итальянских уче- ных, в частности К. Джини, название одной из работ которого «Логика в статистике», характерно для этого направления [23]. Широкую известность в последние десятилетия приоб- ретают методы статистического анализа, характерные для развивающейся новой научной дисциплины — теории пла- нирования эксперимента. Активные пропагандисты ис- пользования этих методов [2] справедливо утверждают, что потребность планирования эксперимента возникла в глубокой древности. Но, по мнению авторов, наш далекий предок не пользовался статистическими методами и потому «... остается непонятным, как он вообще выжил и обеспе- чил тем самым наше существование». Однако правомерна и другая гипотеза (требующая, конечно, как и всякая гипотеза, экспериментальной провер- ки), что элементами статистического анализа люди поль- зовались всегда. Ни одно научное направление не возни- кает на голом месте, а имеет более или менее долгую пре- дысторию. Не является, конечно, исключением и плани- рование эксперимента. В качестве примера решения задачи уменьшения числа опытов, что представляет большой инте- рес для теории планирования эксперимента, можно при- вести метод артиллерийской пристрелки, появившейся, очевидно, в прошлых веках. Задача решается методом ар- тиллерийской вилки. После первого выстрела (предпола- гается, что стрельба выведена на линию наблюдения) оп- ределяется недолет или перелет. В соответствии с этим 122
увеличивают или уменьшают итерациями (например, ло 100 м) прицел (расстояние до цели) до тех пор, пока не по- явится противоположный результат первому выстрелу, т. е. цель не попадает в вилку. После этого вилка последо- вательно сужается до тех пор, пока цель не будет пораже- на. Укажем, что эти процедуры «планирования эксперимен- та» строго формализованы, и искусство их выполнения оце- нивается однозначным критерием — числом «опытов», т. е. снарядов, затраченных на пристрелку цели. И тем не менее историю планирования эксперимента принято считать с момента появления книги Р. А. Фишера (1935 г.). Следует отметить, что рост интереса к методам плани- рования экстремального эксперимента определяется не только нуждами науки и производства, но и существенным расширением технических возможностей реализации этих методов, возникших с созданием ЭВМ. В работах [1, 2, 83] можно найти обстоятельный обзор исследований в об- ласти планирования эксперимента и подробное изложение основ его теории и современных приложений, а также об- ширный перечень публикаций этого направления. Изло- женное ниже следует рассматривать лишь в качестве рас- ширенного реферата о задачах и методах планирования эк- сперимента. Аналогично другим задачам оптимального управления центральное место в планировании эксперимента уделя- ется формулировке цели. Количественное выражение цели называется параметром оптимизации. Так же, как и при дру- гих подходах, при моделировании сложных систем допус- кается (даже рекомендуется) разбиение системы на ряд подсистем, что приводит к задаче согласования параметров оптимизации отдельных подсистем с общей целью системы. Хотя в принципе параметрами оптимизации могут быть различные экономические (себестоимость, производитель- ность, прибыль и т. д.) и технические категории, но наи- больший опыт накоплен в экстремальном планировании с 123
использованием таких целей, как степень извлечения, выход, содержание какого-либо компонента в продукте ит. п. В системах автоматического регулирования пара- метр оптимизации, как правило, выбирается из техноло- гических показателей. Одной из особенностей планирования эксперимента является стремление вести анализ с использованием одного параметра оптимизации или хотя бы уменьшить их число. Для этого разрабатываются приемы сведения многокрите- риальной задачи к нескольким однокритериальным, про- водится оценка корреляции между параметрами для исклю- чения высококоррелируемых. Кроме параметров оптимизации, различают параметры, называемые факторами. Между параметром оптимизации, которая называется еще функцией отклика, и факторами существует зависимость У = / (-4. х2, ..., xk), (2.5) где у — функция отклика; хъ х2, xk — факторы. Функ- ция отклика (2.5) — это по сути статическая параметри- ческая модель объекта. Задача эксперимента состоит в по- лучении как можно более полной информации об этой функ- ции. Разделение параметров, описывающих состояние объек- та, на параметры оптимизации и факторы, конечно, услов- но, так как то, что в одном случае является фактором, в другом случае может стать параметром оптимизации. Построение функции отклика может основываться как на эксперименте, так и включать уже известные аналити- ческие зависимости или опыт специалистов — экспертов. Эксперты могут ранжировать факторы по степени их вли- яния на параметр оптимизации. Методы обработки таких экспертных оценок приведены в работах [41, 56]. Содер- жание используемых при этом мер согласованности будет описано в гл. 3. Для всех параметров, используемых при планировании эксперимента, устанавливается область определения. На- 124
иболее распространенный случай — планирование на осно- ве двух значений факторов, называемых уровнями: верхним и нижним (обозначается соответственно + и —). Стрем- ление уменьшить число уровней определяется уже упоми- навшейся «проклятой размерностью». Так, возможное чис- ло состояний объекта (S), число факторов (k) и число уров- ней (р) связано зависимостью S = р*. Уже, при р = 5 и k = 10, что в общем является малоразмерной задачей, S « 107. Очевидно, что методом простого перебора всех состояний задачу решить нельзя. Поэтому основная задача планирования эксперимен- тов — это минимизация числа опытов. В планировании эксперимента имеется большой опыт использования при построении функций отклика линейной модели (уравнение регрессии) вида у = bQxQ + + b2x2 + • • • + bkxR- Коэффициенты при факторах определяют силу влияния факторов, их вклад в достижение параметра оптимизации. Если коэффициент имеет знак плюс, то с увеличением зна- чения фактора параметр оптимизации увеличивается, коэф- фициент со знаком минус ведет при увеличении значения фактора к уменьшению параметра оптимизации. Линейная модель, конечно, часто нарушается, что опре- деляется взаимодействием между факторами. Взаимодей- ствие факторов учитывается следующей моделью: У = ЬОХО + btxt + Ь2ха + Ь^х^ + • • • + bijXiXi. (2.6) Одно из основных требований к модели — возможность с ее помощью предсказывать такое направление дальней- ших опытов, которое ведет к наискорейшему улучшению параметра оптимизации. Это направление опытов назы- вается направлением градиента. Если исследуемая область настолько сложна, что нельзя построить адекватную линейную модель, допускается по- строение нескольких линейных моделей в подобластях. 125
Движение по градиенту осуществляется до тех пор, пока происходит улучшение значения параметра оптимизации, т. е. достигнута область оптимума, доступная выбранной модели. При необходимости уточнения (ссужения) области оптимума переходят к полиномам более высоких степеней или к другим моделям. При определении числовых значений коэффициентов модели (коэффициентов регрессии) используется метод наименьших квадратов [72]. В полном факторном экспери- менте количество опытов превышает число коэффициентов линейной модели. Разность между количеством опытов и чис- лом коэффициентов дает возможность сократить количе- ство опытов и перейти к так называемым дробным репликам. Не будем касаться технических приемов и подробностей минимизации числа опытов, которые описаны в работах [1, 2]. Конечно, методы, предлагаемые теорией планирова- ния эксперимента, не универсальны и требуют творческого отношения при их использовании. Очевидно и то, что ограничения, накладываемые на число параметров и факторов и ряд других ограничений, связанных с выбором модели, суживают сферы приложения теории планирования эксперимента. Кроме того, предполагается, что в состав- ленной модели — функции отклика — уже содержится оп- тимальное решение и его нужно только найти. Но не ред- ки случаи, когда принятая модель, включая заданный перечень факторов, не содержит решения. Покажем характер таких задач на одном из примеров [9], в котором осуществлен интересный информационный анализ проблем формовки металлических отливок. Извест- но, что форма из песчано-глинистой смеси должна удовлет- ворять следующим требованиям: 1) конфигурация формы должна строго соответствовать конфигурации модели. Для того чтобы формовочная смесь полностью заполнила все мелкие пустоты модели, она долж- на обладать текучестью (у^ 2) освобожденная из модели форма должна сохранять 126
неизменной приобретенную конфигурацию, т. е. формовоч- ная смесь должна обладать связностью (4/2); 3) для того чтобы форма выдержала нагрузку от мас- сы жидкого металла в момент заливки, она должна обладать жесткостью (г/8); 4) увеличение размеров отдельных элементов смеси должно происходить за счет внутренних пустот самой смеси, и форма должна обладать термоустойчивостью (у4); 5) нагрев формы во время заливки приводит к испарению влаги, содержащейся в смеси. Образующийся пар необ- ходимо отводить в атмосферу во избежание попадания его в металл и образования в отливке газовых раковин. По- этому форма должна обладать газопроводностью (у5); 6) поверхность формы, прилегающая к металлу, должна быть гладкой, чтобы предотвратить затекание металла в поры и обеспечить чистоту поверхности отливки, т. е. фор- ма должна обладать поверхностной сплошностью (г/в). Достижение необходимых значений приведенных пара- метров у получается за счет следующих факторов: зернис- тости (размера зерен) песка (xi), содержания влажной глины (х2), объема пустот между зернами песка, не заполненных глиной (х8). Однако достичь оптимального значения по всем параметрам у в принципе нельзя регулированием значений Xi, х2, хз- Например, уменьшение приводит к улучшению Уъ Уз> Уы но ухудшает у2, у4, у5. Уменьшение х2 приводит к улучшению уъ y3t уь, но зато ухудшает г/2, у4, г/в. Увели- чение х3 ведет к улучшению у19 у^ уь, но ухудшает г/2, у3, у3. Выход из тупика может потребовать создания специ- альной системы автоматического регулирования, которая обеспечивала бы достижение нужных свойств в отдельные моменты технологического времени. А если и эта мера не приведет к цели, то потребуется переход на другую тех- нологию, в рамках которой приведенные противоречия были бы сняты. Дальнейший прогресс экспериментальных методов по- знания будет определяться использованием сложных дина* 127
мических моделей, основанных на различных (а не только аналитических) представлениях связей между факторами и параметрами, применением современных методов теории оптимальных решений и моделирующих стендов на базе ЭВМ. Первые успехи, достигнутые в этом направлении при использовании автоматизированных систем планирования, управления и анализа экспериментальных данных, об- надеживают. ГЛАВА ТРЕТЬЯ ПРИКЛАДНАЯ СЕМАНТИКА ИНФОРМАЦИОННОГО АНАЛИЗА 3.1. ИНФОРМАЦИОННО-ПОИСКОВЫЕ языки •Обычно возникновение информационных языков (ИЯ) связывают с появлением библиотечных классификаций и ката- логов, а позже с возникновением разнообразных поисковых систем в области научно-технической информации. Однако ИЯ имеют почти тот же возраст, что и книги, статьи и ад- министративно-хозяйственные документы (ведомости, свод- ки, отчеты и т. п.). Если целью использования ИЯ в масси- вах научно-технической информации был поиск релевантных документов, то нормализованное описание на ИЯ содер- жания административно-хозяйственных документов облегча- ло проведение некоторых элементов технико-экономического анализа. Поисковые же функции ИЯ, хотя и были обяза- тельными, но оставались вспомогательными. Существует два подхода к построению ИЯ: фасетный и классификационный. Фасетный подход в построении ИЯ является отражением логической структуры естественных 128
языков, в котором выделяются логическое подлежащее (субъект) и сказуемое (предикат) и их определители (вре- мя, пространство и другие категории). Наиболее глубо- кое обоснование фасетного подхода для библиографичес- кого описания документов дано выдающимся индийским мыслителем Ш. Ранганатаном. Сущность описания науч- ного документа на основе фасетного анализа по Ш. Ранга- натану состоит в следующем. Вначале постулируются 5 категорий (наиболее общие понятия для любой области знания): 1) персональность, 2) материя, 3) энергия, 4) про- странство, 5) время. С помощью этих основных катего- рий выделяются группы понятий, принадлежащие ка- кой-либо отрасли науки и техники, являющиеся по сути проявлением этих категорий в различных науках. Появив- шиеся в результате этой процедуры группы понятий (упоря- доченных, например, по иерархическому принципу) на- зываются фасетами. Некоторым аналогом фасетизации языка служит упоря- дочение слов по частям речи — выделение существитель- ных, глаголов, наречий и т. д. Примерами фасетов в языке техники могут быть «Материалы», «Процессы»; в химии — «Вещества», «Состояния», «Свойства», «Реакции»; в эконо- мике — «Производство», «Транспортировка», «Потребление» и т. д. Очевидно, что в общем случае выделение фасета для группировки понятий, являясь определением аспекта классифицирования, допускает множество вариантов. И чем богаче система (числом элементов и свойств), тем боль- шее число аспектов имеется для группировки понятий. Для управления предприятиями возникает задача фасет- ной группировки производственных объектов, оборудо- вания, материалов, изделий, показателей, документов и т. д. Выделение единых фасетов для упорядочения произ- водственной информации усложняется тем, что эта инфор- мация содержится в различных формах: номенклатурных перечнях документов, табличной форме, текстовых доку- 9 в—3324 129
ментах, спецификациях, паспортах объектов и оборудо- вания и др. После выделения фасетов в ИЯ вводится единое пра- вило построения предложений из понятий, содержащихся в фасетных группах, или иначе, устанавливается фасет- ная формула. Фасетная формула — это многоместный пре- дикат, каждая позиция которого соответствует определен- ному фасету. Многоместные предикаты, как известно, допускают вставления, что применяется и в фасетных фор- мулах. Например, в фасетной формуле Ш. Ранганатана каждая позиция фасета может заменяться не только от- дельным фокусом (фокус — единичное понятие, входящее в данный фасет), но и целой фасетной формулой второго уровня, которая, в свою очередь, может включать фор- мулу (фасеты) третьего уровня и т. д. В естественных язы- ках этому соответствуют сложноподчиненные предложения, допускающие довольно большую глубину (вспомним мно- гоуровневую «фасетную формулу» С. Маршака: — «Вот два петуха, которые будят того пастуха, который бранится с коровницей строгой, которая, ..., который, ..., которая в темном чулане хранится в доме, который построил Джек»). Конкретная реализация такой многоуровневой фасет- ной языково-логической структуры различна не только в естественных языках, но и в информационных. Существу- ют естественные языки с весьма жесткой «фасе!ной форму- лой» (например, английский) и с довольно свободными правилами построения предложений (например, русский язык). Однако в фасетных информационных языках жест- кость фасетной формулы обязательна. Если для поиска научно-технической информации фа- сетные ИЯ не получили широкого распространения (во всяком случае до появления так называемых дескриптор- ных ИЯ), то в области административно-хозяйственного управления фасетный подход был единственно возмож- ным. Именно поэтому разработка ИЯ для АСУ в области экономики основывалась исключительно на фасетном под- 130
ходе. Пример, ИЯ для описания экономических, ситуаций, основанного на фасетных принципах приведен в [29]. В общем случае разделение фасетов в фасетном предло- жении осуществляется различными способами — с помощью анкеты и табличной записи, с использованием так назы- ваемых указателей роли в дескрипторных ИЯ или с по- мощью синтаксических знаков. Так, у Ш. Ранганатана используются следующие указатели фасетов и соответству- ющих им общих категорий: точка свидетельствует о кате- гориях (фасетах) «Пространство» и «Время», двоеточие — об «Энергии», точка с запятой — о «Материи», а запятая — о категории (фасете) «Персональность». Приведем пример записи с помощью фасетного языка Ш. Ранганатана. Текст «Биологическое лечение вирусного заболевания стеблей риса в районах дельты около Мадра- са в сезон дождей 1957 года.» Фасетная запись: «</ 381,4 : : 423 : 6 (g) . 441 . 137 . N 57 • р5», где J — «сельское хозяйство», 381 — «рис»; 4 — «болезни»; 423 — «вирусные заболевания»; 6 (g) — «биологическое лечение»; 441 — «Ма- драс»; 137 — «дельта»; N 57 — «1957 год»: р5 — «сезон дождей»; запятая обозначает фасет «Персональность»; точ- ка — «Место и время»; двоеточие — фасет «Энергия». При- веденная запись содержит три уровня, которые вводятся двоеточием (первый и второй уровни) и скобками (третий уровень). Другим направлением в построении языка описания действительности или информации, содержащейся в доку- ментах, как уже отмечалось, являются классификационные ИЯ, определяющее ядро которых — иерархическое клас- сифицирование. Основные требования к иерархической классификации: деление понятий должно производиться по одному осно- ванию (классификационному признаку); классификация должна быть исчерпывающей, т.е. логическая сумма возникающих в результате делений под- множеств должна составлять первичное делимое множество; 9 131
классификация должна быть исключающей (т. е. полу- чаемые в результате деления подклассы должны исключать друг друга); деление на подклассы должно быть соразмер- ным и непрерывным, т. е. без скачков. На рис. 10 показана иерархическая 4-уровневая клас- сификация информационных носителей [761. Эта класси- фикация имеет недостатки, характерные для иерархических классификаций. Нельзя, например, сформировать следую- щую группу, которой нет в классификационном дереве на рис. 10 «Информационный носитель с произвольным дос- тупом и смешанной обработкой». И тем не менее приведен- ная классификация вполне удовлетворяет современному состоянию развития информационных носителей. В тех случаях, когда количество новых классов, которые мо- жно построить на основе группировки понятий, находя- щихся в различных вершинах классификационного дерева, сравнительно невелико, применение ИЯ классификацион- ного типа весьма эффективно. Такие языки широко исполь- зуются в различных классификаторах продукции: алфавит- но-предметных, документальных и фактографических. Следует подчеркнуть, что в чистом виде не существует ни фасетного, ни классификационного (иерархического) ИЯ. Любой фасетный язык обязательно предусматривает проведение иерархического классифицирования понятий 132
внутри фасета. С другой стороны, как правило, класси- фикационные языки (другое их название — перечислитель- ные классификации) используют фасетные принципы. Даже универсальная десятичная классификация (УДК), заду- манная еще в XIX веке как идеальная иерархическая клас- сификация, в настоящее время широко использует фасетные подходы. На этом основании УДК иногда называют клас- сификацией полуфасетного типа, хотя не с меньшим основа- нием УДК можно называть «полуиерархической». Классификационное дерево УДК состоит из 10 фасе- тов, которые названы главными классами: 0 Общий отдел. Библиография. Библиотечное дело 1 Философия. Психология 2 Религия. Теология / 3 Общественные науки. Право. Управление 4 Свободный раздел 5 Математика. Естественные науки 6 Прикладные знания. Медицина. Техника 7 Искусство. Прикладное искусство. Игры. Спорт 8 Филология. Языкознание. Художественная литера- тура 9 География. История Каждый из разделов УДК с соблюдением десятичного принципа делится на дальнейшие подразделы, группы, подгруппы и т. д. На языке УДК искусственный спутник земли имеет индекс 629.138.82, что означает: 600. Технология (Прикладные науки) 620. Техника 629. Другие области техники 629.13. Аэронавтика 629.138. Использование летательных аппаратов 629.138.8. Полеты в космическом пространстве (инер- ционная навигация) 629.138.82. Искусственный спутник земли Фасетные принципы используются в УДК в так назы- ваемых общих и специальных определителях, основные 133
из которых: определитель языка (= 82 — на русском язы- ке), определитель формы [(0.83.52)— нормативы], опре- делитель места [(44) — Франция], определитель времени («1975.05.1»—1 мая 1975 г.), определитель точки зре- ния (003 — экономическая точка зрения). В отличие от жестких иерархических классификаций, в УДК имеется аппарат для выражения связей между руб- риками: (-{-) — присоединение (6.21.911 + 621.914 — ру- банки и фрезы), (/) — распространение (624/628. Стро- ительное искусство. Наземные и подземные сооружения), (:) — отношения (62—50 : 578.08 — Бионика), (’) — объе- динения или синтеза. Например, 546.32’221 — «сульфид калия», где 546.32 — «калий», а 546.221 — «сульфид». При появлении ЭВМ была предпринята попытка соз- дать ИЯ, который не был бы ни фасетным, ни классифика- ционным и, следовательно, не имел недостатков, прису- щих этим языкам. Такой ИЯ получил название языка клю- чевых слов. Возможность применения ключевых слов для поиска основывается на допущении, что в каждом тексте может быть выделено некоторое множество значимых слов, которые несут существенную информацию об этом тексте. Это дает возможность построить путем простого перечис- ления этих ключевых слов, заимствованных из текста, так называемый поисковый образ документа (ПО). Пусть, например, имеется работа под названием «Проб- лемы инженерной психологии в автоматизированных си- стемах обработки информации в связи с разработкой АСУП». Ключевыми словами здесь могут быть «Автоматизирован- ные системы», «Обработка информации», «Информация», «Инженерная психология», «Психология», «АСУП», «Ис- следование». Очевидно, что из перечисленных ключевых слов можно построить огромное множество текстов, име- ющих весьма отдаленное отношение к исходному. А если учесть синонимию, омонимию и другую неоднозначность языков, то очевидно, что поиск на основе языка ключевых слов к успеху привести не может. 134
Строго говоря, язык ключевых слов не являлся языком, а был лишь «трамплином» к созданию широкой серии дес- крипторных ИЯ. Дескрипторные ИЯ предусматривают прежде всего объединение ключевых слов в группы экви- валентности (т. е. объединение всех синонимов в группу с выделением «главного представителя» этой группы — дескриптора). На основе этой процедуры формируется сло- варь дескрипторов или тезаурус. Развитые тезаурусы могут состоять из фасетных классов, в которых расположенные по алфавиту дескрипторы связываются специальными ука- зателями (в них указываются, как правило, родовидовые и некоторые ассоциативные отношения). Дальнейшее развитие ИЯ шло по пути включения в структуру языков богатого перечня логических, синтакси- ческих и функциональных отношений. Наиболее развиты- ми ИЯ являются язык /?Х-кодов [37] и СИНТОЛ [50]. Соз- датели языка /?Х-кодов утверждают, что объективный мир можно рассматривать как организованное множество, вхо- дящее в состав двух неопределяемых метакатегорий: пред- метов и отношений. Под предметом понимается физическое тело, вещество, движение, свойство (например, «лампа», «диод», «азот», «вращение», «позитрон», «величина», «излу- чение»), а под отношением между предметами — любая взаимосвязь между ними: причинно-следственная, простран- ственная, временная, функциональная и т. д. Авторы язы- ка /?Х-кодов понимают, что анализ ситуаций объективного мира с целью разделения его на предметы и отношения не всегда однозначен, особенно в абстрактных науках. Одна- ко при описании технических объектов, для которых и создавался язык /?Х-кодов, процедуры выделения предме- тов и отношений могут быть определены. Термины (X) обозначают предметы, релатемы (R) обоз- начают отношения. Термины и релатемы могут быть базовыми и производными. В языке /?Х-кодов используется более 50 первичных релатем, сгруппированных в 4 основ- ные группы: 1) транзитивные несимметричные отношения 135
(«быть подклассом», «находиться над», «происходить ра- нее» и др.); 2) транзитивные симметричные отношения («быть равным», «происходить одновременно» и др.); 3) нетранзитивные несимметричные отношения («быть субъек- том», «быть результатом» и др.); 4) нетранзитивные симмет- ричные отношения («быть подобным», «находиться вблизи» и др.). Предложения в языке /?Х-кодов могут быть просты- ми и сложными. Простое предложение описывает двухпред- метную ситуацию вида: «ЭВМ находится в зале»; «погода отличная» и содержит два термина и релатему (Ха Rb Хс). Сложное предложение включает несколько простых, соединенных логическим Д (конъюнкцией). Примером слож- ного предложения может быть «Движение поршня вызы- вает вращение коленчатого вала». На языке /?Х-кодов это предложение выглядит следующим образом: XaR()boXb' ^а^12з^* XbR2b3Xc • XbR12QXd • XcR050Xd, где Ха — поршень; Хь — прямолинейное возвратно-пос- тупательное движение; Хс — коленчатый вал; Ха — вра- щение; R0M — быть субъектом; /?120 — быть причиной; /?123 — быть инструментом; Rib3 — иметь объект; R921 — воздействовать на. Большая гибкость семантических средств и «естествен- ность» языка /?Х-кодов определили возможность его ис- пользования не только для целей документального инфор- мационного поиска, но и для задач анализа текстовой ин- формации и описания ситуаций в системах управления. Так, например, язык /?Х-кодов используется в моделях ситуационного управления сложными системами [66]. Язык СИНТОЛ во многом сходен с языком /?Х-кодов [50], и в качестве минимальной синтаксической единицы имеет синтагму — двухместный предикат XRjY (X, Y — предметные переменные, R,—синтагматические отношения). Особенностью ИЯ СИНТОЛ является предварительная клас- сификация на достаточно высоком уровне обобщения «Слов» (предметных переменных) и отношений. На рис. 11 показа- 136
ны схемы организации словарного состава и отношений языка СИНТОЛ. Подробное описание достаточно трудных правил построения фраз на языке СИНТОЛ имеется в ра- боте [50]. Отметим лишь содержание некоторых исполь- зуемых в СИНТОЛе отношений: 1) координативное используется для характеристики отношений, когда еще неизвестна истинная природа связи между понятиями («культура и личность», «электрические и магнитные явления»); Слова СИНТОЛа Зависимые ПРЕДИКАТЫ Индивиды СУЩНОСТИ Пассивные СОСТОЯНИЯ а Автономные ЭЛЕМЕНТЫ Свойства ФУНКЦИИ Активные ДЕЙСТВИЯ Отношения СИНТОЛа Формальные Реальные КООРДИНАТИВНЫЕ Динамические Статические КОНСЕКУТИВНЫЕ АССОЦИАТИВНЫЕ ПРЕДИКАТИВ- б НЫЕ Рис. 11. Схема организации словарного состава (а) и отношений (б) языка СИНТОЛ. 2) консекутивное служит для определения причинно- следственных зависимостей (возбуждение магнитного поля электрическим током); 3) ассоциативное отношение субъекта к действию, дей- ствия к его объекту; 4) предикативно? отношение — связь между парами слов, при которой одно из слэв относится к категории пре- дикатов. О-ним из важнейших вкладов авторов СИНТОЛа в те- орию ИПЯ является исследование природы синтагматиче- ских и парадигматических отношений. Следуя известному лингвисту Ф. де Соссюру, авторы СИНТОЛа Ж. К. Гар- дэн и др. исходят из того, что в ИЯ необходимо учитывать отношения между понятийными единицами фразы, созда- ваемые синтаксической структурой именно данной фразы (синтагматические отношения), и отношения между 137
понятиями, существующими a priori, т. е. до того, как они стали членами данной синтагмы (парадигматические отно- шения). В естественном языке примерами таких априорных парадигматических отношений являются родовидовые от- ношения (стол — письменный стол). Заслуга авторов СИНТОЛа состоит в том, что они не только распространи- ли эти особенности структурных связей между понятиями на фразы ИЯ, но (и это главное) поняли гносеологическую природу этих отношений в языке науки, информационной моделью которого и является СИНТОЛ. Ими справедли- во утверждается, что в науке не существует резкой границы между синтагматическими и парадигматическими отноше- ниями. Прогресс науки сопровождается непрерывным пе- реходом синтагматических отношений в парадигматиче- ские. Расширение сферы использования ИЯ в системах уп- равления показало, что целесообразно ввести в ИЯ отно- шения, являющиеся особой разновидностью парадигма- тических отношений, которые условно можно назвать «недопустимыми». Примеры невозможности построения пра- вильных предложений в заданном ИЯ (для естественного языка такое предложение может быть вполне допустимо) приводятся в работе [43]. Например, нельзя сказать «Ка- раван состоял из «танкера» и «пассажирского судна», так как это «недопустимо», точнее запрещено инструкциями противопожарной безопасности, которые в прикладных задачах использования ИЯ строже чисто лингвистических правил. Опыт разработки и использования ИЯ в различных отраслях науки и техники показал необходимость учета не только (а иногда — не столько) грамматических пра- вил естественного языка, но (и это главное!) специальных отношений данной области науки или техники и ее особые правила построения правильных фраз. Язык является непосредственной действительностью мысли. Это известное определение языка относится не толь- 138
ко к естественным языкам, которые удобнее, следуя М. В. Поповичу, называть этническими языками [65]. Не- посредственной действительностью мысли (языком) яв- ляется и наука, искусство, т. е. любые средства познания и описания действительности. Пределы познания челове- ком природы и, следовательно, развития мышления не ограничены, в то время как этнические языки развиваются медленно. Если же считать естественными языками являю- щиеся «непосредственной действительностью мысли» только этнические языки, то процесс познания, его языковая мате- риализация станут непонятными. В самом деле, в течение последних десятилетий происходит научно-техническая ре- волюция, а существенных изменений в этнических языках не произошло. Более того, известно, что любые попытки искусственно развивать язык законодательным путем всег- да терпели провал. Естественный язык, отражая этапы познания действи- тельности, характеризуется несколькими уровнями, среди которых условно можно выделить этнический язык и язык науки. В свою очередь, языки науки также существенно различаются уровнями абстрагирования действитель- ности: от прикладных языков до таких метаязыков, как философия, математика, логика. Общей характеристикой любого языка является нали- чие словарного состава, грамматики и логики. Словарный состав — это совокупность слов (понятий), использующих- ся в этом языке. Грамматика и логика языка определяют правила построения правильных фраз из отдельных слов и получение новых фраз из заданных посылок. Рассмотрим некоторые особенности этих общих свойств языка при- менительно к отдельным его уровням. Этнический язык. В работе [46] этот уровень развития естественного языка не очень точно назван «пред- метным языком», так как этнические языки хорошо опи- сывают как предметные, так и абстрактные ситуации. Од- нако в период возникновения языка этнический язык имел 139
в основном предметный характер и это надолго определило его словарь, грамматику и логику (правила вывода). При этом «предметность» этнических языков, по-разному прояви- лась в структуре различных языков, в количестве форм, выражающих грамматические значения. Например, в рус- ском языке насчитывается 157 различных глагольных окон- чаний, в немецком — 354. В русском языке различаются два числа: единственное и множественное, в арабском — три (добавляется двойственное число). В русском языке имеется шесть падежей, в английском — два, в венгер- ском — двадцать четыре. Известно, что в словаре ряда северных народностей имеется множество слов, входящих в общее понятие — снег, у некоторых восточных народов сотни слов характеризуют верблюда и т. п. Словарный состав этнического языка не может быть строго ограничен, так как он непрерывно обогащается тер- минами языка науки. И тем не менее одно и то же слово, скажем «электрон», имеет совсем не идентичное содержание на страницах литературного произведения и монографии по физике. Один из классиков языкознания А. А. Потебня по этому поводу говорил: «Что такое «значение Слова?»... говоря о значении слова дерево, мы должны бы перейти в область ботаники, а по поводу слова причина или причин- ного союза — трактовать о причинности в мире. Но дело в том, что под значением слова вообще разумеются две раз- личные вещи, из коих одну, подлежащую ведению языко- знания, назовем ближайшим, другую, составляющую пред- мет других наук,—дальнейшим значением слова» [77]. В приведенном утверждении А. А. Потебни, кроме подчер- кивания различия содержания слов в этническом и науч- ном языках, формулируется важная мысль о многоуров- невости естественного языка. По этим представлениям, слово, возникнув еще на этапе «предметного» языка (на- пример, слово «луна»), последовательно раскрывает свое соде- ржание — от первоначального («ночное светило», «поэти- ческий образ») до естественного спутника земли, объекта 140
космических исследований. При этом новое содержание слова не отменяет старого, а лишь его обогащает на новом уровне познания действительности. Логикой «предметных» языков является, наряду с известными правилами грам- матики, та часть формальной логики, о которой Ф. Энгельс говорил, что как метод познания она годится только для домашнего обихода, но беспомощна, когда ее стремятся применить к объяснению явлений, изучаемых современной наукой. Язык науки. Словарным составом языка на- уки является информативная часть науки, т. е. совокуп- ность фактов, накопленных наукой, и научных понятий. Грамматикой и логикой языка науки является исчислен- ческая часть науки, т. е. опять-таки правила построения правильных фраз в этом языке и правила вывода. Исчис- ления, развиваемые в каждой науке, — это и есть логика данной науки. Например: линейное программирование — логика транспортных перевозок. Построение этих правил представляет центральную научную задачу, поэтому на каждом шаге развития науки происходит совершенствова- ние правил построения фраз (т. е. формулирования объек- тивных истин), совершенствование методов вывода, т. е. логики и грамматики науки. Логические исчисления в на- учном языке несоизмеримо богаче, чем в этническом, вклю- чают все богатство теории множеств, алгебры, логики и кон- кретное исчисление, развиваемое отдельными науками. Отличительная особенность языка науки — стремле- ние к максимально возможной формализации. И это отно- сится не только к математике или химии, где созданы раз- витые символьные языки, а и к так называемым «нефор- мальным» наукам: медицине, биологии, лингвистике, литературоведению.Формализация определяется прежде все- го не наличием символики, а четко определяемым содер- жанием употребляемых понятий и развитых Формальных правил вывода. Известно, что до Виета (1540—1603 гг.) математика, по сути, не имела символьного языка, но ник- 141
то не решится усомниться в том, что математика с самого своего зарождения была наиболее формальной из всех наук. Принципиально любое математическое понятие (те- орему и т. п.) можно изложить на обычном этническом язы- ке. Однако, как справедливо отмечали, для того чтобы объяс- нить понятие, определяемое одним словом (например, ин- теграл), понадобилось бы вывести большое число новых понятий из теории пределов, а это, в свою очередь, потре- бует сведений из алгебры и т. д. В языке науки эта труд- ность снимается наличием целых блоков и суперблоков понятий, которые на несколько порядков увеличивают ин- формативность элемента языка науки по сравнению с эле- ментом (словом) «предметного» языка. В этом самое существенное отличие организации сло- варного состава языка различных уровней, а не в наличии или отсутствии специальной символики. Более того, на- личие символики не обязательно свидетельствует о формаль- ности (иногда это отождествляется с «научностью») изло- жения. Принадлежность к тому или иному уровню развития языка определяется уровнем абстракции понятий данной языковой системы, характером ее исчисления, глубиной проникновения в объективные закономерности природы или духовный мир человека, а не внешними атрибутами, к которым относится используемая символика. Элементы метаязыка как высшего уровня развития мыш- ления, познания законов объективного мира формировались уже на первых двух уровнях языка. В словарный состав метаязыка входят понятия и зако- ны, имеющие значения абсолютных истин, полученных на предыдущих уровнях развития языка, таких, например, как различные законы сохранения, общие законы преоб- разования информации, логика. Центральное место в сло- варе метаязыка занимают категории диалектического ма- териализма, которые отражают наиболее общие законы развития объективного мира. Категории, являясь формами мышления, т. е. языком высшего уровня, служат способом 142
отыскания новых результатов, методом движения от из- вестного к неизвестному. Используемые в библиотечном, архивном деле, различ- ных каталогах, документальных и фактографических ИПС информационные языки являются моделями языка науки, техники, экономики. В принципе такие информационные модели языка науки и техники (т. е. ИЯ) должны разли- чаться так же, как различаются сами моделируемые языки: словарным составом, грамматикой, исчислением. И если нередко по этим показателям бывает трудно различить ИЯ, то это связано с тем, что ИЯ часто еще плохие, односторон- ние (слишком прагматические) модели. Во внеэкономических сферах создававшиеся ранее ИЯ, как правило, предназначались лишь для поиска информа- ции. И хотя любые ИПЯ отражают в определенной мере семантику текстов, но в целом семантические возможности в различных ИЯ существенно отличаются. Если основным критерием оценки ИПЯ являлась эффективность поиска, бо- лее эффективным языком признавался не тот язык, который имел большую семантическую силу, а тот ИПЯ, который обеспечивал меньше шума и большую полноту поиска. Поисковая эффективность ИЯ зависит, во-первых, от природы языка (его словаря, структуры понятий, грамма- тики и т. п.), во-вторых, от средств распознавания, вклю- чающих распознающий субъект (человек или машина, или человек + машина), и алгоритмов распознавания (для машины —это только «расчетные» критерии семантиче- ского соответствия или критерии выдачи). Наибольшую эффективность поиска в принципе должен обеспечить естес- твенный язык с его формальными и неформальными крите- риями распознавания, используемыми человеком. Однако реализовать поисковый режим практически оказалось невозможным из-за растущих объемов информации, пре- вышающих индивидуальные возможности человека. Возникшие в этих условиях ИЯ и ИПС отражали два подхода описания семантики текстов. В одном главное J43
значение —удовлетворение поисковых задач. Собственно семантические характеристики ИЯ при этом были следствием этой основной цели. Наибольшую поисковую эффективность имеют языки классификационного типа. «Чистые» иерархи- ческие классификации не описывают семантику документа, а лишь снабжают его некоторым указателем о принадлеж- ности к одной (или нескольким) вершинам классифика- ционного дерева. При втором подходе на первое место ста- вится требование моделирования средствами ИЯ семантики текстов. При этом предполагается, что высокие семанти- ческие возможности ИЯ в качестве следствия определяют и его эффективность в поисковых задачах. К семантиче- ским информационным языкам относятся фасетный язык Ранганатана, языки типа СИНТОЛ, /?Х-кодов и другие с развитой грамматикой (указателями роли и связи, фасетным упорядочением тезауруса и т. п.) [37, 50, 69, 75, 86]. И если в поисковых задачах классификационные языки во всяком случае не хуже сложных семантических (по тра- диционным критериям эффективности —шума и полноты), то в настоящее время именно семантические информацион- ные языки выходят на первое место. В целом описанные выше дескрипторные языки с раз- витыми грамматическими средствами в принципе могут удовлетворять поисковые задачи высокой сложности в мо- нотематических массивах, требующих создания словаря в несколько десятков тысяч дескрипторов. Однако ставшие в последние годы актуальными задачи информационного анализа при машинной обработке научно-технической и технико-экономической информации расширяют границы используемых словарных единиц тезаурусов до десятков и сотен тысяч. Объясняется это тем, что анализу подвер- гаются так называемые сложные, т. е. многоуровневые системы. «Кризисная» ситуация в развитии ИЯ возникла в свя- зи с совершенствованием АСУ и задачами коренного повы- 144
шения их эффективности. До тех пор, пока в АСУ подвер- галась обработке лишь информация, содержащаяся в раз- личных ведомостях, отчетных документах, утвержденных директивными органами (например, ЦСУ), острой проб- лемы информационного языка не возникало. Общее количество «бумажных» документов, курсирую- щих в народном хозяйстве, очень велико. Так, по данным Госстандарта СССР, в стране ежегодно выходит около 4 млрд, управленческих документов. В течение года на промышленном предприятии обрабатывается от 1,5 до 5 млн. документов, а в министерствах —от 1 до 2 млн. докумен- тов. По отраслям промышленности в настоящее время дей- ствует более 200 утвержденных форм отчетности [29]. Не включаясь в обсуждение вопроса о целесообразности этого «бумажного потока», скажем лишь, что трудность обработ- ки этих документов в основном техническая, а не языко- вая. Количество базовой информации, содержащейся в этих стандартных формах для отдельного предприятия (или да- же отрасли), сравнительно невелико. В словаре объемом в несколько десятков тысяч слов количество «чужой» тер- минологии, как правило, также не очень велико, а главное, фиксировано. Терминологическая революция происходит лишь при коренном изменении технологии, что не так уж часто случается даже в период научно-технической рево- люции. В конце-концов, подавляющее большинство этих фун- кционирующих в экономике документов ориентировано в основном на решение рутинных традиционных задач. Но как только во главу ставится основное требование к АСУ — принцип новых задач —экономика сразу проявляет себя как сложная многоуровневая система. И для принятия решения требуется включать в анализ параметры различ- ной природы: люди, техника, строительство, проектирова- ние и наука, политэкономия, отраслевая экономика и т. д. Одна из центральных проблем отраслевых и межотрас- левых автоматизированных систем управления —это Ю 6-3324 145
создание условий обмена информацией различными массива- ми, т. е. создание распределенных банков данных. Но эта проблема требует не только создания специального ма- тематического обеспечения. Это, прежде всего, языковая проблема, так как отраслевые массивы должны «понимать» друг друга. Для решения задач информационного анализа в АСУ необходим ИЯ, который обеспечивал бы следующие тре- бования: 1) единство и совместимость семантических средств от- дельных информационных массивов; 2) возможность анализа связей не в конечном («застыв- шем»), а непрерывно расширяющемся множестве понятий, принадлежащих различным уровням, формам движения материи; 3) позволял бы переходить при описании системы, ее состояний на любой уровень обобщения, от модели «фото- графии», содержащей детальную качественную и количест- венную информацию, до абстрактной математической мо- дели; 4) соответствие в каждой описываемой на ИЯ ситуации реальной сложности объекта, его семантике; 5) возможность реализовывать различные исчисления, развиваемые в отдельных науках; 6) был бы достаточно близким по структуре к естествен- ному языку, т. е. языку, на котором удобно (привычно) мыслить; 7) допускал бы диалоговые режимы; 8) был бы реализуем на ЭВМ, т. е. имел бы необходимый уровень формализации. Очевидно, что ни один из известных дескрипторных ИПЯ не может в полной мере удовлетворить эти требова- ния к языку описания и анализа сложных систем. Поэтому нужны новые принципы, что, конечно, не должно приводить к игнорированию богатейшего опыта использования ИЯ в библиотечных классификациях и ИПС. 146
3.2. ЯЗЫК ИНФОРМАЦИОННОГО АНАЛИЗА Описанный ниже язык логических категорий (язык ЛК) семантический ИЯ. Он предназначен для построения и ана- лиза моделей сложных систем. Методологической основой разрабатываемого языка ЛК служат: 1) фасетный язык Ш. Ранганатана [69]; 2) универсальная десятичная клас- сификация [62, 80]; 3) языки семантических кодов: язык 7?Х-кодов и СИНТОЛ [50]. Попытка объединения этих ка- жущихся противоречивых подходов проведена на основе диалектической логики как системы категорий [48] и кибернетики как науки об общих законах преобразования информации в сложных системах [15]. Форма хранения или точнее аккумуляции знания ор- ганически связана с природой используемого языка. Со- держанием знания как результата коллективного мышле- ния являются понятия. «... итоги естествознания суть поня- тия, — указывал В. И. Ленин, —а искусство оперировать с понятиями не прирождено, а есть результат 2000-летнего развития естествознания и философии».* Наука накопила множество экспериментальных дан- ных, различных констант, свойств различных веществ, сформулировала фундаментальные законы природы, об- щества и мышления, разработала систему общих и специ- альных понятий. Входящие в состав знания понятия раз- личаются степенью общности, в которой отражается диалектический путь познания истины «... от живого со- зерцания к абстрактному мышлению и от него к прак- тике»"*1. Будем в дальнейшем различать следующие группы понятий, входящих в состав знания: 1) факты; 2) специаль- ные термины; 3) фундаментальные понятия отдельных на- ук; 4) законы природы, общества и мышления; 5) катего- рии и общенаучные понятия. * Ленин В. И. Поли. собр. соч. Т. 29. 152—153 с. , 236 с. 10* 147
В любом процессе мышления новые закономерности и свойства постигаются с помощью понятийного аппарата, который является итогом знаний предшествующих поко- лений. Без категорий и общих понятий нельзя понять и описать даже двуместную ситуацию. Чтобы сказать, что этот человек моложе другого, нужно владеть понятиями «человек», «возраст», «старость», «молодость», «величина», «этот», «тот» и др. В свою очередь, эти понятия приобретают смысл на основе более общих категорий: время, простран- ство, качество, количество, отношения и др. Известно, что на иностранном языке легче говорить, чем его понимать, так как понимание требует не механиче- ского знания «отображения» одного словарного множества в другое, а владение системой понятий и категорий, т. е. мышления. При информационном моделировании понятий- ного аппарата существенную роль играет моделирование понятийных структур, связей и переходов от одной группы понятий к другой. И первостепенное значение часто имеет не иерархия понятий, какая бы полная она ни была (как это имеет место в большинстве отраслевых тезаурусов), а диалектика понятий. Основой этой диалектической струк- туры понятий (т. е. связей, переходов, динамичности и т. д.) являются категории диалектической логики. Однако имеющиеся в философской литературе класси- фикации категорий, как правило, трудно использовать в разработке понятийных систем отдельных наук, включая словари и тезаурусы. В классификацию включаются лишь самые общие категории, такие, например, как «материя», «движение», «пространство», «время», и не указывается их связь с понятийным аппаратом естественных и обществен- ных наук. Невзирая на революционный скачок в XX веке в раз- витии науки и техники, в литературе рассматриваются в основном лишь категории, многие из которых были из- вестны и анализировались еще Аристотелем, Кантом, Ге- гелем (любопытно, что основу фасетной классификации 148
ш. Ранганатана составляют пять категорий, заимство- ванных у древнеиндийских философов). Правда, в послед- ние годы, особенно с появлением и развитием кибернетики, ученые настойчиво предлагают включить в состав катего- рий диалектической логики ряд фундаментальных понятий, порожденных отдельными науками [21 ]. «Не исключена возможность, —писал П. В. Копнин, — что нужна новая сеть категорий, отражающих уровень и потребности современного научно-технического мышле- ния, которая послужит мощным толчком для познания вооб- ще и выдвижения новых теорий в науке ...» [48]. В состав языка ЛК входят: 1) категоризатор, 2) сло- варь, 3) грамматика, 4) методы распознавания, 5) исчис- ление. 1. Категоризатор. Категоризатор —центральная часть языка ЛК — является информационной моделью струк- туры категорий. Предлагаемая схема категоризатора ос- новывается на том, что законы и формы бытия, после того как они познаны человеком, превращаются в законы и формы мышления [48]. Итак, категоризатор —это не клас- сификация знаний (и не тезаурус), а информационная модель «форм и законов мышления». С позиций кибернетики само мышление можно рассмат- ривать как информационную систему, содержащую в себе динамические модели объективной реальности. Эффектив- ность этой системы зависит от словарного (понятийного) состава, от используемых алгоритмов обработки данных, сортировок, выборок, аппарата исчисления, объема «опе- ративной» и «долговременной» памяти. Не менее важной в этой системе является структура массива, многоуровневая организация фактов, понятий и категорий. При значитель- но худших технических характеристиках памяти (времени «считывания») можно намного быстрее отыскивать нужную информацию за счет лучшей организации массива. Это для ЭВМ. У человека же структура «массивов» и организация понятийного аппарата является не только средством поиска 149
Категори затор а-ступень (Природа) I. Физика II. Химия III. Земля IV. Биология V Человек 1. Вселенная 1. Веще- ство 1. Земля 1. Организм 1. Расы 2. Законы фи- зического дви- жения 2. Реак- ции 2. Эволюция земли 2. Эволюция 3. Физиология пита- ния и выделения 4. Физиология крово- обращения и дыха- ния 5. Физиология раз- множения 6. Биохимические процессы обмена и преобразования энер- гии 2. Эволюция человека 3. Физическая энергия 3. Хими- ческая энергия 3. Эндогенные процессы 3. Поведение Деятельность 4. Структура молекулярных систем 5. Единицы физических ве- личин 6. Физические константы 4. Хими- ческие свойства 5. Едини- цы хими- ческих ве- личин 6. Хими- ческие константы 4. Рельеф, ландшафт 5. Полезные ископаемые 7. Адаптационные процессы 8. Хранение и пере- дача генетической ин- формации 9. Эндокринные про- цессы 10. Нервные процес- сы 1 4. Рецепторная информация 5. Наследст- венность 7. Валент- ность, хи- мическая связь, сродство 8 Катализ G. Геологиче- ское действие организмов 7. Человек и геология Зем- ли 6. Регуляция процессов 150
языка ЛК Таблица 6 Р-ступень (Общество) у-ступень (Мышление) I. Экономика II. Техни- ка III. Общество I. Слово II. Катего- рии III. Фор- мулы ). Экономи- ческие систе- мы 2. Производ- ство 1. Маши- ны, меха- низмы, инстру- менты, де- тали ма- шин и ме- ханизмов 2. Матери- алы 1. Материальное производство 1. Пред- меты 1. Мате- рия 1. Множе- ства 3. Развитие производства 3. Техно- логиче- ские про- цессы 2. Естественно- исторический процесс поступа- тельного разви- тия общества 2. Дейст- вие 2. Движе- ние Развитие 2. Сущест- вование 4. Общие ос- новы товарно- го производ- ства 4. Энерге- тика ма- шин и про- цессов 3. Движущие си- лы развития мате- риального произ- водства 4. Классы 5. Социальная ре- волюция 3. Работо- способ- ность 3. Энергия — 5. Технико- экономиче- ская информа- ция 5. Допус- ки и по- садки. Из- мерения 6. Качест- во 6. Формы общест- венного сознания 4. Струк- тура 5. Свойст- ва 6. Величи- ны 4. Инфор- мация 3. Атрибу- ты 4. Значе- ния 5. Отно- шения 6. Коммуни- кации, связь 7. Управ- ление и регулиро- вание 7. Политическая организация об- щества 7. Влия- ние 5. Управ- ление и связь 6. Отобра- жения. Функции 151
а-ступень (Природа) I. Физика II. Химия III. Земля IV. Биология V. Человек 7. Простран- ство и время 9. Крис- таллогра- фия 8. Геологиче- ское прост- ранство И. Анатомическая за- щита 12. Экосистемы 7. Антропо- метрические параметры 10. Хими- ческая ки- нетика 9. Геологиче- ская шкала времени 13. Биологическое время 8. Возраст 8. Основные физические принципы 9. Методы из- мерений 11. Основ- ные прин- ципы хи- мии 12. Мето- ды хими- ческого анализа 10. Основные принципы и законы геоло- гии 14. Общебиологиче- ские законы и прин- ципы 15. Методы исследо- ваний 9. Психиче- ские процес- сы 10. Методы исследований 10. Физические науки 13. Хими- ческие науки 11. Науки о Земле 16. Биологические науки И. Науки о человеке информации, но и основой таких творческих методов, как аналогия, эвристика, интуиция и т. п. В органи- зации понятийного аппарата (и в этом существенное отличие его от структуры машинных массивов) перво- степенное значение имеет создание целостной картины мира. Категоризатор должен быть моделью такой логики, ко- торая является учением «... не о внешних формах мышле- ния, а о законах развития «всех материальных, природ- ных и духовных вещей», т. е. развития всего конкретного 152
Продолжение табл, б р-ступень (Общество) V-ступень (Мышление) I. Экономика II. Техни- ка III. Общество I. Слово II. Катего- рии III. Фор- мулы 7. Территори- альное разме- щение произ- водства 8. Прост- ранствен- но-техни- ческие ха- рактерис- тики 8. Природа и об- щество 8. Прост- ранствен- ное по- ложение 6. Прост- ранство 7. Геомет- рическое простран- ство 8. Производ- ственно-вре- менные ха- рактеристи- ки 9. Техни- ко-вре- менные характе- ристики 9. Общественное время 9. Вре- менные характе- ристики 7. Время 8. Вре- менные условия 9. Экономи- ческие модели 10. Конст- руирова- ние 11. Техни- ческое мо- делирова- ние 10. Наука 10. Сопос- тавление 8. Позна- ние 9. Исчис- ление 10. Указа- тели и оп- ределите- ли 11. Опера- торы 10. Экономи- ческие науки 12. Техни- ческие науки 11. Обществен- ные науки 11. Науки о естест- венных языках 9. Наука 12. Мате- матиче- ские нау- ки содержания мира и познания его, т. е. итог, сумма, вывод истории познания мира».* Поэтому в основу деления категоризатора на информа- ционные ступени и уровни положен принцип развития форм движения материи и исторический процесс познания (речь идет, конечно, лишь об информационной модели такого про- цесса). Категоризатор языка ЛК состоит из трех ступеней: * Ленин В. И. Поли. собр. соч. Т. 29. 84 с. 4 53
P-ступень (Обще- ство) I. Экономика II. Техника III. Общество V-ступень (Мышле- ние) I. Слово II. Категории III. Формулы a-ступень (Приро- да) I. Физика II. Химия III. Земля IV. Биология V. Человек а-ступень (Природа), P-ступень (Общество), у-ступень (Мыш- ление). Каждая ступень включает следующие уровни (табл. 6). Содержание категоризатора составляют: 1) категории и общенаучные понятия, 2) понятия —законы природы, общества и мышления, 3) фундаментальные понятия отдель- ных наук. Другие составляющие (специальные термины и факты) входят в словари. Между понятиями категоризатора и словаря нет жесткой границы, так как знание динамично, и категоризатор непрерывно обогащается. Кроме того, если категоризатор является логикой, то действующим «ядром», инструментом получения новых истин могут выс- тупать различные составляющие, вплоть до отождествле- ния логики со всем знанием. В зависимости от рода дея- тельности (индивидуальной или групповой), категоризатор может включать различное множество понятий. Но в любом виде деятельности мышление включает в систему своих логических категорий, которыми необходи- мо руководствоваться, такие, например, как «закон все- мирного тяготения». Конечно, эта категория в чем-то раз- лична в логике жонглера, космонавта, архитектора или домохозяйки. Сознательно или подсознательно, но такие категории, как законы живого, общественные законы, также обязательно входят в логику любого человека, яв- ляясь частью его постоянного категоризатора. Употребляя терминологию теории информационных языков, можно ска- зать, что категоризатор фиксирует множество парадигмати- ческих отношений, классифицируя их естественным обра- зом. 154
Все понятия, входящие в состав категоризатора и рас- пределенные по ступеням и уровням, сгруппированы вокруг девяти фундаментальных категорий: 1) материя [М], 2) движение. Развитие [D], 3) энергия [£], 4) информация [J], 5) управление и связь [/? 1, 6) пространство [VI, 7) время [Т], 8) познание [Л], 9) наука [//]. Таким образом, схема категоризатора —это таблица размером 11x9, столбцами которой являются 11 уровней (3 ступени), а строками —9 фундаментальных категорий, раскрывающих свое содержание в понятиях, представлен- ных в отдельных уровнях. Рассмотрим схему категоризатора. Очевидно, что для описания сложных систем различного типа, любого ее со- стояния, процесса необходим намного больший набор ка- тегорий, чем тот, который приписывается соответствующей ситуации категоризатором. Эта органическая связь кате- горий бывает настолько сильна, что не удается их раз- делить даже в модели (классификационных схемах). При- мером этого являются, например, категории «Пространство» и «Время» в Физике, «Движение» и «Энергия» в Биологии и др. Использование для описания системных ситуаций тех или иных уровней языка ЛК прежде всего определяется отношением описываемых объектов к категории [М ]. Если, например, рассматривается «Организм» (Биология), то в принципе для описания возникающих ситуаций могут по- надобиться категории всех предшествующих уровней. Если же рассматривается «Вещество» (Химия), то кате- гории 3,4 и 5-го уровней (a-ступень) вряд ли могут пона- добиться. Однако независимо от того, к какому из уровней а-, Р-, у-ступени относится конкретная ситуация, описы- вается ли естественная или абстрактная система, обяза- тельно необходимы для описания и анализа понятия у- ступени (Мышление). Даже самые формализованные мате- матические тексты содержат слова типа «после несложных преобразований», «отсюда следует» и т. п. 155
Остановимся подробней на ^-ступени (табл. 7). у-ступень (Мышление) является логическим итогом познания человеком объективной реальности, информаци- онным обобщением наиболее общих и существенных свойств сложных систем, описываемых естественными и обществен- ными науками. I. Слово, будучи 1-м уровнем в у-ступени, отражает в основном «донаучный» период познания, являясь в опре- деленном смысле информационной моделью этнического, общеразговорного (естественного языка) (см. гл. 3. 1). Ко- нечно, утверждение о «донаучности» разговорного языка не следует понимать буквально как «ненаучность». Речь идет лишь о том, что общеразговорный язык возник до науки, но этот язык непрерывно обогащается понятиями науки. В приведенной классификации категорий уровня «Слово» сделана попытка дать хотя и нормализованное, но соответствующее фундаментальным категориям упоря- дочение отношений этнического, общеразговорного языка. При этом, безусловно, допущено очень большое огрубление такого уникального феномена, которым является язык, впитавший в себя самые сложные и глубинные закономер- ности мышления, самые тонкие средства системной орга- низации. II. Категории. Как видно из приведенной структуры 2-го уровня, в нее включены в основном категории, рас- сматриваемые в диалектической логике, а также ряд обще- научных понятий, прежде всего, связанных с кибернетикой и ее приложениями. Наряду с другими общенаучными понятиями, введены «Множество», «Альтернативность», «Траектория» (оптимальная, рациональная и т. д.), «Сис- темный анализ», «Принцип информационной неопределен- ности», «Принцип информационной неразрешимости», «Прин- цип системы отсчета» (относительности), «Ассимиляция» и др. Включение в уровень «Категории» общенаучных поня- тий определяется тем, что они в гносеологическом отноше- нии близки к категориям. 156
у-ступеиь (Мышление) Таблица 7 Номер Номер кате- Отношения Индекс | 1 кате- Отношения Индекс горни 0 горни I. Уровень-Слово 1 Изменения коли- 1. Предметы чественные 6. 6.1 Одушевленные 1. Ускорение 6.1.1 Живущие на су- 1.1 Замедление 6.1.2 ше Расширение 6.2 6.2.1 Живущие в воде 1.2 Сужение 6.2.2 Неразличенные 2. Увеличение 6.3 6.3.1 Неодушевленные 3. Уменьшение 6.3.2 Искусственные 3.1 Другие количест- Естественные 3.2 венные изменения 6.4 2. Действие Изменения ка- Возникновение 1. 1.1 чественные 7. 7.1 Исчезновение 1.2 Улучшение 7.1.1 Рост + 2. 2.1 Ухудшение 7.1.2 Рост 0 2.2 Восстановление 7.2 7.2.1 Рост — 2.3 Нарушение 7.2.2 Перемещение 3. 3.1 Возбуждение 7.3 7.3.1 Покой 3.2 Торможение 7.3.2 Процесс 4. 4.1 Другие качест- Состояние 4.2 венные изменения 7.4 Детство 5. 5.1 Деятельность (типа Отрочество 5.2 «применять», «внед- Юность 5.3 рять», «анализиро- Зрелость 5.4 вать», «вводить», Старость 5.5 «создавать» и др.) 8.
S3 Номер кате- гории Отношения Индекс 3. 4. Работоспособность Возможность Невозможность Жизнеспособ- ность Нежизнеспособ- ность Способность Склонность Безразличие Неспособность Конкурентность Неконкурент- ность Энергичность Бездеятельность Действие Противодействие Структура Дерево Корень Ствол Ветки Листья Классификация Тип 1. 1.1 1.2 2. 2.1 2.2 3. 3.1 3.2 33 3.4 4. 4.1 4.2 5. 5.1 5.2 6. 6.1 6.2 1. 1.1 1.2 1.3 1.4 2. 2.1 2.1.1
Продолжение табл. 7 Номер кате- гории Отношения Индекс Класс 2.1.2 Род 2.1.3 Вид 2.1.4 Индивидуум 2.1.5 Целое 2.2 2.2.1 Часть 2.2.2 Целое 2.2.3 Элементы 2.2.4 Организм 2.3 2.3.1 Орган 2.3.2 Состав 2.4 2.4.1 Строение 2.4.2 Родство 3. Родители 3.1 3.1.1 Дети 3.1.2 Братья 3.2 Дядя 3.3 3.3.1 Племянник 3.3.2 Дед 3.4 3.4.1 Внук 3.4.1 5. Свойства Определительные 1. Хороший 1.1 1.1.1 У дов л етвор ите л fa- ный 1.1.2 Плохой 1.1.3
Положительный 1.2.1 Нейтральный 1.2.2 Отрицательный 1.2.3 Очень сильный 1.3 1.3.1 Сильный 1.3.2 Слабый 1.3.3 Крайне слабый 1.3.4 Существенный 1.4 1.4.1 Несущественный 1.4.2 Основной 1.5 1.5.1 Второстепенный 1.5.2 Дополнительный 1.5.3 Познавательные 2. СИ <D Опознанный 2.1 2.1.1 Неопознанный 2.1.2 Определенный 2.2 2.2.1 Неопределенный 2.2.2 Различимый 2.3 2.3.1 Неразличимый 2.3.2 Однородный 2.4 2.4.1 Неоднородный 2.4.2 Функциональные 3. Совместимый 3.1 3.1.1 Несовместимый 3.1.2 Дружественный 3.2 3.2.1 Конкурирующий 3.2.2
Благоприятный Безразличный Неблагоприятный Запланированный Случайный Планируемый Итоговый Вредный Полезный Активный Пассивный Другие свойства типа «упругий», «настойчивый», «эффективный», «чувствительный» Организованный Неорганизован- ный Упорядоченный Неупорядоченный Хаотичный Принадлежности Принцип Манифестация Предмет 3.3 3.3.1 3.3.2 3.3.3 3.4 3.4.1 3.4.2 3.5 3.5.1 3.5.2 3.6 3.6.1 3.6.2 3.7 3.7.1 3.7.2 3.8 3.9 3.9.1 3.9.2 3.10 3.10.1 3.10.2 3.10.3 4.1 4.1.1 4.1.2 4.2 4.2.1
Номер кате- гории Отношения Индекс Свойство 4.2.2 Владелец 4.3 4.3.1 Собственность 4.3.2 Состояние 4.4 4.4.1 Признак 4.4.2 Именной 4.5 4.5.1 Безымянный 4.5.2 Цвета 5. Красный 5.1 Оранжевый 5.2 Желтый 5.3 Зеленый 5.4 Цвет морской волны 5.5 Синий 5.6 Ультрамарин, го- лубой 5.7 Фиолетовый 5.8 Пурпурный 5.9 Бесцветный, прозрачный 5.10 Черный 5.11 Белый 5.12 б. Величины Количественные 1. Качественные 2.
Продолжение табл. 7 Номер кате- гории Отношения Индекс Много 2.1 . . • 2.2—2.3 Мало 2.4 Ориентирующие 3. Начало 3.1 3.1.1 Середина 3.1.2 Конец 3.1.3 Первый 3.2 3.2.1 Второй 3.2.2 Третий 3.2.3 /1-ЫЙ 3.2л 7. Влияние Общая связь 1. Прямая 1.1 1.1.1 Опосредованная 1.1.2 Односторонняя 1.2 1.2.1 Двусторонняя 1.2.2 Активная (оказы- вать влияние) 1.3 1.3.1 Пассивная (нахо- диться под влия- нием) 1.3.2 Функциональная связь 2. Источник 2.1
3324 Основа-условие 2.2 Последствие 2.3 2.3.1 Сопутствие 2.3.2 Руководитель 2.4 2.4.1 Руководимый 2.4.2 Инструмент-дей- ствие 2.5 Средство 2.5.1 Результат 2.5.2 Процесс 2.6 2.6.1 Продукт 2.6.2 Действие 2.7 2.7.1 Цель 2.7.2 Дружба 2.8 2.8.1 Конкуренция 2.8.2 Вражда 2.8.3 Каталитическая связь 3. Полностью опре- делять 3.1 Способствовать 3.2 Быть нейтраль- ным 3.3 Оказывать сопро- тивление 3.4 Не допускать 3.5 Ассоциативная связь 4.
По смежности 4.1 По сходству По контрасту Грамматическая связь Управление 4.2 4.3 5. 5.1 5.1.1 Руководство Субъект 5.1.2 5.2 5.2.1 Объект Субъект 5.2.2 5.3 5.3.1 Пр едикат Подлежащее Сказуемое Определение Дополнение Обстоятельство Однородные чле- ны предложения Логико-граммати- ческое следствие 5.3.2 5.4 5.5 5.6 5.7 5.8 5.9 5.10 8. Пространственное по- ложение Горизонтальное Справа Посредине Слева 1. 1.1 1.2 1.3
Номер кате- гории Опвмпения Индекс Номер кате- гории Осевое 2. Впереди 2. 1 В центре 2.2 Сзади Вертикальное 3. 2.3 Над, выше 3.1 На одном уровне 3.2 9. Под, ниже Ориентирующее 4. 3.3 Вне (за предела- ми) Внутри (в преде- 4.1 лах) 4.2 Близко 4.3 Между 4.4 Вдали, далеко Действие-простран- 4.5 ство 5. Движение к месту Движение из мес- 5.1 та 5.2 Движение изнут- ри 5.3 Движение навст- речу 5.4 Достижение места 5.5
Продолжение табл. 7 Опюшенвя Индекс Окружение (лока- лизания места) 5.6 Соприкос новение с местом 5.7 Общие определи- тели места (по УДК) 5.8 Временные характе- ристики Времена года 1. Дни недели 2. Время суток (утро, полдень, вечер, ночь) 3. Качественное время 4. Всегда 4.1 Часто 4.2 Редко 4.3 Иногда 4.4 Никогда 4.5 Срок 4.6 Короткий 4.6.1 Длительный 4.6.2 Грамматическое вре- мя 5. Настоящее 5.1 5.1.1
Прошедшее 5.1.2 • Будущее 5.1.3 Инд еф ин нт 5.2 5.2.1 Континиус 5.2.2 Перфект 5.2.3 10. Сопоставление Похожесть 1. Идентичность 1.1 Аналогичность 1.2 Несходность 1.3 Противополож- ность 1.4 о> GO Семантичность 2. Синонимия 2.1 Омонимия 2.2 Степень 3. Высшее, более 3.1 3.1.1 Равно 3.1.2 Низшее, менее 3.1.3 Большего размера 3.2 3.2.1 Равного размера 3.2.2 Меньшего разме- 3.2.3 ра Длиннее (продол- жительнее) 3.3 3.3.1 Равной продол- жительности 1 3.3.2
Эджективность (типа «красивее», «эластичнее», «лучше», «хуже» и т. п. 4. II. Уровень-Категории Материя Системы 1. Материальные 1.1 1.1.1 Идеальные 1.1.2 Детерминирован - ные 1.2 1.2.1 Вероятностные 1.2.2 Иерархические (многоуровне- вые) 1.3 1.3.1 Линейные (одно- уровневые) 1.3.2 Самоорганизую- щиеся 1.4 Адаптивные 1.5 1.5.1 Неадаптивные 1.5.2 Простые 1.6 1.6.1 Сложные 1.6.2 Социальные 1.7 1.7.1 Несоциальные 1.7.2 Движение, развитие
Номер кате- гории Отношения Индекс Формы движения I. Физическая 1.1 Механическая 1.1.1 Химическая Физико-химичес- 1.2 кая 1.2.1 Биологическая 1.3 Биохимическая 1.3.1 Психическая 1.4 Социальная Общественное 1.5 сознание 1.6 Формы развития 2. Эволюция 2.1 2.1.1 Революция 2.1.2 Прогресс 2.1.3 Регресс 2.1.4 Обратимость 2.2 2.2.1 Необратимость Отрицание отри- 2.2.2 цания (спираль) 2.3 Тезис 2.3.1 Антитезис 2.3.2 Синтез 2.3.3 Ассимиляция 2.4 Понятийная 2.4.1 Структурная 2.4.2
Продолжение табл. 7 Номер кате- гории Отношения Индекс 3. Энергия Противоположность 1. Единство противо- положностей 1.1 1.1.1 Борьба противо- положностей 1.1.2 Новое 1.2 1.2.1 Старое 1.2.2 Противоречие 2. Динамическое 2.1 2.1.1 Формально-логи- ческое 2.1.2 Антагонистиче- ское 2.2 2.2.1 Неантагонистиче- ское 2.2.2 Внутреннее 2.3 2.3.1 Внешнее 2.3.2 Тождество 2.4 2.4.1 Различие 2.4.2 Конфликт 2.4.3 4. Информация Структура 1. Информационная энтропия 1.1 1.1.1 Негэнтропия 1.1.2
Целостность 1.2 1.2.1 Структурность ! 1.2.2 Простота 1.3 1.3.1 Сложность 1.3.2 Равномерность 1.4 1.4.1 Неравномерность 1.4.2 Однообразие 1.5 1.5.1 Разнообразие 1.5.2 Дискретность 1.6 1.6.1 Непрерывность 1.6.2 Качество—свойство 2. Качество 2.1 Сущность 2.1 Свойство 2.2 Явление 2.2 Содержатель- ность 2.3 2.3.1 Формальность 2.3.2 Изоморфизм 2.4 2.4.1 Гомоморфизм 2.4.2 Симметричность 2.5 2.5.1 Асимметричность 2.5.2 Инвариантность 2.6 Имманентное 2.7 2.7.1 Ситуационное 2.7.2 Постоянное 2.8 2.8.1
Переменное Нормальное 2.8.2 2.9 2.9.1 Патологическое 2.9.2 Естественное 2.10 2.10.1 Искусственное 2.10.2 Качество-количест- во 3. Качество 3.1 3.1.1 Количество 3.1.2 Информационные процессы 4. Сбор информации 4.1 Хранение инфор- мации 4.2 Извлечение ин- формации 4.3 Переработка ин- формации 4.4 Передача инфор- мации 4.5 Управление и связь Управление 1. 1.1 Связь 1.2 Причинно-следст- венные отношения 2. Причина 2.1
Номер кате- гории Отношения Индекс Следствие Случайность-необ- ходимость Случайность Необходимость Одновариантное развитие Многовариантное развитие Возможность-де йст- вительность Возможность Действитель- ность Условия (ограни- чения) развития Катализация Сопротивление Свобода-необходи- мость Свобода Необходимость Одноальтернатив- ный выбор Многоальтерна- тивный выбор 2.2 3. 3.1 3.1.1 3.1.2 3.2 3.2.1 3.2.2 4. 4.1 4.1.1 4.1.2 4.2 4.2.1 4.2.2 5. 5.1 5.1.1 5.1.2 5.2 5.2.1 5.2.2
Продолжение табл. 7 Номер кате- гории Отношения Индекс Управляющий па- раметр 5.3 5.3.1 Управляемый на- раметр 5.3.2 Оптимальная тра- ектория 5.4 5.4.1 Рациональная 5.4.2 У д овл етворител ь- ная 5.4.3 Плохая 5.4.4 Наихудшая 5.4.5 6. Пространство Геометрическое 1. Системно-процес- сионное 2. 7. Время Физическое 1. Системно-процес- сионное 2. 8. Познание Отражение 1. Физическое 1.1 Биологическое 1.2 Раздражимость 1.2.1 Чувственное 1.3 Ощущение 1.3.1
Восприятие 1.3.2 Представление 1.3.3 Логическое 1.4 Распознавание 1.4.1 Сравнение 1.4.2 Равенство 1.4.2. Сходство 1.4.2. Толерантность 1.4.2. Отличие 1.4.2. Понятие 1.4.3 Суждение 1.4.4 Умозаключение 1.4.5 Категория Информационный 1.4.6 уровень 1.4.7 Основные принципы законы познания 2. Диалектика Общие законы 2.1 сбора, хранения, переработки и пе- редачи информа- ции в сложных системах 2.2 Средства и мето- ды познания з..
Наблюдения (экс- перимент) 3.1 Обобщение 3.2 Анализ 3.3 3.3.1 Синтез 3.3.2 Индукция 3.4 3.4.1 Дедукция 3.4.2 Интерпретация 3.5 Аналогия 3.6 Моделирование 3.7 Ал горитмизация 3.8 Формализация 3.9 Гипотеза 3.10 Теория 3.11 Системный анализ 3.12 Прогноз 3.13 Орудия исследо- вания 3.14 ЭВМ 3.14.1 Истина 4. Объективная 4.1 4.1.1 Абсолютная 4.1.2 Непроверяемо 4.2 4.2.1 Истинно 4.2.2 Неопределенно 4.2.3 Ложно 4.2.4
Номер кате- гории Отношения Индекс Уровни познания 4.3 о Открытие новых всеобщих законо- мерностей приро- ды, общества, мышления, созда- ние новых фун- даментальных научных направ- лений 4.3.1 00 Открытие новых фундаментальных законов науки 4.3.2 Крупнейшие тех- нические откры- тия и изобретения, связанные с ис- пользованием новых форм пре- образования энер- гии или информа- ции 4.3.3 Открытие важных законов внутри отдельных наук 4.3.4
Продолжение табл. 7 Номер кате- гории Отношения Индекс Создание новых материалов, раз- работка новых структур, машин для различных форм преобразо- вания информации 4.3.5 Открытие част- ных закономер- ностей внутри от- дельных разделов науки 4.3.6 Усовершенствова- ние технологии обработки и полу- чения материалов, решение различ- ных частных тех- нологических за- дач 4.3.7 Открытие новых свойств ранее изученных объек- тов J 4.3.8
Усовершенствова- ние серийно изго- товленного обору- дования, рациона- лизация отдель- ных устройств об- работки материа- лов 4.3.9. Принцип системы отсчета (относи- тельности) 4.4 Аспект 4.4.1 Динамика 4.4.1.1 Форма 4.4.1.2 Содержание 4.4.1.3 Процесс 4.4.1.4 Продукт 4.4.1.5 Метод 4.4.1.6 Результат 4.4.1.7 Средство 4.4.1.8 Цель (и другие сочетания отно- шений, понятий и категорий) 4.4.1.9 Общие определи- тели точки зрения (по УДК) 4.4.2
Принцип инфор- мационной нео- пределенности 4.5 Принцип инфор- мационной нераз- решимости 4.6 Историческое и 4.7 логическое Теория и практи- 4.8 ка Общность 5. Единичное 5.1 5.1.1 Общее 5.1.2 Всеобщее 5.1.3 Абстрактное 5.2 5.2.1 Конкретное 5.2.2 Имя 5.2.3 Достоверность 6. Качественная 6.1 Достоверно 6.1.1 Очевидно 6.1.2 Возможно (веро- ятно) 6.1.3 Невероятно 6.1.4 Количественная 6.2 Аргументация 7.
Номер кате- гории Отношения Индекс Экспериментами ные данные 7.1 Логика 7.2 Авторитет 7.3 Оценка эксперта 7.4 Перспективно 7.4.1 Неперспективно 7.4.2 Локализовано 7.4.3 9. Наука Диалектическая ло- гика 1. Кибернетика 2. И н формацион н ые системы науки 3. Научно-техниче- ская информация 3.1 Содержание доку- мента 3.1.1 Цель 3.1.2 Предмет 3.1.3 Методы 3.1.4 Результаты 3.1.5 Сфера приложе- ния 3.1.6
Продолжение табл. 7 Номер кате- гории Отношения Индекс Типы документов (общие определи- тели формы по УДК) 3.1.7 Информационные языки науки 3.2 Языки науки 3.2.1 Ал горитмические языки (програм- мирования) 3.2.2 Языки информа- ционных систем 3.2.3 УДК 3.2.4 Документальные информационные системы 3.3 Информацион н ые системы на базе ЭВМ 3.3.1 Другие информа- ционные системы 3.3.2 1. III. Уровень-Формулы Множества Множество предме- тов 1. Элемент-предмет 1.1.1
Множество состоя- ний 2. Элемент-состоя- ние 2.1 Конечное мно- жество 3. 3.1 Бесконечное мно- жество 3.2 Множество с ка- чественными эле- ментами 4. Множество с число- выми элементами 5. 2. Существование Бытие Е Логический опера- тор существования Мало таких сущест- 3 вует Много таких сущест- 91 вует 9з Логический опера- тор общности у Небытие 3 3. Свойства Параметры 1.
Количественные 1.1 Область измене- НИЯ 1.1.1 Качественные Область измене- 1.2 НИЯ Признаковые коор- 1.2.1 динаты 2. Одномерные 2.1 Двумерные 2.2 п-мерные 2л 4. Значения Натуральный ряд чисел Интервал значений Конечность Пределы Бесконечность Большее значение а>Ь Больше на п а>(п) b Больше в п раз а> (тг)ь Меньше на п а< (л) b Меньше в п раз Л " О*
Номер кате- гории Отношения Индекс 5. Отношения Элементно-мно- жественные R Унарные r(D Бинарные г (2) Тернарные г(3) л-арные Принадлежности включения Множество А со- держится во мно- г(п) жестве В элемент а принад- лежит множеству Ас В А элемент а не при- надлежит мно- а£А жеству А объединение мно- а^А жеств пересечение мно- A\JB жеств разность мно- Af]B жеств А/В пустое множество Сравнительные 0
Продолжение табл. 7 Номер кате- гории Отношения Индекс 6. Эквивал ен тн ость Рефлексивность Симметричность Транзитивность Приблизительное равенство Логические Конъюнкция Дизъюнкция Отрицание Импликация Следование Предшествование Линейность Прямая пропор- циональность Порядковость отно- шения 1-я степень Г 2-я степень Г2 3-я степень Г3 Отображения. Функ- ции Отображения Сюръекция Инъекция А V “1
Биекция Функции Инъективные Обратные Геометрическое прост- ранство Одномерное Двумерное п-мерное Высота Длина Ширина Площадь Временные условия Начальное время Конечное время Длительность Периодичность Исчисление Арифметические и эл ементарно-ал геб- раические операции Вероятностные рас- пределения Логические исчисле- ния ^Д
10. Другие исчисления (например, много- значная логика, дифференциальные уравнения) Указатели и определи- тели Указатель поряд- ка считывания (скоб- _ _ ки) ().[].{}. L .3 Определитель субъект-предикат <S>, <Р> Родовидовой оп ре - делигель — Определитель ин- формационного = присвоения Общий указатель свойств Указатель свойств категории «Управле- |. . .1 ние и связь» Указатель присвое- ния имени = Указатель ступени в. ₽. У
Номер кате- гории Отношения Индекс Указатель уровня I, II, III Разделительные знаки Определитель истин- ности Истинно-1 Ложно-0 Неопределен- но-!),5 Условия (коорди- наты) истинности Определитель степе- ни уверенности 11. Операторы Л К-операторы Оператор синтеза сети Операторы сверты- вания — развер- тывания Вынос за скобки Mi (ММ • • • . . . ЛЬп) Группировка aiRi (М^2) • • • • •' R (ьпкьп+ р
Продолжение табл. 7 Номер кате- гории Отношенвя Индекс Склеивание Частичное погло- щение Полное поглоще- ние Порождение Операторы обобще- ния Операторы уровне- вого перехода Общеинформацион- ные операторы Выборка Сортировка Редактирование Вычисл ител ьн ые операторы Диалоговые опе- раторы j = bf bl •‘Л +1 = = bz + l (bihbtK. . . ...hb^>- -A>+i = = bn+l
Особенность уровня «Категории» —это то, что основные категории этого уровня совпадают с фундаментальными категориями [Ml, [D], [£], [J1, 1Я1, IVJ , [7], [Д], [Н]. В этом проявляется основной гносеологический принцип построения категоризатора. Прежде всего уровень «Кате- гории» — логический итог всех предшествующих ступеней и, в свою очередь, применяя терминологию Ш. Ранганата- на, категории (и общенаучные понятия) этого уровня -у-ступени —это «фокус» в информационно-логическом ана- лизе понятий и специальных категорий предшествующих уровней наук о природе и обществе. Выбор перечисленных 9 категорий в качестве фунда- ментальных логических узлов классификации обосновать строго невозможно. Укажем, лишь на то, что первые две категории [Л4], [О] — центральные в диалектической ло- гике, категории [V], [Г] входят во все философские си- стемы категорий и в развитые информационные языки. Категория [£] заимствована у Ш. Ранганатана, но имеет более общее значение, так как в ней раскрывается источ- ник развития. Именно поэтому в уровне «Категории» фун- даментальная категория If] раскрывается через «Един- ство и борьбу противоположностей», «Противоречие». Категория [J] (информация), очевидно, относится к тем общенаучным понятиям, которые, обогатившись поняти- ями различных наук и свойствами систем различного типа, уже «доросли» до уровня категории. В связи со всесторон- ним исследованием понятия информации в последние 20 лет, проводившимися математиками и инженерами, биологами и лингвистами, экономистами и философами, уже неодно- кратно предлагалось включить это понятие в число фило- софских категорий [21 ]. Однако независимо от того, как должен быть решен этот вопрос философами, в категориза- торе языка ЛК «Информация» является одной из главных информационных категорий. Правом называться в языке ЛК фундаментальной категорией дает категории [J] то, что с ней органически связаны такие понятия, как «ка- 175
чество», «количество», «свойство», «сущность», «явление», которые давно объявлены категориями. Категория [7?] (Управление и связь), как и [У], в зна- чительной мере приобрела общенаучное значение благо- даря кибернетике. Появление категории [7?] дает возмож- ность естественным образом упорядочить такие важней- шие для языка ЛК (и в целом для науки) категории, как «Причина — следствие», «Случайность — необходимость?, «Возможность —действительность», «Свобода —необходи- мость». Без категории [7?] все перечисленные категории лишаются родового понятия и становятся формально нес* вязанными. Категория [А ] обобщает теорию и методы исследования в различных науках и поэтому содержит в себе основные понятия теории познания. Категория [//] представляет собой принятую класси- фикацию наук, находящихся на каждом из уровней по- знания (например, по УДК), а дальше в соответствии с при- нимаемой классификацией следует упорядоченный пере- чень понятий отдельных наук, для которых каждый уровень категоризатора является системой общих понятий, логикой. При этом имеется в виду, что «... логика изучает структуру и формы движения знания как в целом, так и в отдельных областях, т. е. в науках» [48]. С этой точки зрения общая биология, а в языке ЛК ее модель — уровень «Биология» является логикой всех биологических наук, уровень «Фи- зика» — логикой всех физических наук и физических зна- ний, входящих в состав любых наук природы, общества и мышления. Именно поэтому А. Эйнштейн утверждал, что «физика представляет собой развивающуюся логическую систему мышления» [90]. Рассмотрим другие входящие в уровень «Категории» понятия. В категории [D ] в разделе «формы развития —2» имеются понятия ассимиляция (понятийная и структурная). Эти понятия отражают содержание процессов, которые прин- 176
ципиально не описываются понятиями род —вид, часть — целое. Например, описание живой клетки не сводится к перечислению всех содержащихся в ней элементов. Это пример структурной ассимиляции. Сплошь и рядом в про- цессе познания осуществляется понятийная ассимиляция, когда новое научное понятие возникает путем обобщения нескольких ранее бытовавших. И эти понятия (иногда целые теории) не ликвидируются и не являются видовыми в новом понятии, а присутствуют в нем, как говорят, «в снятом виде». В категорию [А ] введен принцип системы отсчета (от- носительности). Во-первых, в этом принципе аккумулиро- вано известное утверждение, что абстрактной истины нет, истина всегда конкретна. Во-вторых, в нем обобщается зависимость результатов, оценок от принятых критериев и систем отсчета. Физический принцип относительности при- обретает в связи с этим более широкий смысл, являясь частью соответствующего принципа познания. В этой же «Категории» помещен «принцип информацион- ной неопределенности». Проявлением этого принципа в фи- зике является «соотношение неопределенностей» Гейзен- берга. Однако невозможность с одинаковой точностью определить координату и импульс частицы является всего лишь одним из многочисленных примеров аналогичной ситуации, характерной при исследовании систем различ- ной природы. Укажем в качестве примера соотношение меж- ду релевантностью и полнотой в ИПС. Аналогичное происхождение имеет и рассматриваемый здесь же принцип информационной неразрешимости, что является отражением ситуации, доказанной в известной теореме Геделя. Другие приведенные в уровне «Категории» понятия используются в обычном для них смысле, хотя и упрощаются как любая информационная модель. В у-сту- пени в выбранной последовательности информационных уровней познания — «Слово», «Категории», «Формулы» — отражается и уровень абстракции в описании ситуации. 12 6-3324 177
III. Формулы. В у-ступени уровень «Формулы»—самый абстрактный и в определенном смысле является метаязы- ком языка ЛК- Наличие в языке ЛК 3-го уровня у-ступени «Формулы» должно обеспечить следующие важные требования при опи- сании многоуровневых систем: совместное описание ка- чественной и количественной информации, возможность осуществления различных формульных (логических и грам- матических) преобразований, свертывания и развертыва- ния описаний, проведение расчетных операций в систем- ном анализе, включая построение вероятностных распре- делений, расчет возможных траекторий движения системы и др. В основу уровня «Формулы» положен язык теории мно- жеств. Центральной категорией уровня «Формулы» яв- ляется понятие «Множество» (1.), при этом категории «Ат- рибуты» (3.), «Значения» (4.), «Отношения» (5.) вытекают из следующего определения Бурбаки: «Множество обра- зуется из элементов, обладающих некоторыми свойствами и находящихся в некоторых отношениях между собой или с элементами других множеств» [48]. В уровне «Формулы» категория «Множество» не обя- зательно предполагает вещественность. Любой предмет, состояние, процесс (как единичные, так и целые системы) могут быть абстрагированы до понятия элемент — пред- мет, элемент —состояние. Уровень «Формулы» намного беднее отношениями, чем другие уровни. Однако формульное описание имеет пре- имущество, о котором следующим образом говорил Р. Фейн- ман. «Очевидные сложности природы с ее странными за- конами и правилами, каждое из которых можно объяснить очень подробно, на самом деле тесно связаны. Однако если вы не желаете пользоваться математикой, то в этом ог- ромном многообразии фактов вы не увидите, что логика позволяет переходить от одного к другому». И дальше: «Ма- тематика — это язык плюс рассуждения, это как бы язык 178
и логика вместе. Математика •— орудие для размышления. В ней сконцентрированы результаты точного мышления многих людей» [82]. Информационные категории «Отношения» (5.) и «Отоб- ражения. Функции» (6.) уровня «Формулы» основаны на соответствующих понятиях теории множеств и булевой алгебры. Кроме того, введены простые отношения, заим- ствованные из других областей и имеющие «высокую час- тоту» встречаемости: линейность, прямая и обратная про- порциональность. В языке ЛК используется термин «порядковость отно- шения». Отношения между элементами (или множествами) могут быть непосредственными (1-я степень) и опосредо- ванными (2-й, 3-й, n-й степени). Например, х —отец у — это отношение первой степени xR (Г)г/, в то время как х — прадедушка у является отношением 3-й степени xR (Г3) у. Содержание категорий 7. (V) и 8. (Г) очевидно. Кате- гории 10 и 11 будут разъяснены при изложении грамматики и исчисления языка ЛК- 2. Словарь. В языке ЛК различают четыре типа сло- варей: /(-словарь, //-тезаурус, Т-словарь, Ф-словарь *. Структура /(-словаря полностью определяется струк- турой категоризатора, категории и общенаучные понятия которого служат вершинами иерархического упорядоче- ния понятий словаря. //-тезаурус представляет собой упорядоченное множество основных понятий, характеризующих каждую отдельную науку, входящую в состав классификации наук, вершиной которой является категория категоризатора. Например, в 0-ступени уровень «Экономика». Одной из наук, пред- ставленной здесь, является «Экономика СССР». А такие категории как «Народное хозяйство СССР», «Социалисти- * В проблемном ориентировании языка ЛК принимали участие д-р мед. наук А.А. Попов, инженеры Л. В. Королева, Т. П. Сагайдак, А. И. Хоменко, Л. Д. Фесенко, Г. Б. Ягодзинская. 12* 179
ческое производство», «Основной экономический закон со- циализма», «Общественно-экономические показатели», «До- кументальная информация и документооборот» и другие определяют содержание //-тезауруса. Т-словарь —составная часть //-тезауруса представ- ляет собой информационные единицы следующих уровней иерархического дробления понятий, вершинами класси- фикации которых служат элементы //-тезауруса. Такими понятиями-дескрипторами являются «жилищный фонд», «финансовый уровень», «перечень товаров» и др. При составлении словаря предусматривается широкое использование существующих классификаций и тезауру- сов. Если отрасль науки имеет свою классификацию объек- тов, соответствующую природе объектов, то эта класси- фикация принимается для словаря языка ЛК (например, таблица Менделеева). В словарях указываются синонимы и только родовидовые (часть — целое) отношения. Форма- лизованные единицы Т-словаря (и только это) называются дескрипторами. Выше отмечалось, что понятия отдельных информацион- ных уровней сгруппированы вокруг 9 фундаментальных категорий [М], [£>], ...» [//], которые являются «фокусом» фасетного упорядочения понятий категоризатора. Акку- мулировав в себе самые общие и существенные закономер- ности природы и общества, категории —логический итог их познания. С другой стороны, содержание категорий раскрывается только через соответствующие понятия дру- гих ступеней развития природы. Эти принципы легли в основу построения категориза- тора и словарей. Кроме описанных выше словарей, язык ЛК включает Ф-словарь. Вершинами этого словаря являют- ся фундаментальные категории, а содержанием —систе- ма понятий, распределенных по уровням в соответствии с многоуровневой структурой категоризатора. Покажем на примере категории «Время» структуру Ф-словарей. 180
Очевидно, что не только к философии, но и к информа- ционно-поисковым словарям относится следующее замеча- ние П. В. Копнина. «Возьмем к примеру, категорию времени, которая, если дело будет продолжаться так и дальше, ско- ро перестанет быть философской ибо при ее разработке учитывается в основном опыт физики, в частности теории относительности, и забывается, что человеческое бытие то- же имеет время, а история в не меньшей мере, чем физика, является наукой о времени...» [48]. Наукой о времени в этом смысле является не только физика или история, но и любой из информационных уровней развития природы, общества и мышления — биология, экономика, техника и т. д. При описании в гл. 1.1 основных принципов построения моделей сложных систем отмечалась сложность в их кате- гориальной структуре причинно-следственных отношений. Здесь же следует отметить особое место в этих моделях временных отношений. При выделении параметров модели необходимо определить не только область их изменения, но и те дискретные моменты времени, в которых существен- ны и различимы состояния параметров. Например, для оценки работы турбины измерение числа ее оборотов про- изводится непрерывно, и это важно для управления ре- жимом. Измерение же температуры живого организма, ска- жем, через каждую секунду, не имеет смысла. Параметры характеризуются свойством инертности, т. е. некоторые из них практически сразу изменяют свое состояние при изменении других параметров. Другие параметры реаги- руют на изменение параметров системы только при их оп- ределенных значениях, а главное по истечении некоторого времени. Исследование этих свойств временной инертности параметров (так называемых лагов запаздывания) является важной задачей системного анализа. Однако информаци- онный язык описания моделей сложных систем должен учитывать особенности проявления временных характерис- тик для параметров различных уровней и природы. Рас- 181
смотрим различный характер проявления категории «Время» в а-; Р- и у-ступенях. a-ступень. В физике используется абсолютное (фи- зическое и относительное) время, единицы земного времени, а также время —период обращения других небесных тел. Сюда же входят единицы времени — расстояния (световой год, парсек). Химия. Кроме физических единиц времени, в ки- нетике используются свои временные характеристики, связанные со скоростью химических реакций. Земля. Геологическая шкала времени является ти- пичным примером «процессионного времени», когда астро- номическое время, заключенное в отдельных периодах, неравномерно, а деление на периоды определяется геоло- гическими процессами. Биология. В биологии уже давно было обращено внимание на особенности биологического или физиологи- ческого времени; биологическое время стало предметом экспериментального исследования. В биогенетическом за- коне — онтогенез есть краткое и быстрое повторение филогенеза — наиболее ярко проявляется существо био- логического времени и временные особенности эволю- ционного процесса. В онтогенезе, в частности в эм- бриогенезе, уплотнен во времени филогенез. Естественно, что филогенез и индивидуальное развитие организма (и его часть — эмбриогенез) с точки зрения астрономического времени различаются порядками, а в биологическом (про- цессионном) времени они соизмеримы. Отражением вре- менных особенностей биологических процессов являются стадии развития живого организма. Астрономически вре- мя жизни одного поколения у различных видов существен- но различается (от минут до сотен лет), а биологически это время совпадает, если совпадают общебиологические про- цессы: рождения, зрелости, размножения и др. Человек. При разработке словаря категории «Вре- мя» в уровне «Человек» учитываются все общебиологиче- 182
ские особенности понятий времени. Кроме того, учитывает- ся ряд специфических особенностей проявления категории «Время» у человека. Например, с возрастом субъективно ускоряется астрономическое время —один год 5-летний ребенок (1/5) проживает в 10 раз дольше одного года 50- летнего человека (1/50). Для описания биологического вре- мени была предложена формула х = q + log t + q, где х —время; q и ct —константы [32]. ^-ступень. Экономика содержит временные по- нятия, которые свойственны любой экономической форма- ции, такие, например, как производственный цикл, норма- тивы рабочего времени и др. Кроме того, при уровне «Экономика», начиная от 10-й категории как вершины, имеется иерархическая структу- ра экономических наук, каждая из которых содержит спе- цифические временные понятия. «Экономика СССР» вклю- чает категорию «Производственное время», куда входят, например, пятилетка, баланс рабочего времени, потери рабочего времени, сверхурочное время, производственный стаж и др. Анализ экономических показателей тре- бует включения в число временных оценок понятий, позволяющих классифицировать информацию на долго- срочную, пятилетнюю, годовую, квартальную, месячную, недельную, суточную, сигнальную. Экономическая ин- формация разделяется на постоянную, переменную и опе- ративную. Экономические документы включают также такие грамматические сложные временные показатели как «на конец планируемого периода», «в течение планируемого периода», с 1-го по 20-е июня» и др. Техника. Здесь применяются временные характерис- тики как самостоятельные, так и входящие в другие техни- ческие термины и понятия. К «техническому времени» отно- сятся физическое старение, моральное старение, производи- тельность, надежность, гарантия, нормативный срок службы. «Техническое время», так же, как и временные харак- теристики любых других уровней, органически связано а 183
технологическими процессами, функциями, выполняемыми машинами. Введение тех или иных временных характе- ристик в технике опирается на экспериментальные и тео- ретические исследования, обобщения практики. Зависимос- ти между временными характеристиками могут «со вре- менем» существенно изменяться, так, например, «было время», когда физическое старение технических устройств и моральное старение в астрономическом исчислении вре- мени почти совпадали. В период научно-технической рево- люции, при повышении надежности устройств, моральное старение происходит намного быстрее физического. Имен- но это обстоятельство дало возможность некоторым за- рубежным фирмам торговать транзисторами с гарантией до 100 лет! —ведь никто не будет ждать их фи- зического старения, а выбросит их намного раньше из- за моральной «старости». Общество предоставлено относительным временем: До нашей эры Нашей эры До Великой Октябрьской Социалистической Револю- ции После Великой Октябрьской Социалистической Рево- люции До Великой Отечественной войны После Великой Отечественной войны Общественным временем является также календарь праздников: гражданских, религиозных и др. у-ступень. «Слов о» включает временные понятия, широко используемые в общеразговорном языке и имею- щие качественный характер: утро, полдень, вечер, всегда, часто, редко, иногда, никогда. Применяемые в разговорной речи временные понятия типа «минуточку» имеют очень мало общего с физической минутой, а являются качественным временем, длительность которого зависит от многих обстоятельств. Известное утверж- дение, что абстрактной истины нет, все зависит от условий, 184
места и времени, давно используется человеком и в такой форме — абстрактного времени нет, все зависит от условийг места и цели. В этом же уровне представлены категории граммати- ческого времени: индефинит, континиус, перфект, которые в сочетании с прошедшим, настоящим и будущим временем образуют 9 грамматических временных характеристик (настоящее —перфект, будущее —индефинит и т.д.). «Категории» предполагают лишь идентификацию используемого в суждении времени, т. е. указание на то, является ли время физическим (астрономическим) или системно-процессионным. «Формул ы» содержат временные количественные характеристики, необходимые при временных расчетах: начальное время, конечное время, длительность, перио- дичность. Аналогичным образом строятся все девять Ф-словареи по числу фундаментальных категорий. 3. Грамматика определяет правила и технику построе- ния фраз из единиц языка (категоризатора и словаря), а также правила и технику свертывания и развертывания суждений в языке ЛК. Как уже указывалось, в системном (информационном) анализе особое место занимают причинно-следственные отношения, и это нашло отражение в грамматической струк- туре языка ЛК. В языке ЛК причинно-следственные отношения обоб- щены в категории «Управление и связь» [/?]. Категория [/?] связывает единичные и сложные предметы, процессы, состояния, свойства во фразу, описывающую ситуацию. Структура ситуационной фразы —это граф типа дерева, вершины которого содержат информацию об элементах, вступающих в причинно-следственные отношения, а реб- рами служит категория [/?]. Сами же вершины, для построения которых могут исполь- зоваться любые категории и понятия из категоризатора и 185
словаря, могут быть суждением любой сложности и иметь грамматическую структуру любой глубины. Хотя для по- строения вершины используется множество категорий, но при этом полученное суждение допускает выделение субъекта (S) и предиката (Р). Любая табличная информа- ция по своей логической структуре состоит из субъекта и предиката [28]. Логический субъект—это то, что подлежит суждению, т. е. предмет, событие. Действие и свойства субъекта определяют предикат. При этом субъект в статистических таблицах обозначает более широкое понятие, чем грамматическое подлежащее. В одном субъекте и предикате может быть несколько грамматиче- ских подлежащих, сказуемых, подлежащее и сказуемое, подлежащее и дополнительные члены предложений. Элементарная грамматическая форма в языке ЛК имеет s р вид (субъект) = ( предикат) (вырожденная форма состоит только из субъекта (S)). Элементарная функциональная форма, отражающая причинно-следственные зависимости между отдельными «субъектно-предикатными» формами (предметами, состояниями и т. д.), называется (S — Р) /^-ситуацией или (S —Р) ^-суждением, которым соответ- ствует граф: С-причина С-следствие = <Р/> <SZ> = (Pj) ’ В зависимости от числа вершин в графе различаются двуместные, трехместные, n-местные ситуации (суждения). В общем случае граф-ситуация, по сути, состоит из двух частей: функциональной (связь вершин) и граммати- ческой (структура самих вершин). Множество связанных между собой (S — Р) P-ситуаций составляет информаци- онную модель описываемой системы. Для записи единичных ситуаций используются различ- ные логико-грамматические операторы, указатели, опре- делители, другие технические средства и устанавливаются 186
следующие формальные правила построения (S —Р) R- суждений. 1. Указатель порядка считывания —скобки ( ), [ ], { }, Г JI. Чтение производится в порядке, принятом в математике: круглые скобки, квадратные, фи- гурные, биквадратные. Круглые скобки используются также для фиксации количественных значений отдельных параметров, о чем будет сказано ниже. 2. Определитель «Субъект — предикат» ( ). В угловые скобки соответственно заключается субъект (S) и предикат (Р). 3. Родовидовой определитель «—». Знак «—» ставится между дескриптором (справа) и соответствующим элемен- том категоризатора (слева), который является родовым по отношению к данному дескриптору. При необходимости знак «—» ставится между двумя дескрипторами или эле- ментами категоризатора. Пример: pi.10.l-11.1.1 —БАМ, где БАМ—дескриптор; pi. 10.1 —11.1.1 —железные до- роги Р — ступень «Общество» .1 — уровень «Экономика» ..10 — Экономические науки ...1—Экономика СССР ....— 11—Сообщение и связь ......1—Пути сообщения ......1 — Железные дороги 4. Определители информационного присвоения «=», «=». Указатель ««» используется для соединения субъек- та и предиката (S) — (Р); для указания количественного значения соответствующего параметра (параметром, как указывалось выше, в принципе может быть любая катего- рия, дескриптор и их сочетание, которым присваивается количественное значение). Указатель «»» используется для присвоения любой части фразы, целой фразе или нес- кольким фразам нового обобщенного символа Х(. 187
5. Общий указатель свойства «:». Указатель «:» исполь- зуется для построения фасетной структуры субъекта и пре- диката или когда соответствующему элементу фразы при- сваивается качественный признак; для присоединения не- которых категорий типа «быть частью», указания единицы измерения и т. п. Пример: ' БАМ: у!4.2.2.2. — первая очередь БАМа у14.2.2.2. —часть 6. Указатель основного отношения «|...|». Указатель «|...|» используется только для описания свойств, значе- ний и т. п. категории [7?] —Управление и связь. Пример: /?| у17.1.1.2, у17.2.2, Т(01)|. Читается «связь опосредованная, причинно-следствен- ные отношения типа основа — условие, временные характе- ристики уровня «Экономика». 7. Разделительные знаки «•»,«, », « ; ». Знак точка « • » используется в качестве разделительного зна- ка в иерархических классификациях категоризатора и словаря. Знак запятая «,» разделяет однородные члены предложения (суждения). Знак точка с запятой «;» разде- ляет отдельные (S — Р) 7?-ситуации при текстовой записи. Важное место в любых ИЯ занимают правила отобра- жения средствами ИЯ словосочетаний типа «определяемое — определитель», которые образуются различными катего- риями или частями речи (пусковой объект, быстродейству- ющая ЭВМ, алгебра логики, автоматизированная система, стройка века, удобный пульт и т. д.). В ИЯ СИНТОЛ эти отношения называются предикативными. Некоторые из таких сочетаний являются устойчивыми и входят в слова- ри, другие — свободными и образуются средствами ИЯ. В теории дескрипторных ИЯ разрабатываются правила, в соответствии с которыми производится классификация словосочетаний на устойчивые и свободные [75). Устойчи- 188
выми словосочетаниями признаются, например, такие — «легкая промышленность» (одно из входящих в сочетание слов изменяет содержание), «символическая логика» — «математическая логика» —«алгебра логики» (словосоче- тание имеет один или несколько синонимов), «закон Нью- тона», «Латинская Америка» и др. Однако в задачах информационного анализа нередко возникает необходимость превращения устойчивого сло- восочетания в свободное. Поэтому в языке ЛК основным критерием в выделении свободных словосочетаний являют- ся цели анализа строящейся сети (S — Р) ^-суждений. Средствами построения «предикативных» словосочетаний являются уже упомянутые выше указатель «;» («пульт : удобный») и использование субъектно-предикатной формы. Использование субъектно-предикатной формы для раскры- тия предикатных отношений (типа определений и допол- нений), в целом соответствуя логической структуре ес- тественных языков, приводит к суждению следующего вида: <S0) = (Р0» = «50) = (Ро». s р Такая структура может иметь различные модификации и глубину. Например, нижеприведенная фраза включает попарно предикативные словосочетания, образуя при этом предикативное словосочетание более высокого уровня «ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ПРОМЫШЛЕННЫМИ ПРЕДПРИЯТИЯМИ» «5 Рь /(предприятия) — (промышленность )\ \ПРОМЫШЛЕННЫЕ ПРЕДПРИЯТИЯ / s0 Р PQ /(управление) — (оптимальное) \ “ ^ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ/ В число грамматических приемов языка ЛК входит так- же «идиомизация» фраз, суть которой состоит в придании укороченной и грамматически неправильной фразе опре- 189
деленного значения. Примером такой идиомы является 1980 > (и) 1970, что может означать, например, что ка- кой-то продукции выпущено в 1980 г. на п единиц больше, чем в 1970 г., тогда как дословно — 1980 г. больше на п 1970 г. Идиомизации подлежат часто встречающиеся и громозд- кие фразы в своей канонической форме. Перевод фраз с общеразговорного (естественного) язы- ка на язык ЛК, впрочем, как и ряд других грамматических операций, в настоящее время не поддается полной автома- тизации. Это объясняется, во-первых, тем, что язык ЛК еще недостаточно формализован. Во-вторых, и это глав- ное, полной формализации здесь достичь не удается по той же причине, по которой неразрешимы, например, задачи полного автоматического перевода художественных тек- стов. Наиболее перспективными для обработки массивов со сложной семантикой являются человеко-машинные ре- жимы. Проиллюстрируем на одном примере процедуры пе- ревода фраз с естественного языка на информационный язык ЛК. Пусть имеется следующая фраза «Повышение качества оборудования и предметов потребления ведет к экономии материальных и финансовых ресурсов, позволяет получить дополнительные средства для роста благосостояния со- ветских людей». 1-й шаг. Разделение исходной фразы на несколько час- тей, соответствующих фразам-причинам и фразам-след- ствиям. 2-й шаг. Выделение в каждой из фраз субъектов, пре- дикатов и построение (S — Р) /^-суждения. В результате исходная фраза превращается в следую- s} st $2 щую: «(оборудование) и (предметы потребления) )) « р (качество их повышается). 190
Si /?т | ведет к тому, что | (ресурсы материальные и финан- совые) = (экономиться будут) /?2 I ПОЗВОЛИТ | (средства: дополнительные) «= (получены будут) /?31 приведет к тому, что | (советские люди) г=? (благосостояние вырастет) Наибольшую трудность для формализации представ- ляет выделение обобщенных субъекта и предиката (т. е. группы субъекта и предиката) и отделение собственно субъекта и предиката от определяющих их слов. Впрочем, эти операции далеко не всегда легки и для человека, и по- этому операция логической перестройки фразы и превра- щение ее в (S — Р) /^-суждение остается за человеком. 3-й шаг. Перевод (S —Р) /^-суждения в язык ЛК с ис- пользованием категоризатора и словарей. В принципе эта операция может быть полностью автоматизирована, однако целесообразней и здесь осуществление человеком редактирования с помощью интеллектуальных пультов с экраном: ((0110.1 — 2.7.1 —оборудование) Д (0110.1 — 2.7:0110.1 — -3.1.1.1)) = (0110.1 — 6.1.3.3: т!2.7.1.1 : :Т(у!9.5.1.3: ?19.5.2.1)) | у!7.21 (0110.1 —5.3.3) « (0110.1 —6.1.4.1.4): :Т(у!9.5.1.3: у!9.5.2.1)) /?2 | у!7.2.11 (0110.1 — 5.3 : у!5.1.5.3) = (у!2.1.1 : Т (у!9.5.1.3: у!9.5.2.1)> Яз1 ТП5.4.11 <01112.1.4) = (014.1.1 :у!2.6.3.1 :Т(у19.5.1.3: у!9.5.2.1)) На рис. 12 показан граф причинно-следственных отно- шений между отдельными (S — Р)-суждениями, образован* 191
Рис. 12. Граф (S — Р) ^-суждений.
ними на основе информации, приведенной в табл. 8. В число операций анализа графа входит его свертыва- ние и развертывание. Свертывание и развертывание осно- вано на выделении в системном графе автономных подсис- тем (S —Р) ^-суждений, которые на выходе из этой подсистемы дают одну (или несколько, но внешних) причин- но-следственных связей. В этом случае вся подсистема ото- бражается в одну вершину графа. Операция функционального развертывания, наоборот, состоит в развертывании причинно-следственных отноше- ний между простыми элементами в сложном (S —Р) ^-суждении. Уровневое свертывание и развертывание связано с пе- реводом (S — Р) /^-суждений, записанных с использова- нием низших и высших уровней языка, по возможности на запись категориями более высоких уровней языка. На- пример, физические, химические, биохимические процессы, связанные с накоплением и преобразованием энергии, обоб- щаются до языка уровня физиологии кровообращения и дыхания. Или при необходимости осуществить расчетные операции по поиску точной оптимальной траектории в системе все качественные параметры исключаются и за- меняются числами, и, таким образом, основную семанти- ческую нагрузку принимает уровень «Формулы». Операция уровневого развертывания заключается в обратном процессе, когда описанная система ситуаций (или одна ситуация) в языке высокого уровня постепенно развертывается с включением в описание категорий и по- нятий, имеющих качественную и количественную оценки, нижестоящих уровней языка. Жесткой границы между функциональной и уровневой операциями развертывания, свертывания, конечно, не су- ществует. Каждая из этих типов операций включает обя- зательно элементы другой, а обе эти операции по сути пред- ставляют собой примеры понятийной и структурной асси- миляции, рассмотренные при описании категоризатора. 13 6-3324 193 .
Таблица 8 Причинно-следственные зависимости вкономической ситуации Исходный текст Нормализованный текст Индекс * Формульная запись си- туации Повышение производитель- ности труда в промышленнос- ти за пятиле- тие на 30—34% производитель- ность тру- да>=^промыш- ленность^ « = <повышенная на 30—34% в 1980 г. по сравне- нию с 1975 г.> 1 «pi 10.1—3.1.1.1> = = <рио.1—1.1> = = <у12.6.3.1 : К = = 1980> (30—34%) /„ = 1975]> решающее усло- вие [решающее усло- вие того, что| *12 |у! 7.2.2.2:7 I 5.1.4.1.| увеличения производства промышленной продукции на 35-39% промышленная продукция> = =<увеличенная на 35—39% в 1980 г. по сравнению с 1975 г.> <Р1 10.1—2.7.1> = = <у! 2.6.3.1:|(к = = 1980> (35—39%) •(„ = 1975]> Повышение производитель- ности труда в сельском хо- зяйстве на 27— 30% «С производитель- ность труда> = = <сельское хо- зяйство^ « < по- вышенная на 27— 30% в 1980 г. по сравнению с 1975 г.> х, «р! 10.1-3.1.1.1 > = - <р! 10.1—1.2» = = <VI 2.6.3.1:[/к = = 19В0> (27—30%) = 1975]> приведет /? [приведет к тому, что| *84 |VI7.3.1| 194
Продолжение табл. 8 Исходный текст Нормализованный текст Индекс* Формульная запись си- туации к увеличению среднегодового объема произ- водства продук- ции сельского хозяйства на 14—17 % за пятилетие <сел ьскохоз яйст- венная продук- ция> = увели- чится на 14—17% в 1980 г. по сравне- нию с 1975 г.> *4 <01 10.1—2.7.2> = •=<у12.6.3.1: [/к = •= 1980> (14-17%) /н= 1975]> Увеличение производства промышленной продукции на 35—39% <промышленная продукция > = = увеличенная на 35—39% в 1980 г. по сравне- нию с 1975 г.> А, <Р1 10.1—2.7.1> = = <712.6.3.1 :(/к = = 1980> (35—39%) t„ = 1975 J> даст возмож- ность R |позволит| ^25 |у11 5.4.1.11 выпускать про- дукцию сельско- хозяйственного машиностроения на 5 млрд. руб. в год « промышленная продукция—маши- ностроение> = = <сельское хо- зяйство^ = < из- готовляться будет на сумму 5 млрд. руб. в 1980 г.> «01 10.1— 2.7.1— ма- шиностроение > = = <01 10.1—2.4.1» = = <011 3—изготовле- ние: (01 10.1—6.1.2.3=» «= 5 млрд.): Т = = 1980 > Изготовление в 1980 г. продук- ции сельскохо- зяйственного машиностроения на сумму 5 млрд. руб. «промышленная продукция — маши- ностроение > = = < сельское хо- зяйство^ « < из- готовляемая на сумму 5 млрд. руб. в 1980 г.> «0110.1— 2.7.1 — машиностроение> = = <01. 10.1- -2.4.1» = <0113- изготовление: (01 10.1-6.1.2.1 = = 5 млрд.): Т=1980> 13’ 195
Продолжение табл. 8 Исходный текст Нормализованный текст Индекс • Формульная запись си- туации будет способ- ствовать R | будет способст- вовать тому,что| ^53 1 VI 7.3.21 повышению производитель- ности труда в сельском хозяй- стве < производитель- ность труда> — — < сельское хо- зяйство^* = < по- высится существен- но к 1980 г.> X, « 0110.1—3.1.1.1> =• = < рио.1—1.2 » =1 --= < (712.6.3.1 : : ?15.1.4.1) : Т = = 1980 > Увеличение производства промышленной продукции за пятилетие < промышленная продукция> = = < увеличенная существенно к 1980 г.> X. « pi 10.1—2.7.1> =1 = <у2.6.3.1 : : у! 5.1.4.1» даст возмож- ность R | определит воз- можность | ^26 |у11 5.4.1.1 | довести произ- водство мине- ральных удоб- рений до 143 млн. тонн в 1980 г. <минеральные удобрения> = = < изготов- лять> — = <143 млн. тонн в 1980 г.> X. < РПО.1— (2.7.1— ми- неральные удобре- ния) > = < pH 3— из- готовлять : (PI 10.1 — — 6.1.2 = 143 млн. тонн) : Т = 1980 > Производство в 1980 г. 143млн. тонн минераль- ных удобрений <минеральные удобрения> = = < из готовлен- ные 143 млн. тонн в 1980 г. > X. < РПО.1—(2.7.1— ми- неральные удобре- ния) > = < РП 3— из- готовлять : (РПО.1 — —6.1.2 = 143 млн. тонн) : Т = 1980> будет способст- совать R | будут способст- вовать тому, что | ^83 |у17.3.2| 19b
Продолжение табл. % Исходный текст Нормализованный текст Индекс * Формульная запись си- туации существенному повышению про- изводительнос- ти труда в сель- ском хозяйстве ^производитель- ность труда> = = <сельское хо- зяйство > = <по- высится сущест- венно к 1980 г. > X» «₽1 10.1-3.1.1.1> =1 = < pi 10.1—1.2 >> =1 = < TI2.6.3.1 = = < у 15.1.4.1 : Т = = 1980 > Увеличение производства промышленной и сельскохозяй- ственной про- дукции за пяти- летие < (промышленная продукция) и (сельскохозяйст- венная продук- ция) > = < уве- личенная за 1975 — 1980 гг. > Й < (Р1 10.1-2.7.1) л Л (р! 10.1-2.7.2) > = == <yl 2.6.3.1 : Т(/н=» 1975, = 1980) > определит R (определит то, что( ^(2,4) 7 1 VI 7.3.1/ рост националь- ного дохода на 24—28% < национальный доход > = < уве- личится на 24— 28% к 1980 г. > X, < рпо.1—5.1 > = = <у!2.6.3.1 > (24— 28%): Т= 1980 > Увеличение на- ционального до- хода на 24—28% к 1980 г. < национальный доход > = < уве- личенный на 24— 28% к 1980 г. > X, <Р 110.1—5.1> = = < (у!2.6.3.1) > > (24—28%) : Т = = 1980 > определит R | определит то, что| #73 | у! 7.3.1| 197
Продолжение табл. 8 Исходный текст Нормализованный текст Индекс * Формульная запись си- туации рост реаль- ных доходов населения на 20—22% < реальные дохо- ды >= < увели- чатся на 20—22% к 1980 г. > х» <01 10.1— 6.2.2> = = <(yl 2.6.3.1)> > (20—22%): Т = = 1980 > Увеличение на- ционального до- хода к 1980 г. на 24—28% < национальный доход > = < уве- личенный на 24— 28% к 1980 > х, <01 10.1—5.1> = = <(у!2.6.3.1)> > (24-28%): Т = = 1930 > явится основой R |явится основой | #7 (9—18) |у 17.2.2 | более полного удовлетворения спроса населе- ния на товары < (товары народ- ного потребления) и X, <0110 1 —(4.1.1.1Л Л4.1.1.2.1 Л4.1.1.2.2Л Л4.1.1.2.3Л4.1.1.2.4Л народного по- требления, улуч- шения народно- го образования, (народное образо- вание) и *10 Л4.1.1.2.5Л4.1.1.2.6Л Л4.1.1.2.7Л роста количест- ва детских уч- реждений, улучшения здравоохране- ния, улучшения со- циального обес- печения, улучшения ра- боты обществен- ного транспор- та, (детские учрежде- ния) и (з дравоох ранение) и (социальное обес- печение) и (общественный транспорт) и -^11 Xi< Л4.1.1.2.8Л4.1.1.2.9»- = <у!2.7.1.2: : у!5 1.4.1 > 198
Продолжение табл. 8 Исходный текст Нормализованный текст Индекс ♦ Формульная запись си- туации улучшения роз- ничной торгов- ли, (розничная торгов- ля) и *15 улучшения об- щественного пи- тания, (общественное пи- тание) и ^16 улучшения от- дыха трудящих- ся, (отдых трудящих- ся) и Х17 расширения се- ти зрелищных предприятий (сеть зрелищных предприятий) > — = <2 улучшается существенно > Xie * (S — Р) /^-суждение; х; — z - е суждение: Rtf — направленная связь между /-м суждением-причиной и /-м суждением-следствием. Примечание. Пример порядка чтения формульной записи: 0 110.1 — — 3.1.1.1— производительность труда; 0 — Ступень «Общество»; . 1 —уровень «Эко- номика»; . . 10 — Экономические науки; . . . 1 — Экономика СССР; . . . . — 3 — Развитие социалистического производства; ....—. 1 — Средства развития социалистической экономики; ... . — . . 1 — Научно-технический прогресс; 1 — Производительность труда. Рассмотрим на примере графа рис. 12 применение не- которых операций информационного анализа путем его свертывания и развертывания. 1. Группировка. Индивидуализация. Операция груп- пировки состоит в разбиении графа на группы, содержа- щие конъюнкцию (S — Р)-суждений. Например, граф рис. 12 можно преобразовать в следующий с конъюнктив- ными группами: Х1/?12Х2/?2(56) (Х5 Л ^в) Я(56)(34) (Х3 Д Х4) Р(34)(78) (Х7 Д Х8) /?78 (Хю Л хп Л х1г Л Х18 Л х14 Л Х16 Л х1в Л х17 д х18). Очевидно, что операция группировки приводит к потере части информации о структуре причинно-следственных 199
связей. При этом направленный граф, в котором четко оп- ределены процессы порождения каждой «причиной» своего «следствия», превращается в сложное суждение с конъюнк- тивными группами. Введение конъюнктивных отношений при формировании групп необходимо, так как возникает ситуация, при которой отсутствие даже одного xf может сделать «ложным» (т. е. недостижимым) всю построенную цепочку суждений. Индивидуализация —операция, обратная группировке, состоит в раскрытии конъюнктивных групп и установле- нии между отдельными суждениями (в общем случае — между параметрами сложной системы) направленных при- чинно-следственных зависимостей. 2. Склеивание. Расклеивание. Склеивание состоит в се- мантическом обобщении ряда (S — Р)-суждений или их элементов родовыми понятиями или более общими сужде- ниями. Например, Хг —«повышение производительности тру- да в промышленности» и Х3 —«повышение производи- тельности труда в сельском хозяйстве» могут быть обоб- щены до А —«повышение производительности труда». Обо- значается Хг ♦ Х8 == А. Аналогично Х2 и Х4 обобщаются до В —«дальнейшее развитие производства». Обозначается Х2 *Х4 = В. Обобщение осуществляется с помощью словарей. По- кажем это на примере использования фрагмента //-тезау- руса 0110.1 (0-ступень «Общество», I—уровень «Экономика», 10 — Экономические науки, 1 —Экономика СССР. В со- став pilO.l входит раздел 4. Основной экономический закон социализма со следующей структурой: Цели социалистической экономики 1. Благосостояние 1.1 Личное потребление 1.1.1 Питание 1.1.1.1 Одежда 1.1.1.2 Жилье 1.1.1.3 200
Мебель 1.1.1 4 Книги, журналы 1.1.1.5 Другие виды потребления 1.1.1.6 Общественное потребление 1.1.2 Образование 1.1.2.1 Детские учреждения 1.1.2.2 Здравоохранение 1.1.2.3 Физкультура 1.1.2.3.1 Социальное обеспечение 1.1.2.4 Общественный транспорт 1.1.2.5 Розничная торговля 1.1.2.6 Общественное питание 1.1.2.7 Отдых трудящихся 1.1.2.8 Зрелищные предприятия 1.1.2.9 Спорт 1.1.2.9.1 Общегосударственные внеэкономиче- ские расходы 1.2 Оборона 1.2.1 Охрана общественного порядка 1.2.2 Помощь другим странам 1.2.3 Фундаментальная наука 1.2.4 Охрана природы 1.2.5 Удовлетворение потребностей 2. Материальных 2.1 Духовных 2.2 Конечный общественный продукт 3. Долгосрочного планирования 3.1 Краткосрочного планирования 3.2 На основе приведенного фрагмента словаря можно обоб- щить Х9...Х18 до родового понятия, включающего 1.1 (РПО.1 —4.1.1) —«благосостояние» Х9 * Х10 * Хп * ... ... * Х18 = С. Операция расклеивания также осуществляется с по- мощью словарей или на основе непосредственного анализа интегральной ситуации. 3. Поглощение. Порождение. Операция поглощения со- стоит в функциональном обобщении нескольких причинно- следственных (S — Р)-суждений в одно, содержащее це- почку причинно-следственных зависимостей. Поглощение может быть частичным и полным. Пример частичного пог- 201
лощения X1RX7. Операция обозначается (Хх Д Х2 Д X, Д Л X. Л Хь Л х.) х7. Порождение предусматривает развертывание графа и дифференциацию его причинно-следственных составляющих. Осуществление операций свертывания и развертывания гра- фа особенно с применением таких формальных процедур как вынесение за скобки отдельных составляющих сужде- ний требует осторожности. Пусть, например, в цепочке зависимостей имелись R со следующими характеристиками: R11 у!7.3.1 — полностью определяет R2 | у!7.2.2 —является основой (условием) Я8|у17.2.2 :у15.1.4.1 —является существенным (решаю- щим) условием 1 yII5.4.1.11 — предоставляет возможность Rb | у!7.3.21 — способствует. Очевидно, что при свертывании графа обобщение всех R до их «среднеарифметического» недопустимо, так как при этом теряется решающее значение влияния параметров, содержащихся в суждениях, порождающих соответственно Ri и Rs- Далеко не во всех случаях обобщение осуществляется по наиболее сильному значению R. Может иметь место и обратная ситуация, когда обобщение следует производить по наиболее слабому значению R. Сочетание приведенных выше операций свертывания позволяет преобразовать исходный граф в граф с тремя вершинами А, В, С, что будет означать «повышение про- изводительности труда —решающее условие развития про- изводства и роста благосостояния народа». В состав языка ЛК, как указывалось, входят, кроме описанных выше, исчисление (5) и распознавание (4). Некоторые вопросы распознавания, имеющие общее значение для ИЯ, рассмотрены в гл. III. Исчисление языка ЛК полностью определяется исчислением соответствую- щих наук, языки которых представлены в информационных моделях сложных систем. В этом смысле закон Ома являет- 202
ся исчислением (логикой) электротехники, а линейное программирование —логикой (исчислением) транспортной задачи. В языке ЛК допускается широкое использование математической логики, алгебры и дифференциальных уравнений и другого аппарата математики. Однако наличие в языке ЛК и соответственно в моделях качественной, вообще плохо формализованной информа- ции, не позволяет органичиваться только дедуктивной ло- гикой. Поэтому исчисление языка ЛК включает вероят- ностную логику, в частности, логику правдоподобных рассуждений Д. Пойа [64]. Приведем несколько примеров заключений в такой ло- гике. Из А следует В В само по себе очень невероятно В истинно А гораздо более правдоподобно Из А следует В В само по себе вполне вероятно В истинно А немножко более правдоподобно В вместе с А весьма правдоподобно В без А едва ли правдоподобно В истинно А более правдоподобно Использование некоторых правил теории вероятностей позволяет таким качественным выводам придать числовое значение вероятности. Рассмотренный язык ЛК позволяет сделать некоторые выводы о его приложениях и возможном расширении. 1. В представленной версии языка ЛК центральное место занимают причинно-следственные отношения, что определяет структуру (S —Р) ^-суждений. Однако все категории языка ЛК являются «равноправными». Это поз- воляет строить фразы (суждения) принципиально любой 203
логической конструкции, содержащие в явном виде при- чинно-следственные отношения и не содержащие их. Не обязательным является и наличие в каждом суждении (S) = (Р). Суждения могут быть и «беспредикатными», т. е., например, такой конструкции (S1)/?(S2). 2. Гибкость грамматики языка ЛК позволяет исполь- зовать этот язык (или его упрощенные модификации) для составления рефератов научно-технических текстов (статей, монографий, патентов). Особенностью таких рефератов будет то, что реферат на языке ЛК одновременно является поисковым образом (ПО) документа, так как допускает использование формальных критериев семантического со- ответствия. Более того, если это необходимо (например, для «грубого» поиска), можно осуществить постепенное упрощение ПО (реферата) вплоть до превращения всех семантических элементов языка ЛК в дескрипторную за- пись без грамматики. Такие процедуры и этапы упрощения (усложнения) ПО в процессе поиска детально разработаны в ИПС «Бит» на основе языка /?Х-кодов. 3. Основная цель языка ЛК заключается в построении информационных моделей сложных систем и их анализа для принятия решений в человеко-машинных режимах. По сути это же входит в задачи АСУ. Отсюда язык ЛК дол- жен быть совместим с языками, применяющимися в АСУ. Это достигается наличием в языке ЛК универсальной части (категоризатора) и прежде всего у-ступени (Мышление), содержащей категории и отношения, общие для АСУ раз- личных уровней (предприятий, отрасли), и назначений (экономика, наука, медицина, спорт и т. п.). Удовлетворя- ет ли множество категорий языка ЛК требованиям полно- ты? На этот вопрос априори ответить нельзя, так как это не формально-логическая задача. Очевидно, что исполь- зование языка ЛК при описании различных ситуаций су- щественно расширит число категорий и понятий катего- ризатора, уточнит его грамматическую структуру, исклю- чит излишнюю избыточность описания. 204
Широкое использование в системном анализе и АСУ сложных семантических языков типа языка ЛК требует развитого математического обеспечения, включая опе- рационные системы, банки данных, диалоговые режимы, а также современную техническую базу. С другой стороны, экономическая целесообразность использования сложных- языков в информационном анализе может быть обеспечена лишь при создании такой системы получения первичной информации, перевод которой на язык ЛК, ее обработка дает не тривиальные рекомендации в управлении. 8.3. КРИТЕРИИ СЕМАНТИЧЕСКОГО СХОДСТВА Информационный анализ невозможен без таких про- цедур, как сравнение элементов (или системы элементов), их классификации, определения степени близости между ними, выбора в массиве элементов, соответствующих за- данным требованиям (эталону), упорядочения их по бли- зости к эталону и т. п. Все эти процедуры, с одной сто- роны, близки к современным задачам распознавания об- разов, с другой стороны, —это традиционные проблемы математики. Рассмотрим понятие «отношение». Оно устанавливается тогда, когда выделяются объекты, на которых данные от- ношения определены. Приведем несколько примеров отношений между объек- тами: «8 >> 3», «собака—друг человека», «вселенная ко- нечна», «я люблю, тебя, жизнь», «хинин горьче полыни», «А = В», «белое красивее серого». Здесь объектами яв- ляются «8 и 3», «собака и человек», «вселенная и конечность», «я и жизнь», «хинин и полынь», «А и В», «белое и серое». Отношения соответственно —«больше», «быть другом», «иметь свойство», «любить», «быть горьче», «равно», «быть красивее». Приведенные примеры показывают, что выпол- нять функции отношения может в принципе любая часть 205
речи. Объектами также могут быть как вещественные пред- меты, так и понятия, характеризующие свойства, состоя- ния и собственно отношения. Подавляющее большинство таких структур, включающее объекты и отношения, яв- ляется предметом исследования лингвистики и логики, а в последнее время —теории информационных языков. И только небольшая часть свойств отношений переведена в ранг точных понятий и является предметом исследования математики. Среди них —отношение эквивалентности, ко- торое вводится через следующие свойства отношений: 1) рефлексивность —xRx, т. е. рефлексивное отношение выполняется между объектом и им самим; 2) симметричность —xRy -> yRx\ 3) транзитивность — xRy и yRz xRz. Отношением эквивалентности между элементами од- ного и того же множества Е называется отношение R, об- ладающее свойством рефлексивности, симметричности, тран- зитивности. Отношения сходства и различия, являясь фундаменталь- ными проблемами познания, исследовались с давних вре- мен. Так, уже в древнегреческом софизме «куча песка» содержался весь комплекс логических трудностей при сравнении объектов. Можно ли считать одинаковыми ку- чи песка, содержащие соответственно: лх = 10 000 песчи- нок и п2 = 9999 песчинок или л2 = 9999 песчинок и л3 = «= 9998 и т. д. Если последовательно забирается из кучи песка по одной песчинке, то на каком шаге она потеряет право называться «кучей песка» и станет множеством из нескольких песчинок, т. е. когда произойдет переход количественных изменений в качественные? Любой одно- значный ответ здесь чреват противоречием. Если принимаем лх = л2; л2 = л3 и т. д., то неизбежен логический вывод, что лх = луу, где л/у —одна песчинка. Отрицательный ответ не спасет от трудностей. Если появляется средство пересчитывать песчинки, то формули- ровка задачи переходит на другой уровень, при котором 206
делению подлежат отдельные песчинки. И каким бы ни был применяемый способ измерения, всегда будет существовать минимум различия, ниже которого разница между и л2, л2 и яз> и ял+1 становится столь малой, что прини- мается равной нулю. Однако применение к такой цепочке отношений транзитивности по-прежнему ведет к со- физму. В начале XX века на эти вопросы в связи с проблемой физической непрерывности обратил внимание А. Пуанка- ре [68]. Известен закон Вебера — Фехнера, согласно ко- торому ощущения пропорциональны логарифму раздра- жения. При этом раздражения становятся различимыми, если их величина переходит некоторое пороговое значение. Поэтому, например, предмет массой 10 г (А = 10 г) про- изводит тождественные ощущения предмету В = 11 г, а предмет В нельзя отличить от предмета С = 12 г. Но при этом А легко отличается от С. Обобщая приведенные экспериментальные данные, со- держащие примеры перехода через границы различимости, А. Пуанкаре вводит для описания свойств физической непрерывности следующие соотношения: А « В, В =С, А < С (или А > С). Отсутствие в этих соотношениях транзитивности про- тиворечит логическим законам тождества и противоречия, в соответствии с которыми не допускается, что в одно и то же время, в одном и том же смысле А = В и А «/= В. Пре- одоление этого противоречия осуществляется путем аб- страгирования от свойств физической непрерывности и введения понятия математической непрерывности, допус- кающего отношения эквивалентности. Э. Борель предложил и другой способ разрешения про- тиворечий в нетранзитивных соотношениях А. Пуанкаре. Суть состоит в утверждении, что если опытным путем установлено, что А = В, В = С, А >> С, то отсюда следует без каких бы то ни было новых измерений, что А > В > > С (11 ]. Этот тип умозаключений, к сожалению, не получил 207
развития в современной логике, хотя «приложимость» его ко многим задачам очевидна. В наше время снова возобновился интерес к отношениям типа А = В, В = С, А =/= С. Возобновление интереса к этим отношениям вызвано работами 3. Зимана, О. Бью- немана и Ю. А. Шрейдера [33, 89], которые ввели понятия олерантности. Отношение толерантности иллюстрируется на пред- ложенной авторами работы [33] модели мозга. Внешнее раздражение х вызывает в мозгу состояние у. Формирую- щийся в мозгу образ внешнего мира представляет собой некоторое множество У, которому соответствует множество раздражений X. Имеет место следующая функция (отоб- ражение) f : X = У. Между раздражением х и соответству- ющим состоянием у может не быть явного сходства, напри- мер, х — великолепный пейзаж, а у — возбуждения в со- ответствующих местах мозга. Тем не менее, если в мозгу происходит осмысливание всех поступающих сигналов, то способы организации и взаимосвязи различных раздра- жений должны в определенной форме отражаться в харак- тере связей между элементами мозга, т. е. если множества X и У обладают некоторой структурой, то отображение должно сохранять эту структуру. Введенное понятие то- лерантности соответствует «наименьшему воспринимаемому различию» (дифференциальному порогу) в психологии. Если два раздражения в X (хх, х2) настолько близки, что не под- даются различению, то это означает, что они связаны от- ношением толерантности (хх ~ х2). Толерантность по оп- ределению есть множество таких пар (хх ~ х2)> что xi ~ а само множество X, на котором задана толерантность, называется толерантным пространством. Перемещаясь в пределах толерантности, мы не замечаем различий, и до- казательство близости (или полного) совпадения двух (или нескольких) объектов также происходит в пределах то- лерантности. В свою очередь, конечно, сама различимость определяется природой сравниваемых объектов и чувст- 208
вительностью прибора или используемой меры близости. В общем случае толерантность нетранзитивна, поскольку при приближении к дифференциальному порогу всегда приходим к нетранзитивности. Отношение толерантности обобщает и формализует интуитивные представления о не- различимости. Если при сравнении п объектов имеет место рефлексивность отношения (каждый объект неразличим сам с собой) и симметричность, т. е. их сходство (или раз- личие) не зависит от того, в каком порядке они сравни- ваются, то эти объекты могут находиться в отношении то- лерантности. Сравнение объектов обязательно предусматривает ука- зание аспекта такого сравнения. Даже математические объекты, число свойств которых конечно, предусматривает выделение аспекта сравнения, например, треугольники могут быть конгруэнтными, подобными, гомотетичными, прямыми, параллельными и т. д. Сравнение реальных объек- тов на сходство и различие без указания аспекта сравнения вообще не имеет смысла, так как заведомо известно, что в реальном мире нет ничего абсолютно одинакового, есть лишь сходство или неразличимость различия с какой-то точки зрения. Очевидно, что если два объекта и ©а находятся в от- ношении толерантности, то они имеют хотя бы один об- щий признак и хотя бы один неразличимый признак. Если бы сходство объектов и соа оценивалось только по обще- му признаку, то в этом случае имело бы место отношение эквивалентности. При этом если бы обнаружилось, что объект <оа имеет одновременно общий признак с объектом со3, то транзитивность отношения ведет к выводу, что ~ (о3. Однако при наличии хотя бы одного неразличимого признака транзитивности нет, и вывод о том, что cox ~ со3, может в общем случае оказаться ложным. Данная си- туация встречается на производстве сплошь и рядом. Пусть, например, на предприятии изготовляется де- таль, имеющая т измеряемых признаков (размер, масса, 14 б-зз24 209
прочность и т. д.). Каждая из этих серийно изготовляемых деталей должна удовлетворять требованиям ГОСТа, со- ответствующим допускам и быть, естественно, взаимоза- меняемой. Пусть детали в выпущенной партии пронумеро- ваны Я1, £2, £з> •••» gn- Эти детали, даже если они оце- нены высшим баллом качества, составляют толерантный, а не эквивалентный класс. Отсутствие транзитивности при сравнении изготовляемых деталей уже давно учитывается технологией производства, которая не допускает сравнения каждой последующей детали с предыдущей, а предусмат- ривает сравнение каждой изготавливаемой детали с этало- ном. Но даже при использовании эталонного контроля обя- зательно имеют место погрешности измерения, связанные с чувствительностью приборов. В условиях массового производства стандартных дета- лей определяется ряд номинальных значений, характери- зующих измеряемые свойства (емкость конденсатора, диа- метр и твердость шарикоподшипника, чистота поверхности, содержание примесей и т. п.). Например, в соответствии с ГОСТ 2825—67 для постоянных регистров с допустимым отклонением ±20% задается ряд: 1,0; 1,5; 2,2; 3,3; 4,7; 6,8. Величины номинальных сопротивлений должны со- ответствовать числам, получаемым умножением этих зна- чений на 10*. Задание ряда номинальных значений (хх, х2, ...» хп) с допустимым отклонением Дх является заданием толерантных пространств во множестве значений парамет- ров х некоторых объектов. И хотя объекта, параметры которых принимают эти значения, взаифзаменяемы и неразличимы (с помощью данных приборов), но ни один из них не может стать эталоном, так как объекты не эк- вивалентны, а толерантны [72]. Итак, в общем случае толерантность н0 транзитивна. Но в частном случае, т. е. на некотором интервале, толерант- ность может быть транзитивной, так как различия сравни- ваемых элементов в цепочке (gx, g2, ..., gn) в этом интер- вале (и с помощью данных приборов или мер близости) еще 210
неразличимы. Например, из ~ g2 и g2 ~ g3 g± ~ g.i9 что одновременно подтверждается показаниями приборов. Но дальше при продолжении цепочки g3 ~ ^обнаруживает- ся, что gr =/= gv т. е. неразличимые количественные различия, постепенно накапливаясь, перешли в качественные. Любопытные примеры субъективного выбора толе- рантных пространств приводят американские психологи П. Линдсей и Д. Норман [53]. Происходит покупка спортивного автомобиля, исходная цена которого А =* «= 3500 долларов. Продавец предлагает экземпляр с улучшенной внешней отделкой (хромированные детали), что ведет к удорожанию автомобиля всего лишь на 49 долла- ров. Теперь автомобиль стоит В = 3549. Но для покупателя А х=» В, и он соглашается на покупку хромированных ча- стей к машине. Далее предлагается экземпляр с отделкой черной кожей приборной доски (37 долларов). Новая це- на машины С = 3586. Но для покупателя нет ощутимого различия между В = 3549 и С = 3586. Так, постепенно про- двигаясь в пространстве «психологической» толерантности, когда увеличение цены остается для покупателя нераз- личимым, он считает, что, если А = В и В С, то А » С. Но может случиться, что покупателя вдруг на каком-то шаге озарит, и он поймет «подвохи», таящиеся в отноше- ниях толерантности. Это может, например, случиться, когда ему на каком-то шаге попытаются доказать, что 3500 « = 4000. Искусство хорошего продавца и состоит как раз в том, чтобы этого не допустить и без осечек провести по- купателя через все «лабиринты» толерантных пространств. В теории ИПС проблема сходства рассматривается в связи с задачами сравнения поисковых образов документов (ПО) и поисковых предписаний (ПП) для выдачи из массива релевантных документов (или их адресов). Как правило, документы из выданного релевантного множества не экви- валентны. Более того, ПО (или тем более сами документы) по их близости друг к другу даже не толерантны, так. как их различия вполне различимы. -. , 14* 2Ц
При операциях поиска и анализа информации исполь- зуют различные правила определения степени близости ПО и ПП (так называемые критерии семантического со- ответствия или критерии выдачи) [86]. Очевидно, невоз- можно создать универсальный критерий (во всяком слу- чае в ближайшее будущее), оценивающий всю совокупность свойств и признаков сравниваемых объектов (текстов, ПО и т. п.). Например, в системе SMART используются де- сятки различных критериев соответствия и мер близости. Однако сравнение используемых в SMART критериев и мер производится лишь путем экспертной оценки, когда после выдачи потребитель ранжирует документы по их релевантности. При таком подходе невозможно полу- чить однозначной оценки каждого из применяемого кри- терия, так как потребитель может дать более высокую оцен- ку (на основе качественного анализа списка) различным критериям и мерам в различных выдачах. Если рассматривать, например, ПО документов как вектор, то в нем отражены не менее трех свойств: 1) пере- чень компонентов, 2) порядок компонентов (или их вес), 3) место вектора (ПО) в общей семантической структуре массива документов. Ниже приведены меры, которые оценивают близость векторов лишь по компонентам [79]. 1. Произведение векторов rw = W(, (3.1) 1=1 где Vi и Wi — i-e компоненты векторов V и W размерности Пример: У = (1, 1» 1, 0, 0,0, 1, 1); № = (1, 1, 1,0,0,0,0,0), г^ = 3. Недостатком меры (3.1) является то, что она не учиты- вает общее число ненулевых свойств и частоту данного свой- ства. Произведение rVVIL будет сохранять значение «3» для 212
следующих существенно различающихся пар векторов! V = (1, 1, 1, 0, 0, 0, 0, 0); V«= (1, 1, 1, 0, 0, 0, 0, 0); V = (l, 1, 1, 1, 1, 1, 1, 1); (32) W = (1, 1, 1, 0, 0, 0, 0, 0). 2. Произведение векторов с учетом отсутствующих свойств ‘ rva> = 2 VtWi + 2 (3.3) _ 1=1 /=1 где Vi —дополнение Данная мера применима для бинарных векторов, где Vi имеет значения 0 или 1. Близость приведенных трех пар векторов соответственно равна 6; 8; 3. 3. Нормированная мера Танимото t 2 fvw = -t f------1---------’ (3-4) 2 ^+2^-2 v‘w‘ £=1 i=l <=l Используя формулу (3.4), получаем соответственно равное 0,6; 1 и 0,375. Для сравнения векторов по упорядоченности описанные выше меры (3.1), (3.3), (3.4) не подходят. Для этих целей могут быть использованы различные метрические меры близости, среди которых наиболее распространены коэффициент кон- кордации мера Кемени (4к) и косинус угла между векторами (dcos<p). При анализе упорядочений множества объектов по ка- кому-либо признаку встает задача сравнения одного упо- рядочения с другим или определения согласованности части множества упорядочений. У Кемени такая задача сводится к подсчету расстояния между любыми двумя упорядоче- ниями [40]. 213
Обозначим возможные упорядочения через Д, В, С, а объекты каждого упорядочения через ах, а2, а3, ...» и т. д. Некоторые объекты можно рассматривать как оди- наково предпочтительные. Мера измерения расстояния между упорядочениями А и В D(At В) 0 выбирается такая, чтобы она удовлет- воряла геометрическим свойствам расстояния. Этому со- ответствуют следующие аксиомы. Аксиома 1.1. D (Д, В) > 0, причем равенство дости- гается, если и только если А и В представляют собой одно и то же упорядочение. Аксиома 1.2. D (Д, В) =D (В, Д). Аксиома 1.3. D (Д, В) + D (В, С) > D (Д, С), причем равенство достигается, если и только если упорядочение В лежит между А и С. Аксиома 2. Если А' получается из А некоторой пере- становкой объектов, а В' из В той же самой перестановкой, то D (Д', В') = £> (Д, В). Аксиома 3. Если два упорядочения Д и В одинаковы всюду, за исключением k-то элемента множества S, кото- рое является сегментом их обоих, то D (Д, В) можно вы- числить, как если бы рассматривались упорядочения толь- ко этих k объектов. Предлагаемые метрические меры близости, основан- ные на геометрических свойствах расстояния, имеют раз- личные границы изменения [0,1], [—1, + 1]. Верхней границей служит максимальная величина, зависящая от размерности упорядочения. Для удобства сравнения раз- личных мер близости вводим одинаковые пределы измене- ния расстояний [0,1]. Конкретные формы перехода к нор- мированным расстояниям с одинаковыми границами из- менения описаны ниже. С учетом нормированное™ расстояний сформулируем следующую аксиому. Аксиома 4. Минимальное расстояние, равное 0, дости- гается тогда и только тогда, когда А = В. Максимальное 214
расстояние, равное 1, т. е. d (А, — Л) =1, достигается тогда и только тогда, когда объекты в упорядочении — А расположены в порядке, противоположном порядку объек- тов в упорядочении Л. Кемени представляет любое упорядочение Л матрицей aijt где Л / = 1,2, ..., п. Величины aij определены следу- ющим образом: а/у = 1, если i предпочтительнее /, — 1, если / предпочтительнее i, О, если i и / равноценны. В работе [40] доказано, что формула D(4,B)e-’-£|%-b,/| (3.5) ь/ определяет единственное расстояние D, удовлетворяющее приведенным аксиомам. Максимальное расстояние между упорядочениями определяется по формуле Я(Л,— Л) = п(п — 1), (3.6) где Л — упорядочение, объекты которого расположены в противоположном порядке упорядочению Л; п — коли- чество объектов. Переход к принятым границам изменения расстояния осуществляется по следующей формуле = (3.7) М. Кендалл для определения меры согласованности между 2, 3, ..., т упорядочениями и объектов вводит по- нятие коэффициента конкордации формула которого выводится на основании следующих соображений [41]. Предположим, что т экспертов упорядочивают по пред- почтению множества и объектов. Для этого используются числа натурального ряда от 1 до п таким образом, чтобы самый важный объект принимал значение 1, остальные чис- ?15
ла распределяются по мере убывания важности объекта по ранжируемому признаку: Сумма всех чисел такой таблицы т(% feK + U=1 / 2 Следовательно, среднее значение столбца i =1, 2, и. mti (п + 1)____т (п + 1) 2 *п “ 2 т, т (п + 1) Величину ——— можно считать средним весом каж- дого объекта. Если бы все эксперты одинаково проран- жировали все объекты, то множество сумм элементов по каждому столбцу можно было бы записать в виде т9 2т, ..., пт. Отклонения этих чисел от среднего значения запишется -----±т(п-3), .... y/n(n-l). (3.8) Установим общий вид элемента с учетом (3.8) -4" т (п + 1) — km = т | ----й| = т п 2fe , (3.9) где k = 1, 2...п. 216
Вычислим сумму квадратов полученных отклонений. После несложных преобразований получаем g|[^(„+l-2t)]’= . т т т2 (п3 — п) Нетрудно показать, что значение-------- является наибольшим, которое может принимать сумма квадратов отклонений. Пусть S—сумма квадратов истинных отклонений от сред- него П / \2 S = £ ( (п2+ ° — , (3.10) i= 1 4 ' где — сумма Лго столбца (I = 1,2, ..., п). л с ГП2 (fl3 — п) 12$ ТЛ Отношение dw =S : ——- = —--------------------г- Кендалл w 12 tn2 (п3 — п) назвал коэффициентом конкордации [41 ]. Если двум или т упорядочениям эксперты дали одинаковую оценку, то dw = 1. Если же в двух упорядочениях объекты имеют противоположный порядок, то dw = 0. Для случая, ког- да эксперты присвоили некоторым объектам в упорядоче- нии одно и то же значение (связанные ранги), коэффициент конкордации dw принимает вид п Ъ , (3.11) -jy- т2 (п3 — n) — m^Ti где dj — истинные отклонения от среднего значения столб- ца; (3.12) 217
Lt — количество групп равных рангов Z-го упорядочения; — мощность Z-й группы равных рангов 1 < I < Lt. Два упорядочения объектов А и В можно сравнивать, ис- пользуя коэффициент корреляции р. Если в упорядочении есть связанные ранги, то р (Л, В) имеет вид 2^’ р = р (Л, В) = 1---------, (3.13) 2_(пз_п)__^(Гл-Тв) где V, — разность рангов i-ro объекта в упорядочениях А и В; Та = 2 (*? - О; = £ & - (3-14) /«1 1=1 Коэффициент р для упорядочений, в которых отсут- ствуют области равных рангов, имеет вид р = 1 (3.15) Сравнение двух упорядочений можно производить о помощью коэффициента cos <p (dCos ф ) п. У, afii f=i t/cos(p — COS ф (3.16) где ai9 — i-e компоненты векторов а и b размерности и. На рис. 13 изображены кривые расчета упорядоченности команд в 30 турах одного из чемпионатов страны по футболу *. • Программа для ЭВМ МИР-2 подготовлена инж. А. А. Патиохой, 218
Кривая 1 показывает изменение dw между турами (1—2), (1—2—3), ..., (1—2—3—...—30). Кривая 4 между турами (30—29), (30—29—28) (30—29—...—1). Кривые 2 и 3 показывают изменение dw и между турами (30—29), (30—28), ... (30—1), а кривые 5 и 6 между турами (30— 29), (29—28).... (2—1). Описанные меры близости могут быть использованы как критерии соответствия в ИПС и меры согласованности между экспертными оценками. Рисунок демонстрирует возможности данных мер изме- рения близости упорядочений для целей экстраполяции. Например, 30 туров футбольного чемпионата, по данным 219
анализа, разделяются на 3 зоны: 1-я зона — большие пе- репады значений dK и dw (начало сезона, когда каждый проигрыш или выигрыш вносит существенное изменение в упорядочение команд); 2-я зона — область крутого подъе- ма кривых согласованности; 3-я зона — область высокой согласованности (окончание сезона, когда проигрыш или выигрыш несущественно сказывается на положении ко- манд). Очевидно, что прогнозирование в первой зоне мето- дом экстраполяции имеет наибольшую неопределенность, в третьей зоне — экстраполяция — достаточно надежный метод прогноза положения команд. Наибольшую трудность представляет оценка близости между векторами с учетом занимаемого им места в семанти- ческой структуре текста или тезауруса. Известна школьная задача перехода от «мухи к слону». Суть ее состоит в построении цепочки слов, начиная со слова «муха», где каждое последующее слово отличается от предыдущего всего на 1 букву и последним в цепочке словом было слово «слон». Вот один из вариантов такой цепочки: «муха — мура — фура—фара—кара — каре — кафе — кафр — каюр — каюк —крюк—урюк — урок — срок — сток — стон — слон». Любые два соседних слова по любым мерам близости, оценивающим общность компонентов (букв) и их последо- вательность, будут весьма близки, так как различаются всего одним символом. Но как эти слова далеки по смыслу, например, урюк — урок! Сравнение на сходство (различие) отдельных слов, по- нятий, текстов и в общем случае несущих семантическую информацию векторов любой природы относится к числу фундаментальных проблем. Однако, не дожидаясь пол- ного решения этих проблем, прикладная наука разрабаты- вает множество прагматических приемов, удовлетворяю- щих в определенной мере практическим целям. Очевидно, что не существует универсального алгоритма распознавания, который был бы не зависимым от природы 220
распознаваемого объекта. Одно дело — распознавать шах- матную позицию, другое — тип дифференциального урав- нения, третье — семантическую идентичность текстов, изло- женных на разных языках. В информационно-поисковых системах, основанных на про- стых информационных языках дескрипторного типа, поиск релевантных документов основывается на сравнении по- исковых образов документов (т. е. рефератов, записанных на информационном языке) и запроса (точнее поискового предписания), также записанного на ИЯ. При этом в ос- нове алгоритма распознаваний релевантных до- кументов лежит принцип встречаемости — чем больше общих признаков имеется у поискового образа и поискового предписания, тем с большей вероятностью «распознается» близость документа и запроса. В информационных системах, основанных на семанти- ческих сложных языках (СИНТОЛ, язык ЯХ-кодов), рас- познавание ведется путем сравнения семантических де- ревьев, понятий, текста и запросов. В этом случае для при- нятия решения о релевантности учитывается не только (скорее даже не столько) наличие общих слов (признаков) у поискового образа и запроса, а и их семантическая струк- тура, определение общности отдельных уровней семанти- ческих кодов. В связи с этим вместо весьма расплывча- того понятия — степень релевантности, в системе «Бит» использовались такие характеристики, как семантическая общность, семантическая близость, безусловная и гипоте- тическая семантическая связь. Эти меры семантической бли- зости документа и запроса определены на основе правил сравнения семантических структур «деревьев». Точность распознавания релевантных документов определяется рядом факторов, среди которых наиболее важные: 1) семантические возможности ИЯ, применяемого для составления ПО документов; 2) применяемые правила (критерии) отбора релевантных документов. Но при заданном ИЯ и правилах поиска релевантных документов 221
эффективность поиска существенно зависит от струк- туры ПО. Какие требования предъявляются к поисковому об- разу документа? Он должен быть моделью документа, со- ответствующей задачам поиска. Любой документ представ- ляет собой семантическую многоуровневую информацион- ную систему. Поэтому в ПО в развитых ИЯ представляют собой также дерево понятий (язык/?Х-кодов, СИНТОЛ). Однако это требование — учитывать многоуровневость опи- сываемого средствами ПО объекта — имеет силу и для прос- тых ИЯ. Для этого словарь документа, например, по признаку частоты вхождения в текст, должен быть разделен на не- сколько уровней (зон). Определение количества зон связа- но с проблемой точности и различимости ПО [44]. Но если число уровней определено, то количество дескрипторов, которые в ПО (модели документа) представляют содержа- ние документа, должно удовлетворять требованиям мо- дели организованной системы (см. гл. 1.3), т. е. минимуму числа связей (минимум суммарной частоты вхождения дескрипторов в текст при максимальной средней инфор- мативности одной связи и при условии равенства инфор- мативности каждого уровня). Поэтому при W =0^*, которое оценивает поуровневый рост числа потенциальных дескрипторов (т. е. всех дескрип- торов или просто слов — понятий документа), имеем = аер, N2 = ае2р.....Nk = аЛ (3.17) И, следовательно, ... :УА=1:р:р«: ...:р*-‘. (3.18) Зависимость (3.18) совпадает с так называемым «зако- ном рассеяния» информации и так же, как и «закон рассе- яния» научно-технической информации, является одним из следствий многоуровневой организации сложной си- стемы [45]. Если установлено ограничение на общее число 222
дескрипторов в ПО, то соответственно уменьшается N2, •••» но при этом должно сохраняться соотношение nf л2: п3: ... =1 : b : Ьа. Это соотношение обеспечивает про- порциональное представительство в ПО различных час- тей текста [44]. Такой подход приводит к выводу, что по- исковый образ должен включать в определенных отноше- ниях как высокочастотные, так и низкочастотные слова. Обычно утверждается, что чем выше частота употребления слова, тем меньше информации оно сообщает — большую информационную нагрузку в ПО несут редко употребля- емые слова. Отсюда делается вывод, что в поисковый образ нужно включать лишь редкие слова. Однако этот вывод скорее основан на недоразумении. Необходимость присут- ствия в поисковом образе сравнительно большого коли- чества низкочастотных дескрипторов по отношению к «го ловным» объясняется не их информационной содержатель* ностью, а наоборот, их информационной «бедностью». Примеры поисковых образов документов, составленных с соблюдением вышеизложенных правил, приведены в работе [46]. В системах, содержащих миллионы документов, прямой просмотр непосредственно каждого документа ведет к боль- шим затратам машинного времени. Инвертированная схема хранения массива (т. е. когда каждому дескриптору ста- вится в соответствие номер документа, в котором он представлен) также не эффективна, если ПП содержит боль- шое число дескрипторов. В связи с этим получают рас- пространение схемы организации массивов и методов поиска, основанные на построении в массивах многоуровне- вых понятийных структур. Подробно эти процедуры опи- саны Г. Сэлтоном на примере системы SMART [79]. Идея построения этой понятийной классификации со- стоит в следующем. Пусть имеется массив документов М = w2, •••, тп}у в котором каждый документ пг1 пред- ставлен вектором размерности t. На основе сравнения век- торов документов, используя описанные выше меры, 223
Рис. 14. Построение центрои- ды. формируем такие группы, в кото- рых подобие любых двух доку- ментов будет большим, чем в дру- гих группах. Будем различать dij —внутреннюю величину бли- зости, если mi и т}- принадлежат одной группе (классу), и dq — внешнюю величину близости, если mt и принадлежат разным группам. Для каждой группы докумен- тов строится вектор — центрои- да, который отражает средние величины значений свойств для всех документов внутри данной группы. На рис. 14 показана центроида четырех нормализован- ных двумерных векторов. Координаты векторов {ulf иа, о4) заданы матрицей: X У a Vi 0,99 0,12 7° Vi 0,97 0,3 17° V3 0,3 0,96 73° Vt 0,13 0,99 81° Ненормализованное значение координат центроиды t определяется следующим образом: х = 4- 5 *1 = 4" (0.99 + 0,97 + 0,3 + 0,13) = 0,597; 4 1=1 4 У - 4-5 Vi = 4- (0,12 + 0,3 + 0,96 + 0,99) = 0,592. 4 i=\ 4 224
Координаты нормализованной центроиды хиорм-----> - °’597 =- = 0,709; v /(0,597)2 + (0,592)» 0,592 п _АО //норм исз г— 1 " ' — с= 0,703. Р ^(0,597)’ + (0,592)а Полученным значениям координат z соответствует a (z) «=» »44°. Положение центроиды z таково, что сумма угло- вых расстояний между четырьмя векторами и z достаточно мала: 4 2 0 (zv<) - 37° + 27° — 29° — 37° = — 2°. /=»1 В массивах с большим числом первичных групп доку- ментов двухуровневая система поискового процесса может быть заменена n-уровневой. В этом случае строятся цен- троиды центроид и т. д. При поиске центроид для векторов, различающихся лишь упорядочением компонентов, можно использовать методы поиска медианы и среднего значения, предложенные Ке- мени [40]. Медианой данного множества точек Лх, ...» Ат т называется такая точка В, для которой Т dx (Л£, В) ми- f=i нимальна, а средним значением — точка В, для которой т минимальна S (Л£, В)2. Например, в 3 упорядочениях i=l /а\ /а\ /Ь\ /а\ I b I, I b I, I а I медианой будет 16 1, так как сумма расстоя- \с/ \с/ \с/ \с/ ний йк до трех приведенных упорядочений равна 0 + 0 + -у = -у, а для любого другого упорядочения из этих эле- ментов d > 4“ (1 > > 0). и 15 6-3324 225
Общим, хотя и весьма трудоемким методом разбиения массива документов (или экспертных упорядочений) на непересекающиеся группы с последующим построением центроид, является метод математического программи- рования. В работе [20] описываются способы решения задачи классификации объектов на заданное число классов по критерию минимума среднего значения всех внутренних величин близости di}- с использованием методов линейного программирования. В каждом из классов теми же мето- дами выделяется эталонный объект (центроида), сумма ве- личин близости между которым и остальными объектами минимальна. При сравнении векторов во многих прикладных зада- чах информационного поиска и анализа первое место зани- мают вопросы определения информационного веса ком- понентов вектора. Одним из алгоритмов определения информационного взса признака и использования его для целей прогнозиро- вания является метод тупиковых текстов. Анализ инфор- мационного массива по указанному методу начинается с отбора эталонов, которые соответствуют цели исследова- ния (прогноз полезных ископаемых, распознавание объек- тов, поиск релевантных документов и т. п.). Отобранные эталоны должны соответствовать цели, т. е. обладать це- левым свойством, например, содержать искомое полезное ископаемое. Далее эталоны анализируются и выделяется характеризующая их система признаков, которая должна быть по возможности полной. Каждый из признаков может быть строго выполнен (1), строго не выполнен (0) или не- известен (—). Затем строится таблица, строки которой пред- ставляют собой эталоны, а столбцы — признаки. Постро- енная таким способом таблица называется основной. В основной таблице выделяют все признаки, которые выполнены или не выполнены одновременно для всех строк (эталонов). Столбцы, которые для всех строк имеют зна- чение единицы или нуля, называются отождествляющими 226
Основная таблица Допустимая таблица А'1 X., X, х4 хъ х. Х7 *1 хз xt 1 0 0 1 1 1 0 1 0 0 1 1 s2 1 1 0 1 1 1 0 1 1 0 1 1 S3 1 0 1 1 0 1 0 1 0 1 1 0 S4 1 1 1 0 0 1 0 1 1 1 0 0 S5 0 1 1 1 0 1 0 0 1 1 1 0 (хв, хт). Таблица, которая получается из основной при уда- лении отождествляющих столбцов (признаков), называет- ся допустимой. Оставшиеся в таблице строки различаются хотя бы одним признаком, т. е. они различные. Это разли- чие и является основным при дальнейшем определении информационного веса признаков, составивших набор строк. Тестом называется таблица, составленная из такого набо- ра признаков допустимой таблицы, так что все строки в ней остаются различными. Тест называется тупиковым, если из него нельзя удалить ни одного признака (столбца) без того, чтобы он перестал быть тестом. Тупиковыми тестами таблицы будут (xl9 х2, *5)» (х2, x4, х6), (jq, х2, х3, х4). В этом нетрудно убедиться по таблицам приведенных тестов. При удалении любого из столбцов в приведенных тупиковых тестах появляются одинаковые строки. Описание выбранного множества эта- лонов в основной и допустимой таблицах было избыточным. После удаления некоторых признаков сохраняется основ- ное свойство совокупности эталонов: во-первых, они толе- рантны по основному (одному или нескольким отождествля- ющим признакам), во-вторых, эталоны различны. Путем удаления отдельных столбцов получается несжимаемое, неизбыточное описание, которое при дальнейшем сжатии* 15* 227
(удалении одного из столбцов) теряет свойство различения объектов данного класса. Такими несжимаемыми описа- ниями, сохраняющими строки в пределах заданной толе- рантности, и являются тупиковые тесты. Появление в за- данной процедуре сходных строк свидетельствует о том, Что эталон данного класса объектов утерян и мы попали Отсюда вытекает следующий принцип классификации признаков. Из двух различающихся признаков, входящих в допустимую таблицу, более существенным для характе- ристики данного класса объектов является тот, у которого больший информационный вес. Очевидно, что информаци- онный вес где о<-— число тупиковых тестов, в которые вошел i-й признак; о — общее число тупиковых тестов. Распознавание объектов по описанной выше про- цедуре связано с определением информационного веса стро- ки эталонов и сравнением распознаваемого объекта (и его информационного веса) со строками эталона. Подробное описание алгоритмов распознавания имеется в работе [24]. В алгоритме классификации и информационного анализа целесообразно использование подходов, основанных как на принципе сходства, так и на принципе различия. Для этой цели можно, например, использовать простую про- цедуру подсчета общего удельного сходства таблицы эта- 228
лонов. После того как получены информационные веса признаков (ft, qit q~n) отдельных строк, таблицы этало- нов сравниваются на степень сходства по каждому из при- знаков. При этом принимается, что 1X1=1 (совпадение признаков), 1 х 0 = 0 (в одной строке признак имеется, в другой — отсутствует), а также Ох 1 =0; 0x0=1. Сравнение строк основной и допустимой таблиц дает следующее: Sx — S2(l, 0, 1, 1, 1) Sx — S3(l, 1, 0, 1, 0) Sx —S4(l, 0, 0, 0, 0) Sx — S6(0, 0, 0, 0, 1) S2 — S4(l, 0, 1, 0, 1) S3 — S#(0, 0, 1,0,0) S2 — Ss(l, 0, 0, 1, 0); S2 — S4(l, I, 0, 0, 0); S2-S5(0, 1,0,0, 1); S4 —S6(0, 1, 1, 1,0). Удельное сходство таблицы эталонов п т 2 2 рияи Q = ,= !/=,----- тп, Таким образом, Q представляет собой сумму информа- ционных весов по всем сравниваемым парам строк (S£ —Sj), где р (номер строки) принимает значение 0 или 1; q£ — инфор- мационный вес i-го признака; т — число строк; п — число столбцов. Распознавание нового объекта ведется путем сравнения с Q допустимой таблицы. Если Q — (Q + AQ) < < р, то данный объект относится к группе эталонов; AQ — вклад, вносимый распознаваемым объектом в величину удельного сходства полученной из допустимой новой таблицы. Эту процедуру можно также использовать при форми- ровании таблицы эталонов, когда достаточно выбрать (на- пример, с помощью экспертизы) две строки, а остальные строки формулируются сравнением с первичными. Во многих прикладных задачах, имеющих дело с тек- стами, определение информационных весов признаков само по себе не дает сколько-нибудь однозначного ответа о 229
степени сходства (различия) документов. Одной из таких задач является определение новизны предлагаемого изоб- ретения. В патентно-лицензионном поиске не допустим уровень эффективности обычных ИПС (до 50% шума и потерь). Для определения новизны предлагаемого устрой- ства приходится разрабатывать более четкие критерии, обобщающие многолетний опыт рассмотрения изобретений. Эти критерии в концентрированном виде отражают глу- бинные свойства семантики текстов. В основе семантики текстов, описывающих различные устройства (конструк- ции), лежат следующие общие понятия, играющие роль категорий или фасетов [7]: узлы, механизмы, детали; пространственное расположение и взаимодействие уз- лов, механизмов и деталей; форма выполнения узлов, механизмов, деталей; материал, из которого изготовлены отдельные узлы, механизмы и детали; соотношение размеров у отдельных узлов и деталей. Новизна изобретений соответственно определяется этой общей фасетной формулой, описывающей любое устройство, и содержанием каждого отдельного фасета. Так, новизна изобретения проявляется в следующих формах: 1) в сочетании узлов, механизмов, деталей, подобного которому не было ранее известно; 2) в добавлении в известное сочетание узлов, механиз- мов, деталей нового узла, механизма, детали, получение нового сочетания; 3) в замене в известном сочетании части узлов, меха- низмов, деталей новыми для данного сочетания механизма, узлами, деталями, получение нового сочетания; 4) в изменении в известном сочетании узлов, механиз- мов, деталей пространственного расположения и взаимо- действия узлов, механизмов, деталей, получение нового их сочетания; 5) в изменении в известном сочетании узлов, механиз- 230
мов, деталей средств связи между узлами, механизмами, деталями; 6) в изменении в известном сочетании узлов, механиз- мов, деталей, формы их выполнения; 7) в выполнении в известном сочетании узлов, механиз- мов, деталей, отдельных частей из новых для этого сочета- ния материалов, когда такая замена придает объекту новое полезное свойство; 8) в особом соотношении размеров у отдельных узлов и деталей, представляющих определенную закономерность конструкции, состоящей из известного сочетания узлов и деталей; 9) в особом сочетании двух и более одинаковых узлов, механизмов, деталей; 10) в совокупности использования для этих же целей известных узлов, механизмов, деталей в виде нового соче- тания, дающего новый положительный эффект, а не сум- му эффектов от их функционирования; 11) в различных сочетаниях отличий при изменении не одного, а нескольких элементов устройства; 12) в применении известного устройства в качестве дру- гого по назначению устройства в другой области техниче- ских задач. Перечисленные формы новизны не избавляют "от слож- ной работы сопоставления конкретного предложения на изобретение с этими эталонами изобретательской новизны. И решение вопроса, является ли предложение изобрете- нием, — также творческая задача, требующая проведения системного анализа. Рассмотрению подлежит накоплен- ный патентный массив с использованием современных средств поиска и сравнения информации; инженерный анализ предложенной конструкции устройства для струк- турирования каждого из входящих в устройство элемен- тов и выяснения работоспособности механизма; анализ устройства на соответствие положенных в его основу прин- 231
ципов, фундаментальных законов науки и техники (а в слу- чае предложения на открытие анализу подвергается несо- ответствие какому-либо из законов). Наконец, семантически лингвистическому анализу подвергается сама структура текста первого пункта формулы изобретения. В заключение отметим следующее. 1. Информационный анализ, основанный на систем- ном подходе,— важное условие повышения эффектив- ности управления. Хотя справедливость этого положения не зависит от используемых средств переработки инфор- мации, но в настоящее время реализовать системный подход без ЭВМ практически невозможно из-за огром- ных и быстроизменяющих потоков информации. Именно поэтому создание АСУ — одно из важнейших средств повышения эффективности управления. 2. Успешное внедрение ЭВМ в управление невоз- можно без большой подготовительной работы, состоящей в системном (критическом!) анализе существующих форм сбора и обработки информации и замены их но- выми процедурами принятия решений соответствующим возможностям и требованиям ЭВМ. 3. Опыт разработки АСУ различных назначений убе- дительно показал, что подготовительная работа по за- мене устаревших форм и приемов управления новыми процедурами принятия решений сказывается на повыше- нии эффективности управления еще до того, как реали- зуется в полном объеме на ЭВМ. 4. Системы социального типа, т. е. системы определя- ющим элементом которых является человек,— это слож- ные многоуровневые системы. В управлении такими си- стемами недопустим технокритизм и игнорирование моральных правовых, психологических и других общест- венно-экономических аспектов. Сочетание точных эконо- мико-математических методов с методами и рекоменда- циями других областей знаний, описывающих различные уровни общественно-экономических систем и человека — 232
одно из основных требований системного подхода к за- дачам управления. б. Семантическая информация, лежащая в основе прини- маемых человеком решений, требует для своего описания и анализа знаний из различных областей науки и техни- ки, включая фундаментальные ее основы, право, лингви- стику, психологию... Использование автоматизированных (человеко-машинных) систем обработки информации тре- бует создания развитых информационных и алгоритмиче- ских языков, многотысячных словарей, моделей, основан- ных на познании природы творческих процессов человека. Но еще более трудные проблемы встают перед человеком, когда ставится задача создания такой общей теории се- мантической информации, которая могла бы служить теоре- тической основой искусственного интеллекта. Создание искусственного интеллекта — это не отдаленное будущее. Элементы этой воистину грандиозной и самой уникальной задачи, которую когда-либо ставило перед собой и решало человечество, уже закладываются сегодня. Это и познан- ные законы природы, общества и мышления, создание и исключительно быстрый прогресс ЭВМ, математические методы поиска оптимальных решений, автоматизирован- ные системы управления, информационные и алгоритми- ческие языки, системный анализ, развитое математическое обеспечение машин 3-го и последующих поколений, ус- пехи лингвистики, психологии, логики и кибернетики как науки об общих законах преобразования информации. Во всяком случае, в любой момент времени, теория се- мантической информации и созданный на ее основе искус- ственный интеллект будут материализованным итогом раз- вития всей науки, высшим результатом познания человеком окружающих его сложных систем и управления ими. И всегда при этом сохранится незыблемым принцип: машине — машинное, Человеку — человеческое.
СПИСОК ЛИТЕРАТУРЫ 1. Адлер Ю. П. Введение в планирование эксперимента. М., «Ме- таллургия», 1969. 156 с. 2. Адлер Ю. П., Маркова Е. В., Грановский Ю. В. Планирование эксперимента при поиске оптимальных условий. М., «Наука», 1971. 284 с. 3. Антонов О. К. Планирование и формирование коммунистического отношения к труду.— «Вопросы философии», 1975, № 7, 27—28 с. 4. Асмус В. Ф. Логика. М., ОГИЗ, 1947. 387 с. 5. Афанасьев В. Г. Научное управление обществом. М., Политиздат, 1973. 392 с. 6. Афанасьев В. Г. Хозяйствование — дело партийное, политиче- ское.— В кн.: Научное управление обществом. М., 1975, с. 3—18. 7. Бакастов В. Н. Я Формы новизны объектов изобретений (устройств).— «Вопросы изобретательства», 1968, № 1,с. 19—24. 8. Бейзер А. Основные представления современной физики. М., Атомиздат, 1973. 548 с. 9. Бернштейн Э. С. Информационное обеспечение систем управле- ния. М., ЦНИИ информации и технико-экономических исследований по атомной науке и технике, 1974. 102 с. 10. Борель Э. Вероятность и достоверность. Пер. с франц. М.> «Наука», 1969. 110 с. И. Ботвинник М. М. О кибернетической цели игры. М., «Сов. ра- дио», 1975. 86 с. 12. Вентцель Е. С. Исследование операций. М., «Сов. радио», 1972. 551 с. 13. Гарнек Ф. Альберт Эйнштейн. М., «Прогресс», 1966. 236 с. 14. Глушков В. М. Введение в АСУ. Киев, «Техшка», 1972. 312 с. 15. Глушков В. М. Введение в кибернетику. Киев, Изд-во АН УССР, 1964. 324 с. 16. Глушков В. М. Макроэкономические модели и принципы по- строения ОГАС. М., «Статистика», 1975. 160 с. 17. Глушков В. М. О прогнозировании на основе экспертных оце- нок.— «Кибернетика», 1969, № 2, с. 2—4. 18. Глушков В. М. Основные принципы построения автоматизиро- ванных систем организационного управления.— «Управляющие системы и машины», 1972, № 1, с. 9—18. 234
19. Голдман Ст. Теория информации. Пер. с англ. М., Изд-в© иностр, лит., 1957. 446 с. 20. Головкин Б. А. Машинное распознавание и линейное програм- мирование. М., «Сов. радио», 1973. 99 с. 21. Готт В., Урсул А. Общенаучные понятия и их роль в познании.— «Коммунист», 1974, № 9, с. 75—84. 22. Гуд Г. X., Макол Р. Э. Системотехника. Введение в проектиро- вание больших систем. Пер. с англ. М., «Сов. радио», 1962. 382 с. 23. Джини К- Логика в статистике. Л., «Статистика», 1973. 128 с. 24. Дмитриев А. Н., Журавлев Ю. И., Кренделев Ф. П. Об одном принципе классификации и прогноза геологических объектов и явле- нии. — «Геология и геофизика», 1968, № 5, с. 50—64. 25. Добров Г. М. Наука о науке. Киев, «Наукова думка», 1970. 320 с. 26. Добров Г. М. Прогнозирование науки и техники. М., «Наука», 1969. 208 с. 27. Дубовиков Б. А. Основы научной организации управления ка- чеством. М., «Экономика», 1966. 319 с. 28. Дюженко Г. А. Документальная лингвистика. М., «Статистика», 1975. 64 с. 29. Жеребин В. М. Информационное обеспечение АСУ. М., «Наука», 1975. 200 с. 30. Жимерин Д. Г., Мясников В. А. Автоматизированные и автома- тические системы управления. М., «Энергия», 1975. 680 с. 31. Зайцев Н. Г. Информационное и математическое обеспечение АСУП. Киев, «Техшка», 1974. 144 с. 32. Земаи И. Познание и информация. М., «Прогресс», I960. 254 с. 33. Зиман Э.» Бьюнеман О. Толерантные пространства и мозг.— В кн.: На пути к теоретической биологии. М., 1970, с. 134—144. 34. Зильберминц Л.В. К вопросу о критериях оценки текущей вторичной информации.— «Научно-техническая информация. Сер. 1», 1969, № 2, с. 3—7. 35. 1ваненко Л. М., Стогн1й А. О. 1нформащйний вибух та ЕОМ. К-, «Наукова думка», 1975. 216 с. 36. Ингве В. Гипотеза глубины.— «Новое в лингвистике», 1965, вып. IV, с. 126—138. 37. Информационно-поисковая система «Бит». Киев, «Наукова думка», 1968. 219 с. Авт.: Э. Ф. Скореходько, Л. Э. Пшеничная, И. Н. Кар-Ялайне и др. 38. Калужнин Л. А. Что такое математическая логика. М., «Наука», 1964. 150 с. 39. Квейд Э. Анализ сложных систем. Пер. с англ. М., «Сов. радио», 1969. 520 с. 40. Кемени Дж., Снелл Дж. Кибернетическое моделирование. М., «Сов. радио», 1972. 192 с. 235
41. Кендэл М. Ранговые корреляции. М., «Статистика», 1975. 215 с. 42. Клименюк В. Н. Управление развитием и использование науч- ного потенциала. Киев, «Наукова думка», 1974. 206 с. 43. Клыков Ю. И. Ситуационное управление большими системами. М., «Энергия», 1974. 134 с. 44. козачков Л. С. Некоторые методологические вопросы теории информационно-поисковых систем.— «Научно-техническая информа- ция», 1969, сер. 2, № 12, с. 9—16. 45. Козачков Л. С. Некоторые особенности распределения Ципфа — Брэдфорда.— «Науковедение и информатика», 1969, № 1, с. 81—9G*. 46. Козачков Л. С. Системы потоков научной информации. Киев, * «Наукова думка», 1973. 199 с. 47. Козачков Л. С., Скобец Т. Я. Об алгоритмах и программах коли- чественного анализа отдельных альтернатив прогнозного графа.— «Науковедение и информатика», 1974, № 10, с. 22—29. 48. Копнин П. В. Логические основы науки. Киев, «Наукова думка», 1968. 283 с. 49. Кофман А., Фор Р. Займемся исследованием операций. Пер. о франц. М., «Мир», 1966. 279 с. 50. Крое Р. К., Гарден Ж- К-, Левин Ф. Синтол Универсальная мо- дель системы универсального поиска. М., ВИНИТИ, 1968. 178 с. 51. Крылов А. Н. Прикладная математика и ее значение для тех- ники. М.—Л., Госнаучно-технич. изд-во, 1931. 16 с. 52. Ланкастер Ф. Информационно-поисковые системы. М., «Мир», 1972. 307 с. 53. Линдсей А., Норман Д. Переработка информации у человека. Введение в психологию. М., «Мир», 1974. 550 с. 54. Мандельброт Б. О рекуррентном кодировании, ограничиваю- щем влияние помех.— В кн.: Теория передачи сообщений. М., 1957, с. 139—157. 55. Месарович М., Мако Д., Такахари И. Теория иерархических многоуровневых систем. М., «Мир», 1973. 344 с. 56. Методика программного прогнозирования развития науки и техники. ГК СМ СССР по науке и технике. М., 1971. 112 с. Авт.: В. М. Глушков, Г. М. Добров, Ю. В. Ершов, Л. С. Козачков и др. 57. Мидоу Ч. Анализ информационно-поисковых систем. Пер. а англ. М., «Мир», 1970. 368 с. 58. Мойсеев Н. Н. Простейшие математические модели экономиче- ского прогнозирования. М., «Знание», № 10, 1975. 60 с. 59. Мостеллер Ф., Рурке Р., Томас Дж. Вероятность. Пер. с англ. М., «Мир», 1969. 431 с. 60. Обэр-Крие Дж. Управление предприятием. М., «Прогресс», 1973. 304 с. 61. Оптнер Станфорд Л. Системный анализ для решения деловых и промышленных проблем. Пер. с англ. М., «Сов. радио», 1969. 216 с. 236
62. Перро В. П. К теории УДК. М., ВИНИТИ, 1973. 135 с. 63. Петраков Н. Я. Кибернетические проблемы управления эко- номикой. М., «Наука», 1974. 160 с. 64. Пойа Д. Математика и правдоподобные рассуждения. М., Изд-во иностр, лит., 1957. 535 с. 65. Попович М. В. Философские вопросы семантики. Киев, «Науко- ва думка», 1975. 299 с. 66. Поспелов Д. А., Клыков Ю. И. Ситуационное управление в АСУ.— «Управляющие системы и машины», 1972, Na 1, с. 27—34. 67. Принципы построения и особенности развития автоматизиро- хЛнной системы информационного обслуживания (Из опыта проектиро- вание и эксплуатации отраслевой системы «Сетка»).— «Научно-техни- ческая информация». Сер. 1, 1975, Хе 11, с. 18—29. Авт.: М. Л. Кол- чинский, Ф. В. Базилевич, Г. И. Василенко, Т. М. Нарекая, Л. М. Чер- ни хов. 68. Пуанкаре А. Наука и гипотеза. Пер. с франц. М., 1904. 268 с. 69. Ранганатан Ш. Р. Классификация двоеточием. Основная клас- сификация. Пер. с англ. М., ГПНТБ, 1960. 422 с. 70. Саатн Т. Л. Математические методы исследований операций. М., Воениздат, 1963. 420 с. 71. Сборник нормативно-технических документов по оценке уровня качества продукции. М., Изд-во стандартов, 1975. 92 с. 72. Сигорский В. П. Математический аппарат инженера. Киев, «Техжка», 1975. 768 с. 73. Скурихин В. И., Морозов А. А. Комплексные автоматизирован- ные системы управления.— «Управляющие системы и механизмы», 1976, Ne 2, с. 5—7. 74. Сложные системы и оешение экстремальных задач.— «Киберне- тика», 1967, № 5, с. 29—39. Авт.: В. С. Михалевич, В. В. Шкурба, В. М. Ермольев, Н. 3. Шор. 75. Соколов А. В. Методические материалы по разработке информа- ционно-поисковых тезаурусов. Учебно-методическое пособие. Ленин- градский государственный ин-т культуры им. Н. К- Крупской, 1975. 68 с. 76. Справочник проектировщика /СУП. М., «Экономика», 1974. 375 с. 77. Степанов Ю. G Основы общего языкознания. М., «Просвещение», 1975. 271 с. 78. Стогиий А. А. Об основных принципах построения автоматизи- рованных информационных систем.— «Управляющие системы и маши- ны», 1972, № 2, с. 5—10. 79. Сэлтон Г. Автоматическая обработка, хранение и поиск инфор- мации. Пер. с англ. М., «Сов. радио», 1973. 560 с. 80. Универсальная десятичная классификация. М., 1969. 294 о. 237
81. Феллер В. Введение в теорию вероятностей и ее приложения. Пер. с англ. М., «Мир», 1967. 498 с. 82. Фейнман Р. Характер физических законов. М., «Мир», 1968. 231 с. 83. Финни Д. Введение в теорию планирования эксперимента. Пер. с англ. М., «Наука», 1970. 288 с. 84. Фор Р., Кофман А., Дени-Папен М. Современная математика. Пер. с франц. М., «Мир», 1966. 271 с. 85. Харари Ф. Теория графов. М., «Мир», 1973. 300 с. 86. Черный А. И. Введение в теорию информационного поя^кЗк. М., «Наука», 1975. 237 с. - 87. Шеннон К- Работы по теории информации и кибернетике. М., Изд-во иностр, лит., 1963. 830 с. 88. Р’рейдер Ю. А. О возможности теоретического вывода статис- тических закономерностей текста.— «Проблемы передачи информации», 1967, № I, с. 57—63. 89. Шрейдер Ю. А. Равенство, сходство, порядок. М., «Наука», 1971. 256 с. 90. Эйнштейн А. Физика и реальность. М., 1965. 359 с. 91. Эйрес Р. Научно-техническое прогнозирование и долгосрочное планирование. Пер. с англ. М., «Мир», 1974. 295 с. 92. Bradford S. С. Documentation. London, 1948. 93. Kendell М. G. The Bibliography of Operational Research.—* «Operational Research Quarterly», 1960, 11,1/2. 94. Zipf K- Human Behaviour and the Principle of Least Effort. 1949.
СОДЕРЖАНИЕ Стр Предисловие .............................................. 3 Глава первая. Информационные модели системного анализа 5 1.1. Некоторые принципы управления в системах социального типа............................... 5 1.2. О некоторых моделях последовательного анализа вариантов и принятия решений.................. 27 1.3. Интегральные свойства информационных систем иерархического типа .......................... 49 Глава вторая. Информационный анализ в системах планирования и управления......................................... 77 2.1. Системный подход в анализе экономических си- туаций ....................................... 77 2.2. Анализ перспектив развития технических объек- тов .......................................... 96 2.3. Информационный анализ в научных исследова- ниях .........................................114 Глава третья. Прикладная семантика информационного анализа 128 3.1. Информационно-поисковые языки ...........128 3.2. Язык информационного анализа ............147 3.3. Критерии семантического сходства.........205 Список литературы .......................................233
Лев Семенович Козачков, канд. техн, наук Информационный анализ в управлении Редактор издательства Н. М. Корнильева Обложка художника Н. И. Кучеренко Художественный редактор В. С. Шапошников Технический редактор Л. И. Левочкина Корректор В. В. Цекало ИБ №424 Сдано в набор 25.XI. 1976 г. Подписано в печать 6.V. 1977 г. Формат TOXlOeVs,. Бумага типогр. № I. Усл. печ. л. 10,5. Уч.-изд. л. 11,49 Тираж 3000 экз. БФ 04941. Зак. Кв 3324. Цена 75 коп. Издательство «Тегника», 252601, Киев, 1, ГСП, Пушкинская, 28. Отпечатано с матриц Головного предприятия республиканского производственного объединения «Полиграфкнига» Госкомиздата УССР в Харьковской городской типографии № 16 Областного управления по делам издательств, полиграфии н книжной торговли. Харьков-3, Университетская, 16. Зак. 2289.
75 коп.
Л.С. КОЗАЧКОВ ИНФОРМАЦИОННЫЙ АНАЛИЗ В УПРАВЛЕНИИ