Text
                    .*/./
N
9


ПРОБЛЕМЫ КИБЕРНЕТИКИ ПОД РЕДАКЦИЕЙ А. А. ЛЯПУНОВА ВЫПУСК 9 ГОСУДАРСТВЕННОЕ ИЗДАТЕЛЬСТВО ФИЗИКО-МАТЕМАТИЧЕСКОЙ ЛИТЕРАТУРЫ МОСКВА 1963
6П2.15 П 78 Сборники «Проблемы кибернетики» выпускаются под общим руководством Научного совета по комплексной проблеме «Кибернетика» Академии наук СССР Председатель Совета академик А. И. БЕРГ В СОСТАВЛЕНИИ И РЕДАКТИРОВАНИИ СБОРНИКА ПРИНИМАЛИ УЧАСТИЕ: А. М. ГИЛЬМАН, О. С. КУЛАГИНА, Б. Ю. ПИЛЬЧАК, СВ. ЯБЛОНСКИЙ Сборник статей под редакцией Алексея Андреевича Ляпунова М., Фивматгиз, 1963 г., 360 стр. с илл. Редакторы Г. Я. Багриновская, Г. В. Вакуловская. Техн. редактор В. Я. Крючкова. Корректор С. Я. Емельянова. Сдано в набор 27/Х 1962 г. Подписано к печати 13/И 1963 г. Бумага 70Xl08i/ie. Физ. печ. л. 22,5+2 вкл. Условн. печ. л. 32,54. Уч.-и8д. л. 28,75. Тираж 12 000 экз. Т-01546. Цена книги 1 р. 59 к. Заказ № 459. Государственное издательство физико-математической литературы. Москва, В-71, Ленинский проспект, 15. Московская типография № 5 Мосгорсовнархоза. Москва, Трехпрудный пер., 9.
СОДЕРЖАНИЕ I. ОБЩИЕ ВОПРОСЫ А. А. Ляпунов и С. В. Яблонский. Теоретические проблемы кибернетики ч 5 II. УПРАВЛЯЮЩИЕ СИСТЕМЫ J. H о f e j §. Преобразования, определенные конечными автоматами ... 23 Б. М. К л о с с, Э. И. Н ечипорук. О классификации функций многозначной логики 27 Э. И. Нечипорук. О синтезе вентильных схем 37 Ю. И.- С о рк и н. Теория определяющих соотношений для автоматов ... 45 III. ТЕОРИЯ ИНФОРМАЦИИ И КОДИРОВАНИЕ М, М. Б о н г а р д. О понятии «полезная информация» 71 IV. ПРОГРАММИРОВАНИЕ Н. И. Глебов. О строении класса Л-критериев эквивалентности 103 Р. И. Подловченко. Об одной задаче со свертывающимися циклами . . 123 Т. М. Т е р-М икаэлян. О программировании ветвящихся процессов . . 139 V. ТЕОРИЯ ИГР Ю. В. Голунков. Алгоритмизация и программирование задачи поиска в лабиринте 163 Ш. О. С р а п я н и Т. М. Т е р-М и к а э л я н. Об одном методе оценки ситуации при игре в крестики и нулики 171 Е. Б. Яновская. Итеративный метод решения биматричных игр .... 177 VI. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЭКОНОМИКИ Н. П. Б у с л е н к о. Моделирование производственных процессов на электронных цифровых машинах 189 Г. А. А л и е в, Н. П. Б у с л е н к о, Г. П. К л и м о в, А. И. Н а з а р е н к о. Моделирование производственного процесса автоматизированного стана печной сварки труб 211 VII. ПРОЦЕССЫ УПРАВЛЕНИЯ В ЖИВЫХ ОРГАНИЗМАХ Ж.- А. Медведев. «Ошибки» репродукции нуклеиновых кислот и белков и их биологическое значение 241
4 СОДЕРЖАНИЕ VIII. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ Н. А. Баландина. Сокращение анализатора при машинном переводе • • .265 А. М. Кондратов. Теория информации и поэтика (Энтропия ритма русской речи) 279 Г. Г. Белоного в, Г. Д. Фролов. Эмпирические данные о распределении букв в русской письменной речи 287 Я о Ч ж а о-в е й. Применение метода интерполяции для нахождения слов в словаре при машинном переводе 307 IX. КРАТКИЕ СООБЩЕНИЯ А, Л. Б р у д н о. Пример цен оптимального планирования 313 Е. Ю. Захарова. О синтезе схем из пороговых элементов 317 О. Б. Лупанов. О сравнении двух типов конечных источников 321 Ал. А. Марков. Условия полноты для неравномерных кодов 327 Н. А. Соловьев. К вопросу о существенной зависимости функций алгебры логики 333 С. В. Яблонский. О суперпозициях функций в Р^ 337 X. ХРОНИКА О координации научно-исследовательской работы по кибернетике на }Украйне (информация) 341 Семинары по кибернетике в МГУ 344 Семинары по' кибернетике в Новосибирске 346 Пять лет ленинградской секции кибернетики 347 Кибернетика в Дальневосточном государственном университете 347 Конференция по философским проблемам кибернетики 349
I. ОБЩИЕ ВОПРОСЫ ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ А. А. ЛЯПУНОВ (НОВОСИБИРСК) С. В. ЯБЛОНСКИЙ (МОСКВА) ВВЕДЕНИЕ Кибернетика — это наука об общих закономерностях строения управляющих систем и течения процессов управления. Всякое управление осуществляется посредством передачи информации, поэтому кибернетика изучает процессы хранения, передачи, переработки и восприятия информации и способы ее кодирования на разных языках, а также методы переработки информации и устройства, выполняющие эту переработку. По своим методам кибернетика является точной наукой. Кибернетика взаимодействует со многими отраслями знания, изучающими конкретные управляющие системы. В основе кибернетики лежат представление о дискретности процессов управления и строения управляющих систем, а также стремление к выявлению элементарных актов, обратных связей, иерархичности управления и совместного рассмотрения строения и функционирования управляющих систем. ТЕОРЕТИЧЕСКИЕ ВОПРОСЫ КИБЕРНЕТИКИ § 1. Понятие управляющей системы Общее понятие управляющей системы оказывается пригодным для описания и изучения существенно более широкого класса реальных объектов, чем те объекты, которые явились исходными для построения этого понятия. В частности, управляющими системами могут оказаться и такие объекты, в которых управления в обычном смысле слова нет. С этой точки зрения управляющими системами являются, например, арифметическое выражение, заданное некоторой формулой и представляющее некоторую арифметическую операцию; вычислительная машина, представляющая собой определенную электрическую схему и осуществляющая определенный комплекс операций; нервная ткань, состоящая из системы нейронов и участвующая в управлении жизненными функциями организма; химическая молекула,'представляющая соединение атомов и имеющая определенные свойства; шахматная позиция, определяемая расположением фигур на доске и указанием перечня возможных ходов; фраза русского языка, составленная из синтаксических элементов выражающая определенный смысл; система банков, обслуживающих экономический район, характеризуемая некоторой структурой связи между отдельными банками и производящая некоторые операции, и т. д.
6 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ Управляющая система представляет собой объект, в котором можно выделить следующие составные части: схему, информацию, координаты и функцию. Схема отражает строение управляющей системы. Схема в свою очередь состоит из полюсов, памяти и элементов. Полюсы представляют собой органы, через которые осуществляется связь управляющей системы с внешней средой. Иногда среди полюсов выделяют входные полюсы (входы) и выходные полюсы (выходы). Память состоит из целого ряда ячеек, способных находиться в определенных дискретных состояниях. Каждая ячейка обладает своим материальным носителем. В частности, ячейками памяти могут быть полюсы. Обычно память подразделяется на внешнюю и внутреннюю память. Внешняя память состоит из тех ячеек, в которые поступает исходная информация, исходные данные. Остальные ячейки недоступны для воздействия извне и составляют внутреннюю память. Элементы суть «элементарные кирпичи» по переработке информации. Каждый из элементов имеет свои собственные полюсы, через которые он связан с другими элементами, а также с полюсами управляющей системы. Эти связи могут иметь сложную геометрическую структуру и обычно обнаруживаются при простом наблюдении управляющей системы. Благодаря данному типу связей происходит взаимодействие элементов между собой и с внешней средой. В частности, через них происходит включение в работу тех или иных элементов, входящих в управляющую систему. Кроме того, элементы связаны с ячейками памяти, и эти связи часто бывают скрытыми, невидимыми при непосредственном наблюдении. Через этот тип связей происходит переработка информации в памяти, а также производится влияние на «состояние» элемента, определяющего его режим работы. Информация полностью определяется набором состояний ячеек памяти в данный момент времени. Обычно при функционировании управляющей системы нас интересует та часть информации, которая связана с состояниями внешней памяти. Существенным свойством памяти является то, что она способна хранить, помнить информацию в течение определенного времени. Координаты характеризуют расположение элементов в схеме. По существу они определяют некоторое состояние управляющей системы, связанной с дополнительной «памятью». Назначение координат состоит в том, что через них управляющая система «распознает» сама себя. Благодаря этому она может определенным образом, в соответствии со своими функциональными свойствами, воздействовать сама на себя, «переделывать» сама себя. Функция — это характеристика, определяющая поведение управляющей системы. Она указывает то действие, которое может совершить управляющая система в данный момент при переходе к следующему дискретному моменту времени. Это действие, вообще говоря, ведет к изменению схемы, к изменению информации, к изменению координат и к изменению самой функции. В зависимости от природы управляющей системы изменение может носить либо случайный, либо детерминированный характер. Прослеживая изменение управляющей системы от одного момента времени до другого и т. д., мы получим полную картину хода поведения управляющей системы. Отсюда, в частности, мы можем получить полное представление о происходящей в ней переработке информации. Из этого описания видно, что управляющая система по существу состоит из более простых управляющих систем, схемы которых совпадают с отдельными элементами. Для пояснения понятия управляющей системы рассмотрим более цодробно ряд примеров.
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 7 1. Вычислительная машина а) Схема. Представляет собой электронную схему, элементами которой (в зависимости от состояния техники и назначения машины) являются: клеммы, полупроводники, ферриты, сопротивления, емкости, электронно-лучевые трубки, магнитные ленты и барабаны, реле и т. п. Обычно из этих элементов собираются небольшие схемы, представляющие собой элементарные подсхемы или ячейки; ячейки входят в более сложные схемы — узлы машины, соединение узлов дает всю схему машины. Память состоит из «ячеек» лент, барабанов, электронно-лучевых трубок, линий задержек, тумблеров и т. п. б) Информация. Определяется состоянием «ячеек» памяти, т. е. величинами электрических, магнитных и прочих характеристик этих «ячеек». в) Координаты. В данном случае это номера элементов схемы. Они позволяют определять положение деталей в схеме (что может быть интересно, например, в вопросах контроля работы машины). г) Функция. Это та операция, которую «выполняет» машина в данных условиях. Например, ею может быть «сложение» двух чисел, «умножение» двух чисел, «перенос» числа из одной ячейки в другую, логическое сравнение с последующей «передачей» управления, останов машины и т. п. Функциональные возможности каждой машины определяются перечнем всех выполняемых ею операций. 2. Нервная ткань а) Схема. В данном случае — нервная сеть, состоящая из соединения нервных клеток — нейронов. Таким образом, элементарными ячейками здесь являются нейроны. Память нервной сети состоит из рецепторов, являющихся входами схемы и воспринимающих внешние раздражения; из эффекторов, представляющих выходы схемы и передающих сигналы органам, и, наконец, из промежуточных нейронов, способных переходить в возбужденное состояние. б) Информация. Определяетед состоянием «ячеек» памяти, т. е. наличием или отсутствием стимулов на входах, состоянием промежуточных нейронов и состоянием эффекторов. в) Координаты. Указание определенных нейронов. Координаты нейронов, определяющие их местоположение в схеме, важны при рассмотрении таких вопросов, как развитие нервной ткани и пр. г) Функция. Выражает зависимость состояния эффекторов от состояния рецепторов и памяти. Другими словами, определяет характер воздействия на органы в зависимости от наличия или отсутствия тех или иных стимулов. 3. Программы вычислительных машин (реализующие алгоритмы) а) Схема. Представляет собой последовательность приказов (команд). Обычно программу разбивают на части, каждая из которых реализует отдельный оператор — часть данного алгоритма. Эти элементарные подпрограммы делятся в зависимости от вида оператора на типы. При этом можно отождествить элементарные подпрограммы с соответствующими операторами. Обычно различают арифметические операторы, операторы переадресации и восстановления, операторы формирования, операторы управления и пр. Таким образом, схему программы можно рассматривать как последовательность операторов.
8 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ Память состоит из тех ячеек, с которыми связаны операторы, входящие в схему. б) Информация. Определяется состоянием ячеек памяти. в) Координаты. В программе — это адреса приказов, в операторной записи — номера операторов. В данном примере координаты необходимы по существу для объясненияТфункционирования управляющей системы. Они позволяют находить нужный приказ для производства того или иного действия, в частности, для преобразования самой программы. г) Функция. Определяется тем элементарным преобразованием информации, которое задает выполняемый оператор. Последовательность элементарных преобразований позволяет найти и окончательное преобразование информации, совпадающее^ преобразованием информации, определяемым данным алгоритмом. 4. Арифметические выражения а) С х е м а. В данном случае схема есть" формула, определяющая арифметическое выражение. Формула состоит из символов: букв, цифр, скобок и знаков операций. Например, а{а-\-2Ъ). Арифметическая формула всегда может быть построена из «элементарных» формул, а именно из формул вида: а+6,а—ft, a-b, a : Ъ. Символы букв и цифр составляют память формулы. б) Информация. Определяется состоянием памяти. В случае арифметических выражений состояние памяти задается перечнем констант и числовых значений переменных (букв). в) Координаты. Здесь это номера символов, входящих в состав формулы. По ним можно, например, различать вхождения одной и той же буквы, положение скобок и т. п. г) Функция. Определяется тем преобразованием чисел, которое мы обычно связываем с данной формулой, трактуя операции +♦ —» • и : соответственно как сложение, вычитание, умножение и- деление. 5т Шахматы а) Схема. Задается расположением фигур на шахматной доске. б) Информация. Представляет собой запись всего хода игры, начиная с исходной позиции и кончая данной. Эта запись хранится в памяти. По ней, в частности, определяется, кому из партнеров принадлежит очередной ход, а также оцениваются стратегические замыслы игроков. в) Координаты. Определяют положение фигур на доске. Позволяют кодировать ход игры. г) Функции. Это очередной ход. Последний включает, во-первых, перемещение фигур и, во-вторых, запись хода в память. Ясно, что в данной позиции a priori возможно несколько ходов. Какой'именно и$ ходов будет сделан игроком, может быть определено в данных условиях с некоторой вероятностью. Следовательно, функция полностью определена указанием перечня допустимых в данной позиции ходов, а также их вероятностей. Теперь мы в состоянии продолжить обсуждение понятия управляющей системы. Как видно, понятие управляющей системы является достаточно широким понятием, имеющим значимость и за пределами кибернетики. Ввиду этого необходимо несколько уточнить класс тех управляющих систем, которые подлежат рассмотрению и изучению в рамках кибер-
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 9 нетики. С этой целью мы} отметим ряд существенных особенностей управляющих систем* имеющих место при этих рассмотрениях. Характерной чертой |управляющих систем, изучаемых в кибернетике, является то, что они представляют собой по существу объекты дискретной природы. Именно диркретным является строение управляющей системы, т. е. схема, ее координаты, информация, функция, а также время. Эта дискретность может бЬггь сильно замаскированной. Так, при рассмотрении информации, перерабатываемой машинами, мы имеем дело с состоянием ячеек памяти. В то же время состояние ячейки памяти определяется непрерывной величиной,* например, напряженностью поля. Следовательно, носитель информации может быть непрерывной величиной. Несмотря на это, для работы машины важны лишь некоторые пороговые значения этой ведшшнн. Другой характерной тертой управляющих систем, требующих специальных кибернетичесшк рассмотрений, является их сложность. Мы уже отмечали, чю управляющая система состоит, вообще говоря, из целого ряда элементарных управляющих систем. Эта сложность проявляется в том, что управляющие системы состоят из большого числа элементов (элементарных управляющих систем), имеют сложную систему связи, имеют большие потоки информации и реализуют сложную функцию. Все это делает трудным непосредственный полный просмотр управляющей системы. Наконец, третьей чертой является то, что реальные объекты можно рассматривать как управляющие системы, вообще говоря, многими способами. Это связано с тем, что фиксация управляющей системы зависит от того, какие управляющие системы взяты в качестве элементарных. Например, с вычислительной машиной связан ряд управляющих систем. Так, если интересоваться ею как радиотехническим устройством, с точки зрения «выборки» чисел, «преобразования» чисел, «записи» чисел и т. п., то за элементарные управляющие системы можно взять отдельные радиотехнические элементы: логические элементы, элементы памяти и т. п. С другой стороны, если мы рассматриваем программу, выполняемую этой машиной, то элементами будут отдельные приказы. Наконец, если — как средство для реализации алгоритма, то элементами, управляющими системами, будут отдельные операторы. Итак, понятие управляющей системы является относительным понятием. Часто выделяемые в изучаемом объекте управляющие системы относятся к разным «уровням» управления. При этом одни управляющие системы являются элементарными управляющими системами, входящими в состав более крупных управляющих систем. Другими словами, мы имеем дело с иерархичностью управляющих систем. При изучении управляющей системы строение и функционирование ее, как правило, рассматриваются совместно. Рассматривая тот или иной объект как управляющую систему, мы всегда пренебрегаем многими конкретными особенностями данного объекта. Так, при изучении вычислительных машин как управляющих систем нас не интересуют, например, габариты элементов, в какой-то мере даже тип элементов и т. п. В силу этого может оказаться, что две физически различные управляющие системы имеют сходные схемы и одинаковые назначения (функции). Например, вполне мыслимы две вычислительные машины с одинаковыми схемами и тождественными функциями, причем одна из них состоит из ламповых элементов, а другая из полупроводниковых. Две управляющие системы с одинаковыми схемами и одинаковыми функциями называются изоморфными. При изучении и конструировании управляющих систем нужно иметь представление об общих особенностях всей совокупности
10 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ изоморфных управляющих систем. Изоморфные управляющие системы представляют, по сути дела, совершенно равнозначные объекты с точки зрения их изучения в рамках кибернетики. Поэтому для кибернетики характерно широкое использование абстрактных понятий и методов точных наук. § 2. Основные задачи кибернетики Кибернетическая проблематика может быть подразделена на ряд разделов (см. строки таблицы). Каждый из разделов объединяет сходный круг вопросов, относящихся к самым различным областям наших знаний. Левый столбец таблицы в очень общей форме содержит перечень основных задач кибернетики. Изучение управляющих систем возможно с двух точек зрения: с макроскопической и с микроскопической. При макроподходе управляющая система рассматривается как «черный» ящик, внутреннее строение которого неизвестно или почти неизвестно. Такая ситуация имеет место, например, при изучении недоступных управляющих систем (в играх Прочие полюса и Пр.) или при рассмотрении управляющих систем, строение которых недостаточно полно изучено (в биологии и пр.). Сущность макроподхода определяется некоторыми специфики^/ | | выходЬ/ вескими особенностями управляющих систем. Из предыдущих рассмотрений видно, что в большинстве рассмотрений управляющая система представляет собой объект дискретной природы, состоящий, вообще говоря, из большого числа элементарных управляющих систем (элементов). Это обстоятельство приводит к тому, что управляющая система выступает не только как объект, имеющий микроструктуру, но и как объект макроскопический. Наличие большой сложности управляющей системы делает трудным прослеживание зависимости макросвойств от микросвойств управляющей системы. При первых рассмотрениях управляющей системы обычно прибегают к макроподходу (ср. с павловским подходом к изучению высшей нервной деятельности и пр.). Итак, при макроподходе исследуемая управляющая система не допускает полного просмотра; единственно, что подлежит прямому наблюдению — это полюсы схемы, ее внешняя память, а также поведение системы (см. рис.). Перед осуществлением макроподхода мы, как правило, не знаем ни схемы управляющей системы, ни информации, перерабатываемой ею, ни ое координат, ни ее функции. Таким образом, с самого начала мы обладаем сведениями о назначении данного объекта и располагаем либо тривиальным, либо весьма расплывчатым представлением об объекте как управляющей системе. Поэтому, прежде всего, нужно раскрыть данный объект как управляющую систему. Получение такой трактовки объекта связано с построением специального математического описания этого объекта, необходимого для последующих кибернетических рассмотрений. -Сделать это на пути одного макроподхода невозможно, здесь необходим также и микроподход. К макроподходу относятся четыре задачи.
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ Ц 7. Выяснение потоков информации Здесь мы исходим из того, что мы имеем некоторые сведения о назначении данного объекта. Это позволяет поставить вопрос о точной формулировке цели, преследуемой объектом. Знание цели объекта весьма важно, ибо оно позволяет, правда, пока на чисто содержательном (не формальном) уровне выявить, какая информация существенна для управляющей системы, а какая — не существенна. Последнее дает возможность отфильтровать информацию, не имеющую отношения к рассматриваемому вопросу. При этом следует различать информацию, переработка которой нас яепосредственно интересует (числовые значения переменных в формулах, наличие или отсутствие стимулов и т. п.), и информацию, которая нас непосредственно не интересует, но которая существенна для получения результата. И, наконец, информацию, которая необходима для функционирования управляющей системы (в программе — это знание оператора, действующего в данный момент, в шахматах — сведения о том, кто из игроков производит очередной ход, и пр.). С первым thhqm информации •связана так называемая внешняя память. Со вторым типом — внутренняя память и с третьим — полюсы схемы, через которые осуществляется -связь с внешней средой. Итак, выясняя потоки информации, мы должны выделить внешнюю память. Устройство внутренней памяти для нас непосредственно не доступно при макроподходе. Далее определяются полюсы схемы, а также их специфика, т. е. выясняется, какие из них являются входами, какие — выходами. Таким образом, эта задача связана по существу с предварительным анализом схемы управляющей системы, цель которого состоит в выявлении внешней памяти и полюсов. Эта задача решается в основном на чисто содержательном, не формальном уровне. 2. Раскрытие кода информации Итак, память управляющей системы разбивается на внешнюю и внутреннюю. Как мы уже видели, информация, с которой приходится иметь дело при макроподходе, связана с внешней памятью. Именно по отношению к этой информации управляющая система выступает как машина: если управляющая система в некоторый момент времени находится в некотором определенном состоянии и воспринимает через свою внешнюю память некоторую информацию, то, с одной стороны, она меняет свое состояние, с другой стороны, она выдает некоторую вполне определенную информацию. При этом как воспринимаемая, так и выдаваемая информация выражается при помощи некоторых систем элементарных сигналов. Здесь возникает следующий вопрос: как кодируется информация во внешней памяти, каковы алгоритмы кодирования и декодирования информации в управляющей системе. Более подробно переработка информации выглядит так. Имеется некоторое явление (скажем, математическая задача или физическая обстановка и пр.). Это явление характеризуется некоторой информацией (числовыми данными задачи, наличием или отсутствием тех или иных стимулов и т. д.). Данная информация поступает на внешнюю память управляющей системы в некоторый момент времени в виде некоторого кода. Последнее связано с кодированием.первичной информации в состояние памяти. Иногда управляющая система сама способна непосредственно воспринимать информацию, производя такое кодирование автоматическим образом (например, как в читающих устройствах).
12 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ Далее, управляющая система производит переработку информации и выдает в следующий момент времени во внешнюю память сигнал, представляющий код информации. И, наконец, происходит окончательное декодирование информации. Итак, изучение управляющих систем приводит нас к задаче изучения систем кодирования, к сопоставлению различных систем кодирования. В связи с последующей задачей синтеза управляющих систем важным вопросом является вопрос о построении кодовых систем с заданными характеристиками, например, кодовых систем, имеющих минимальную избыточность. С другой стороны, при построении кодовых систем приход дится выяснять, обладают ли они теми или иными свойствами. Напримерf будет ли кодовая система допускать однозначное декодирование или будет ли алгоритм декодирования обладать ограниченной задержкой и т. п. Данный круг вопросов составляет предмет теории кодирования — главы теории информации. 5. Выявление функции управляющей системы Знание «входной» информации и «выходной» информации позволяет ставить вопрос о выявлении функций данной управляющей системы. Вполне понятно, что при этом речь идет не о нахождении полной функции (что при макроподходе, вообще говоря, невозможно), а только о ее компоненте, связанной с переработкой состояний внешней памяти. Говоря о «входной» и «выходной» информации, мы неизбежно связываем их с определенными моментами времени. Последнее предполагает построение шкалы времени, т. е. предполагает выяснение, в какие моменты времени может поступать информация в управляющую систему и в'какие моменты времени производится вывод информации из управляющей системы. В частности, здесь решается вопрос о том, осуществляется переработка информации за один такт или за несколько тактов. В последнем случае определяется величина временного шага. С этой целью ставится серия экспериментов. Далее, опираясь на эксперимент, выясняют природу связи «входной» или «выходной» информации. Здесь определяют, с каким типом переработки информации мы имеем дело: детерминированным или случайным. В первом случае «выходная» информация в некоторый момент времени Тг однозначно определяется «входной» информацией в предыдущий момент времени Т0. Во втором случае связь «входной» информации с «выходной» носит случайный характер. Наконец, производится функциональное описание переработки информации. Это требует, с одной стороны, достаточно полного набора экспериментов и, с другой стороны, знания кодовых описаний информации. Для построения функциональной характеристики берут всевозможные наборы «входной» информации в моменты времени, предшествующие данному моменту. Для каждого набора находят перечень возможных «выходных» информации. Если цри этом происходит детерминированная переработка информации, то для данного набора «входной» информации будем иметь всегда одну и ту же «выходную» информацию. В этом случае мы получим функцию, описывающую связь «входной» и «выходной» информации. Ее можно, далее, выразить либо в терминах алгебры логики, либо в терминах многозначной логики, либо в терминах ограниченно- детерминированных операторов, либо в терминах рекурсивных функций и т. д. Если же происходит переработка информации случайным образом, то «выходная» информация не является однозначной функцией набора «входных» информации. Этот результат характеризуется перечнем возмож-
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 13 яых «выходных» информации и законом распределения, описывающим вероятность появлений той или иной «выходной» информации этого перечня. Его можно описать либо в терминах вероятностей логики, либо в терминах алгоритмов и операторов со случайными элементарными актами, либо в терминах теории случайных процессов и т. п. К этому вопросу тесно примыкает вопрос о разработке функциональных систем «с операциями, позволяющими описывать переработку информации. 4. Изучение функционирования управляющих систем В целом ряде случаев и, особенно, в случае, когда мы имеем дело •с управляющими системами, такими как мозг, как система экономических связей и пр., составляющими предмет изучения смежных наук, возникает вопрос об изучении функционирования управляющих систем. Зта задача является актуальной еще и потому, что для сложных управляющих систем часто не удается до конца выявить их функции. Единственно возможным здесь остается изучение функционирования, целью которого является достижение лучшего понимания управляющей системы. Ясно, что подобного рода изучение ценно с точки зрения познания данных управляющих систем и с точки зрения возможности использования принципов функционирования этих управляющих систем на благо человека (через моделирование). При рассмотрении управляющей системы как канала связи возникает целый комплекс вопросов, связанных с функционированием этого канала. К числу этих вопросов относятся такие, как оценка пропускной •способности канала, исследование помехоустойчивости и пр. Этими задачами занимается теория информации. В ряде случаев управляющую систему рассматривают как систему, осуществляющую обслуживание. Так, например, автомат, осуществляющий регулирование уличного движения, является обслуживающей системой. Здесь мы имеем дело с такими задачами, как задача об образовании очереди, задача об оценке времени ожидания и пр. Данные задачи изучаются в теории массового обслуживания. Иногда интересуются поведением управляющей системы с точки зрения достижения цели'. Такого рода ситуация имеет место в игровых алгоритмах. Возникающий здесь комплекс вопросов относится к области теории игр, теории линейного и динамического программирования. Важным вопросом является сравнение поведения различных управляющих систем. Сюда относятся, в частности, выяснение таких понятий, как целесообразное поведение, обучение и т. п. Наконец, возникает вопрос о познании управляющих систем в целом на базе изучения функционирования. Сюда входит выяснение таких вещей, как наличие или отсутствие обратных связей в управляющей системе, оценка объема внутренней памяти и т. п. Таким образом, представляется возможность в известной степени «заглянуть» внутрь черного ящика. Следует заметить, что макроподход является ограниченным, поэтому он не дает возможности полностью уяснить строение управляющей системы. Так, очевидно, что макроподход почти не дает никакого представления о структуре схемы управляющей системы. Как правило, он не позволяет найти также и полную функцию управляющей системы, ибо невозможно внешним экспериментом обнаружить характер изменений состояний внутренней памяти и наличии преобразований схемы (какое, например, имеет место при работе программы). Несмотря на все это, макроподход имеет большое значение в исследовании управляющих систем, особенно на первой стадии.
14 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ После того как произведены исследования на пути макроподхода, мы неизбежно должны будем перейти к микроподходу. Возможность микроподхода определяется тем, что управляющую систему можно расчленить на элементарные, причем число этих элементарных управляющих систем может быть довольно больпшм. Последнее обстоятельство- приводит к значительным трудностям, в силу чего приходится опираться на данные макроподхода. Здесь, как и всюду, характерно, что рассматриваются, как правило, не отдельные управляющие системы, а целые классы управляющих систем. К микроподходу можно отнести .следующие восемь задач. 5. Выявление элементов управляющих систем Микроподход начинается всегда с выявления элементарных управляющих систем по отношению к управляющим системам, принадлежащим некоторому классу. Таким образом, здесь происходит выделение- кирпичей», из которых строятся управляющие системы. Очень важно отметить, что такой процесс разбиения может быть осуществлен, вообще говоря, многими способами и, так сказать, в разном «масштабе». Приведем ряд примеров. При рассмотрении вычислительной машины можно рассматривать в качестве ее «кирпичей» или отдельные узлы, или функциональные блоки, или радиодетали. При изучении мозга в качестве «кирпичей» можно брать или отдельные его части, несущие определенные функции, или нейроны. Наконец, при исследовании программ «кирпичами» могут быть или операторы, отвечающие более мелким частям алгоритма, или отдельные приказы, связанные с элементарными актами. Эти «кирпичи» можно выбирать на разном уровне, и при каждом выборе- мы будем иметь свою управляющую систему. Следует заметить, что определение того, что считать «кирпичом», связано с учетом ряда содержательных факторов. Так, если взять «кирпичи» большого «размера», мы не сможем объяснить многих явлений, связанных с данным объектом. В случае «кирпичей» малого «размера» в принципе возможно объяснить любое явление, но это объяснение будет крайне громоздким. Таким образом, и в этом случае обращение с управляющей системой'затруднено. Выбор масштаба «кирпичей» обусловлен цельк>2изучения объекта и является наиболее важным звеном в вопросе выделения «кирпичей». После того как все «кирпичи» найдены и расклассифицированы, требуется детально изучить свойства этих элементарных управляющих систем. Их|изучение ведется средствами макроподхода и всегда требует привлечения специальных сведений из области, к которой принадлежат рассматриваемые объекты. 6. Выявление связей между элементами После того как произведено выделение элементарных «кирпичей», т. е. элементов, происходит изучение связей между элементами. Речь идет о выявлении связей, существенных для функционирования данного объекта. При этом основное внимание здесь уделяется тому, как геометрически связаны1 между собой полюсы отдельных элементов. Следует заметить, что «физическая» реализация этих связей в каждом случае может быть своей. Так, в случае арифметических выражений связь осуществляется через упорядоченное расположение символов, в случае вычислительной машины — через соединения проводниками или через магнитные и элек-
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 15 трические поля и т. п., в случае нервной ткани — через аксоны и синап- сы и т. д. Установив существенные связи между элементами в изучаемом объекте, мы получаем возможность описывать его как управляющую- систему, поскольку теперь нам известны и его схема, и информация, и координаты, и функция. Для этого круга вопросов представляет большую ценность изучение некоторых топологических вопросов. Среди них можно упомянуть такие вопросы, как исследование конечных метрических пространств, теорию графов и сетей и т. п. Дальнейшие задачи имеют целью изучение управляющих систем в целом. 7. Алгоритмизация управляющих систем Обычно приходится иметь дело не с одной управляющей системой, а с целым классом управляющих систем. Для изучения ^систем данного- класса в принципе возможно идти только что описанным путем. В частности, можно при помощи экспериментов находить функциональные характеристики управляющих систем. Однако это встречает серьезные трудности из-за объема эксперимента. В некоторых случаях, когда речь идет о гипотетических управляющих системах (например, о проекте вычислительной машины), нахождение функциональных характеристик путем эксперимента вообще невозможно. Поэтому возникает вопрос о нахождении данных характеристик, минуя эксперимент. Такую возможность дает алгоритмизация управляющих систем. Алгоритмизация состоит в том, что находят алгоритм, который позволяет для любой управляющей системы данного класса по ее схеме, информации и координатам найти функциональную характеристику. В этом смысле алгоритмизация представляет собой, по существу, универсальный метод моделирования управляющих систем. Найденная функциональная характеристика может совпадать с характеристикой, полученной экспериментальным путем; в этом случае алгоритмизация для данной управляющей системы является точной. Однако часто алгоритмизация не является точной для всех управляющих систем рассматриваемого класса ввиду грубости математического описания. Такого рода ситуация имеет место для класса электрических схем, для управляющих систем из области лингвистики и т. п. В связи с этим возникает вопрос о построении такой алгоритмизации, которая для достаточно большого запаса управляющих систем из данного класса была бы точной (задача о выборе тактики). Процесс алгоритмизации предполагает проведение ограниченного эксперимента. Сначала экспериментально находят функциональные характеристики для элементов, затем путем эксперимента выясняют, как по функциям отдельных элементов схемы и по их связям можно находить истинную функциональную характеристику управляющей системы. В результате этого получают алгоритм, который, будучи примененным к элементарным управляющим системам (элементам), выдает их истинные функциональные характеристики и дает какие-то функциональные характеристики для остальных управляющих систем данного класса. В случае, если алгоритм построен удачно, эти функциональные характеристики для большинства управляющих систем будут совпадать с их истинными характеристиками^ Качество алгоритмизации проверяется также опытным путем. Следующий круг задач возможен как для алгоритмизированных, так и для неалгоритмизированных управляющих систем.
16 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ S. Анализ управляющих систем Часто, когда мы имеем дело с управляющими системами, требуется получить более полные сведения об этих системах, исследовать какие- либо их свойства. Например, по схеме, координатам и информации определить функцию или по данному набору управляющих систем выяснить, можно ли из них «сконструировать» управляющую систему, обладающую определенным поведением. Данные задачи относятся к анализу управляющих систем. Остановимся несколько подробнее на задаче анализа управляющих систем. Как уже указывалось, часто приходится находить по схеме, информации и координатам функцию управляющей системы. В отличие от задачи выявления функции при макроподходе тут требуется определить функцию, описывающую не только переработку состояний внутренней памяти, но и переработку схемы, координат и самой функции. Частично эта задача возникает на этапе алгоритмизации. Однако наибольший интерес она приобретает для алгоритмизированных управляющих систем, поскольку ее решение становится возможным без экспериментов. Знание функции управляющей системы или, как мы будем ее называть, полной функции управляющей системы позволяет определить много производных функциональных характеристик. Важную роль среди них играют функциональные характеристики, описывающие переработку состояний внешней памяти. Так, например, в программе полная функция — очередное преобразование, а производной функцией можно считать преобразование начальных данных (исходное состояние внешней памяти) в данные результата (заключительное состояние внешней памяти). Поскольку в формулировке последующих задач используется не полная функция, а производная функция, то в дальнейшем (кроме п. 11) мы для краткости вместо «производная функция» будем писать «функция» и под функцией управляющей системы будем понимать производную функцию управляющей системы. Далее, сюда^же относится вопрос о полноте элементов. Этот вопрос может быть сформулирован следующим образом: дано некоторое множество функций и некоторое множество элементов (элементарных управляющих систем); решается вопрос о возможности для любой функции из указанного множества построить! при помощи данных элементов управляющую систему, обладающую этой функцией. Наконец, часто нас интересует поведение (функция) управляющей системы. Так, в'задаче о перевозке грузов мы интересуемся планами перевозок, в задаче регулирования уличного движения — алгоритмами регулирования. При этом решение вопроса обычно подсказывает тот или иной критерий оценки поведения управляющих систем. В упомянутых примерах это — оценка плана перевозок и оценка качества алгоритма управления. В связи со способом оценки возникает вопрос о выборе управляющей системы заданного типа, обладающей наилучшим (оптимальным) поведением. Данного рода задачи находятся в центре внимания таких дисциплин, как теория массового обслуживания, теория игр, теория линейного и динамического программирования. 9. Синтез управляющих систем' Задача синтеза управляющих систем является в некотором смысле обратной задачей по отношению к задаче анализа управляющих систем. Эта задача ставится следующим образом. Задан класс функций и задан полный относительно этого класса набор элементов. Требуется из этих
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 17 элементов построить управляющую систему с заданной функцией. Как правило, задача синтеза имеет несколько решений, поэтому возникает вопрос о выборе предпочтительного решения. Последнее зависит от критерия, определяющего преимущества одной управляющей системы по отношению к другой. Таким образом, сначала в соответствии с соображениями специфики вопроса происходит выработка критерия. После этого задача приобретает точный смысл и разрабатываются методы синтеза оптимальных управляющих систем. Поскольку синтезирование оптимальных управляющих систем требует разработки проекта и эта разработка достаточно трудоемка, то возникает вопрос об автоматизации процесса составления оптимального проекта. С такого рода проблематикой мы сталкиваемся в теории програхммирова- ния, в задаче перевода с одного языка на другой и т. д. В связи с задачей синтеза управляющих систем часто приходится изучать вопросы, связанные с эффективностью алгоритмов синтеза. Перечисленные выше задачи входят в круг математических вопросов синтеза управляющих систем. 10. Эквивалентные преобразования управляющих систем Две управляющие системы называются эквивалентными, если они Ихмеют тождественные функции. Очевидно, что эквивалентные управляющие системы при помощи внешних экспериментов неразличимы. Переход от одной управляющей системы к эквивалентной ей управляющей системе называется тождественным преобразованием. Важной задачей является изучение тождественных преобразований управляющих систем. В частности, большой интерес представляет описание всех возможных тождественных преобразований. Последнее в принципе дает возможность тождественного преобразования управляющей системы в оптимальную. Следовательно, изучение тождественных преобразований может быть использовано для решения задачи о синтезе управляющих систем. Важным вопросом является вопрос об исследовании алгоритмов «упрощения» управляющих систем при помощи тождественных преобразований. 11. Эволюция управляющих систем Здесь мы временно вернемся к полной функции управляющей системы. Очевидно, что под воздействием своей функции управляющая система преобразуется в новую управляющую систему. При этом результаты преобразования в зависимости от случая могут быть различными. Так, совершая ход в данной шахматной позиции, мы переходим к новой позиции. Эта новая позиция зависит от выбора хода. Если затем к полученной управляющей системе применить ее функцию, то получим, вообще говоря, опять новую управляющую систему и т. д. Возникшая таким образом последовательность (конечная или бесконечная) называется эволюцией управляющей системы. Поскольку на каждом шаге мыслимы различные преобразования, то данная управляющая система может эволюционировать различными способами. Так, в случае шахмат эволюцией является конкретная партия; множество всех партий определяет все эволюции. Важной задачей является изучение эволюции управляющих систем. В частности, интересен следующий вопрос: даны две управляющие системы; спрашивается, возможен ли эволюционный переход от одной управляющей системы к другой. Эта задача в сицща&лтхмат может быть сформулирована так: возможен ли в дадйоы позиции ввя^уэыш, т. е. переход 2 Проблемы кибернетики, вып. 9
18 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ от заданной позиции к выигрышной. Подобного рода вопросы имеют большое значение в области биологии (при выведении новых пород). В некоторых случаях возможно «управление» элементарными переходами. Например, в шахматах такое управление осуществляется с использованием опыта играющего в эволюционной биологии — с использованием отбора. В таком случае представляется возможность «управлять» эволюцией. Это в свою очередь ставит вопрос о разработке методов «управления» эволюцией, т. е. о разработке и изучении алгоритмов эволюции. Подобного рода проблематика составляет предмет изучения в теории игр и теории динамического программирования. 12. Изучение надежности управляющих систем Рассмотрение управляющих систем показывает, что в их функционировании возможны сбои, т. е. отклонения от требуемого режима. В связи с этим возникает вопрос об изучении надежности управляющих систем. Сбои в функционировании возможны как за счет искажения информации при поступлении во внешнюю память, так и за счет сбоев отдельных элементов. Вполне понятно, что прежде всего надо изучить источник возможных сбоев и произвести классификацию последствий, которые могут вызываться этим источником. В случае, если известно, что происходит искажение исходной информации и что искажение имеет такой-то вид, возможны два пути использования этой информации. Первый путь предполагает использование более надежной системы кодирования. Таким образом, мы переходим к задаче построения помехоустойчивых (для данного класса помех) кодов. Последняя является одной из центральных задач теории информации. Наиболее трудным здесь является нахождение компромисса, поскольку приходится одновременно добиваться возможно большей пропускной способности канала. Наряду с этим приходится стремиться к простоте алгоритмов кодирования и декодирования. Другой путь состоит в создании «устойчивости» в самой управляющей системе за счет подходящей структуры. Подобного рода подход осуществлен в системах типа гомео- стата. Следует заметить, что второй путь более перспективен, хотя он не может полностью устранить сбои. Кроме того, оба пути предполагают перестройку управляющих систем и ничего не дают в тех случаях, когда такая перестройка невозможна. Пусть теперь известно, что ненадежность управляющей системы может быть обусловлена ненадэжностью ее элементов. Если при этом управляющая система задана, то возникает вопрос, как с ней обращаться? Так мы приходим к задаче контроля функционирования управляющей системы. Эта задача предполагает разработку методов отыскания сбоев. Если же управляющей системы нет и требуется ее построить из данных элементов, то мы приходим к проблеме создания надежных управляющих систем из ненадежных элементов. Центральным вопросом здесь является поиск алгоритмов построения надежных управляющих систем, удовлетворяющих требованию оптимальности. Разумеется, приведенный список задач не может считаться окончательным. Однако уже он позволяет построить единую и достаточно полную программу исследовательских работ в области кибернетики. Эти работы предполагают широкое использование как математического аппарата и теоретических соображений из разных конкретных областей знаний, так и проведения экспериментальных исследований.
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 19 § 3. Математические вопросы кибернетики Переходя к описанию математических вопросов кибернетики, следует иметь в виду, что использование в кибернетике далеко идущих абстракций ведет к широкому применению математического аппарата. Такой аппарат, с одной стороны, создается, исходя из потребностей самой кибернетики, с другой стороны, берется из различных разделов математики. Следует отметить, что уже на начальной стадии развития кибернетики возникла необходимость в широком использовании математической логики, теории вероятности, математической статистики, теории функций действительного переменного, теории множеств, функционального анализа, топологии, теории чисел, абстрактной алгебры и т. п. Математическая проблематика в кибернетике связана с основными задачами кибернетики, и поэтому удобно дать перечень математических задач в соответствии с задачами кибернетики. 1. Макроподход 1. Выяснение потоков информации. В настоящий момент здесь не представляется возможным сформулировать какие-либо математические задачи. 2. Раскрытие кода информации. Сюда относится ряд вопросов из теории информации: а) изучение различных принципов кодирования; б) изучение свойств кодовых систем; в) исследование алгоритмов кодирования и декодирования. 3. Выявление функций управляющей системы. Здесь предполагается исследование математического аппарата, описывающего функционирование управляющих систем: а) разработка конечнозначных и бесконечнозначных логик; б) изучение ограниченно-детерминированных операторов; в) изучение алгоритмов; г) разработка вероятностей логики и теории алгоритмов со случайными элементарными актами. 4. Изучение поведения управляющих систем: а) изучение управляющих систем как канала связи (оценка пропускной способности «канала», вопросы помехоустойчивости и т. п.); б) исследование управляющей системы как системы массового обслуживания (проблема ожидания, оценки эффективности обслуживания и т. п.); в) изучение поведения управляющей системы с точки зрения достижения цели (игровая проблематика); г) изучение поведения управляющих систем с точки зрения их «организованности» (их сравнение, определение обучаемости и т. п.); д) оценка строения управляющей системы, исходя из ее поведения, в частности, оценка объема внутренней памяти. 2. Микроподход 5. Выявление элементов управляющих систем. Здесь сформулировать математические задачи пока не удалось. 6. Выявление связи элементов. Здесь рассматриваются задачи, связанные с топологией управляющих систем: а) развитие4 теории графов; б) развитие теории сетей; в) изучение схем (включая разработку различных языков для записи схем). 2*
20 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ 7. Алгоритмизация управляющих систем: а) изучение различных способов алгоритмизаций управляющих систем (учет элементов, топологии, информации); б) разработка принципов приближенных алгоритмизаций (тактик), в том числе теории игр, игровых математических моделей. 8. Анализ управляющих систем. 9. Синтез управляющих систем: а) построение методов синтеза управляющих систем, имеющих заданное поведение (включая задачу автоматизации синтеза); б) изучение асимптотических характеристик (в зависимости от элементов, топологии, типа алгоритмизации); в) выяснение логической природы трудности синтеза минимальных схем; г) выделение семейств управляющих систем с существенно более простым строением. 10. Тождественные преобразования управляющих систем: а) построение систем тождеств для преобразования управляющих систем различных классов; б) выяснение случаев, когда возможно построение конечной полной системы тождеств; в) разработка алгоритмов упрощения управляющих систем при помощи системы тождеств. 11. Эволюция управляющих систем: а) разработка методов перехода от одной управляющей системы к другой при эволюции. 12. Изучение надежности управляющих систем: а) выяснение влияния выбора кода на надежность работы управляющей системы при ненадежности входов (построение помехоустойчивых кодов); б) синтез надежных управляющих систем из ненадежных элементов; в) разработка методов контроля работы управляющих систем. МЕТЭДЫ КИБЕРНЕТИКИ Кибернетика тесно соприкасается с большим числом разделов науки и техники. Ввиду этого она широко использует их методы, особенно при изучении конкретных управляющих систем. Вместе с тем кибернетика является наукой точной, поэтому для нее характерны методы точных наук. Исключительно важную роль в кибернетике играют математические методы самого разнообразного рода, пронизывающие почти все ее разделы. Наряду с этим в кибернетике используется опыт. Привлечение опыта крайне важно при изучении сложных объектов. Для кибернетики является типичным рассмотрение управляющих систем высокой сложности. Последнее означает, что здесь приходится иметь дело с большими потоками информации, с весьма громоздким и с достаточно сложным функционированием. Поэтому в кибернетических исследованиях опыт играет большую роль. Опыт встречается в различных формах: наблюдение, статистический анализ, логический анализ и кибернетический эксперимент. Наблюдение широко используется при изучении конкретных систем. Этот метод особенно распространен, например, в таких областях, как биология или экономика. Статистический анализ занимает видное положение в кибернетике. Его применение связано не только с теоретико-вероятностным подходом к изучению явлений, но и с рассмотрениями по существу детерминированного характера. В частности, он удобен при изучении управляющих систем высокой сложности. Поэтому статистический анализ употребляется при изучении многих кибернетических вопросов. Мы сталкиваемся с ним
ТЕОРЕТИЧЕСКИЕ ПРОБЛЕМЫ КИБЕРНЕТИКИ 21 при изучении информации, при исследовании элементов, при рассмотрении функционирования, при проведении алгоритмизации и т. д. Логический анализ находит применение в кибернетике по тем же причинам, что и статистический анализ. Его назначение состоит в том, чтобы вскрыть логические закономерности в изучаемых объектах. В частности, он нередко употребляется в форме выявления типов управляющих систем и построения классификации управляющих систем. Типизация управляющих систем является исходным пунктом во многих теоретических разработках. Наряду с этим типизация представляет новый этап изучения классификации управляющих систем. Здесь следует иметь в виду, что всякая классификация строится не как самоцель, а в связи с определенными рассмотрениями. Таким образом, классификация прежде всего требует установления цели. После этого происходит выбор «масштаба» при определении исходных типов. Последнее позволяет избежать излишнего усложнения самой классификации. Особенно следует обратить внимание на то, что каждая классификация должна основываться на четких принципах. Например, классификация может производиться по типам элементов, по типам схем, по функциям и т. п. Сложность управляющих систем нередко бывает столь значительной, что упомянутые выше методы, а также чисто математические соображения оказываются недостаточными при изучении и построении управляющих систем. Ввиду этого важное положение среди методов кибернетики занимает кибернетический эксперимент. Кибернетический эксперимент состоит в том, что исходная управляющая система заменяется моделью, которая затем изучается. Принципиально моделирование состоит в создании управляющей системы, изоморфной или приближенно изоморфной данной, и в наблюдении ее функционирования. В связи с моделированием возникает целый ряд вопросов: а) отчетливое выяснение цели эксперимента; б) выработка математического описания изучаемого явления, включая разработку языков для его описания; в) проведение алгоритмизации; г) выработка критериев для оценки результатов эксперимента и т. д. Для моделирования характерно то, что модель имеет определенные преимущества перед исследуемой управляющей системой. Так, например, при проектировании систем управления производственными процессами моделирование позволяет проверить правильность замысла и выбрать рациональные значения некоторых параметров конструкции дешевле и быстрее, чем непосредственное построение натурального опытного объекта. В тех случаях, когда исследуемая управляющая система слабо изучена, модель позволяет проверять правильность наших представлений о ней. Такого рода ситуация имеет место при моделировании отдельных функций сознания. Здесь оказывается существенным то, что принципы функционирования модели известны много лучше, чем изучаемой управляющей системы. Чаще всего моделирование управляющих систем осуществляется либо средствами техники, либо программным путем на ЭВМ. Моделирование средствами техники требуется там, где необходимо сохранить близость модели к исходному объекту, где техническая реализация представляет удобства для наблюдения. Например, при создании ЭВМ обычно предварительно строят макет, на котором уточняют замысел проекта. Последнее достигается благодаря некоторой близости макета к проектируемой машине. Далее, при изучении поведения животных удобно пользоваться техническими моделями, поскольку они дают возможность легко оценивать принципы, лежащие в основе этого поведения.
22 А. А. ЛЯПУНОВ и С. В. ЯБЛОНСКИЙ Программный путь моделирования является наиболее мощным и наиболее распространенным видом кибернетического эксперимента. Этот путь обладает определенной спецификой, благодаря которой возникает ряд дополнительных вопросов. К их числу относится выбор подходящего кода для перерабатываемой информации на разных этапах работы алгоритма, чтобы обеспечить благоприятный режим работы как с точки зрения загрузки памяти, так и с точки зрения машинного времени. В частности, важно по возможности сократить переборы вариантов, возникающих при решении данной задачи. В ряде случаев, когда весь алгоритм не умещается в машине, возникает вопрос о его рациональном расчленении на автономные части с тем, чтобы можно было осуществить вычисление в несколько этапов. При этом должно быть обеспечено стыкование отдельных частей между собой. Наконец, необходимо выбрать достаточно производительный способ программирования. Нередко встает вопрос об автоматизации процесса программирования алгоритмов, связанных с определенным кругом задач. В качестве примеров программного моделирования на ЭВМ укажем машинный перевод и программирующие программы, связанныз с моделированием некоторых актов мышления. Хотя кибернетический эксперимент как научный метод появился совсем недавно, однако уже сейчас он находит многочисленные применения и оказывает влияние на выработку точных понятий и отчетливых постановок вопросов. Кибернетический эксперимент применяется в целом ряде задач. Он широко используется при раскрытии и изучении систем кодирования информации; при изучении функционирования управляющих систем в задаче выявления элементов и связи элементов и особенно при алгоритмизации управляющих систем. В приведенной таблице сделана попытка систематизации проблематики кибернетики. Горизонтальные строки характеризуют классы родственных задач, относящихся к изучению управляющих систем различной природы; они разбиты на две группы: макроподхода и микроподхода. Первый вертикальный столбец содержит общее наименование задач. Второй вертикальный столбец содержит некоторую детализацию этих задач. В третьем столбце приведены наиболее характерные средства, используемые при решении соответствующих задач. Здесь указываются области математики, математические разделы кибернетики, а также экспериментальные методы. Последующие вертикальные столбцы соответствуют отраслям знаний, в которых изучаются конкретные управляющие системы. Это изучение и то обстоятельство, что в самых различных отраслях знаний приходится иметь дело с однотипными вопросами, касающимися управляющих систем, породили возникновение кибернетики. Формирование собственных методов в кибернетике обусловлено тем, что однотипные вопросы, возникающие в разных конкретных областях при изучении управляющих систем, решаются одними и теми же методами. Отметим, что во многих случаях при этом возникают новые методы. Следует отметить, что набор этих столбцов отнюдь не претендует на полноту, скорее он носит иллюстративный характер. В каждом столбце имеется в виду отнюдь не одна-единственная управляющая система; так, например, в столбце, относящемся к физиологии нервной системы, имеется в виду то организм в целом, то нервная система в целом, то некоторые ее отделы. Возможно, что в процессе развития кибернетики понадобится дальнейшая детализация этой таблицы, прежде всего в направлении введения новых столбцов, либо путем расщепления старых, либо, путем охвата новых областей.
II. УПРАВЛЯЮЩИЕ СИСТЕМЫ ПРЕОБРАЗОВАНИЯ, ОПРЕДЕЛЕННЫЕ КОНЕЧНЫМИ АВТОМАТАМИ J. HOUEJS (БРЫО, ЧЕХОСЛОВАКИЯ) {Конечным) автоматом называется конечное непустое множество М вместе с конечной системой 3 некоторых отображений этого множества в себя, если: 1) в М отмечен определенный элемент а0; 2) для каждого аг£М, аг Ф а0, существует конечная последовательность S{ly . .., Si элементов из 5 такая, что ar = S\ ... S^S^a^. Элементы множества М называются состояниями (а0 — начальное состояние), элементы множества 3 — входами автомата. Пусть теперь дано конечное множество 3 каких-нибудь символов, 3 = {5Х, ..., Sjv}; построим множество всех (конечных и бесконечных) последовательностей этих символов и обозначим его через 2. Отображение А множества 2 в себя называется нормальным, если существуют автомат с множеством входов 3 (т. е. входов, обозначенных символами из 3) и с начальным состоянием а0 и функция а, отображающая множество его состояний в 3 так, что A{Sh, ..., Sik) = (S^ ...,Sik) тогда и только тогда, когда для всякого р, 1<р<А: + 1, имеет место a(Sip ••• Sj1a0) = S'i (в случае, когда отображаемая последовательность бесконечна, положим к=со). Замечания. 1. Введение этого понятия оправдано интерпретацией: нормальным отображениям соответствует постепенная обработка информации (кодированной потенциально бесконечной последовательноостью символов пределенного алфавита) конечным автоматом. 2. При нормальном отображении последовательности из 2 соответствует последовательность с тем же самым числом символв. 3. Каждый автомат вместе с подходящей функцией создает указанным образом определенное нормальное отображение. С другой стороны, для данного нормального отображения существует, вообщо говоря, много автоматов, удовлетворяющих требованиям определения. Е .Ф. Мур ([1], стр. 1CJ6) показал, что в этом случае среди них существует один (с точностью до изоморфизма) автомат с минимальным числом состояний. Теорема 1. Мномсество всех взаимно однозначных нормальных отображении {множества 2 на себя) есть группа {относительно сложения отображений). Замечание. Взаимно однозначному нормальному отображению «соответствует автомат, который обрабатывает информацию, не теряя ее.
24 J. HOREJS Доказательство. Так как все взаимно однозначные отображения 2 на себя образуют группу, достаточно доказать два утверждения: а) сложение двух взаимно однозначных нормальных отображений дает опять отображение взаимно однозначное и нормальное; б) обратное отображение (к взаимно однозначному и нормальному) является взаимно однозначным и нормальным ([2], стр. 206). Ясно, что в обоих случаях получаем взаимно однозначные отображения; докажем их нормальность. а) Пусть А и И — отображения, для которых существуют соответственно автоматы А и В с начальными состояниями а0 и bQ и функции аир такие, что A(Siv .. ., sik) = (s'h> •••> S'ik) тогда и только тогда, когда a (Si ... S^a^^Si Для всякого ру 1 < р < /с + 1. Наша задача — найти автомат С, его начальное состояние с0 и функцию у такие, что при выбранном обозначении С = В A (Silt ... • • •» Sift) = (sh> • • •. s'ik) Т0ГДа и только тогда, когда y(Sip . . . Shc0) = S"ip для всякого/?, 1< р < ft-f-1. Покажем, что этим требованиям удовлетворяют: автомат с состояниями [ai? Ь;.], где а{ и Ь;. — соответственно состояния автоматов А и 5, и с отображением 5$[яг, 6S] = [S{ar9 а(^аг)68] для i=l, ..., Лг; начальное состояние c0 = [aQ,bQ] и функция yK, Ьу] = Р(Ьу)- Действительно, для всякого р, 1< р < Л+ 1, выполнены соотношения? Y(Sip ... 5ilCo) = Y(5ip ... 541[а0> b0]) = y(Sip ... Si2[*V0, a(SiA) Ь0]) = = y(Sip ... 54а[541а0> 5J160]) = Y(5ip ... Sh[ShSha0, a (ShSha0)b0}) = = y (Sip ... 5|3 [S^Si^o, Si2SiA]) = = ... = y [Sip .. . Sha0, S'ip ... S'hb0] = p (5|p ... S'hb0) = S"ip. б) Пусть для отображения А существует автомат А, его начальное состояние а0 и функция а такая, что A (Siv . . . у Sik) = (S'iv . ..,S*fe) тогда и только тогда, когда a (Si ... S^uq) = S[p для всякого р, 1</? </c-f 1. Наша задача —найти автомат А\ его начальное состояние а'0 и функцию а' такие, что A~1(Si1, ..., Sik) = (Siiy ..., 5|ft) тогда и только тогда, когда a' (S[ ... ^ц^о) = ^р для всякого р, 1 < р < к+ 1. Состояниями автомата А' будем считать пару [a0, a0] (начальное состояние) и упорядоченные пары [aiy ay], где aif a; —состояния автомата Л, для которых существует 5ft такое, что Skai=^aj. Отображения множества состояний определим следующим образом. Для i=l, 2, ..., N положим St [ar, as] = К, 5rtas], где 5П определено соотношением a(Sua3) = Sl. Такое 5П должно существовать и притом только одно, так как символы a(5'1as), a(S2as), ..., a(SNas) должны быть попарно различными, иначе отображение А не было бы взаимно однозначным. Действительно, если бы, например, для IФ V было a(Slas) = a(SL>as), то a(SLSJt ... 5;1а0) = a(Si>SJt ... Sha0)t где Sj19 ..., Sj — последовательность такая, что Sjt ... 5ла0 = а8 (такай последовательность существует в силу 2)); но тогда A(Sh, ..., Sjt, Sl) = A{Sh, ...,Sh, Sv).
ПРЕОБРАЗОВАНИЯ, ОПРЕДЕЛЕННЫЕ КОНЕЧНЫМИ АВТОМАТАМИ 25 Следовательно, указанные символы различны, и между ними в точности один равен St. Функцию а' определим соотношением а' [arf as] = Sk> если Shar — as; такое Sk всегда существует, кроме, возможно, случая r = s = 0 (см. определение множества состояний); если для начального состояния такого Sk не существует, положим а' [а0, а0] равным любому символу. Однозначность а' следует по аналогии с предыдущим из взаимной однозначности отображения А. Действительно, для всякого р,. 1 < р < к + 1, имеет место a'(S'ip ••• ^i'iK> a0]) = a'(S'ip ••• #sK> sn1a0]) = (так как a (Snia0) = S^, то iS^^S^ и, следовательно,) = a' (S'ip • • • ^i2 K> ^iiao]) = a' (^ip ' ' • Sh [Siiao> Sn2Shao\) = (так как a(6,ri2iS,i1a0) = 5i2, то Sn2 = Si2 и, следовательно,) ~a'№ • • • $ч [^h^haoy Sn3Si2Si1a-0])=i — a' [5ip_1 • • • «Si^, Sn^Si/pi .. . S^aJ — S{p (так как a(Sn Si .-. 51^) = 5i и, следовательно, Sn =S{ ). Этим завершается доказательство теоремы 1. Так как при доказательстве пункта а) не было использовано предположение о взаимной однозначности рассматриваемых отображений, мы одновременно доказали Следствие. Множество всех нормальных отображений (множества 2 в себя) есть полугруппа (с единицей). Теорема 1 намечает связь между некоторыми классическими понятиями математики и возникающей теорией автоматов. Несмотря на то, что эта связь касается только некоторых вопросов, возможно, она окажется полезной. Как пример докажем следующую теорему. Теорема 2. Группа из теоремы 1 не является циклической, если N > 2 (iV —число символов из множества ©). Замечание. С точки зрения интерпретации теорема утверждает, что не существует «универсального» автомата, многократное использование которого (т. е. в большом числе экземпляров, см. [1], стр. 181) было бы способно заменить в обработке информации любой автомат. Здесь рассматриваются только автоматы, не теряющие информации (см. замечание к теореме 1). Доказательство. а) N = 2. На простом примере покажем, что группа не является абелевой, —этим доказывается утверждение. Пусть для автомата А с множеством состояний a0, av a2 (a0 —начальное) и с входами Sly S2 имеют место равенства S1a0 = S2a1 = S2a2 = av S2aQ = 5^2 = S1al — а2. Вместе с функцией a, a(a0) = a(a1) = S2i a(a2) = 51, этот автомат порождает нормальное отображение А; нетрудно показать, что оно взаимно однозначно. Аналогично автомат В с множеством состояний Ь0, Ьъ Ъ2 (/^ — начальное) и с входами Sly S2> где 51ft0 = 52fc1 = 51b2 = fclF S2b0 = = S2b2 = S1b1 = b2, вместе с функцией p, P(b0) = Р(йх) = 52, $(b2) = S1} определяет взаимно однозначное нормальное отображение Б. Для определенных таким образом отображений IiA(Sly S1) = B(S2, S1) = (S1, S2), no Ali(Sl9 S1)=A(S2, SJ-^, S,). б) N > 2. В следующей лемме покажем, что в этом случае группа имеет подгруппу, которая не является циклической. Можно было бы применить тот же прием, что и в предшествующем случае, но доказательство леммы имеет общее значение.
26 J. HOREJS Лемма. Пусть ©' — подмножество множества ©, Р — множество всех подстановок множества ©'. Множество всех отображений вида A(Sh, ..., Sik) = (p{Sh), ..., p(Sik)), где р£Р (для S^S' положим p(S{) = S{), есть подгруппа группы всех взаимно однозначных нормальных отображений. Если в ®' по меньшей мере три элемента, то эта подгруппа не циклическая. Замечание. В лемме описан самый простой способ кодирования (см. [2], гл. 8, 8/5). Доказательство. Взаимная однозначность рассматриваемых отображений следует из свойств подстановок. Без труда можно показать, что сложение двух отображений рассматриваемого вида дает отображение того же вида и что обратное преобразование обладает тем же свойством. Остается доказать, что всякое такое отображение А нормально. Определим автомат Л с множеством состояний а1У ..., a./v, с входами Sly ..., Sjv, положив Siai = ai для £=1, 2, ..., N и выбрав произвольно начальное состояние. Определим функцию а соотношением а(аг) — Р(^г)- Для отображения А, определенного автоматом А и функцией а, для всякого г, 1</-</с + 1, равенство a(SiS\ ... S^a^^ = a(aj ) = p(S{) действительно имеет место тогда и только тогда, когда A{Sh, ..., 5ift) = (p(5i1)> ..., p(Sih)). Вторая часть утверждения леммы следует из того, что множество всех подстановок из по меньшей мере трех элементов есть нециклическая группа. Следствие. Полугруппа из следствия теоремы 1 не является циклической, если N > 2. Замечание. Здесь утверждается отсутствие «универсального» автомата в смысле замечания к теореме 2 в классе всех автоматов, а не только тех, которые не теряют информации. Доказательство. Если бы полугруппа Н была циклической, существовал бы элемент А£Н такой, что для любого Х£Н равенство Х—Ак верно для подходящего к. В частности, для единицы Е£Н (тождественное отображение) существует к0 такое, что JE = Ak°. Из теоремы 2 вытекает, что А £ H\G (где G обозначает группу из теоремы 2) и, следовательно, существуют два различных элемента множества 2, образы которых в отображении А равны. Из этого следует, что и их образы в отображении Ак° равны, но Ак°=Е> а при тождественном отображении, разумеется, двум различным элементам соответствуют два различных элемента. Противоречие завершает доказательство. С точки зрения интерпретации было бы полезным исследовать и другие — классически выразимые — свойства введенных групп, например, вопрос существования конечного числа образующих (возможное усиление теоремы 2), установление всех подгрупп (см. лемму), связь между группами, отвечающими различным множествам 3 (например, & = {Slf ..., SN}, Z' = {SV .... 52Л,})и т. д. ЛИТЕРАТУРА [1] Сб. Автоматы, ИЛ, 1956. [2] Эшби У. Р., Введение в кибернетику, ИЛ, 1959. Поступило в редакцию 18 X 1961.
О КЛАССИФИКАЦИИ ФУНКЦИЙ МНОГОЗНАЧНОЙ ЛОГИКИ JS. М. КЛОСС (МОСКВА) э. и. НЕчтпорук (ЛЕНИНГРАД) Объектом изучения данной работы являются функции f(xu ...,xn) от п переменных, принимающие значения из некоторого конечного множества элементов С = {с0, сх, . .., ст_1}. Аргументы xi принимают значения также из множества С. Таким образом, каждая такая функция осуществляет отображение прямого произведения Сп в С. Обозначим множество всех функций, зависящих от п переменных, через Рп (число га—количество элементов в множестве С фиксируется и в дальнейшем меняться не будет). Как известно, мощность множества Рп равна ттП. Число это с увеличением п быстро растет. В связи с этим возникает задача компактного описания функций из Рп. Более точно задача ставится следующим образом: построить некоторые отображения множества Рп в себя, физически реализуемые достаточно просто, позволяющие рассматривать только некоторые типовые функции вместо всего множества Рп. Подобная постановка задачи известна для случая булевых функций. Важнейшим вопросом, возникающим в подобной ситуации, является вопрос о числе типовых функций и о скорости роста этого числа при увеличении п. Получение оценок такого рода связано с установлением в широком ряде случаев эффекта Шеннона, по которому почти все функции не являются инвариантными относительно данной группы преобразований. § 1. Классы эквивалентных функций 1.1. Пусть 31 есть некоторая группа преобразований множества Рп в себя. Будем говорить, что функции / и g из Рп эквивалентны относительно группы 31, если для некоторого AgSt / = Ag. Отношение эквивалентности рефлексивно, симметрично ^"и транзи- тивно. В силу этого все множество Рп разбивается на непересекающиеся классы эквивалентных относительно 31 функций. Их число будем обозначать через * Щ[. Вопрос об определении числа классов эквивалентности относительно конкретных групп преобразований является важнейшим в излагаемой теории. В данном случае нам будет полезна следующая
28 Б. М. КЛОСС, Э. И. НЕЧИПОРУК Лемма. Если для некоторой группы отображений 91 множества Рп в себя при п—> оо выполнено х(И)-ДГ(80 ,р т где к (91) есть число элементов в 91, а N (Щ—число функций, остающихся инвариантными хотя бы при одном нетождественном преобразовании группы 91, то имеет место асимптотическое равенство Доказательство. Нижняя оценка является очевидной. Теперь рассмотрим множество из ттП — N (Щ функций, не являющихся инвариантными относительно нетривиальных преобразований из 91. В это множество вместе с каждой функцией из некоторого класса эквивалентности входят все эквивалентные ей функции, и все они различны. Таким образом, в этом множестве содержится m™n — А'(Я) классов эквивалентности. Отсюда следует верхняя оценка Д*^—щ—+ NW- Асимптотическое равенство обеих границ равносильно условию леммы, что и доказывает наше утверждение. 1.2. Рассмотрим те преобразования из группы 91, которые оставляют данную функцию f£Pn неизменной: А/ = /. Легко видеть, что все такие преобразования сами в свою очередь образуют группу, которую будем называть группой инерции функции / в группе 91 и обозначать через Н (/). В том случае, когда группа инерции содержит только тождественное преобразование, она будет называться тривиальной, в противном случае—нетривиальной. Вполне очевидным является факт, что все преобразования, соответствующие элементам какого-нибудь левого класса смежности 91 по Н(/), переводят функцию / в одну и ту же функцию. С другой стороны, ясно, что разным классам смежности соответствуют разные функции. Отсюда можно заключить, что если порядок группы 91 есть х(91), а порядок группы Н (/) есть х(Н), то класс эквивалентности, в который входит функция f£Pn, содержит ровно *(Н) различных функций. Отметим также, что у эквивалентных функций группы инерции сопряжены. Действительно, пусть g = Af. Тогда функция g, как легко видеть, инвариантна относительно группы АН (/) А"1 и поэтому АН (/) A_1CZH (g). С другой стороны, если Bg = g, то ВА/ = А/ и A^BAgHtf),
КЛАССИФИКАЦИИ ФУНКЦИЙ МНОГОЗНАЧНОЙ ЛОГИКИ 29 т. е. BgAH(/)A х. Таким образом, доказано обратное включение, в силу чего мы можем утверждать, что H(g) = AH(/)A-1. 1.3. Одной из важнейших характеристик функций m-значной логики является их вес. Весом функции f£Pn назовем набор чисел (Х0, Хх, ..., Хт_1), где Xt обозначает число точек Сп, на которых функция / принимает т—1 значение с{. Ясно, что ^ Xi — m'n. Наряду с этим определим также обобщенный вес функции f£Pn как набор весовых чисел Xt, взятых в произвольном порядке. В дальнейшем мы будем интересоваться преобразованиями, сохраняющими вес функций из Рп. Будут рассмотрены также преобразования, сохраняющие обобщенный вес функций. Примеры таких преобразований мы сейчас приведем. Пусть о есть некоторая перестановка элементов множества Сп. Тогда оператор Aaf(x) = f(ox) (1) осуществляет преобразование множества Рп в себя, причем вес функций /, как легко видеть, сохраняется. Пусть s— некоторая перестановка элементов множества С. Тогда операторы A'f(x) = sf(x), AsGf(x) = sf(ox) X > являются преобразованиями, сохраняющими обобщенный вес функций из Рп. Будем называть преобразования типа (1) и (2) подстановочными. В первом случае мы имеем дело с подстановочным преобразованием, сохраняющим вес, — оно порождается некоторой перестановкой точек Сп; во втором случае мы имеем дело с подстановочными преобразованиями, сохраняющими обобщенный вес, — они порождаются перестановками как точек С1', так и значений функции. Операторы ASG являются при этом общим видом подстановочного преобразования, сохраняющего обобщенный вес. Каждый такой оператор можно представить в виде произведения двух преобразований: Аа = А Аа. Легко видеть, что операторы As и Аа коммутируют между собой: А*Аа = АаА\ так что в дальнейшем верхний индекс оператора А^ будет обозначать подстановку, совершаемую над значениями функции, а нижний индекс о—подстановку, совершаемую над значениями аргумента. Множество всех подстановочных преобразований, сохраняющих вес функций из Рп, образует группу, которую будем обозначать через ЯЗа. Все подстановочные преобразования, сохраняющие обобщенный вес функций из Рп, также образуют группу, которую обозначим через 3J,t. Тогда, как легко видеть, группа 3in распадается в прямое произведение двух своих подгрупп: 33 л и Sm — симметрической группы порядка т, т. е. Мощность группы 33 ,г равна (иг77)!, группы Sm — ml, следовательно, порядок группы 2tn есть т\(т?)\.
30 Б. М. КЛОСС, Э. И. НЕЧИПОРУК § 2. Подстановочные операторы 2.1. Возникает вопрос, какое место в множестве преобразований, сохраняющих, например, вес, занимают подстановочные операторы? Ответ на этот вопрос четко можно сформулировать лишь в случае, когда само множество С является алгебраическим образованием. Именно, потребуем, чтобы элементы множества С образовывали группу. Тогда естественным образом множество функций Рп также превращается в группу, включающую С в качестве подгруппы. Имеет место следующая Теорема 1. Пусть 31 есть группа преобразований, сохраняющих вес функций из Рп. Оператор А £21 является подстановочным тогда и только тогда, когда А осуществляет автоморфизм группы Рп. Доказательство. Тот факт, что всякий подстановочный оператор осуществляет автоморфизм группы Рп, является очевидным. Теперь предположим обратное. Пусть по отношению к групповой операции -f преобразование А ведет себя следующим образом: A(/ + g) = A/ + Ag, /, g£Pn. Докажем, что оператор А является подстановочным. Рассмотрим сначала функции Ф^сь(#), которые в точке а£Сп обращаются в сг, а на остальных точках —в ck (с1Фск). Очевидно, Аф^сМ^) = фсэ*сЧ^)- (3) По равенству (3) мы определим функцию перехода от точки (3 к точке а: При фиксированных ci и ch функция ac.Cft определяет некоторую перестановку элементов множества Сп, причем Афа1С*(*) = Фа'СкКск(а;)]. Покажем, что ac.Cft в действительности не зависит от ск. Предположим противное — что для некоторых ch и е., к Ф /, и некоторого a£ Сп имеем: Аф°*сЧ*) = Фр*Ск(*). Аф?сЧ*) = ф?с>(*). где р ф у. Пусть С0 = 0, т. е. С0 есть нулевой элемент группы С. Тогда функция ™с1си С.С . 0, С_С . Фаг,1-Фаг;=фа " ' имеет вес (1,0, ..., Kk^ = mn-l, 0, ..., 0), а функция г|> = А (фVk - ffi) = Atf/k - АФ^С; = ф^ _ ф^, которая должна иметь тот же самый вес, на самом деле имеет вес (л0, ..., А,г_, = тп —2, ..., Хт_1). Это следует из того факта, что тЬ обращается в q-c, в точке р, в ck - ct в точке у и в ск-с, в остальных точках. При этом, как следует из наших предположений, Ci-Cj^cft-Cj и ск-С1Фск-сг Итак, ac.ck = aCic. для всех ck и cjy отличных от с4. Аналогичным образом показывается, что ac.Cft не зависит и от первого индекса, т. е....
О КЛАССИФИКАЦИИ ФУНКЦИЙ МНОГОЗНАЧНОЙ ЛОГИКИ 31 имеем Таким образом, мы показали, что сужение оператора А на функции типа фс*сь является подстановочным оператором, причем соответствующая подстановка определяется соотношением (4). Распространим этот результат на функции, принимающие только два значения. Предположим, что функция f£Pn на к точках равна ciy а на остальных— с,. Покажем, что Af(x) = f(ax). Функцию / можно представить в виде суммы функций: / = Ч>1+ . • • +<Pfc + '*l+ • • • +'*mn_ft, где каждая ф;. в /-й точке (из числа выбранных к точек) р°вна cit. а на остальных —нулю, а каждая г|эр в /?-й точке (из числа остальных тп — к точек) равна cL, а на остальных —нулю. Тогда А/(я) = Аф1(ж)+... +Ayk(x) + Aty1(x)+ • .. +^mn_k(x) = = Ф1 (GX) + • • • + <Pfc (GX) + Ь (GX) + • • • + Утп-к (GX) = f (°X)- В заключение покажем, что на множестве функций, в весовом наборе которых к отличных от нуля величин, оператор А действует как подстановочный с подстановкой а. Возьмем произвольную функцию / из этого множества. Пусть она принимает значение с, на ^ точках, значение с2 на Х2 точках, . . ., значение ск на Xh точках (^, Х2, ..., Xk =?= 0). Тогда функцию / можно представить в виде суммы функций / = /i + /a+---+/ft, где /х на выбранных Х1 точках обращается в с1У а на остальных — в нуль, /2 на Х2 точках обращается в с2, а на остальных —в нуль, и т. д. В весовом наборе каждой из функций /t не более двух отличных от нуля чисел, поэтому Af = A(f1+...+fh) = Af1+...+Afk==f1(cx)+...+fk(Gx) = f(ox), т. е. оператор А подстановочен. Поскольку к выбиралось произвольным, то теорема полностью доказана. 2.2., Каждую перестановку /2-мерных наборов (а1? . .., <xrt)£Cn можно осуществить, задав систему из п функций {fi(xly ..., xfL), ... •••> fn(x\y •••> хп)}> гДе каждая функьия fi берется из множества Рп. Обратное утверждение, очевидно, не имеет места: не всякая система из п функций определяет перестановку /2-мерных наборов. Следующий необходимый признак достаточно очевиден: для того чтобы система из п функций, принадлежащих Рп, описывала некоторую перестановку точек С71, необходимо, чтобы каждая из этих функций принимала любое из т значений на га7'-1 наборах, иными словами, имела вес (т71'1, га7'"1, .. ., га7'"1). Более полное описание свойств таких систем дается в следующей теореме. Предварительно введем одно определение. Функции /1? /2, . . . ..., fn£Pn называются зависимыми, если существует такая отличная от константы функция ф(жр ..., хп), что ф(/,, . ..,/J = c, где с£С. Функции шзависимы, если они не являются зависимыми. Теорема 2. Для того чтобы система (/р ..., f) функций из Рп реализовывала некоторую перестановку точек С71, необходимо и достаточно, чтобы функции /1? . .., / были независимы.
32 Б. М. КЛОСС, Э. И. НЕЧИПОРУК Доказательство. Допустим сначала, что функции Д, ...,/„ зависимы, т. е. существует такая функция Ц)(х1ч ..., хп) Ф const, что ф(/х. .... fn) = c, (5) где с есть некоторый элемент С. Поскольку функция ф не является тождественной константой, найдется такой набор а = (а1? ..., aj, что ф(а) = с', где с'ф с. Покажем, что при отображении множества С\ определяемом системой (fv ..., //г), в точку а не перейдет ни одна точка. Действительно, если бы нашлась хоть одна такая точка Р = (Pi. •••- Р»). что /t(Pi. .... Р„) = «г. i = L 2, .... п, то мы имели бы <P[/i(P). •••./„(Р)] = Ф(«1, .... о„) = с', что противоречит равенству (5). Обратно, пусть функции fv ..., fn независимы. Докажем, что они определяют перестановку точек множества Сп. Предположим, что это не так: найдется хотя бы одна точка а —(с^, ..., а/г), в которую не переходит ни одна точка. Определим функцию ф (xv ..., xri), которая в точке а обращается в с, а в остальных, скажем, равна с'. Функция ф тогда не равна тождественно константе и <P(/i> •••> fn) = c'- Действительно, для любой точки (3 набор (/х(Р), ..., /П(Р)) отличен от набора (av ..., aiL) и, следовательно, функция ф равна на нем с'. Таким образом, получаем, что система функций fv ..., fn зависима, что противоречит предположению. § 3. Эффект Шеннона в симметрическом случае 3.1. В группе 33п выделим еще ряд привлекающих внимание подгрупп. Например, перестановки аргументов хх, х2> ..., хп порождают соответствующие перестановки точек Сп. Отвечающие им подстановочные операторы образуют группу порядка я!, которую мы обозначим через S/t. Другим примером являются перестановки, совершаемые над значениями i-то аргумента хг (ни порождают подгруппу S^ операторов, действующую в пространств > функций Рп. Порожденная подгруппами S<*\ i = l, ..., /2, группа Тп является, очевидно, их прямым' произведением: НП C(l) ч/ C(2) v/ w ООП) л- п — От А От А ... Л От . В заключение рассмотрим группу QnCZ934, порожденную подгруппами Sa и Тп. Элементы подгрупп Sa и ТЛ не перестановочны но отношению друг к другу. Вместе с тем можно показать, что для каждой пары s £Sa и t£Tn найдется такой элемент £'£Т;г, что ts = st'. (6) Действительно, tsf (жр . .., xj = tf (xh, .. ., х{п) = / (th (x{l), . .., tin (Xin))f st'f(x19 ...9xJ = sf(t[(xl)9 ..., t,n(xu)) = f(t[(xil), ..., t'n(xin)). Для выполнения соотношения (6) достаточно подобрать t' = (t[9 ..., t'n) таким образом, чтобы t'k = ti . Теперь ясно, что группа Qa является
О КЛАССИФИКАЦИИ ФУНКЦИЙ МНОГОЗНАЧНОЙ ЛОГИКИ 33 полупрямым произведением групп Sл и Тн, а любой элемент Qu представляется в виде st, где «s£SH, / g Tn. Отсюда следует, что порядок группы Q(l равен п\ (пг\)''\ 3.2. Теорема 3. При п—>со почти все функции из Рп обладают в Sm X QIL тривиальными группами инерции. Доказательство. Произведем подсчет числа функций /£Pn, для каждой из которых существует по крайней мере одно нетождественное преобразование из Sm X Q,t, переводящее функцию f(xl, ...,хЛ) в себя. Для каждого такого преобразования возможны три следующих случая. 13 первом случае при преобразовании для некоторого i имеем xi—^s{xl), где s — нетождественная перестановка. Тогда найдется по крайней мере одно значение а- такое, что асФ s (at)f и, следовательно, в С'1 имеется по крайней мере 2m,L~l перемещаемых точек, или не более m'i—2m"'~1 неподвижных точек. Пусть точное число неподвижных точек есть v. Тогда перемещаемые m'l — v точек распадаются не более чем в —{та— v) циклов. Если функция f^Pa инвариантна относительно данного преобразования, то ее значение в одной точке цикла определяет ее значения во всех остальных точках цикла. В том случае, когда над значениями функции / не совершается никакой перестановки, функция / 1 1 может быть произвольно задана не более чем в v -\- — (тп — v) = — (тп 4- v) точках, или, так как v< тп — 2тп~11 не более чем в f 1 j mn точках. В том случае, когда над значениями / производится некоторая перестановка, функция / задается на тех же циклах, но уже, правда, не произвольным образом. В любом случае функций из Рп, инвариантных г- ^ (l_I)mn относительно данного преобразования, не больше т т/ Второй случай —когда для данного преобразования имеем xi—^s(xX где i Ф /. В этом случае имеем не менее 2(т— 1)тп~2 перемещаемых точек Сп, поэтому функций из Ра, инвариантных относительно данного .(•-=£4 тп преобразования, не более т т1 Рассмотрим третий случай, когда преобразование производит перестановку не точек С'\ а перестановку значений функций f£Prl. Функция / не может ни в одной точке принимать значения, перемещаемые этой перестановкой. Если данная перестановка нетождественна, то функция /бР(1, инвариантная относительно этой перестановки, может принимать в каждой из ти точек не более т — 2 значений. Таким образом, число функций f^P,^ инвариантных относительно данной перестановки s £ Sm, не превосходит (т — 2)тП. Итак, число функций из Рп, инвариантных относительно хотя бы одного преобразования из Sm x Q,t, не более чем т\п\ (т\)птУтП, где Y = max [ 1 —— ' 1 ^~ , logm(m-2) ! . Очевидно, что у < 1, и поэтому -> О (7) при /2—>оо. Теорема доказана. 3 Прэблемы кибернетики, вып. 9
34 Б. М. КЛОСС, Э. И. НЕЧИПОРУК Следствие. Число классов эквивалентных относительно Sm X QH функций от п переменных при п—>оо, асимптотически равно тг!(т!)'1+1 (так как в силу соотношения (7) справедлива лемма из пункта 1.1). § 4. Линейные преобразования 4.1. Пусть С есть поле Галуа GF (pk). Рассмотрим группу LrtCZ93rt преобразований, порождаемых перестановками точек С\ описываемых уравнениями вида у = Ах + а, (8) где а, я, у £ Сп, Л — неособенная квадратная матрица порядка п над полем GF(ph). Преобразования типа (8) будем называть невырожденными линейными преобразованиями. Введенная выше группа Sn является, очевидно, подгруппой Ь1Ъ. Определим порядок группы Ln. Поскольку число неособенных матриц порядка п над полем GF(pk) равно п (п— 1) п (mn _ m0) (mn __ ml) и т # (Щп _ mii-i j = m 2 [J (mk _._ ^ то доля неособенных матриц в множестве всех матриц n-го порядка равна п2-п п т 2 Г| (mfc-1) м^н—^ = п (i-4)- При оценках числа 61Ь (т) удобно воспользоваться разложением оо оо 3fe2+fr oo 3fe2-fe П (i-«h)= 2 (-!)"« 2 +2(-i)"a~ = = 1 — а — а2 + а*-[-а7-а12 — а13--[■ . . . Таким образом, число неособенных квадратных матриц порядка п над полем из т элементов равно дЛ(гп)тп2. Порядок группы ha равен, следовательно, б/г (т) тп +п. С ростом п число 6 t (т) монотонно убывает и стрзмится к некоторому пределу 6(т). Например, для т — 2 и больших п числа _.бп (2) оцениваются в следующих границах: 0,288 <dfl(2)< 0,289. Обозначим черзз Мг группу, пэрэ кцзнную подгруппами * Lrt п Тн. Покажэм, что она явтяэтся их потупрямым прэтвздзннзм. ! Именно, докажем, что дня данных /6ЬЛ и t £ Ti4 найдзтся такоз V £Та, что lt = t'l. Имеем: tf(xl9 ..., xn) = f[t1(anx1 + ... + а1пхп + аг), ... •••> t,Aa*ixi+ ••• +artflxflj a J], l'lf(xly ..., х^ = 1[аг11[(хг)+...+allirn(xti) + al4 ...
О КЛАССИФИКАЦИИ ФУНКЦИЙ МНОГОЗНАЧНОЙ ЛОГИКИ 35 Приравнивая соответствующие аргументы и пользуясь невырожденностью матрицы А, мы найдем значения подстановок t'i(x), i=l, ..., /г, определяющие элемент f £ Тп. Из проведенных рассуждений следует, что. порядок группы Мп равен дп{т)тп2+п(т\)п. 4.2. Теорема 4. При п—> оо почти все функции из Рп обладают в Sm X Мп тривиальными группами инерции. Доказательство. По доказанному выше всякий элемент М7. можно представить в виде tl. Подсчитаем, сколько точек Сп это преобразование оставляет неподвижными. Рассмотрим первый случай, когда хотя бы в одной строке матрицы А имеется не менее двух отличных от нуля элементов. Без ограничения общности можно считать, что таковой строкой является первая. Тогда система уравнений, описывающая данное преобразование, будет выглядеть следующим образом: 2/i = ati (xi) + апК (хч) + • • • + <V*fe (^ft) + Pi' У* = <*2i*i (Si) + • • • + a2ntn (xn) + pa> Уп = anih (xi) + • • • -r anntn (xn) + pn> где a\v ..., a\ Ф 0. Из нашего предположения следует, что если а Ф 0, то fc>l, если а = 0, то /с>2. Рассмотрим наборы Y = (0, Y2> •••> Yii» •••> Yifc. •••> Yn). на которые налагается следующее условие: ачьч (Yii) + • • • + <V*fe (Yifc) + Pi = с, (9) где с £ С есть любой элемент, отличный от нуля. Очевидно все такие наборы нашим преобразованием переводятся в наборы 8 = (с, б2, . . ,, бп). Определим число наборов у. В силу линейности формы (9) найдется (т — l)wk_1 Zc-компонентных наборов, удовлетворяющих условию (9). Следовательно, общее число наборов у, для которых выполнено (9) и условие Yi= 0, равно (т — 1) т*'1 m"""*"1 = (т — 1) тп~2. Отсюда следует, что по крайней мере 2(т— 1)тп~2 точек множества Сп перемещаются нашим преобразованием. Таким образом, общее число функций, инвариантных относительно данного преобразования, не превосходит т(т -т+1)т _. щ\ т2/ Рассмотрим второй случай, когда в каждой строке матрицы А имеется ровно по одному отличному от нуля элементу. Тогда, как легко видеть, и в каждом столбце данной матрицы имеется ровно по одному отличному от нуля элементу, т. е. эта матрица является матрицей перестановки, и мы имеем случай, описанный в предыдущей теореме. Число функций, инвариантных относительно данного преобразования, как было показано, не превосходит т*тП, где y<1« Тогда число функций из Рп, инвариантных относительно хотя бы одного преобразования из Sm х МГ1, не превосходит ert(m)iy,"H-w-(ni!)n+1mYf«n> 3*
36 Б. М. КЛОСС, Э. И. НЕЧИПОРУК где , Г л га —1 ~| у =max[l--^-, y] . Очевидно, что у' < 1, и поэтому 6n(»i)nin2+n(m\)n+[mV'mn ^ Q цри п—>оо. Теорема доказана. Следствие. Число классов функций из РЛ, эквивалентных относительно SmxMu, асимптотически равно Ьп (т) тп2+п (т\)п+{ ' ЛИТЕРАТУРА 11J Shannon С. Е., The Synthesis of two-terminal switching circuits, BSTJ 28, 1, 1949, 59—98. [2] Яблонский С. В., Функциональные построения в А-зиачной логике, Тр. Матем. ин-та им. Стеклова 51, 1958. Поступило в редакцию 30 III 1962.
О СИНТЕЗЕ ВЕНТИЛЬНЫХ СХЕМ Э. И. НЕЧИПОГУК (ЛЕНИНГРАД) 1°. Многие задачи об оценках сложности различных типов управляющих систем могут быть сведены к соответствующим задачам для вентильных схем*)* Рассмотрим, например, (р, #)-операторы [2] у = Ах следующих видов: р Vi= V (ait}&Xj), (la) i=l Vi= <S (fli.jVs,), (16) i=i p ^=£Ку ex *,)**) (lB) i=t (i = l, ...,^). Реализация их схемами над базисами, состоящими из одного элемента, реализующего V» <х или ©, почти однозначно описывается вентильными (р,^)-схемами, реализующими матрицу А.* = || ait \\j=\,.. .,р- Эти вентильные схемы являютсяS-схемами для опе- раторов (1а), (16) и SR-схемами для операторов (1в) [3]. 2°. Ниже будет использоваться функция H(z)= -z\gtz-(i-z)\gt(l-z). Установим некоторые ее свойства. Лемма 1. Пусть выполнены условия: а) 0<а<у, 0<d< oo; б) 0 < Pt < 1. * = 1, .... N; N в) Ънщ<* г=1 г=1 Тогда N<H(a)d. *) Определение вентильной схемы см. в [1]. **) Символы \)t, 0 обозначают сложение по mod 2.
38 Э. И. НЕЧИПОРУК Доказательство. Рассмотрим вспомогательные переменные дх, . . ., бд' и условия: б°)0<р4<1, 0<б4<оо, ( = 1 N; б')0<р{<1, 0<б{<оо, i = l N; б» 1=1 Введем функцию q>jv (бц • • •, 6лт) = 2 fy. Так как при бг = ... = бЛ> = 1 i=i и при выполнении условий а) — г) условия б'), в'), г') выполнены, то*) Покажем, что ЛГ< max фл? (бх, . .., 6Л'). Эъ ...>PiV (а), б'), в'), г')) max ф^ (dlf .... 6iV) = Я (a) d. (2) 6b...,6/V Pi» •••> Pv (a,) б'), в'), г')) I. Положим рх = . . . = pN = а; бх = . .. = бдг = J • Тогда условия б'), в'), г') выполнены. Поэтому max фл^, . .., бдО >Н(а) d. II. Будем искать тахфдг сначала при фиксированных рг, .. ., Рлг*. условие б') заменим на условие б°); при этом тахфуу может только увеличиться. Получается задача отыскания максимума линейной формы в выпуклой области, ограниченной плоскостями. Максимум достигается в одном из углов, т. е. когда все 6t, кроме самое большее двух, равны нулю. В силу симметричности условий в') и г') относительно переменных 6t можно считать, что эти 6t суть бг и б2. Очевидно, что экстремальная пара бг, б2 должна удовлетворять по крайней мере одному равенству в условиях в'), г') (иначе все 6t суть нули, ибо всего в условиях б°), в'), г') должно быть выполнено по крайней мере N равенств). Возможны три случая (с точностью до переименования бх, б2): 1) 61Ф0> б2 = 0; в)— равенство, г')—неравенство; 2) бх Ф О, б2 = 0; в')— неравенство, г')— равенство; 3) 61ф0, 62Ф0 (в этом случае в'), г') —равенства). Рассмотрим все эти случаи. 1) Условия в'), г') дают „ * = d, ,, !q\ < ad. Отсюда получаем -" (Pi) « (Pi) б, = ^Я(Р1), Px<a, а так как <*<—> то //(РА)<#(а). Поэтому N 2 6^6^Н{a) d. *) Запись max ф:у (61} ..., 6^) означает, что максимум ищется по области бь ..., 6V Рь ...,PV (а), б'), в'), г')) {6lt . ,.,6#, Pi, ...,Ptv}» определяемой условиями а), б'), в'), г').
О СИНТЕЗЕ ВЕНТИЛЬНЫХ СХЕМ 39 2) Имеем щб;т<<1, ^(П = а^ откуда рх >а. Пусть h ф) = -^ тогда h' (р) < 0 при 0 < р < 1, откуда e^<HJ?) f и Pi a i=i ^(Р1)+я(р,)-аа- (3) Определитель этой системы равен тгпггтгтсгс • "(Pl)«(P2) а) Если Pi=P2, то система совместна лишь при pi==p2 = a и 2 в* = в1 + в2 = Я(а)* i=l б) Пусть теперь рх =£ Р2. Без ограничения общности можно считать, что Pj < р2. Решая систему (3) относительно 6Х, б2, получим: «, = //(&)*£=£, б2 = я(р2)<^. Так как 6^0, #(Р,) > 0, р2 > рь то Pi<a< P2, и, следовательно, в силу выпуклости функции Н (z) ^Ь.^61 + 6.2 = я(р,)(р|-«)+я(р1)(«-р1) d<ff{a)dm Таким образом, max ф# < Н (a) d при любых фиксированных рх, . .., рл-. Тем самым равенство (2) и утверждение леммы доказаны. Обозначим через к(Ш) мощность произвольного конечного множества Ш. Пусть 3Jc — конечное множество, состоящее из элементов двух сортов: нулей и единиц (бинарное множество). Обозначим через ||ЗЛ|| rr/OTU тт /' II 9R II Л число единиц в нем и через Н(Ш) число Н ( " 1 . Лемма 2. Если 9Ji' — бинарное множество, то при Ш^Ш' Н{Ш)н(Ш)<Н(Ш,)к(Ш'). Доказательство. Достаточно рассмотреть случай, когда х ($Щ') = х($Ш)+ 1, и при этом различать два подслучая: а) || 5№ || = || Ж'|| и б) || а»'|| = 11 а» И+1. Пусть к(ЗЯ) = т и ||9Ji|| = s. Тогда, очевидно, : о < s < т и -4т < — < :L+5 • L т-\-1 т m-\-i Обозначим через Д разность Н(Ш')к(Ш')-Н {Щх(Ш). хГ-+л~— )m = H(-^-j\ ^ lg, 1=1, где -±-4 < £< — ; Vm-)-l m J \m-\-\J m-\-l bz £ ' " т-\-1 ^э ^ т '
40 О. И. НЕЧИГТОРУК следовательно, б) А = Я 7 М- 1 г ; lg9 — -2 , где — < £ < —^ ; следо- 7 \m-i-ly \ m riy bj g ' ^ m ^ > m-|-1 M вательно, 4>-0-=^)1*0-^)-i(i-^)ib(i-S>o. Лемма доказана. 3°. Назовем глубиной вентильной схемы максимум (по всем цепям, соединяющим входные и выходные полюсы) числа вентилей в . епи. Нве- дем функции Шеннона: В (А) (соответственно Вт (-4)) — минимум чист вентилей в схеме (соответственно по всем схемам глубины не более п>) реализующей матрицу Л; В (р, д) — max В (Л), Вт(р, q) = max Bvl (Л) где максимум берется по всем матрицам, имеющим р строк и q столбцов. Обозначим через 93 (р, q, а) класс матриц Л, имеющих р строк, q столбцов и ||Л.|| — apq (условия 0<а<1 и o.pq — целое число —всегда подразумеваем, не оговаривая). Обозначим, далее, через а* число min (а, 1 —а). Теорема. Пусть последовательность {{PU ?l. ttl)» •••> (Рп* Я*' aJ> •••} такова, что выполнены условия а) ЧЛ<РЛ* б) 9а->°°» Р-пЯп в) Н (a J T- г) ISUj^co. «11 Гегда для 23 (ра, g,lt aj Доказательство. Нижняя оценка следует из того, что число неэквивалентных (р, д)-схем глубины 2, содержащих не более /с вентилей, не превосходит [1] Cf С^ (р + <7)'\ и из равенства . Н (an)Pn<7n у 2яал(1 — <*п) РпЯп Верхняя оценка. Обозначим через [А];- строку матрицы Л с но мером /. Пусть Аа б S3 (pa, qik, a J. Образуем вектор 2rt = (МЛ, ..о [Лп]Рп). Разобьем его на неперемежающиеся части wilti = wUyi(Au), Ап = ( wrlt х, . .., г#а, /v(n)) следующим образом.Вектор w]U i — максимальный кусок вектора, получающегося из А1Ь «отрезанием» векторов wn,o,..., wfi,i-i (wn,o — пустой вектор), примыкающий к его левому концу и такой, что Н (2>n, i) * fan. г) < ^2 Рл - fV (4) где \in — параметр, удовлетворяющий условию Pn = o{lg2pn). (5>
О СИНТЕЗЕ ВЕНТИЛЬНЫХ СХЕМ 41 Таким образом, неравенство (4) не выполняется, если wn,i заменить на вектор, получающийся из wtiii приписыванием правого соседнего к нему элемента из А1Г Этот элемент может быть нулем или единицей, поэтому при i < N (п) V Х(«п, i)+i У 1»2 А.-»*„<] ИЛИ _ (6) Обозначим через ynti число ' VZ% г . Имеем при 0 < s < m * (//'п, г) ''(4t^('"т',1)-//(■s■)"'<,-lg'C,-^)• *(=й; <-+?>-и с^><1-,ыг,> Отсюда в силу (4), (6) следует, что при 0 < s < m lg2Pa-!1n-1 + 1g2YX,i<// Ki)x(wn|i). (7) Разобьем множество векторов ttVi ПРИ i < N (п) на группы Wn. ьИ^„.2: M;n,i6^n,i, если x(-wn.i) < vn, и wn^^Wnt2 в противном случае. Здесь vn —параметр, удовлетворяющий условиям гда^-[<^<^-.ида^о <i-ig2(i-i,)<i-ig2fi--i) , так как ^<1, lg2£i<0, — lg2 (1 —g1)<_lg2 ^ i _ _£_ ^ . Аналогично, где -<|.<ЯГр[.н далее я(^)+С1-^),в'4&<1+(1-^",в'(1-Ь)-(1-^>'Ь< s так как lg.(!-£.)< 0. lg2£2<0.
42 Э. И. НЕЧИПОРУК В силу второго условия множество И7П, i при достаточно больших п не содержит векторов wn, i, состоящих из одних нулей или из одних единиц *). Имеем для wUti £ WUt 1 ^<-Yn,b (9) откуда в силу (7) и (9) Wn - Vn—2Wn < Н {wnti) x (u„,i). (10) Обозначим через $nti> число —^л(г) . Из (10) следует: N* (п) ЛГ(п) lg2^7i — fin — 21 £2Vn ^ VA Занумеруем векторы wn, t из Wnt t числами г' = 1, ..., N' (n) < NL(n). H"Yi(i')H i'=l n' г г'=1 Отсюда ZJ //(P ,.) ^ lg«pn-|Xn-21g,vn* V ' г'=1 Пусть, далее, ап<у. Число единиц в векторе tvn,nv) равно Pn,i'^(^n,t(i'))- Имеем V Рп.г'О&^п —Jin —21g2Vn) ^ - 2j ■ /Щ~о ^ р»'*'*^*-*<*'>) <а»р«9* i'=l П'г г'=1 Ат'(п) 2 i'=l V Р"'{' ^ а Мп (12) В случае, когда an > — , подсчет нулей (вместо единиц) в векторах wn< j (j-j дает неравенство JV'(n) Л 1-Pn.i S fi7p^7<-(1-(X-)lg^4"n-21g2vn- <12') i'=l Применим лемму 1. В силу (И), (12), (12') имеем: ^H<-g(ajlg2fn_;:-2ig2vn- Так как ^(n) = x(WBil) + x(Wn,2) + l *) Мы будем писать an<-6n (<2n<*&Ti), если неравенство ап<Ъп (ап^.Ъп) выполняется при достаточно больших значениях п. Если имеем Yn, i = 0 и #(—^ ) (х (wn, i) + l) > ^i lg2Pn для бесконечной последовательности значений /г, то для этой последовательности -Щ !lii_. > С2 > 0, т. е. wn, * & WVi при достаточно больших и.
О СИНТЕЗЕ ВЕНТИЛЬНЫХ СХЕМ 43 ■и, согласно определению множества WUt 2, x(Wn,2)<^, то ЛГ(п)<-#(апЬ ЕцЯп + Мп+1> (13) v ' v n/lg2Pn — Цп — 2lg2vn ' vn r v ' Разобьем матрицу J_n на р неперемежающихся полос Ant h no pn строк, £а столбцов в каждой полосе, кроме, быть может, одной, содержащей меньшее число столбцов (£rt — параметр). Элементы каждой полосы ^4n,h разобьем на векторы ип> k, i, состоящие из всех тех элементов одной и той же строки, образы которых при отображении Ап в Ап попадают в один и тот же вектор гсу t. Пусть вектор ип> ki { расположен в строке [An]j(ntk,i)- Сопоставим каждому вектору untkti взаимно однозначно вентиль Vnt ki i, выходящий из входного полюса с номером j(n, к, i) ( всего не более N(n)-\-pn ^ вентилей). Вентили Fn, ft, v, Vn, k,i» назовем сходными, если соответствующие векторы untk,i'> untkti» одинаковы и одинаково расположены в своих строках. Выходы сходных вентилей объединяем в один узел. Оценим число таких узлов. При достаточно больших значениях величины ( —^ к'г" ) к (ип н i) число раз- личных векторов untkti для данных значений || геП| ft, %\\ и K(untk,i) в силу формулы Стирлинга не превосходит 2H("n,ft, 0 *(«ч п, О Далее, Н (ип> л, t) х (геП| h,i)<H (wnt i) к (wnt i) < lg2 рл — \in (лемма 2, неравенство (4)). Таким образом, существует константа со такая, что число различных векторов -wn, ft, i (при фиксированном /с) для произвольных значений || uUt k, % || и х (г^П( ft| i), удовлетворяющих неравенству не превосходит (- 2»Ч, (в силу неравенства || г*П( л, 11| < и (ггп, ft, г)< Бц). Число различных векторов uiltkti для произвольных значений ||wn.iftii|| и и (w№i kt 4), удовлетворяющих неравенству (JlibilYxA.,,.) 4 *("n, ft, г) ' <С0, не превосходит ££+2. Векторы ищ и, % могут быть расположены в своих строках не более чем £п способами (расположение вектора ип, ft, i определяется заданием положения его концов в векторе длины не более £а). Таким образом, при каждом к число образованных узлов не превосходит ЪпРп , J-(o-|-4 2^п
44 Э. И. НЕЧИПОРУК Каждый узел соединяем пучком вентилей с выходными полюсами, соответствующими ненулевым элементам векторов Miti/iii, определяющих этот узел. Построенная схема глубины 2 реализует матрицу Ал и при достаточно больших п содержит вентилей не более К тт /_, \ РпЯп , РпЯп , i , Яп f | r 1 Яп Г / £?iPn , Го)4-4\ Для того чтобы выполнялось неравенство К < Н (ап) Рп(1п и тробова- ' Щъ Рп ния конструкции (5), (8), достаточно, чтобы параметры [х/4, v;4, £u удовлетворяли следующим условиям: l)^ = o(lg2pJ, 5)J|^-->0, 2) ii^L_> о, 6) i"ii»^'L -> О, 3) l^Pn 0 ?) ^ = / /^ ^ _ ' //(a„)v„ ' ъ" V2 ПУ 4) С(1 = 0(0- Условия (2), (3) выполнены, если v _ v' 1& Рп / ^Vn 0 V--V-7i(an) ' Vn >oo, Jg2^ >U, например, при Vii=lg2pfl. Действительно, так как a*<#(a), то 1 i« v 2 1g2lgap«41g2-r*- lcr v Jg2 vn ^ «n lg2 vn > Q lg2/?n ^ lgiPn ' lg2/»n (условие г) теоремы). Условия 4) — 6) выполнены, если В силу 1) условие 7) выполнено, если Ig2 Рп Положим £; = lg2 ' Я]1аг1п)<УпУ И'н= l/^-^ir-feAi- ТогДа все условия выполнены. Теорема доказана. ЛИТЕРАТУРА [1] Л упанов О. Б., О вептильных и контактно-вентильных схемах, ДАН СССР 111, 6, 1956, 1171—1174. [2] Л у п а н о в О. С, О принципе локального кодирования и реализации функций из некоторых классов схема*ми из функциональных элементов, ДАН СССР 140, 2, 1961, 322—325. [3] Н е ч и п о р у к Э. И., О многополюсниках, рсатизующих функции многозначной логики, Сб. «Проблемы кибернетики», вып. 5, Физмаггиз, 1,)61, 47—60. Поступило в родасцч'о: первый вариант 30 XI 1961, окончательный вариант 20 111 1962.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ Ю. Я. СоРКИН (МОСКВА) § 1. Введение Ряд процессов, происходящих в различных машинах (в широком смысле этого слова), в частности в автоматах, в последнее время подвергся разносторонним рассмотрениям с абстрактно-математических точек зрения (см., например, [1]). Действия автоматов и машин, а также поведение многих живых существ могут быть охарактеризованы множеством А внутренних состояний, в которых может находиться соответственно автомат, машина или живое существо, и некоторым множеством ui входных симсолов,т. е. определенных комплексов влияющих факторов из внешней среды, в результате действия каждого из которых автомат (машина, живое существо) изменяет свое внутреннее состояние на какое-то другое. Этой концепции удовлетворяют весьма общие понятия машин в смысле Тьюринга[2], Мура [3] и Медведева [4]. В настоящей работе дается определение автоматов такое, что автоматы становятся частным случаем универсальных алгебр [5J или алгебраических систем [6]. Поэтому для них естественно возникают такие понятия, как подавтомат, гомоморфизм, свободный автомат, задание автоматов определяющими соотношениями и т. п. В связи с этим возникают обычные для различных частных случаев алгебраических систем (групп, колец, структур и т. д.) вопросы, такие, как описание подавтоматов свободных автоматов, проблема тождества, вопрос о вложении счетных автоматов в автоматы с конечным числом образующих и другие родственные вопросы. В работе рассматриваются указанные вопросы. Краткое изложение результатов этой работы опубликовано в [12]. § 2. Определение частичного автомата Пусть А — произвольное множество, а Щ — непустое множество отображений одних подмножеств А на другие, т. е. для каждого а£$1 в А существует подмножество А такое, что для всякого Х^А, определено XagA*) и Ха не определено при Х$А,. Множество Л, рассматриваемое совместно с множеством 91, называется частичным автоматом, элементы множества Л называются внутренними состояниями частичного автомата (или, короче, состояниями), элементы множества 9J называются входными символами (короче, входами) этого частичного автомата. Множество Ла называется суппортом входа а. *) Мы будем записывать результат примонения входа а к состоянию X в виде правого оператора (без скобок) Ха. Запись ХаЪс (а, 6, с £ ty) означает ((Ха)Ь)с.
46 Ю. И. СОРКИН Я/ ъ * 1 а' \а, *2аг ha> °г \Ъ *2аг *-заг ! а3 *7% ягаз лзаз ... ... ... Рис. 1. Частичный автомат S с множеством всех состояний Л и множеством входов 3J будем обозначать символом Л (21), а когда возможность недоразумений будет полностью исключена — символом Л без указания множества входов. Если в частичном автомате Л(21) суппорты всех входов совпадают с множеством всех состояний Л, т. е. если Ла=Л при любом а £91, то такой частичный автомат называется полным автоматом. В дальнейшем, если не будет специальных оговорок, мы под автоматом будем подразумевать полный автомат. Частичный автомат Л(91) может иметь либо конечное число состояний и входов, и в этом случае он называется конечным частичным автоматом, либо может иметь бесконечное множество состояний или входов, в этом случае он называется бесконечным частичным автоматом. Под счетным частичным автоматом будем понимать частичный автомат, имеющий множество состояний счетной мощности. Сформулированное определение автомата является весьма общим и включает в себя как частные случаи последовательностные машины в смысле Мура [3], конечные автоматы в смысле Медведева [4], машины Тьюринга и пр. Понятием автомата охвачен и тот случай, когда некоторая машина работает без постороннего вмешательства, т. е. последовательность изменений внутренних состояний происходит не под влиянием последовательности входов, задаваемых кем-либо (или чем-либо) из внешней среды, а в результате внутренних же изменений автомата. Для этого достаточно представить себе внутренние состояния как двумерные векторы, в которых первая компонента является собственно состоянием, а вторая компонента является новым входом, которым определяется следующий переход. При этом вторая компонента может быть функцией, зависящей от некоторых параметров, например от совокупности (упорядоченной или неупорядоченной) последних к состояний. Сформулированное выше понятие автомата охватывает лишь случаи вполне детерминированного поведения, в действительности же поведение ряда машин (существ) является лишь вероятностным. Рассмотрение такого рода стохастических автоматов [8] в настоящей статье проводиться не будет. Таким образом, мы будем рассматривать лишь детерминированные автоматы. - щ Для описания того или иного конкретного автомата используются часто (особенно в случае конечных автоматов) функциональные схемы (рис. 1), которые состоят в том, что в вертикальном столбце записывается перечень всевозможных состояний автомата: Кг, Х2, ..., а следующие столбцы показывают соответственно результаты переходов состояний под действием различных входов: аг, а2,... Наряду с описанием автомата функциональной схемой часто бывает удобно задавать описание, геометрически наглядное, с помощью графа переходов. Для этого каждое состояние интерпретируется кружочком на плоскости и стрелками указываются переходы состояний под воздействием входов, наименования которых помещаются рядом со стрелками. Поясним сказанное на следующем примере.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 47 Пример 1. Рассмотрим квадрат ABCD. Под действием трех входов: а — симметричное отражение относительно вертикальной оси, /; — симметричное отражение относительно горизонтальной оси, с — поворот на. 90° против часовой стрелки (вокруг центра квадрата) — квадрат претерпевает различные самосовмещения — внутренние /7, Д В S С J В.. А Л □, И Д В. д\ \л в{ U с^-—\в л\ 1 л с в Рис. 2. состояния. Всего различных состояний у квадрата будет 8. Обозначим их через 1, 2, 3, 4, 5, 6, 7 и 8. Они изображены на рис. 2. Функциональная схема этого автомата и его граф переходов приведены на рис. 3 и 4 соответственно. Все сказанное об описании автоматов функциональными схемами и графами переходов переносится на частичные автоматы. В этом случае 7 2 3 , 4 | 5 В 7 8 1 а . Б 5 8 7 2 1 4 3 ; Ь 8 7 В 5 4 3 г 7 с Z 3 4 1 В 7 8 В Рис. 3. Рис. 4. в некоторых местах функциональной схемы будут пробелы. В соответствующем графе из некоторых вершин будет выходить стрелок меньше, чем число входов. -л § 3. Подавтоматы,"? системы образующих Легко видеть, что сформулированные в § 2 определения характеризуют автоматы й частичные автоматы как частный случай алгебраических систем и частичных алгебраических систем [6] с совокупностью 31 лонар- них(унитарных)операций.Поэтому такие общие понятия, как подавтомат, гомоморфное отображение автоматов, система образующих, свободный
48 Ю. И. СОРКИН автомат и т. д., уже определены как частные случаи соответствующих понятий для алгебраических систем. Однако для удобства чтения нашей статьи мы приведем в этом и ближайших параграфах определения этих понятий в интерпретации для автоматов и установим их простейшие свойства, в которых специфика автоматов нашла свое отражение. Подмножество состояний Л2 (Z Л в частичном автомате называется частичным подавтоматом в Л(&), если из того, что ^gAj, a £ 31, ^а определено в Л (31) и lkla — X2j следует, что Х2(^А1. В частности, если частичный автомат Л (31) является автоматом (полным автоматом), то его частичные подавтоматы называются подавтоматами. Ради общности пустое множество состояний также считаем (частичным) подавтоматом. Очевидна Теорема 1. Множество всех частичных подавтоматов произвольного частичного автомата S относительно теоретико-множественных операций пересечения и объединения образует полную дистрибутивную структуру. В случае (полного) автомата теорема 1 утверждает, что множество всех его подавтоматов образует полную дистрибутивную структуру. Единицей этой структуры является исходный автомат, а нулем — пустое множество. Системой образующих частичного автомата Л (91) называется всякое подмножество М CZ Л такое, что для каждого Х^А либо Х£М> либо найдутся состояние х£М и конечное число входов а1У а2, ..., ah в множестве 21 такие, что ха1а2 ... Д/4 = А,. Ясно, что система образующих всегда существует в частичном автомате и может быть выбрана, вообще говоря, неоднозначно. Например, в качестве системы образующих может быть взято множество всех состояний Л. На рис. 5 даны функциональная схема и граф переходов автомата, состоящего из пяти состояний и одного входа, в котором любое непустое подмножество состояний составляет систему образующих; например, в качестве системы образующих может быть взято любое из пяти состояний. Если М является системой образующих в частичном автомате Л (2i), то будем говорить, что частичный авто- Рис- 5. Мат Л (21) порождается множеством (состояний) М. Ясно, что всякое подмножество Мх порождает в Л (31) некоторый частичный подавтомат АЛ (3v), который мы будем обозначать символом {Mt}. Если в частичном автомате S существует хотя бы одна система образующих М, состоящая из конечного числа состояний, то частичный автомат S называется частичным автоматом с конечным числом образующих. Однако далеко не всякий автомат имеет конечную систему образующих. Назовем систему образующих неприводимой, если никакая истинная ее подсистема не является системой образующих. Оказывается, что существуют автоматы, не имеющие неприводимых систем образующих. Поясним это следующим примером. Пример 2. В качестве множества Л возьмем множество всех рациональных чисел, в качестве множества 31 —множество всех целых чисел. Действие входа а на состояние X определим как обычное числовое умно- s> s2 Sj s, % a * 1 Sj\ * 4 s,
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 49 жение соответствующего рационального числа (состояния) на соответствующее целое число (вход). Покажем, что в автомате А (31) не существует неприводимых систем образующих, а следовательно, не существует и конечных систем образующих. Пусть М —произвольная система образующих в Л (31), и пусть т — произвольный ее элемент. Покажем тогда, что М' = М \т также является системой образующих для Л. Обозначим через Лх (31) подавтомат, порожденный множеством М' = = М\т, А1(Щ = {М'} = {М\т}. Ясно, что Лх (31) не пусто, так как в противном случае все рациональные числа были бы кратны т, что неверно. Пусть п — произвольное число из Л1(91). Ясно, что существуют целые числа кх и /с2 такие, что fc1m = /c2w; при этом кгт = к2п £ Лх (%). Если -тг-бЛ^Э!), то й^-г—= т£Л1(91), и все доказано. Если же ■т--бЛ(31)\Л1(31), то -^- = s/ra, где 5 б 31, и тогда m = k1(sm) = = s(/c1/w)£A1 (31), и также все доказано. Рассмотренный пример 2 показывает, что частичные автоматы могут не иметь неприводимых систем образующих. Другой, более простой пример автомата с таким же свойством будет рассмотрен ниже. Очевидно в то же время, что если в частичном автомате имеется конечная система образующих, то существуют неприводимые системы. На рис. 5 изображен автомат, не имеющий неприводимых систем образующих. Справедлива следующая Теорема 2. Все неприводимые системы образующих в частичном автомате с конечным числом образующих имеют одинаковое число образующих состояний. Доказательство. Пусть в частичном автомате даны две неприводимые системы образующих т19 т2, ..., mh и Zlf Z2, ..., /n. Тогда для любого i = l, 2, ..., п найдется последовательность входов aj'v aiv • • •» aih (быть может, пустая) такая, что В силу неприводимости системы mv m2, . . ., mk элемент та пробегает всю эту систему, следовательно, дг>/с. Аналогично устанавливается, что /с>гс. Два последних неравенства означают, что п = к. Теорема 2 доказана. § 4. Гомоморфные отображения. Вложимость Два частичных автомата А (31) и А'(31') называются изоморфными, если между элементами множеств входов 31 и 31' существует взаимно однозначное соответствие if»: а «—* а , и между элементами множеств состояний А и А' существует взаимно однозначное соответствие ф: причем \|) и ф таковы, что если Ка и Х'а' определено, то и второе из этих двух состояний определено и Ха <—► Х'а'. При этом отображение ф называется изоморфизмом (и обозначается символом s^) или изоморфным отображением частичного автомата А (31) 4 Проблемы кибернетики, вып. 9
50 Ю. И. СОРКИН на частичный автомат Л' (91'). Если для двух конечных частичных автоматов известны функциональные схемы, то ясно, что легко алгоритмически проверяется, изоморфны они или ньт. Если же частичные автоматы бесконечны, то вопрос об установлении того, изоморфны они или нет, не столь тривиален, так как в этом случае возникают трудности уже в задании автоматов. Позже мы еще вернемся к этому вопросу. Изоморфное отображение частичного автомата Л (31) на себя называется его автоморфизмом. Автоморфизмы автомата Л (31), при которых множество входов отображается на себя тождественно, будем называть автоморфизмами 2-го рода. Теорема 3. Множество всех автоморфизмов произвольного частичного автомата относительно операции умножения отображений образует группу, в которой множество всех автоморфизмов 2-го рода составляет нормальный делитель. Доказательство того, что множество Ш автоморфизмов частичного автомата Л (31) образует группу, очевидно. Ясно также, что множество 9Ji' автоморфизмов 2-го рода образует подгруппу г в ней. Пусть ф, хр> и а — произвольные элементы —| множеств ЗЛ, ЭДГ и 31 соответственно. Тогда II I аф_1\|9ф = [(аф_1)г|)] ф = [аф_1]ф = а, A(Oi) Л(01,) <™, „ cm гр 0 о ' т. е. Ш —нормальный делитель в Ш. Хеорема 6 ф / \а' Доказана. Однозначное отображение ф частичного автомата Л (31) на частичный автомат Л' (31') назы- Рис# 6# вается гомоморфным, если ф отображает множество 31 на множество ЭГ и множество Л на множество Л', и при этом, если Ка = Х1^А(Щ, то в Л'(31') определено (^ф)(аф) и (Хф)(аф) = Ххф. Если 31 = Si' и ф отображает 31 на ЗГ тождественно, т. е. если частичный автомат Л (31) отображается в себя, то мы имеем дело с эндоморфизмами автоматов. Теорема 4. Если гомоморфное отображение ф автомата Л(31) на автомат А1(%1) является взаимно однозначным (Л«—^Aj и Э1«—^З^), то ф является изоморфизмом между автоматами Л (31) и Л1(Э{1), т. е. Действительно, так как отображение ф взаимно однозначно, то обратное к нему отображение ф-1 также взаимно однозначно. Пусть X и а — произвольные состояние и вход автомата Л (31), и пусть Хф = V £ Лх (3^) и аф = а'£Э11. Тогда Х = А/ф-1 и а = а'ф-1, и в силу гомоморфности отображения ф имеем: (ка) ф = [(Х'ф-1) (а'ф"1)] Ф = (Х'ф-1ф) (а'ф-1ф) = (ку) (аф), что и требовалось доказать. Заметим, что для частичных автоматов теорема, аналогичная теореме 4, не верна. В этом легко убедиться на примере двух частичных автоматов, функциональные схемы и графы переходов которых изображены ( Хф = X' , на рис. 6. Ясно, что взаимно однозначное отображение ф: \ , будет гомоморфным отображением частичного автомата Л (31) на Лх (Э^х), но эти частичные автоматы не изоморфны. Частичный автомат Л (31) называется вложимым в частичный автомат Л* (31), если в множестве состояний Л* частичного автомата Л* (31) существует подмножество Л' такое, что между множествами Л и Л' может быть установлено взаимно однозначное соответствие ф, при котором
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 51 всякий раз из того, что Ха = Х1 в Л (2t), где а £ 91, следует, что (Хф)а = = ^ср в Л* (31); если, кроме того, всякий раз из равенства (Адр)а = А,1ф в Л* (21) следует, что Ха=Х1 в Л (21), то частичный автомат Л (31) называется сильно вложимым в частичный автомат Л* (31). Если при этом Л' является системой образующих в Л* (31), то частичный автомат Л* (31) называется расширением частичного автомата Л (31) или соответственно сильным расширением частичного автомата Л (31). Ясно, что каждый частичный автомат вложим в автомат. Для такого вложения достаточно все пустые клетки функциональной схемы частичного автомата произвольным образом заполнить некоторыми (быть может, новыми) состояниями. Более того, ясно, что каждый частичный автомат сильно вложим. Действительно, для осуществления сильного вложения достаточно заполнить пустые клетки функциональной схемы частичного автомата произвольным символом т (отличным от состояний и входов), объявив его новым состоянием, и добавить новую строку, состоящую целиком из одних т, т. е. положить та = т при любом входе а. § 5. Свободные автоматы Пусть дано некоторое множество й символов (ov (v пробегает некоторое непустое множество индексов 91), которые мы назовем свободными образующими внутренними состояниями или, короче, свободнообразующими состояниями; пусть дано также некоторое множество 31 символов ам (|х пробегает некоторое непустое множество индексов 2Л), которые мы назовем свободными образующими входными символами или, короче, свободнообразующими входами. Построим с помощью символов o)v и а^ множество слов следующим образом. Всякий символ cov при любом v£$ft назовем словом ранга 0. Если А — слово ранга п, то словом ранга п + 1 назовем всякое выражение вида Аа^ при \х^Ш. Ранг слова А будем обозначать символом г (А). Тем самым нами индуктивно построено множество Л слов со свободно- образующими множествами состояний Q и входов 31. Легко видеть, что всякое слово из Л имеет вид <йчаИ1аиг • • • Дц8» где первая слева буква —любой элемент из Q, а далее к нему приписано произвольное слово (быть может, и пустое) в смысле ассоциативных исчислений [9] в алфавите 31. Ранг слова, очевидно, совпадает с числом входящих в слово свободнообразующих входов. Два слова а и р из Л будем считать равными (а == Р) тогда и только тогда, когда они графически совпадают. Образуем теперь из построенного множества слов Л автомат Г&(Щ следующим образом. Каждое слово из Л назовем состоянием автомата Ра(Щ, каждый вход из 31 назовем входом автомата FQ (31) и, по определению, будем считать, что состояние А£А под действием входа ам переходит в состояние Аа^ где Аа^ — слово из Л, получающееся из словак припиской справа входа ам. Автомат FQ (31) назовем свободным автоматом (с множеством свободнообразующих состояний Q и множеством свободно- образующих входов 31). Докажем следующую теорему о подавтоматах свободного автомата. Теорема 5. Всякий подавтомат свободного автомата Fq(%) является свободным автоматом. Доказательство. Пусть непустое подмножество М в множестве состояний Л свободного автомата F& (31) образует подавтомат М (31) с множеством входов 3t. Множество слов из М, имеющих ранг нуль, обозначим 4*
52 Ю. И. СОРКИН через М0] через N0 обозначим множество всех слов, порождаемых словами из М0, т. е. N0={M0}. Пусть Mi и Ni определены, тогда в множестве всех слов из M\Ni возьмем все слова ранга £ + 1, если они существуют, и обозначим это множество через Mi+1. Положим Д/\+1 = {Mi+1}. Тем самым нами индуктивно построена система образующих для М: оо К= \}\Mit i=0 которая, как легко видеть, является системой свободных образующих. Заметим, что если окажется, что для некоторого i множество 71/. пусто, то процесс построения К обрываем на этом шаге. Теорема 5 доказана. Из приведенных рассуждений ясно, что всякое подмножество Q' в множестве свободнообразующих состояний Q порождает свободный подавтомат с множеством свободнообразующих Q'. Однако даже в случае, когда Q состоит всего лишь из одного состояния со, а множество входов 91 содержит более одного элемента, свободный автомат F& (91) содержит подавтоматы с любым конечным и даже счетным множеством образующих. Имеет место Теорема 6. Свободный автомат Fq (9(), где множество 9{ содержит более одного входа, содержит подавтомат со счетным можеством свободнообразующих. Действительно, взяв некоторое состояние со изЙ и два различных входа а и Ь из 91, рассмотрим множество слов г|?4 = соаг& для i = 0, 1, 2, ... Здесь и далее через аг обозначается при i = 0 пустое слово, а при £>0 — слово а1~1а в алфавите 91. Легко видеть, что множество слов \J)t при £ = 0,1,2,... порождает подавтомат, свободный в силу теоремы 6, с множеством г|^ свободнообразующих состояний. Подавтоматы свободного автомата Fq(%) с одноэлементным множеством свободнообразующих входов 91 = {а} описываются теоремой 7. Теорема 7. Всякий подавтомат свободного автомата Р&(Щ с множеством свободнообразующих входов 91, состоящим из одного элемента а, изоморфен свободному автомату F&> (9t), где Q' — некоторое подмножество множества Q. Доказательство. Пусть М(91) — подавтомат в /Ъ(91). Всякое слово из М имеет вид cova\ где a g 91 и /с = 0, 1, 2, .. . Обозначим через Q' подмножество тех состояний из Q, которые служат началами слов из М(91), т. е. cov€^' тогда и только тогда, когда при некотором к слово ,щак принадлежит М. Пусть covgQ', тогда в множестве Mv всех слов из М, начинающихся с o)v, найдется слово наименьшего ранга covfl v. Легко видеть, что всякое слово из Mv имеет вид o)vak, где k>kv. Если сопоставить каждому слову cova* из Му, слово (ovak~kv из Fq(W), to тем самым будет установлено изоморфное соответствие между подавтоматом {cov}, порожденным состоянием cov в 7^(91), и подавтоматом Mv(9i), а так как Л/(31)= U Мч(Щ, то M($t)^FQ>(%). Теорема 7 доказана. Из теоремы 7 следует, что всякий подавтомат свободного автомата Fn{\) с конечным числом п свободнообразующих состояний и с единственным свободнообразующим входом является свободным автоматом Fm{\) с конечным числом т<дг свободнообразующих состояний и единственным свободнообразующим входом.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ГДЛЯ АВТОМАТОВ 53 Наконец, заметим, что из следующих очевидных утверждений: 1) системы свободнообразующих состояний и свободнообразующих входов в свободном автомате единственны', 2) всякий автоморфизм индуцирует взаимно однозначное отображение множества свободнообразующих состояний на себя и множества свободнообразующих входов на се.бя; 3) всякое взаимно однозначное отображение множества свободнообразующих состояний на себя и всякое взаимно однозначное отображение множества свободнообразующих входов на себя индуцируют в совокупности автоморфизм свободного автомата — следует Теорема 8. Множество всех автоморфизмов свободного автомата FqC&) изоморфно прямому произведению двух (симметрических) групп: группы Sq всех взаимно однозначных отображений множества Q на себя и группы S% всех взаимно однозначных отображений множества 3{ на себя. § 6. Определяющие соотношения Пусть в свободном автомате Л (31) дано некоторое множество S пар слов [i?Y; Ну], где у пробегает некоторое множество индексов 6. Каждую пару слов из множества S назовем определяющим соотношением, а множество S всех определяющих соотношений назовем системой определяющих соотношений, С помощью системы определяющих соотношений определим на множестве всех слов Л бинарное отношение условного равенства слов. Условное равенство обозначим символом ^ и введем его индуктивно следующим образом. Мы скажем, что слово А условно равно слову В на первом шаге (символически А ъ В (1)), если выполнено хотя бы одно из трех условий: а) А = В; б) при некотором Yo€© имеют место графические равенства А = Ry и в = д;0; в) при некотором у0 £ © имеют место графические равенства А = HL и B = RSo. Пусть условное равенство слов до п-то шага включительно определено (символически А ^ В (/с), где /с< п). Мы скажем, что слово А условно равно слову В на (п-\- 1)-м шаге, если выполнено хотя бы одно из двух условий: г) существует слово С такое, что А ъ С (п) и С ъ В (/г); д) А = А'а и В = В'а, где a g 31 и А' ъ В' (п). Назовем слово А условно равным слову В (символически А ^ 5), если существует натуральное число m такое, что А ъ В (т). Покажем, что отношением условного равенства слов множество всех слов Л разбивается на непересекающиеся классы. Для этого достаточно показать рефлексивность, симметричность и транзитивность отношения условного равенства слов. А^А, так как А— А, т. е. по a) A^A(i). Итак, условное равенство слов рефлексивно. Покажем, что если А ъ В, то В ъ А. Если A^B(i), тогда либо А ъ В (1) по а) и тогда В^А(1) по а), либо А ъ В (1) по б) или в) и тогда В ^ А (1) соответственно по в) или б). Предположим доказанным, что из А ъ В (к) следует В ъ А (к) для всех А:</?, и пусть А ъ В (к+1). Последнее соотношение имеет место из-за выполнимости хотя бы одного из условий г) — д). Рассмотрим их поочередно. В случае г) по индуктивному предположению В^С(п), С ^ В (л) и, следовательно, по г) В^А(п-\-1). В случае д) по индуктивному предположению В' ъ А' (п) и по д) В ъ А (п-\-1).
54 Ю. И. СОРКИН Итак, условное равенство слов симметрично. Для доказательства транзитивности условного равенства слов заметим, что если А ъ В (/сх), то А ^ В (к2) при k2^kv Пусть теперь А ъ В и В ъ С, т. е. при некоторых пг, п2 имеет место А ^ В (пг) и В ^ С(п2). Тогда А яь В (п3) и В ^ С (п3), где п3 — max {nv n2}. Пользуясь теперь условием г), имеем А ъ С (п3 + 1), т. е. А ъ С. Таким образом, условное равенство транзитивно. Определим теперь на множестве классов *S3 условно равных слов действия входов 31 с тем, чтобы получился автомат S* (31). Если дан класс X, то возьмем какое-либо слово А из класса X и какой-либо вход а из 31. Будем считать, что класс X под действием входа а переходит в тот класс Ха, к которому принадлежит слово Аа. Если А' — какое- либо слово из X, то i^i', .т. е. при некотором к имеет место А ^ А' (к), но тогда Аа ^ А'а (к4-1), т. е. Аа ъ А'а, т. е. А'а £Ха. Поэтому класс Ха не зависит от первоначально сделанного нами выбора из класса X представителя А и, значит, нами построен автомат *SS (31), в котором множеством состояний является множество классов условно равных слов, а множеством входов — множество 91. Этот автомат называется автоматом, заданным образующими состояниями соа, где а пробегает непустое множество индексов 9i, образующими входами ар, где р пробегает непустое множество индексов 9Л, и определяющими соотношениями [Ну] /?у], где y пробегает непустое множество индексов ©. Нами доказана Теорема 9. Произвольная система определяющих соотношений (при произвольной системе образующих) однозначно задает некоторый автомат. В то же время справедлива Теорема 10. Всякий автомат S может быть задан определяющими соотношениями. Действительно, пусть S (31) — автомат, и пусть произвольное его состояние sa переводится входом а$ в состояние sa>p, т. е. Saap = *a,0. (1) Поставим во взаимно однозначное соответствие каждому состоянию sa автомата S (Щ новый символ sa. Взяв тогда в качестве алфавита множество S всех символов sa, свяжем его определяющими соотношениями [$а.а& *а,р], соответствующими всем равенствам (1) в автомате 5(31). Тем самым нами в соответствии с теоремой 9 задан некоторый автомат S (Щ. Легко видеть, что £(31)^5^(31). Теорема 10 доказана. Докажем теперь теорему, аналогичную известной теореме Дика ([10], стр. 118) в теории групп. Теорема 11. Если автомат Sx (Щ задан системой образующих sa (а пробегает непустое множество индексов 31) и системой определяющих соотношений Н и автомат S2 (Щ задан той dice системой образующих и системой определяющих соотношений Ф, причем ФцзЕ, то автомат *S2(3t) является гомоморфным образом автомата Sx (31). Так как при доказательстве теоремы 11 мы будем рассматривать условные равенства слов как относительно системы определяющих соотношений S, так и относительно системы определяющих соотношений Ф, то будем условные равенства писать с указанием системы опре- s ф деляющих соотношений, например, А ъ В или соответственно А ъ В.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 55 Для доказательства теоремы 11, очевидно, достаточно показать, что Е Ф из условного равенства А ^ В следует условное равенство А ^ В. Докажем это индукцией по шагу условного (относительно системы определяющих соотношений S) равенства слов. Если А^2?(1), то в случае ф а) А = 5, т. е. А ъ В (1), а в случае б) (или в случае в)) [А\ В] £ S (или [В\ Л]£Н); но тогда в силу включения ФцзЗ имеем [А; В] £ Ф ф (или [Б;Л]£Ф), т. е. А ъ В (1). Предположим доказанным, что из s ф s А ъ В (п) следует А ^ В (п). Пусть теперь А ^ В (п-\-1). Если последнее отношение выполнено в силу условия г), то существует слово С такое, S S Ф что1 А ^ С (п) и С ^ В (п), т. е. по индуктивному предположению А ъ С (п) Ф Ф S и С я? В (п), т. е. А ъ В (п + 1). Если же отношение А ъ В (п -\- 1) выпол- нено в силу условия д), то А = Ага^ 5=Sxa^ и Ахъ В1(п)\ но тогда ф ф А1^В1(п) и, значит, А ъ В (п+ 1). s ф Итак, мы доказали, что из А ^ В (к) следует А ^ В (/с), т. е. s ф доказали, что из А ъ В следует А ^ В. Теорема 11 доказана. Из теоремы 11 и теоремы 8 вытекает, в частности, что всякий автомат является гомоморфным образом некоторого свободного автомата, так как свободный автомат можно считать заданным пустым множеством определяющих соотношений. Справедлива также теорема, обратная к теореме 11. Теорема 12. Если автомат 51(Э1) задан системой образующих состояний sa (a пробегает непустое множество индексов 9Ji) и системой определяющих соотношений R и автомат S2 (91) является гомоморфным образом автомата S1 (91), то автомат S2 (Щ может быть задан той же системой образующих состояний, что и автомат Sb(%)y и системой определяющих соотношений Q, где QuR. Для доказательства теоремы 12 достаточно заметить, что если при гомоморфизме ф автомата Sj (91) на автомат S2 (Щ некоторые неэквивалентные слова Л и В из Sx (91) отображаются в эквивалентные слова из 52 (91), то определяющее соотношение [А\ В] следует присоединить к R. Пополнив R всевозможными такими определяющими соотношениями, мы придем к системе определяющих соотношений Q, которой, как легко видеть, определяется автомат, изоморфный автомату S2(9l). Теорема 12 доказана. В связи с заданием автоматов определяющими соотношениями для автоматов, как и для других алгебраических образований, возникает ряд алгоритмических задач (проблем), решения которых мы рассмотрим в настоящей работе. Сформулируем три основные алгоритмические задачи. Пусть автомат Л (91) задан системой образующих состояний sa, a£9ft, входов ар, (5 £91, и конечным множеством R определяющих соотношений IRy, R'y], y = U 2, . .., п. Проблема тождества (слов). Указать алгоритм, позволяющий R R для двух произвольных слов А, В б Л (St) выяснить А ^ В или же А ф В. Проблема вхождения. Если даны т+1 слов A, Bv В2, . . ., Вт в автомате Л(91), требуется указать алгоритм для установления того, входит состояние А в подавтомат автомата Л (91), порожденный
56 Ю. И. СОРКИН словами Bv 52, ..., 5П, или не входит. Другими словами, А£{В19В2,...,Вт} или А${Вг,В2, ...,Вт}1 Проблема изоморфизма. Указать алгоритм, позволяющий установить, будет ли автомат Л (9J) изоморфен произвольному автомату Л (2t), заданному образующими состояниями аа, a£9Ji, входами 6р, P €_5R, и конечным множеством R определяющих соотношений [Ry\ R'y]> Y = l, 2, ...у п. Другими словами, требуется найти алгоритм для установления того, будет ли Л (91)^ Л (91) или Л (91)$ Л (91)? Для решения трех сформулированных алгоритмических задач нам понадобится понятие замкнутой системы определяющих соотношений, к которому мы сейчас и переходим. § 7. Замкнутые системы определяющих соотношений Введем следующее Определение. Система образующих состояний sa и входов ар, связанная системой определяющих соотношений [i?Y; R'y] (где a, (3 и у пробегают соответственно множества индексов ЯК, У1 и ©, из которых лишь множество ©, быть может, пустое), называется замкнутой системой, если выполнены два условия: 1) r(Ry) = l и г (R'y) = О для всякого у€©> т- е- во всяком определяющем соотношении левая часть Ry имеет вид sa а* и правая часть Ry имеет вид sir т. е. Ry = saya*y и R'y = s'ay; 2) если на множестве состояний sa, a£9K, определить действия входов ар, Р б 91> следующим образом: результат saoap0 существует и равен б'а0 тогда и только тогда, когда при некотором Yo€® имеет место Ry0 = 5aoap0 и Ry0 = s'ao, то получится частичный автомат. Поясним это определение тремя примерами. Пример 3. Пусть автомат задан двумя образующими состояниями st и s2, двумя образующими входами аг и а2 и двумя определяющими соотношениями [s^a^ s2] и [s2a2; sxa2]. Эта система не будет замкнутой, так как нарушено условие 1) определения, ибо ранг правой части второго определяющего соотношения равен единице, а не нулю. Пример 4. Пусть автомат задан двумя образующими состояниями s1 и s2, двумя образующими входами аг и а2 и двумя определяющими соотношениями [s^: s2] и [s^; s^. Эта система, как и система из примера 3, не будет замкнутой, так как здесь хотя и выполнено условие 1) из определения замкнутой системы, но не выполнено условие 2), ибо результат действия входа ах на состояние s1 неоднозначен, т. е. мы не получаем частичного автомата. Пример 5. Пусть автомат задан, как и в примерах 3 и 4, двумя образующими состояниями sx и s2, двумя образующими входами ах и а2 и двумя определяющими соотношениями [s^; s2] п [*2а2*> SA- Здесь, как легко видеть, мы имеем дело с замкнутой системой определяющих соотношений, так как выполнены оба условия определения. Первое условие выполнено, так как в обоих определяющих соотношениях ранги левых частей равны единице, а ранги правых частей равны нулю. Второе условие выполнено, так как если определить действия входов, как указано в определении, то получаем частичный автомат с функциональной схемой, изображенной на рис. 7.
ТЕОРИЯ ^ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 57 Заметим, что условие 2) в определении замкнутой системы определяющих соотношений, очевидно, эквивалентно следующему условию: 2') если в двух определяющих соотношениях из R (удовлетворяющих условию 1)) левые части (графически) равны, то и правые части также (графически) равны. Рассмотрим теперь некоторую конструкцию, сопоставляющую каждому частичному автомату S с состояниями .9а и входами а$ (а£ЗЛ, P£9i) некоторый (полный) автомат S, задаваемый замкнутой системой определяющих соотношений. Сопоставим каждому состоянию sa частичного автомата S новый символ sa> множество которых и множество всех входов ар, где (3 G 91, свдачем системой определяющих соотношений Л, отнеся к R все соотношения вида [saa& *а,р] в том и только дом случае, когда saa$ определено в S и равно £а>р. Ясно,: что система определяющих соотношений замкнута. Ею определяется некоторый автомат S, который Рис* 7* мы будем называть свЩодным расширением частичного автомата S. То обстоятельство, что термин расширение употреблен здесь корректно, а также важную роль описанной конструкции выясняет следующая Теорема 13*). Свободное расширение S частичного автомата S является сильным расширением частичного автомата S, и всякое его другое расширение Т является гомоморфным образом автомата S. Докажем сначала вторую часть теоремы 13. Пусть Т (Щ — некоторое расширение частичного автомата S (91). Тогда существуют подмножество- состояний U, являющееся системой образующих в Т (31), и взаимна однозначное отображение ф множества состояний частичного автомата S на множество U такое, что если saa^ для некоторых а£Ш и (3 £ 91 определено в S и saa$ = sat$y то ($аф)ар = £а,рф в автомате Т. Определим отображение \|) автомата S в автомат Т следующим образом. Всякому элементу sa£S поставим в соответствие элемент 5аг|р = $аф£ Т. Если для слов А из S при г(Л)<тг отображение г|э уже определено, то положим #ф, где г(В) = п + \ и В == Аа^ равным (A\J))a^. Покажем, что отображением я|э автомат S отображается на автомат Т. Действительно, всякое состояние из Т может быть представлено в виде (MP)api<ipa...apfe, (2) где /с>0, saq£U{zT и р. £ У1 (i = 1, 2, . . ., к). Легко ьидеть тогда, что состояние saa^a^2 . . . ар из S является прообразом состояния (2) при отображении \|э. Гомоморфность отображения \|э может быть легко усмотрена непосредственно из определения отображения \|э. Если теперь si = s^ в S, то s^ — s .1|) в Г (в силу гомоморфности отображения if>). Последнее равенство можно записать в виде ^ф = $;-ф, т. е. £{ = $у. Поскольку, далее, множество состояний sa составляет систему образующих в S, то автомат S является расширением, и притом сильным, частичного автомата S. Теорема 13 доказана. *) Теорема 13 является частным случаем теоремы Ивенса [И, доказанной им для произвольных алгебраических систем.
-58 Ю. И. СОРКИН Из теоремы 13 вытекает важное Следствие. Если автомат S задан системой образующих состояний Sa, а £ 9К, связанных замкнутой системой R определяющих соотношений, то при а Ф а' состояния sa и sa> различны, т. е. принадлежат к разным классам условно равных {относительно R) слов. § 8. Преобразования системы образующих и определяющих соотношений В этом параграфе мы рассмотрим некоторые типы преобразований системы образующих и определяющих соотношений, которые не меняют исходного автомата, т. е. такие преобразования, которые приводят к новому автомату, изоморфному исходному. Теорема 14. Если автомат S задан системой образующих состояний sa, а£9К, образующих входов ар, P£9t, и множеством R определяющих соотношений, и некоторое определяющее соотношение имеет вид [sxaPlaP2. . ,aPft; sj, где хф1, (3) то, исключив из системы образующих состояние sx и из R определяющее соотношение (3), а в остальных определяющих соотношениях заменив sx словом SxCLfaCLfc. . .ар , получим автомат Т, изоморфный автомату S. Доказательство. Определим однозначное отображение ф множества L слов автомата S на множество Р слов автомата Т следующим образом. Если В входит в L и имеет вид В = sKa&1a62. . .абг, то при х Ф 1 считаем, что Вц = В £Р, а при к=1 считаем, что By = s^a^a^.. .ар а^а^2. . . a$ , т. е. мы заменяем состояние st левой частью определяющего состояния (3). Ясно тогда, что для всякого В £ L имеет место условное равенство В^Ву. (4) Непосредственно же из определения отображения ф вытекает, что оно является гомоморфизмом, т. е. что для любого слова В из L и любого входа ар выполняется равенство Барф = Бфар* (5) Обозначим преобразованную систему определяющих соотношений, которой определяется автомат Т', через Q. Покажем теперь, что из условного равенства B^D (6) вытекает условное равенство Q Бф^Яф. (7) Последнее утверждение докажем индукцией по шагу условного R равенства (6). Если B^D(l), то либо B—D (случай а)), либо В и D являются левой и правой частями некоторого определяющего соотношения [В; D] или [D; В] из R (случай б) или в)). В случае а), очевидно, Q B^D. В случаях же б) и в), если определяющее соотношение [В; D] (или соответственно [D; В]) отлично от соотношения (3), то Бф и /)ф будут левой и правой частями некоторого определяющего соотношения
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 59 из Q, т. е. Вф^£*ф(1); если же [В; D] (или [D; В]) совпадает с определяющим соотношением (3), то Бф = Dq> = 5хар1ар2. . . ар , и тогда опять- таки справедливо (7) на первом шаге. R Предположим, что из B^D(m) вытекает (7) при всяком т<дг. R Пусть теперь B^D(n-\-l). Если последнее соотношение имеет место R R по г), то существует слово С такое, что В^С (п) и C^D (п), т. е. в силу Q Q индуктивного предположения Бф^Сф и Сф^Оф, т. е. имеет место (7). R Q В случае д) В == Вга^ D = Dxa$Q и B1^D1(n), но тогда B^^D^ по предположению индукции и по (5) Q Бф = В1аРоф = В1фаРо^/)1фар0 = /)1аРоф = £>ф. Таким образом, нами доказано, что из (6) следует (7). Только что доказанное утверждение вместе с (4) показывает, что отображение ф взаимно однозначно отображает множество классов условно равных (относительно R) слов из L на множество классов условно равных (относительно Q) слов из Р. Так как в соответствии с (5) отображение ф гомоморфно, то по теореме 2 ф является изоморфизмом. Теорема 14 доказана. Из теоремы 14 легко вытекает Теорема 15. Если автомат Т задан системой об разу югцих состояний sa, а б ЯК, образующих входов и множеством R определяющих соотношений, то, присоединив новое образующее состояние v и новое определяющее соотношение [A] v], где А — произвольное (непустое) слово из Ту получим автомат S, изоморфный автомату Т. Действительно, так как автомат S получается из автомата Т преобразованием системы образующих и определяющих соотношений, предусмотренным посылкой теоремы 14, то по теореме 14 автоматы S и Т изоморфны. Теорема 16. Если в автомате S, заданном системой определяющих соотношений R, одно определяющее соотношение [А; В] таково, Н\[А; В] что А ^ В, то, выбросив это определяющее соотношение из системы, получим автомат Т, изоморфный исходному автомату S. R\[A; В] R Действительно, если С ъ D, то по теореме 14 C^D. Легко показать, что из условного равенства C*Ld. (8) следует условное равенство Я\[А; В] С ъ D. (9) Из теоремы 16 легко вытекает Теорема 17. Если к системе определяющих соотношений R, задающей автомат Т', присоединить определяющее соотношение [А; В] R такое, что А^В, то новой системой определяющих соотношений будет задаваться автомат S, изоморфный автомату Т. Действительно, в силу теоремы 16 автомат Т получается из автомата S преобразованием, предусмотренным этой теоремой, т. е. автоматы Т и S изоморфны.
60 Ю. И. СОРКИН Из теорем 16 и 17 и из того, что отношение условного равенства симметрично, вытекают следующие следствия. Следствие 1. Если в некотором определяющем соотношении из системы R поменять местами левую и правую части, то автомат не изменится (останется изоморфным исходному). Следствие 2. Если в системе определяющих соотношений есть определяющие соотношения вида [А; В] и [А; С], то, присоединив определяющее соотношение [В\ С], получим автомат, изоморфный исходному. § 9. Преобразование системы определяющих соотношений в замкнутую систему Пользуясь понятием замкнутой системы определяющих соотношений, теорему 10 можно несколько усилить, придав ей следующую формулировку: Теорема 18. Всякий автомат S может быть задан замкнутой системой определяющих соотношений. Действительно, построенная в доказательстве теоремы 10 система определяющих соотношений является замкнутой. Задание автомата замкнутой системой определяющих соотношений представляет значительные преимущества перед незамкнутыми системами, что найдет свое подтверждение в следующих параграфах. Однако исходное задание автомата может быть незамкнутым. Поэтому возникает вопрос об алгоритме для переработки произвольной системы определяющих соотношений и образующих в замкнутую систему. Разумеется, что вопрос о таком алгоритме следует ставить лишь для конечноопределенных автоматов, т. е. для автоматов, исходное задание которых включает лишь конечное число определяющих соотношений. Справедлива следующая Теорема 19. Всякий конечноопределенный автомат может быть задан конечной замкнутой системой определяющих соотношений. Доказательство. Пусть автомат S задается образующими состояниями sa, agSft, образующими входами ар, Р£$1,и связывающей их конечной системой определяющих соотношений R, [RjRi], где i = 1,2,..., ft. (10) Покажем сначала, что систему образующих и определяющих соотношений можно преобразовать к виду, где каждое определяющее соотношение [А] В] таково, что г (A) -f г (В) < 1. Действительно, если в каком- либо определяющем соотношении [i?i0*> R'i0] сумма рангов левой и правой частей больше 1, например Rio = saoaPiaP2- • -a3 > гДе т> U т0 можно ввести новое образующее состояние v и два новых определяющих соотношения [WW, v\ и [шР2аРз- • -aPm; яу. Произведя конечное число такого рода преобразований, мы или придем к определяющим соотношениям требуемого вида (т. е. к таким, что сумма рангов левой и правой частей каждого из них равна нулю или единице), или же еще останется некоторое число определяющих соотношений вида [А; В], где г(А) = г(В)— 1. От определяющих соотношений последнего типа также можно освободиться, заменив каждое из них двумя: [A; v] и [v; В], где v — новое образующее состояние. Ясно, что произведенные преобразования привели нас к новому автомату, изоморфному исходному автомату S в соответствии с теоремой 15.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 61 Если теперь в новой системе определяющих соотношений встретится определяющее соотношение [А, В], где г(А) = г(В)=0, т. е. где оба слова А и В графически равны некоторым образующим состояниям, то это определяющее соотношение можно исключить из системы определяющих соотношений; при этом из числа образующих состояний следует исключить либо Л, либо В, заменив его в остальных соотношениях другим. Такого рода преобразование не изменит автомата (с точностью до изоморфизма) в силу теоремы 16. Повторяя, если понадобится, такие преобразования несколько раз, мы придем к системе определяющих соотношений, где каждое имеет вид [А; В], причем r(A)-\-r{B) = i. Это означает, что в каждом определяющем соотношении ранг одной части равен единице, а второй — нулю. Будем считать, что ранги всех левых частей равны единице, а правых — нулю, что не уменьшает общности рассуждений. Далее, взяв какое-либо определяющее соотношение из оставшихся, например [$а0яро*> 5aJ> следует просмотреть все остальные, — если среди них не окажется ни одного с графически равной левой частью, то перейдем к следующему определяющему соотношению; если же окажется определяющее соотношение [saoa$0] sa2], то в случае, когда sai= sa2, выбросим это определяющее соотношение, а в случае, когда sai ф sa2, добавим новое определяющее соотношение [sai; sa2]. Повторяя такого рода преобразования, которые в силу теоремы 17 и следствий из нее не изменят автомата S, мы через конечное число шагов придем к замкнутой системе определяющих соотношений. Таким образом, последовательность преобразований системы образующих состояний и определяющих соотношений распадается как бы на циклы: 1-й цикл. Пополнение системы образующих и определяющих соотношений с той целью, чтобы сумма рангов обеих частей каждого соотношения не превышала 1. 2-й цикл. Сокращение числа образующих и числа определяющих соотношений с целью, чтобы сумма рангов обеих частей каждого определяющего соотношения стала равной 1 (и =£0). 3-й цикл. Пополнение числа определяющих соотношений типа [А; В], где г(А)=г(В) = 0. Следующие циклы повторяют циклы типа 2-го и 3-го. Ясно, что этот процесс — конечный, так как при каждом цикле с четным номером происходит уменьшение числа образующих состояний, а при циклах с нечетным (большим единицы) номером число образующих не возрастает (а число определяющих соотношений за счет графически совпадающих тоже может уменьшиться). Рассмотренное доказательство теоремы 18, как легко видеть, эффективно, т. е. оно дает и алгоритм для переработки произвольной системы определяющих соотношений конечноопределенного автомата в замкнутую систему. Рассмотрим указанный алгоритм на следующем примере. Пример 6. Пусть автомат задан одним образующим состоянием, двумя образующими входами а и b и одним определяющим соотношением [sa2b3\ sa3b]. Введем обозначения для подслов слов sa2b3 и sa3b: vL=^&\ v2=sa, v3 = sa2, v^ = sa2by vb = sa2b2, vQ = sa2b3, v7=s, vs = sa, y9 = 6a2, u10 = ia3, vn = sa3b. Их следует связать (1-й этап) определяющими соотношениями: 1. Ка;у2]. 5. [vbb;vB]. 9. [v10b; vn]. 2. [v2a; v3]. 6. \v7a; v8]. 10. [ve\ vn]. 3. [v3b; vx]. 7. [v8a;v9]. 11. [vx\ v7]. 4. [v^b; vb]. 8. [v9a; v10].
62 Ю. И. СОРКИН Будем перерабатывать эту систему определяющих соотношений. В результате применения 1-го сокращения (2-й этап) выбросим определяющие соотношения 10 и 11, заменив в остальных vn на v6 и v7 на vv В результате определяющие соотношения 1—5, 7 и 8 останутся без изменения, а 6 и 9 преобразуются, т. е. система примет вид 1'. Ка;у2]. 4'. [vj)\vb]. 7'. [v8a\ v9]. 2'. [v2a; v3]. 5'. [vbb; v6]. 8'. [v9a; v10]. 3'. [v3b; y4]. 6'. [v±a; vs]. 9'. [v10b; v6]. Совершая теперь пополнение (3-й этап), из определяющих соотношений 1' и 6' получим новое соотношение: 10'. [v2;v8]. Теперь совершаем 2-е сокращение: выбрасываем определяющее соотношение 10' и в остальных заменяем v8 на v2. Получим: 1". [Vla; v2]. 4". [t>46; vb]. 7". [v2a; v9]. 2". [v2a;v3]. 5". [vbb\vs]. 8". [v9a] v10]. 3". [v3b] y4]. 6". [vxa\ v2]. 9". [v10b\ vs]. Теперь замечаем, что 1" и 6" ничем не отличаются друг от друга. Поэтому одно из них, скажем 6", можно выбросить и произвести очередное пополнение: из 2" и 7" получаем новое соотношение: 10". [v3] v9]. Затем производим 3-е сокращение, в результате чего система примет замкнутый вид: Г. [Vla; v2]. 4'". fob; vb]. T. [v1Qb; vQ]. 2'". [v2a] v3]. 5'". [vbb; vs]. 3"'. [v3b;v,]. 6'". [vsa;v10]. Мы пришли к замкнутой системе, которой в силу условия 2) определения замкнутой системы соответствует частичный автомат с семью- состояниями: vv v2, v3, vAt vb> v6> v7> ДВУМЯ входами: a, 6, и семью определяющими соотношениями: Г" — Т". Функциональная схема и граф переходов этого частичного автомата изображены на рис. 8. Заметим, что практически при алгоритмической переработке произвольной (конечной) системы определяющих соотношений в замкнутую целесообразно пользоваться не только что рассмотренным алгоритмом, а некоторым его более экономичным видоизменением, идея которого состоит в следующем. Каждый раз, когда какое-либо слово ранга единица «обозначается» новым образующим состоянием, т. е. вводятся «} "г Щ «* 0$ 0 V,o a \ч « Чо — - - | — b\ — ' - Ъ : щ\ щ\ — d Рис. 8.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 63 новое образующее состояние и новое определяющее соотношение, например [i^a; v2], то во всех остальных определяющих соотношениях следует подслова, графически равные vxa (если, конечно, такие встретятся), заменить на v2. Поясним применение этого «улучшенного» алгоритма на том же примере, который был рассмотрен выше. Пусть автомат задан одним образующим состоянием vv двумя образующими входами а, Ъ и одним определяющим соотношением 1. [Via2b3; ига*Ь]. Если ввести образующее состояние v2 и определяющее соотношение 1'. [v^a\ v2], то определяющее соотношение 1 перейдет в определяющее соотношение 2. [v2ab3; v2a2b]. Введя, далее, образующее состояние v3 и определяющее соотношение 2'. [v2a; vs], определяющее соотношение 2 преобразуем в определяющее соотношение 3. [v3b3; v3ab]. Вводя, далее, последовательно соотношения 3'. [v3b; y4], 4'. [v&Vs], 5'. [vbb;vQ], 6'. [v3a\ v7], определяющие соотношения преобразуем соответственно в 4. [у4Ь2; vsab], 5. [vbb; v3ab], 6. [vQ; v3ab], 7. [v6;v7b]. В результате последовательности преобразований автомат будет последовательно задаваться системами: 1; 1', 2; 1'-2',3; 1'-3',4; 1'-4',5; 1'-5',6; 1'-6',7. Поменяв местами в последней системе левые и правые части определяющих соотношений 6' и 7, получим замкнутую систему определяющих соотношений [vxa\ v2], [v2a; vs], [v3b\ t;4], [vj)\ vb]9 задающую частичный автомат с функциональной шкалой и графом переходов, получающимися из шкалы и графа исходного автомата посредством подстановки у7 вместо v10.
64 Ю. И. СОРКИН § 10. Каноническое представление слов. Решение проблемы тождества и проблемы вхождения Пусть автомат S задан образующими состояниями, vv v2> ..., Vk19 образующими входами av а2, . .., ak2 и замкнутой системой определяющих соотношений R. Для каждого слова А из автомата S определим (индуктивно по рангу слова) его каноническое представление, кото- «-1 рое будем обозначать символом А. Если г(А) = 0у то положим А=А. Пусть А определено для всех слов А, имеющих ранг, не превышающий п, и пусть г(А)~п-\-1. Тогда А = А^0У где г(А1) = п. Если г(А1)>0 или если г (А1) = 0, но слово А±а$0 не является левой частью никакого определяющего соотношения ^ «-1 ^ ^ из R, то положим А ~ А^0. Если же r{Al) = Q и слово Ага^0 является левой частью определяющего соотношения [^i«p0; vao] из i?, то положим А = vao. Теорема 20. В автомате S, заданном замкнутой системой определяющих соотношений, для произвольных двух слов А и В условное равенство Аъ В справедливо тогда и толъко^тогда, когда А =В. Достаточность условий очевидна, так как если А =5, то А ъ А =В ъ В. Необходимость условий докажем индукцией по шагу к условного равенства А ^ В (к). Пусть к= 1. Тогда в случае а) А = В и в силу однозначности канонического представления А = В. В случае б) в системе определяющих соотношений, задающей автомат S, есть определяющее соотношение [va{ia$0\ vao р0] такое, что A =vaoap0 и В ~ Voq, go» н0 т°гда А = В = va0t ро- Случай в) симметричен случаю б). Предположим, что для всех /е<я доказано, что из А ъ* В (к) сле- •-1 *-■ дует А = В. Пусть теперь к = п-\-1, т. е. А ^ В (п+ 1). Если последнее соотношение выполняется в силу г), то существует слово С такое, что А ^ С(п) и С^В(п). Тогда в силу предположения индукции А = С и С-В, т. е. А~ В.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ ГТ> 15 случае д) А ~ Аха^ В =е 51аРо и А1 ^ Вх (п). Тогда по предпо- ложению индукции А1~В1. Рассмотрим здесь два подслучая: 1. г(А1) = г(В1)>0 И 2. г (£) = /• (Я,) = 0. И подслучае 1 по определению канонического представления имеем Л ~ Ага^0 = В^ц = В. В подслучае 2 пусть Ах~ В± = va^. Если среди определяющих автомат S соотношений есть определяющее соотношение «-1 ^ вида [иа,ар0; vai p0], то A = B==vait$0\ если же такого определяющего ^-i ^ соотношения нет, то А = В -^ vaia$0. Теорема 20 доказана. Теперь легко указать алгоритмы для решения проблемы тождества и проблемы вхождения (формулировки см. на стр. 55). Для решения проблемы тождества следует: 1) переработать задание конечноопределенного автомата в задание замкнутой системой определяющих соотношений; 2) найти канонические представления двух рассматриваемых слов; 3) сравнить два полученных канонических представления. В случае, если они окажутся графически равными, то и исходные слова (условно) равны; если же канонические представления окажутся не равными графически, то в силу теоремы 20 исходные слова не равны (условно). Ясно, что все три отмеченных здесь шага 1)—3) алгоритмически выполнимы (теорема 18, определение канонического представления и определение графического равенства слов). Для решения проблемы вхождения следует: 1) переработать задание конечноопределенного автомата в задание замкнутой системой определяющих соотношений; 2) найти канонические представления A, Bv В2, ..., Вт исследуемого слова А и слов Bv В2, ..., Вт, порождающих исследуемый подавтомат; 3) сравнить слова В1У 52, ..., Вт со всевозможными подсловами слова А. Если выяснится, что какое-либо слово В{ (l<i<m) графически равно некоторому подслову Л;- слова А, то А^{В1, В2, ..., Вт}\ если же никакое Bi (1<£<иг) не равно графически никакому подслову слова Л, to4^{5„ В2, ..., Вт} = {Вг, В2, ..., Вт}. Ясно, что все три шага, отмеченные выше для решения проблемы вхождения, алгоритмпчны. Нуждается, быть может, в пояснении лишь то обстоятельство, что если А £ {Вх, В2, . . ., Вт], то некоторое Bi (1 < i< m) графически равно некоторому подслову слова А. Действительно, если Л €{/?,, В2, ..., Вт), то А£{Вг, В2, ..., Вт). Последнее означает, что А£{В{} при некотором г, где l<z<m, т. е. что А =еВ^^а^ ... а\к. » Проблемы кибернетики, вып. 9
66 Ю. И. СОРКИН §11. Проблема изоморфизма Определение 1. Состояние s частичного автомата Л(31) назовем примитивным, если выполнены следующие три условия: 1) существуют st £ Л и а £ 31 такие, что б^а = s; 2) если s1a1 = s = s2a2, то s Ф sv Si = s2 и ai = а2*> 3) если ба1 = 51а2, то s = ^ и aj = а2. Это определение показывает, что фрагмент графа переходов дл» частичного автомата с примитивным состоянием s имеет вид, указанный на рис. 9. Другими словами, примитивное состояние s таково, что 1) оно получается под действием одного и только одного входа из одного и только одного другого состояния; 2) условию 1) удовлетворяют и все состояния sat, если они определены, т. е. к любому из них идет одна и только одна стрелка; даже двойные стрелки, Рис. 9. т. е. когда результат действий двух входов один и тот же, недопустимы. Определение 2. Состояние s частичного автомата Л (31) назовем удалимым, если выполнены следующие два условия: 1) частичный подавтомат {s}, порожденный состоянием s в Л(31), состоит только лишь из примитивных элементов; 2) для всякого состояния £{£{я} и для произвольной последовательности входов а%1% ai2, ..., а\ (/с>1) выполняется неравенство ty^a^ . . . dik Ф Si9 т. е. в подавтомате {s} нет «циклов». Состояния, не являющиеся удалимыми, будем называть неуда- лимыми. Теорема 21. В автомате с конечным числом образующих состояний (и входов) множество неудалимых состояний является системой образующих. Доказательство. Прежде всего заметим, что, как уже отмечалось в § 3, поскольку рассматривается автомат с конечным множеством образующих, то в нем имеется неприводимая система образующих. Пусть она состоит из состояний .sx, s2, ..., sih. Покажем, что все эти п состояний неудалимы. Рассмотрим какое-либо состояние из них, для определенности, скажем, sv Если для всех состояний sa, отличных от 5ц и всех входов а выполняется неравенство saa Ф st, то это означает, что не выполнено условие 1) определения примитив ного состояния, т. е. состояние s1 не является примитивным и, тем более, не является удалимым. Пусть найдутся состояние sa, sa Ф sv и вход а такие, что saa = sl. Так как sl9 s2, ..., sa составляет систему образующих, то sa£ {slf s2, . . ., sj и sa$ {s2, s3, . . ., stl}, так как в противном случае s1 = saa также входило бы в {s2,s3> . .., stl}, что противоречило бы неприводимости рассматриваемой системы образующих. Значит, saGW- Это означает, что при некоторой конечной последовательности входов aiv ai2, . . ., a\k имеем: Sa = siailau . . . (iik, т. е. sx = saa = s1a,ilau. . .at a. *ц
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 67 Это равенство показывает, что нарушено условие 2) определения* удалимого элемента, т. е. состояние sx является неудалимым. Итак, мы доказали, что каждое состояние из неприводимой системы образующих неудалимо. Тем самым доказано, что множество всех неудалимых состояний является системой образующих. Теорема 21 доказана. Заметим, что теорема 21 для автоматов, не имеющих конечной системы образующих, не выполняется. Так, в автомате, рассмотренном в примере 2. множество удалимых состояний пусто — в нем все состояния неудалимы. ибо для всякого рационального числа — и двух различных целых чисел тип, отличных от нуля, имеем: р Р р q q771 qn т. е. нарушено условие 2) определения примитивного состояния, и тем самым теорема 21 для этого автомата тривиальным образом выполняется. В то же время рассмотрим Пример 7. Пусть автомат имеет в качестве множества состояний множество всех целых чисел и один вход а, действие которого выражается в том, что к состоянию прибавляется единица, т. е. sa = s-\-l при любом состоянии s. Граф переходов этого автомата изображен на рис. 10. Рис. 10. Легко видеть, что в этом автомате все состояния удал имы, т. е. множество неудал имых состояний пусто, и, значит, они не составляют системы образующих. Таким образом, для этого автомата теорема 21 не верна. Заметим кстати, что в этом автомате не существует неприводимой системы образующих. Множество всех неудалимых состояний К произвольного автомата Л(31) образует частичный подавтомат, функциональная схема которого индуцируется функциональной схемой автомата Л(ЭД). Точнее, если Х£К и а£ 31, то при Ха$К считается, что Ха в частичном автомате К не определено; если же Ха — Х^^^К, то считается, что Ха=Х1 в К. Этот частичный подавтомат К в Л(21) назовем базой автомата Л(31). Теорема 22. Если из частичного автомата А(Щ выбросить некоторое множество удалимых состояний N и все порожденные ими состояния {N}, то в оставшемся частичном автомате (Л\{ N}) (31) всякое состояние s будет удалимым или неудалимым в точном соответствии с тем, было ли оно удалимо или неудалимо в частичном автомате Л(31). Доказательство теоремы 22 достаточно очевидно — стоит лишь внимательно продумать определение удалимых состояний. Утверждение теоремы 22 весьма наглядно, если воспользоваться геометрической интерпретацией (на графе переходов) понятия удалимого состояния. Теорема 23. Всякий автомат А(Щ с конечным числом образующих изоморфен свободному расгиирению своей базы. Доказательство. Рассмотрим автомат А(Щ с конечным числом образующих. Будем считать, что он задан замкнутой системой образующих vY, v2, ..., vri и определяющих соотношений. Будем считать, что каждое слово задано своим каноническим представлением. Из теоремы. 20 следует, что если г(Л)>0, то состояние А удалимо. Таким образом, база автомата Л(31) является подмножеством в множестве образующих. Ol. ^ ■••» V*- 5*-
08 Ю. И. СОРКИН Вообще, из этих состояний vL, v2, • •, va следует составить частичный автомат Л1(Э1). В соответствии с теоремой 22 в нем будут удалимы те и только те состояния, которые были удалимы в автомате Л(91). В соответствии с теоремой 13 автомат Л(Э1) изоморфен свободному расширению частичного автомата Л1('й). В то же время достаточно ясно, что если удалить из частичного автомата Л-^ЭД) все удалимые состояния и выбросить все определяющие соотношения, в которых они ранее участвовали, то в соответствии с теоремой 14 останется база К, свободное расширение которой изоморфно исходному автомату Л(Э1). Теорема 23 доказана. Таким образом, нами показано, что всякий автомат (с конечным числом образующих) с точностью до изоморфизма определяется своей базой. Поэтому для решения проблемы изоморфизма можно предложить следующий алгоритм. Если даны два конечноопределенных автомата Л1(,й) и Л2(ЧЛ), то следует 1) переработать их задания в задания замкнутыми системами определяющих соотношений; 2) в двух полученных частичных автоматах для каждого состояния установить, удалимо оно или нет, и выбросить все удалимые состояния; 3) оставшиеся базы сравнить и выяснить, изоморфны они или нет. Если базы изоморфны, то и исходные автоматы изоморфны (в силу единственности свободного расширения). Если же базы неизоморфны, то и данные автоматы неизоморфны, так как если бы они были изоморфны, то и их базы должны были бы быть изоморфными (база состоит из неуда- лимых состояний, определение которых не зависит от способа задания автомата!). Заметим, наконец, что все три пункта 1) — 3) для решения проблемы изоморфизма алгоритмичиы — 1) в силу теоремы 19, а 2) и 3) в силу конечности рассматриваемых частичных автоматов. В заключение заметим, что из единственности базы в автомате и единственности свободного расширения вытекает Теорема 24. Группа автоморфизмов 2-го рода произвольного автомата с конечным числом образующих изоморфна группе автоморфизмов 2-го рода базы этого автомата. Таким образом, если дан конечноопределенный автомат, то легко усматривается алгоритм для составления таблицы Кэли группы его автоморфизмов (2-го рода). § 12. Заключение В заключение заметим, что большая часть результатов этой работы справедлива не только для автоматов, а для более широких классов алгебраических систем. Так, например, алгоритмы для решения проблем тождества, вхождения и изоморфизма почти дословно переносятся на алгебраические системы с пустым множеством тождественных соотношений. Более подробно автор собирается рассмотреть эти вопросы в одной из своих ближайших работ. Однако теорема 3 справедлива, по-видимому, лишь для автоматов. Интересно было бы рассмотреть алгоритмические задачи для стохастических автоматов. Здесь, однако, возникают трудности уже в самой постановке вопроса. Как задавать стохастические автоматы определяющими соотношениями? И можно ли это сделать? Нам представляется также интересным рассмотрение автоматов с тождественными соотношениями для входов. В первую очередь, по-видимому, следовало бы рассмотреть автоматы с коммутирующими входами, т. е. автоматы, в которых для любого состояния s и любых двух входов а и Ь выполняется условие sab = sba.
ТЕОРИЯ ОПРЕДЕЛЯЮЩИХ СООТНОШЕНИЙ ДЛЯ АВТОМАТОВ 69 ЛИТЕРАТУРА [1] Автоматы, ИЛ, 1956. [2] Трахтенброт Б. А., Алгоритмы и машинное решение задач, Физ- матгиз, 1960. [3] М у р Э. Ф., Умозрительные эксперименты с последователыюстными машинами, Сб. <(Автоматы», ИЛ, 1956, 179—210. [4] Медведев 10. Т., О классе событий, допускающих представление в конечном автомате, Сб. «Автоматы», ИЛ, 1956, 385—401. [5] Б и р к г о ф Г., Теория структур, ИЛ, 1952. [6J Мальцев А. П., К общей теории алгебраических систем, Матем. сб. 35 (77), 1, 1954, 3—20. [7] К о с с а П., Кибернетика, ИЛ, 1958. [8] Э ш б и У. Росс, Введение в кибернетику, ИЛ, 1959. [9] Марков А. А., Теория алгорифмов, Труды Математического института •им. В. А. Стеклова 42, 1954. [10] К у р о ш А. Г., Теория групп, Гостехиздат, 1953. [И] Evans Т., The words problem lor abstract algebras, J. London MalJi. Soc. 26, 1951, 637-649. [12] С о р к и ii IO. И., Алгоритмическая разрешимость проблемы изоморфизма для автоматов, ДАН СССР 137, 1961, 804—806. Поступили в редакцию первый вариант К) \ I 1960, окончательный вариант 23 XII 1961.
III. ТЕОРИЯ ИНФОРМАЦИИ И КОДИРОБАПИЕ О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» М. М. БОН ГАРД (МОСКВА) Теория информации появилась как теория передачи сообщений по каналам связи. Поэтому, естественно, она мало внимания уделяла вопросу ценности переданной информации для устройств, находящихся на приемном конце канала. Между тем имеется много вопросов, для решения которых количество переданных бит далеко не полностью характеризует информацию. Существует также подход, при котором ценность информации должна характеризоваться изменением трудности некоторой задачи (см., например, [1], [2], [3]). При этом возникает целый ряд осложнений, связанных, во-первых, с тем, что «трудность» задачи может быть различной для разных наблюдателей, и, во-вторых, с тем, что изменение трудности зависит не только от пришедшего сообщения, но и от того, как наблюдатель к этому сообщению относится. Мы говорим про сообщение: «я этому не верю», «я это знал и раньше», «не понимаю» и т. п. Без формализации «истолкования сообщения наблюдателем», очевидно, нельзя говорить о пользе сообщения. В настоящей работе будет рассматриваться система, которая для решения задачи ведет экспериментальную работу (метод проб и ошибок) и таким путем извлекает некоторые сведения, которых она вначале не имела. В качестве «трудности» задачи для этой системы принимается некоторая функция числа проб, необходимых для нахождения решения. Кроме того, система может получать сведения о задаче через канал связи. Следствием этого является изменение порядка проб, а значит, и трудности задачи. Этот подход был использован [4] при оценке «полезности» процесса обучения счетной машины для последующего узнавания некоторых объектов. За «трудность» задачи принималось просто среднее число проб, необходимых машине. В большей части настоящей работы в качестве меры трудности используется логарифм среднего числа проб. Это вызвано тем, что при такой оценке получаются наиболее простые соотношения между пропускной способностью канала связи (или емкостью памяти) и максимальным сокращением трудности, которое можно получить, используя этот канал (или память). Однако основные понятия введены, по существу, независимо от конкретной функции цены трудности и могут быть применены к довольно широкому классу функций цены. Одна из сторон этого вопроса рассматривается в § 8.
72 М. М. БОНГАРД § 1. Задача. Решающий алгоритм. Неопределенность Пусть А есть множество элементов а-. Имеется п подмножеств /;1562,..., Ъп множества А таких, что ^(J^U •••U^n =A. Пусть мы обладаем алгоритмом проверки утверждения: «а^£^»; назовем его W-алгоритмом. Нас будет интересовать, какие а;. каким bi принадлежат. Будем называть А — массовой задачей, а;- — частным случаем задачи А и Ък — ответом этой частной задачи, если а^£ bk. Будем считать, что имеется некоторый способ выбора элементов а} из множества А такой, что для каждого элемента существует вероятность р(а}) быть выбранным. В соответствии с этим будем говорить: «нам нужно решить задачу^.», если с вероятностью р{а±) нам придется решать частную задачу ах, с вероятностью р(а2) — задачу а2 и т. д. В дальнейшем мы рассматриваем следующий класс алгоритмов, которые называются решающими. Выбираем с помощью жребия с некоторым распределением вероятностен одно из множеств Ь{. Затем подставляем в ^-алгоритм решаемую частную задачу а;- и выбранное с помощью жребия Ь{. Если ответ — «истина», то задача решена, если — «ложь», то снова бросаем жребий, и т. д. При этом распределение вероятностей быть выбранными для разных bt может оставаться постоянным, а может изменяться от шага к шагу. Различные решающие алгоритмы отличаются друг от друга начальными распределениями вероятностей и законами их изменения. Если заданы частная задача а;- и решающий алгоритм, то число применений РУ-алгоритма (проб), приводящее к отысканию ответа, есть случайная величина К(а^). Назовем неопределенностью N(aj) частной задачи а;- для данного решающего алгоритма логарифм математического ожидания K(dj) числа проб, т. е. N(af) = \ogK(ai). (1) Неопределенностью задачи А для этого решающего алгоритма будем называть среднюю неопределенность частных задач а; N(A) = 2p(ai)N(a}) = 2p(ajnogK(aj). (2) ;' J § 2. Связь между неопределенностью и энтропией В §§ 2 —5 мы будем всюду рассматривать, не оговаривая этого каждый раз, такие задачи А, все частные задачи которых имеют только по одному ответу *) и решающие алгоритмы с постоянным распределением вероятностей выбора bt. Найдем неопределенность А в случае, если частная задача из А с вероятностью pt**) имеет ответ bv а решающий алгоритм пробует Ь{ п с вероятностью qt (где У; ^=1). i=i Если решается частная задача с ответом bi9 то среднее число проб равно i/qt***). Обозначим неопределенность в этом случае через N{(A). Тогда Nt(A)= -log q{. *) Это эквивалентно утверждению; что 6| П bk = Q при i Ф к. **) pi есть сумма вероятностей р (а;-) для всех частных задач, имеющих ответ Ъ{. ***) При этом мы используем то, что 6{ — единственный ответ. Ср. § 6.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 73 Вероятность этой ситуации равна ft. Следовательно, п N(A) = N(p/q) = -2 ftlogfc. (3) Легко показать (см., например, [2], [5]), что если pi фиксированы, то неопределенность задачи минимальна тогда, когда ql = pi. В этом случае неопределенность задачи равна энтропии распределения вероятностей ft, ft, ..., ft, ..., ftt, которую обозначим через Н (р). В общем случае N(p/q)>H(p). (4) Таким образом, если при построении решающего алгоритма мы знаем вероятности ft, то лучшее, что можно сделать, — это выбрать q{ — ft (лучшее в смысле минимизации неопределенности задачи для решающего алгоритма). ^ Допустим, имеется задача с распределением вероятностей ft, ft, . ..., рп. Мы же, по какой-то причине, полагаем, что распределение вероятностей ft, ft> ..., p'nj причем, вообще говоря, р\Фр{. Стремясь построить наилучший решающий алгоритм, мы сделаем qi = ft (i=l, 2, ..., п). Неопределенность при этом будет N(А) = N(р/р'). Мы видим, что выражение (3) можно рассматривать также как неопределенность задачи с распределением вероятностей ответа р для наблюдателя, исходящего из гипотезы, что это распределение равно q. Поэтому мы будем называть распределение вероятностей ^-гипотезой наблюдателя. С этой точки зрения энтропия Н(р) является частным случаем неопределенности. Энтропия— неопределенность для алгориша, знающего и полностью использующего распределение вероятностей ответов задачи. Естественно считать, что энтропия —это неопределенность, связанная с самой задачей, а величина N(plq) — H(p) характеризует степень «незнания задачи» данным решающим алгоритмом. Интуитивно очевидно, что, вообще говоря, незнание но своей природе может быть двоякого рода. Мы можем не все знать о задаче, и мы можем «знать» то, чего нет на самом деле (заблуждаться). Для того чтобы формально разделить эти случаи, рассмотрим ситуацию, когда при построении решающего алгоритма мы знаем не распределение вероятностей ру а лишь некоторые ограничения типа: /i(A> Р2> •••> Рл)>°> | (5) fk(Pl> />2> • ... Ра)>()' К системе ограничений, конечно, всегда добавляются соотношения А>0 и J А = 1. (5') Будем считать, что система ограничений такова, что существует, по крайней мере, одно распределение р> удовлетворяющее всем неравенствам. Введем следующие определения. Распределение вероятностей q° называется оптимальной гипотезой относительно ограничений (5), если тахр N (p/q°) < тахр N (p/q), (6)
74 M. М. БОНГАРД где тахр есть точная верхняя граница, взятая по всем распределениям р, удовлетворяющим ограничениям (5), a q — произвольная гипотеза. Назовем распределение вероятностей q гипотезой, содержащей только истину относительно ограничений (5), если m*xpN(p/q)<H(q). (7) Гипотезы, не удовлетворяющие соотношению (7), мы будем называть содержащими не только истину. Заметим, что для любой системы ограничений существует, по крайней мере, одна содержащая только ,1 истину гипотеза ^ = — (£ = 1, 2, ..., п). Действительно, в этом случае N(p/g) = logn = H(q). Назовем q° сильнейшей содержащей только истину гипотезой, если q° — гипотеза, содержащая^только истину, и имеет место соотношение ' H(qO)<H(q), (8) где (/ — произвольная, содержащая только истину гипотеза. Можно показать *), что множество всех гипотез, содержащих только истину, является замкнутым, и так как #(#)>0, то Н (q) достигает на этом множестве точной нижней границы, а следовательно, сильнейшая содержащая только истину гипотеза всегда существует. Для дальнейшего нам будет удобно обратиться к геометрической интерпретации понятий: «распределение вероятностей ответов задачи», «гипотеза», «энтропия» и «неопределенность». Рассмотрим случай п = 2. Благодаря связи qx -f- q2 = 1 многообразие всех возможных гипотез является одномерным. Будем изображать гипотезу точкой q на отрезке [0; 1] оси абсцисс (рис. 1). На этом же отрезке находятся точки р. Для отыскания неопределенности задачи, характеризуемой р\ при гипотезе q = t строим кривую y = H(q) и проводим прямую, касательную к ней в точке, соответствующей t. Касательная будет графиком функции y = N(p/t). В самом деле, N(p/t)= — рх log tx — p2 log t2 есть линейная функция от p. N(t/t) = H(t) и N(p'/t)>'H(p') при р' Ф t. Таким образом, y = N(p/t) должно быть прямой, имеющей с y = H(q) общую точку при p = t и лежащей выше y = H(q) при р ф t. Так как, кроме того, у = = Н (q) выпукла, непрерывна и имеет непрерывную производную всюду, кроме точек ^! = 0 и ^ = 1, то у = N {pit) — касательная к y = H{q). ') Для краткости доказательство мы не приводим.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 75 Пусть ограничения, наложенные на р, например, таковы, что р может находиться только на отрезке аЬ (рис. 2). Тогда из изображенных на рисунке гипотез гипотеза q содержит только истину относительно этих ограничений, а д1 и q2 — гипотезы, содержащие не только истину, так как mdiXpN(p/q1)>H(q1) и maxpN (p/q2) > H (q2). Очевидно, что в этом примере q° совпадает с точкой &. Оптимальная гипотеза q° также совпадает с Ь> так как тахр N (р/Ь) = Н (ft), а тахр N (p/q) > N (b/q) > H (6) при q фЬ. Если п произвольно, то р и q являются точками (п— 1)-мерного тетраэдра. Обозначим (/г — 1)-мерную гиперплоскость, содержащую этот тетраэдр, через К. Обозначим через L множество всех точек тетраэдра, удовлетворяющих ограничениям (5), а через L — замкнутое множество, содержащее L и его предельные точки. В этом случае y = H(q) есть Рис. 3. (п — 1 )-мериая выпуклая поверхность. Проведем (п — 1 )-мерную гиперплоскость, касательную к поверхности y = H(q) в точке, соответствующей q = t. Уравнение этой гиперплоскости y = N {pit). Посмотрим, какими свойствами она обладает. Образуем (п — 2)-мерное пересечение гиперплоскостей y = N(p/t) и у = Н (t) = const. Спроектируем полученное пересечение на К, эта проекция F также является (п— 2)-мерной плоскостью. Если p^F, то N(p/t) = H(t). F делит К на две части. Для точек р, находящихся по одну сторону F, имеет место соотношение N (p/t) < Н (£), для находящихся по другую сторону — соотношение N(P/t) > H(t). Точка h с координатами h{ = — (i=l, 2, ..., п) всегда попадает в область больших неопределенностей. Действительно, N(h/t)> >Н (h)> H(t). При t Ф h имеет место строгое неравенство. При t = h плоскость y-^N (pit) совпадает с у = Н (t) и/1 заполняет весь тетраэдр. Спроектируем теперь на К область, образованную пересечением поверхности у = II (q) и плоскости y = H(t). Обозначим эту проекцию через G. Очевидно, t£F, t£G и F касается G в точке t. Пересечение L и F обозначим через М. На рис. 3 изображена плоскость К для случая лг = 3. Для того чтобы узнать, является ли t гипотезой, содержащей только истину
76 М. М. БОНГАРД относительно ограничений (5) (или, что то же самое, относительно области L)y нужно провести через t поверхность постоянной энтропии G и построить касательную к ней в точке t гиперплоскость F. Если F отделяет L от /**), то t есть гипотеза, содержащая только истину**). Отсюда следствие: если область L такова, что не существует (п — 2) мерной гиперплоскости, отделяющей ее от hy то единственной содержащей только истину гипотезой является q=h. Пример такого случая показан на рис. 4. Рис. 4. Теорема. Для любой системы ограничений, наложенных на р, существует единственная оптимальная гипотеза q°. Оптимальная гипотеза q° совпадает г сильнейшей содержащей только истину гипотезой <у°. При этом maixpN(p/q«) = H(q0). Докажем сначала следуЕОщую лемму. Лемм а. Если q° — сильнейшая содержаишя только истину гипотеза, то найдутся такие точки ж1; т2;... mj . . .; т\ mj £ Л/, * ч п — I, и такие числа aj > 0, что ^ а'= \и ^ a]'mj = </°. Пусть В — выпуклая оболочка, натянутая на область L. Рассмотрим соотношение между В и поверхностью G, проходящей через q°. 1) принципе мыслимы четыре случая: 1) В и G пересекаются, 2) В и G не имеют общих точек, 3) В и G касаются, но не в точке q°9 4) В и С касаются в точке q°. Первый случай не может иметь места, так как при этом не существует гиперплоскость, отделяющая В (а значит, и L) от G. Реализация второго случая противоречила бы предположению, что q° есть сильнейшая содержащая только истину гипотеза. Действительно, мы могли бы построить другую поверхность С, охватывающую G и не пересекающуюся с В. На G' всегда найдется точка t такая, что гиперплоскость, касательная в этой точке к G' отделяет G' от В. Значит, t было бы гипотезой, содержащей только истину. Но Н (t) < Н (</°), что и доказывает противоречивость предположений. ^ Третий случай, как и первый, не совместим с предположением, что q° содержит только истину. В самом деле, G есть выпуклая поверхность, не имеющая плоских частей. Поэтому гиперплоскости, касательные к ней в двух разных точках, не могут совпадать. Так как В и G касаются, то единственная разделяющая их гиперплоскость касается G в этой же точке, а значит, касательная к G в точке </° гиперплоскость не отделяет В от G. Итак, остается только четвертая возможность. Это значит, что q° обязательно принадлежит В. Так как В есть выпуклая оболочка области L, то q° является центром тяжести нескольких точек т1, т2, . . . ..., т\ ..., ms области L, которым приписаны положительные веса. е) L можег иметь точки на F. ') При этом F отделяет L от G.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 77 Последнее утверждение и означает, что найдутся такие числа а3 и точки mj £ L, что s 2о' = 1, (9) i=i J aJ'mj = g°, (10) причем a>>0 (/=1, 2, ..., s). (11) Так как q° принадлежит гиперплоскости F, a L расположена по одну сторону от F, то mj£F и, следовательно, т3£М. Лемма доказана. Следствие. Если t = q°, то М не пусто. Отсюда max,, A' (p/q°) = H (q°). (12) Переходим к доказательству теоремы. Из формулы (10) следует: N (q°/q) = 2 a,jN (mj/q). (13) Учитывая (9) и (11), получаем: N Q°/Q) < шах> N {mjlq), где max;. есть максимум, взятый по s точкам mJ. Так как т} £ L, то N Cq°/q) < max„ N (p/q). (14) И случае q ф q° HQ°)<N(q°/q)> (15) Сопоставив (12), (15) и (14), получаем: mRxpN{p/q°) < mAxpN(p/q), (16) это и означает, что q° есть оптимальная гипотеза, и притом единственная. Следствия, а) Из соотношения (12) вытекает: mdiXpN{p/q0) = H(q0). (17) б) Из единственности оптимальной гипотезы следует единственность сильнейшей содержащей только истину гипотезы. в) Если область L такова, что не существует (п — 2)-мерной гиперплоскости, отделяющей ее от точки Ji, то оптимальней гипотезой является q° = h. Например, если на р не наложено никаких ограничений, кроме 2]р| = 1, то оптимальной будет гипотеза q\ = — . Следствие в) поясняет, в каком смысле целесообразно пользоваться распространенным приемом: «поскольку мы не имеем сведений о вероятностях некоторых событий, будем считать их равновероятными». Объясним теперь, почему гипотеза, удовлетворяющая соотношению (7), названа «содержащей только истину». Пусть неравенства (5) определяют некоторую область L (рис. 5, а), внутри которой в действительности может находиться р. Допустим, нам сообщили не все неравенства. Другими словами, нам сообщили «только истину, но не всю истину». Сообщенные нам ограничения определяют область //
78 М. М. БОНГЛРД Очевидно, U ZJ L. Если наша задача состоит в том, чтобы найти оптимальную гипотезу, то, при имеющихся в нашем распоряжении сведениях, мы выберем #0-гипотезу, оптимальную относительно области U. Относительно области L она не обязательно будет оптимальной, но всегда будет содержащей только истину. Рассмотрим другой случай. Нам сообщили некоторые сведения, определяющие область Z/ (рис. 5, б). Исходя из них, мы выбрали а) б) Рис. 5. оптимальную гипотезу q°. Если в действительности положение р ограничено не областью Z/, a L, то это значит, что нам сообщили ложные ограничения на положение р. И действительно, в случае, изображенном на рис. 5, б, q° содержит не только истину относительно области L. Таким образом: 1) если при построении оптимальной гипотезы мы пользовались истиной (но не обязательно всей), то получим гипотезу, содержащую только истину; 2) если при построении оптимальной гипотезы мы получили гипотезу, содержащую не только истину, то значит сведения, которыми мы пользовались, содержали ложные ограничения! области, где может находиться р. Разумеется, обратные соотношения не имеют места. Например, ложные ограничения могут и не привести к гипотезе, содержащей не только истину. Такой случай приведен на рис. 6. Очевидно, здесь дело в том, что не все свойства области L существенны для построения оптимальной гипотезы. Ложные сведения коснулись именно этих несущественных для нашей задачи свойств. Равенство (17) говорит о том, что если мы пользуемся гипотезой, оптимальной при реально существующих ограничениях, то максимум возможной неопределенности равен энтропии гипотезы. Этим, по существу, определяются границы применимости энтропии как меры неопределенности. В общем случае, когда гипотеза может быть неоптимальной, неопределенность не выражается через энтропии распределении р или г/. * Не следует думать, что для введения понятия «неопределенность» обязательно нужно рассматривать решающий алгоритм, использующий случайный процесс («жребий»). Пусть мы обладаем ТУ-алгоритмом. дающим возможность про любое подмножество множества А сказать, при- 71 надлежит ли ему а,. Припишем каждому Ь{ вес qif 2 £i = l- Сгруппи-
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 79 руем все bi в два подмножества так, чтобы сумма весов biy вошедших в каждое подмножество, была по возможности близка к 1/2. С помощью ^'-алгоритма выясняем, в какой половине находится ответ. Разбиваем это подмножество на две части с суммами весов ^1/4 и т. д., пока не дойдем до подмножества, содержащего лишь одно bt. Если ответом является Ьк, которому мы приписали вес qk, то нам понадобится ^ — log2 qk проверок с помощью ^'-алгоритма. Отсюда, если ответ имеет распределение вероятностей р, а мы приписали bi вес qif то среднее число применений Р^'-алго- 71 ритма будет ^ — 2 Pi l°g2 qt. i=t Все соотношения в предыдущем абзаце приблизительны из-за невозможности при произвольных qt создавать подмножества с суммарным весом, в точности равным \/2к. Именно поэтому для основного определения «неопределенности» мы воспользовались И7-алгоритмом, хотя ^'-алгоритм и имеет преимущество более «естественной» платы за применение. § 3. Декодирование сигнала. Полезная информация Рассмотрим систему, состоящую из решающего алгоритма, канала связи и алгоритма, -соединяющего выходной конец канала с решающим алгоритмом. Этот дополнительный алгоритм мы будем называть декодирующим. Каждому значению приходящего сигнала и распределению вероятностей q декодирующий алгоритм ставит в соответствие некоторое новое распределение q' и заменяет в решающем алгоритме qi на q\*). Таким образом, пришедшее сообщение изменяет неопределенность задачи. Пусть до прихода сообщения задача имела для данного решающего алгоритма неопределенность N0, а после прихода сообщения 7V\. Мы будем говорить, что по каналу передана полезная информация /п = #,>-#!. (18) Из определения следует, что не имеет смысла говорить о полезной информации, содержащейся в сигнале, если не указаны: задача, которая решается, начальное состояние решающего алгоритма и свойства декодирующего алгоритма. Учитывая сказанное в предыдущем параграфе, в случаях, когда до прихода сообщения на распределение р не наложено никаких ограничений (кроме вытекающих из самого смысла р), мы будем считать, что 1 решающий алгоритм пользуется гипотезой qt = — (i = 1, 2, . .., п), и от этого уровня отсчитывать полезную информацию. Изменение неопределенности задачи под влиянием пришедшего сигнала можно интерпретировать как процесс запасания полезной информации в виде распределения вероятностей q. Если за нулевой уровень принять запас информации при qt = — (i = 1, 2, .. ., п), то запас полезной информации, содержащийся в гипотезе q относительно задачи с распределением вероятностей ответа р, дается соотношением In=^\ogn — N (plq). Точность, с которой можно вычислить /п, зависит, в частности, от гочности, с которой известны qt. Однако сама величина 1П не зависит *) В терминах теории игр декодирующий алгоритм —это стратегия, являющаяся функцией приходящего сигнала.
80 M. М. БОНГАРД от точности qi. Этим «полезная информация» отличается от «просто информации» /, которая может храниться в коде набора qv . . . , qn. Действительно, / определяется логарифмом числа возможных различных состояний набора qit . . . , qn, т. е. прямо связана с точностью, с которой могут быть измерены qi. Разумеется, /п</. В самом деле, даже если каждая вероятность qt может принимать только два значения, то число R различных наборов q не меньше п*). Так как /n<log/2, получаем: /n<log /2<log/? = /. Приведем пример, иллюстрирующий определения. Некто А хочет застать в учреждении, открытом с 10 до 18 часов, сотрудника JS, о котором известно, что он бывает там по два часа ежедневно. Желая уточнить эти сведения, А обратился к знакомому, работающему в том же учреждении. Знакомый ответил, что В бывает на работе после 14 часов в 2 раза чаще, чем до 14. После этого А позвонил секретарю в учреждение. В ответ на свой вопрос он услышал: «... на будущий месяц расписание еще не составлено, но товарищ В всегда принимает 5 раз в неделю с 12 до 14 и 1 раз с 14 до 16. Ой, простите, я ошиблась. Один раз в неделю с 12 до 14 и 5 раз с 14 до 16». Последний ответ соответствовал действительности. Какую полезную информацию получил по интересующему его вопросу А: 1) из ответа знакомого? 2) из ответа секретаря? 3) получил бы из ответа секретаря, если бы она не исправила ошибки? Для удобства все вероятности сведены в таблицу 1. Таблица 1 Начальная гипотеза . . Гипотеза после сообщения знакомого Гипотеза после ответа секретаря Гипотеза после ошибочного отпета секретаря . . Истинное распределение вероятностей 10-12 1 4 1 6 0 0 (.) 12-14 1 4 1 "6 1 5 ~6~ 1 В 14-16 1 4 1 3 А 6 1 о Г) 16-18 1 т 1 3 0 0 0 *) Может показаться, что этих значений не меньше чем 2п, однако связь V qi= 1 •сильно уменьшает число возможных векторов. Например, если qi может быть только 1 или 0, то имеется лишь п разных векторов: 1, 0, 0, ..., 0; 0, 1, 0, ..., 0; ...; 0, 0, 0, ..., 0, 1.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 81 Будем выражать неопределенность и полезную информацию в битах. Начальная неопределенность: ^е= -4"log2T""'6"log»T==loga4 = 2- Неопределенность после ответа знакомого: Неопределенность после ответа секретаря: N2= —g-log2-^--g-log2-g-^0,65. Если бы секретарь не исправила ошибки, была бы неопределенность: Л^з= --^log24""Tlog2~6"^2'20- Таким образом, полезная информация, полученная от знакомого: Ответ секретаря содержал полезную информацию: Если бы тот же самый разговор с секретарем произошел до ответа знакомого, то он содержал бы 7V0 —7V2= 1,35 бита полезной информации. Ошибочный же ответ нес полезную информацию /Пз — ^1 — ^з^ ^ —0,45. Другими словами, ошибочный ответ содержал 0,45 бита дезинформации. При рассмотрении этого примера мы молчаливо подразумевали, что алгоритм декодирования сообщения сводится к переносу сообщенных вероятностей прямо в решающий алгоритм («полное доверие»). Разумеется, при другом декодирующем алгоритме полезная информация, содержащаяся в рассмотренных сообщениях, была бы другой. Например, со стороны А было бы естественно, получив ошибочное сообщение секретаря, резко противоречащее сообщению знакомого, не поверить ему, а верному сообщению поверить не полностью, во-первых, из-за некоторого расхождения с сообщением знакомого, во-вторых, из-за предварительной ошибки секретаря. Следует отметить, что величина полезной информации зависит также от кода, которым передается сообщение. «Те же» сообщения могли быть иначе закодированы, например произнесены на незнакомом А языке. В этом случае декодирующее устройство вообще не перераспределило бы q{ в решающем алгоритме (А не понял бы даже, что сигнал имеет отношение к интересующему его вопросу). Полезная информация была бы равна нулю. Во всех руководствах по теории информации настойчиво подчеркивается, что если в сообщении, закодированном с помощью двузначного алфавита, заменить «нули» на «единицы» и обратно, то количество информации не изменится. К полезной информации это, естественно, не относится. § 4. Пропускная способность канала связи для полезной информации. Запас полезной информации в декодирующем алгоритме Рассмотрим теперь соотношение между запасом полезной информации в решающем алгоритме (после прихода сообщения) и пропускной способностью канала связи. Можно было бы ожидать, что прирост полезной информации не может быть больше информации, переданной по каналу. 6 Проблемы кибернетики вып. 9
82 М. М. БОНГАРД Однако это не так. Существуют системы, для которых полезная информация, поступившая в решающий алгоритм, может быть много больше логарифма числа сигналов, различимых системой. Прежде чем привести пример системы, обладающей таким свойством, уточним, что мы называем «неразличимыми сигналами». Два сигнала Сг и С2 называются неразличимыми для системы, если после прихода как С1? так и С2 система перейдет в одно и то же состояние, иначе говоря, решающий алгоритм будет пользоваться одной и той же гипотезой q[, q'2,..., q'n. Задавшись определенной точностью измерения q{, мы можем про любые два сигнала сказать, различимы они или нет. Очевидно, что реальная система может иметь лишь конечное число состояний. Пусть число различных наборов qx, ..., qn равно t. Разобьем множество всех сигналов на классы С,, С2, ..., Ст неразличимых между собой сигналов. Очевидно, m< t *). Заметим, что при таком подходе нам не нужно рассматривать последовательности сигналов, учитывать их длину, число символов и т. д. Всякий сигнал принадлежит какому-то Cfe, поэтому любая последовательность сигналов (декодируемая один раз, как единый сигнал) неотличима от одного из сигналов нашего набора. Таким образом, совокупность канала связи и декодирующего устройства имеет ограниченную пропускную способность не в единицу времени и не на символ, а на сообщение в целом. Свойства декодирующего устройства при фиксированном начальном распределении q исчерпываются разбиением сигналов на классы и таблицей 2, определяющей распределение q[ после прихода сигнала из класса C/t. Таблица 2 С, я[ <?2 <h < du d2. di, dn l i l l rfi.» • ^2, 2 • d-i. 2 • dn,2 • •• dltk . • • ^2, k • •• di,k • • dn, k • .. db .. d2, -. dit • • dn m m m m Здесь di,^, d2,ft, . . ., dn, ^—значения q[, q'„ . . ., q'n после прихода сигнала n из класса Ckl поэтому diik>0 и ^ di}k = 1 **). Всякую таблицу, состав- 2=1 ленную из ditk> обладающую такими свойствами, можно считать декодирующим устройством. Вернемся к соотношению между разнообразием различимых сигналов и запасом полезной информации в решающем алгоритме после прихода сообщения. Рассмотрим пример. В 1943 г. во французский город с населением около 50 000 человек был послан из Англии человек для связи с движением Сопротивления. Перед отъездом он получил запечатанный пакет и следующую инструк- *) Сигналы, неразличимые для системы, находящейся в одном состоянии, могут оказаться различимыми для системы, находящейся в другом состоянии. Однако нам в дальнейшем достаточно рассматривать лишь классы сигналов, не различимых системой, находящейся в данном состоянии. **) Кроме того, любые два столбца различны.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 83 цию: «Постарайтесь сами найти людей, через которых можно связаться с партизанами. Если это не удастся, то можете запросить меня шифровкой по радио. Если я отвечу словом «вперед», то вскройте пакет — в нем адрес надежного человека. Ни в коем случае не вскрывайте пакета до получения сигнала «вперед», так как явка может быть открыта немцами. Никаким другим указаниям и советам по радио не верьте, ибо я не вполне уверен в некоторых своих сотрудниках». Каково в данной ситуации разнообразие различимых сигналов и какую полезную информацию содержит сигнал «вперед»? Инструкция разбила множество сообщений на два класса. Первый содержит единственный элемент — сигнал «внеред». После прихода этого сигнала вероятности обращения ко всем жителям города, кроме одного (указанного в пакете), становятся равными нулю, а вероятность обращения к этому человеку становится единицей. Второй класс содержит все остальные сигналы. Каждый из них не изменяет вероятностей обращения к различным людям, а следовательно, сигналы, входящие во второй класс, неразличимы между собой. Итак, набор различимых сигналов содержит только два сигнала. В то же время запас полезной информации в решающем алгоритме после сигнала «вперед» увеличивается гораздо больше, чем на один бит. Действительно, неопределенность после сигнала — нуль, а до сигнала ^10— 12 бит (учитывая, что не надо проверять детей и что пригодных людей, вероятно, несколько). При этом существенно то, что большая полезная информация, содержащаяся в сигнале «вперед», никак не связана с величиной априорной вероятности получения этого сигнала. В частности, полезная информация не уменьшается при увеличении вероятности получить сигнал «вперед». Интуитивно ясно, что несоответствие полезной информации, содержащейся в сигнале, и разнообразия различимых сигналов объясняется тем, что система еще до прихода сигнала обладала запасом полезной информации в декодирующем алгоритме (пакет!). Пришедший сигнал перевел эту информацию из «скрытого» состояния в распределение q решающего алгоритма. В таком виде информация уже проявляется при решении задачи. Дадим теперь формальное определение запаса полезной информации в декодирующем устройстве (мы будем его также называть скрытой информацией). Обратимся к таблице 2, характеризующей декодирующий алгоритм. Пусть 771 Di=±'2di.h. (19) т h=i Тогда скрытой информацией мы будем называть: /c„p = log#i-tf(i>/I>). (20) В случае /скр = 0 мы будем говорить о системе без скрытой информации (относительно данной задачи) *). Рассмотрим соотношение между скрытой информацией, пропускной способностью канала связи и запасом полезной информации, который может быть создан в решающем алгоритме в результате декодирования сигнала. *) Достаточным условием отсутствия в системе скрытой информации явля 1 равенство между собой всех сумм по строкам таблицы 2. При этом В^ — - и /скр относительно любой задачи. 6*
84 М. М. БОНГАРД Пусть в результате посылки некоторого сообщения 0 на приемном конце канала связи с вероятностью Рг появляется сигнал Cl9 с вероятностью i^ —сигнал С2 и т. д.*). Неопределенность, которую после прихода такого сообщения будет в среднем иметь задача А с распределением вероятностей ответов р, определяется следующим образом: тп п N(A)=-^Ph^lPilogdi,k. (21) fc=l i=l Преобразуем (21): п m n m ЛГ(4)=-2 A2^1°g*>h=-Sft2**(lo^, + logm + log^). i=l fe=l i=l fc=l n m Так как 2 ft = 1 и 2 Pft == 1, то г=1 * = 1 n m ^U)=-logm-2Pi(log^ + 2 ^l0^)- (22) i=l ft=l m Из соотношения (19) следует 2 ~^zT = 1- Учитывая это и соотноше- /i=i ние (4), оценим снизу выражение — 2 ^fcl°£~^b" /г=1 тп тп - 2 Л 1о£5d7 > - 2 ^1ог^ = я (*>• (23) h=i fc=l Через #(Р) мы обозначили энтропию распределения вероятностей «разброса» приходящих сигналов Ch при условии посылки сообщения 0 (но не вероятностей посылки разных сообщений!). Теперь мы можем оценить снизу неопределенность. Учитывая (22) и (23), получиАм: N(A)>-logm-%pi[logDi-H(I>)] = H(I>)-logm + N(p/D), (24) i=i или, принимая во внимание (20), N(A)>H (Р) - log т + log п - /скр. (25) Соотношение (25) можно записать так: \ogn-N (A) <[logm-H {!>)] +1СКР. (26) В левой части неравенства (26) стоит запас полезной информации в решающем алгоритме**) после прихода сообщения. В квадратных скобках—пропускная способность канала на одно сообщение. Таким образом, если учитывать скрытую информацию, то увеличение полезной информации не будет парадоксальным. *) Нас сейчас не интересует причина «разброса» приходящих сигналов. Это может быть влияние помех, закона работы кодирующего сигнала алгоритма и т. п. **) Можно также говорить, что это —полезная информация, содержащаяся в сигнале для наблюдателя, «ничего не знающего» о задаче.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 85 Формула (26) накладывает ограничения на запас полезной информации в решающем алгоритме, а не на ее прирост*) после прихода сообщения. Поэтому если канал имеет небольшую пропускную способность на одно сообщение, а мы хотим накопить в системе большой запас полезной информации путем посылки серии сообщений, то сделать это можно лишь путем запасания информации в декодирующем алгоритме. Этот процесс заключается в том, что после декодирования сообщения новому распределению q' соответствует новый декодирующий алгоритм с новым запасом скрытой информации. На следующем шаге скрытая информация снова повлияет на q", что опять изменит скрытую информацию, и т. д. Возникает вопрос: почему мы определили полезную информацию, заключенную в сигнале, как изменение неопределенности задачи? Не лучше ли было отделить полезную информацию, перешедшую в решающий алгоритм из декодирующего устройства, от полезной информации, пришедшей по каналу связи, и лишь последнюю считать полезной информацией, заключенной в сигнале? Для ответа на этот вопрос обратим внимание на некоторую непоследовательность, проявленную при определении понятия «скрытая информация». До этого момента мы все время говорили о свойствах индивидуального сигнала. Изменение неопределенности задачи зависит от данного сигнала (и состояния системы) и вовсе не зависит от того, какие еще сигналы могли бы прийти. При определении же скрытой информации мы явно использовали некоторое среднее свойство совокупности возможных сигналов. Формулу (20) можно интерпретировать так: перережем линию связи и с помощью жребия будем на приемном конце генерировать сигналы Ck. После каждого сигнала замеряем qf и возвращаем систему в прежнее состояние. После многих опытов находим средние q[. Для решения задачи пользуемся этими средними q[. Если такой «средний сигнал» сделал неопределенность отличной от log n, мы говорим о наличии в системе скрытой информации. Теперь видно, что формулы (19) и (20) в совокупности являются определением скрытой информации в некотором частном случае — если считать равновероятными приходы всех различимых сигналов. При другой гипотезе о вероятностях прихода Ch мы должны приписать той же системе другой запас скрытой информации. Оценим конечную неопределенность задачи в случае произвольной гипотезы о вероятностях прихода сигналов Ck. Формула (20) в этом случае сохраняет свою силу, а формула (19) переходит в формулу т 0i=2OA,fc, (27) где Qh — ожидаемая вероятность прихода Ck. т п п т N(A) = - 2 Рк 2 Pi log*, h = - 2 А 2 Рк (log D, - \ogQh + k=i i=l i=l /i=l И Т) п т и 77 + log-^^ = N(p/D)-N(P/Q)-2 Pi 2 i>ftlog-^p.. (28) Принимая во внимание (28), (27), (20) и (4), можем написать: N(A)>H(JP)-N(JP/Q) + \ogn-ICKD, *) Уменьшение неопределенности может быть очень большим, если начальная неопределенность была больше log п. В этом нет ничего неожиданного, так как уменьшения неопределенности до log n всегда можно достигнуть путем увеличения энтропии распределения q-x, а следовательно, без прихода информации извне.
86 M. М. БОНГАРД или loSn-N(A)<[N(I>/Q)-H(I>)] + ICKp. (29) Нам кажется целесообразным считать выражение, стоящее в квадратных скобках, средней пропускной способностью канала при распределении вероятностей прихода сигналов Р и гипотезе о распределении этих вероятностей Q. При изменении распределения Q изменяется пропускная способность канала, но одновременно изменяется и /скр. Поэтому деление полезной информации, приобретенной решающим алгоритмом, на информацию, пришедшую по каналу связи, и информацию, извлеченную из декодирующего устройства, зависит от исходной гипотезы о вероятностях сигналов. Изменение же неопределенности задачи от этой гипотезы не зависит и полностью определяется данным единичным сообщением. Поэтому мы и определили полезную информацию, содержащуюся в данном сигнале, через изменение неопределенности задачи. Обратим внимание на выражение, стоящее в квадратных скобках в формуле (29). Оно характеризует степень «неожиданности» приходящих сигналов. Если Qk = Pk, то в среднем мы из приходящего сигнала ничего извлечь не можем (мы могли бы сами его генерировать на приемном конце канала с помощью подходящего по распределению вероятностей случайного процесса), а используем лишь скрытую информацию. § 5. Построение декодирующих алгоритмов Формула (29) ограничивает сверху возможности декодирующих алгоритмов. В частности, любое устройство, не обладающее относительно ожидаемого распределения вероятностей сигналов Qk запасом скрытой информации, в среднем даст результат \ogln-N(A)<N(P/Q)-H(P). (30) Покажем теперь, что если -^г^->1 для всех /с, (31) ■* k то для задачи с распределением вероятностей ответов р всегда можно построить декодирующий алгоритм, не имеющий скрытой информации и дающий в среднем после посылки сообщения 6 с распределением вероятностей сигналов Р запас полезной информации в решающем алгоритме \ogn-N(A)>N(P/Q)-H(P)-H(p). Построим таблицу di% ъ. следующим образом: ^~~Ж~+ ..<»-l)Qk ' (32) Покажем, что эта таблица определяет некоторый декодирующий алгоритм, не имеющий скрытой информации относительно распределения вероятностей сигналов Qk. Действительно, dbh>0, так как в силу (31) (i-Pi)(nQk-Pkj>^ (33) n(n — l)Qk
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 87 Кроме того, несложными преобразованиями можно убедиться, что п т V djjfe=l, а 2 Qkdi,k— — . Последнее соотношение является доста- ?=i fc=i точным условием отсутствия в системе скрытой информации (см. сноску на стр. 83). Вопрос о том, будут ли все столбцы различными, мы не ставим, так как не стремимся к тому, чтобы система различала все сигналы Ск. Оценим среднюю неопределенность задачи после декодирования сообщения построенным алгоритмом: т п М(А)=-%Рк% Pi\ogdbh = m n L nQb n(n—l)Qk J k=i i=l VR v / ч:я Учитывая соотношение (33), можно написать: т п откуда окончательно получаем: \agn-N(A)>N(I>/Q)-H(I>)-H(p). (34) В случае Н(р) = 0 формула (34) переходит в logrt-tf(4)>tf(P/Q)-#(:P). (35) Сравнивая формулы (35) и (30), мы видим, что в случае Н (р) = 0 указанный способ построения декодирующего алгоритма дает наилучший возможный (для алгоритма без скрытой информации) результат: log п - N (А) = N (P/Q) -H(JP). В общем случае мы не знаем, является ли этот способ оптимальным. Гарантируется лишь, что если Н (р) > 0, то в формуле (34) имеет место строгое неравенство. Легко показать, что построить декодирующий алгоритм указанным способом удается только при соблюдении условия (31). Смысл его в том, что сигналы, приходящие в действительности часто, нельзя считать очень мало вероятными. * ■* * I Пусть теперь имеется г задач А1У А2> • . ., Alt . . ., АТ и вероятности ответов задач задаются матрицей || pi, i || (см. таблицу 3). Таблица 3 &1 bi Ьп А Pl,l Pi, 1 Рп, 1 А2 . Pi, 2 •• Pi, 2 • Рп, 2 • .. At . • Pi, I • • Pi, I • • • Pn, I • .. Ar •• Pi, r • • Pi, r • • Pn, r
88 М. М. БОНГАРД О необходимости решать задачу Ах нас извещают путем посылки сообщения 64. Вероятности прихода сигналов Ch после посылки различных сообщений определяются матрицей ||Pi/t|| (см. таблицу 4). Bi в| ег Сх Л.1 Pi,\ Pr.l с2 . Риг ■ Pi,г ■ Pr,t ■ Таблица 4 Ch • ■ ■ Cm ■ ■ Pi, k ■ • ■ P\, m ■■ Pl,k •■■ Pl,m ■ • Pr, k • • • Pr, m Очевидно, 2 a, i = 1 и 2 Ptt k - 1. Пусть все сигналы декодируются одним и тем же алгоритмом с матрицей ||di|ft|| (см. таблицу 2). Обозначим через N (А) среднюю неопределенность задачи после посылки сообщения. Если задача А{ встречается с вероятностью Вх, г причем 2 /?j = 1, то положим: N(A)=-%Rl?,Pi,h'E Pi,ibgdith. l = i h=[ 1 = 1 (36) Введем обозначения: Легко показать, что рк= зад,*. 1=1 Pi= 2 RiPi.i. l=i m Ъ= 2ЛА* i=l n i=l it i VI -у RlPl.kPi.l _ I (37) (38) (39) (40) (41) (42) (43) i=i 1=1
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 89 Для оценки снизу средней неопределенности преобразуем (36): г т п _ N(A)=-% Л, ^ Л,* 2 ^(log^-log^ + log^- / = 1 k=i i = { г т г п = 2 Ri^Pi.klogPbS Д,2 А,,1о8^- 2=1 k=i 1=1 i=l г п тп _ -2 д,2 ^.«2 Pi,kiog^±=-H(¥)+N(p/d)- r n m [ '•, /=1 t=l fc=l г Учитывая (39) и[ (4), получаем: N(J)>NXp/d)-H(P) + H(P), (44) r m где #(P) = — 2-^1 2 Л fel°g^i й есть средняя энтропия распределе- ния вероятностей сигналов Ch в сообщениях 6£. Из (44) следует также N (А)> Н (р)- Н (Р) + И(Р). (45) Посмотрим, как должна быть построена матрица декодирующего алгоритма, если мы хотим получить минимум средней неопределенности задачи после декодирования сигналов. Запишем (36) в виде т п г лч^)=-2М2(2 ^у^'О1^*]- k=i i=l Z=l fe n Принимая во внимание (43) и то, что 2 ^i, ft =1, мы видим, что выра- 2=1 жение в квадратных скобках, а с ним и средняя неопределенность минимальны при <^= 2 *'%»"''■ (46) 1=1 h Легко убедиться, что при построении матрицы dit h по формуле (46) имеет место равенство d{ = p{. Это значит, что оптимальный декодирующий алгоритм обладает максимально возможной скрытой информацией относительно «средней задачи» (среднего распределения вероятностей ответов для всех задач). Оценим среднюю неопределенность задачи после применения оптимального декодирующего алгоритма. Так как di,h> = '
90 М. М. БОНГАРД ТО 171 П 1 = 1 k=l i=l Ук = Я(Й) + Я(Р)-Я(Р)-2Д. Sft.«bgA,,. /=1 2=1 т. е. N(A)<H(R) + H(P)-H(P) + H(p), (47) где я(л)= - 2 д,зА,,logА>1. Z=l 2=1 Формула (47) оценивает неопределенность после декодирования сигнала оптимальным способом. Представим себе теперь, что декодирующий алгоритм конструирует наблюдатель, исходящий из гипотез: а) вероятность появления 1-й задачи равна St; б) вероятности ответов разных задач соответствуют матрице qi} t; в) вероятности прихода сигналов Ск после посылки различных сообщений определяются матрицей |K?i>ft||. Введем обозначения, аналогичные (37), (38) и (39): &=2ед,к, (48) i=i 9i=2 5l9i>l, (49) 1=1 т й=2&А,к. (5°) h=l Стремясь получить наилучший результат, наш наблюдатель, естественно, выберет diifc=2 SlQl-kqui . (51) Средняя неопределенность задачи после такого декодирования будет: N(A)='ZRl S^.kSPi.ilog<«,fc. (52) 1=1 k=l i=l С помощью подстановки, аналогичной той, которая применялась при выводе формулы (44), легко получить: N (A)>N (pfa')-N (P/Q) + H(P). (53) Из (51) следует d\^qv поэтому N(p/q)~N(A)<N(P/Q)~H(I>). (54) Посмотрим теперь, чему равна средняя начальная неопределенность Nq(A) задач для нашего наблюдателя. Допустим, что до прихода
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 91 сигналов он пользуется решающим алгоритмом с распределением вероятностей х\ тогда NU{A)=-Y Д,2 fr^logx^Nip/x). (55) /=1 2=1 Начальная неопределенность достигает минимума при xi = р{у поэтому наблюдатель положит xi — qi. Итак, средняя начальная неопределенность при данной гипотезе определяется формулой N0(A) = N(p/tf. (56) Сопоставляя с (54), получаем: N0(A)~N(A)<N(P/Q)-H(P). (57) В левой части неравенства (57) стоит средняя полезная информация, пришедшая по каналу связи, поэтому правую часть естественно считать пропускной способностью канала связи для полезной информации при решении нескольких задач. Для наблюдателя, все знающего правильно о задачах и о канале связи (Sl=Rl; #i, i =<Рг, f> Qi, k^Pi,k)> получается обычная граница #(Р) — H(JP). Декодируя сигнал оптимальным со своей точки зрения способом, наблюдатель всегда может получить результат N(A)<N(R/S) + N(p/q) + N(P/Q)-N(P/Q), (58) где черта над функцией всюду указывает на усреднение по разным задачам (по I) с распределением вероятностей R (реальным, а не гипотетическим). Формула (58) выводится аналогично формуле (47). При выводе формул (56) и (57) мы считали, что начальное состояние решающего алгоритма (распределение q{ до прихода сообщения) не произвольно, а определяется гипотезой наблюдателя об относительной частоте разных задач A L и о распределении вероятностей их ответов (Si и ди ,)• Если бы мы так же поступили при выводе формулы (29), то оказалось бы, что «последовательный наблюдатель», исходящий из гипотезы о распределении вероятностей сигналов Q и разумности своего декодирующего устройства, должен перевести решающий алгоритм до прихода сообщения в состояние qi = Di. Мы получили бы формулу N (p/D) - N (А)< N (P/Q)- H (JP). (57') В левой части неравенства (57') стоит прирост полезной информации (для «последовательного наблюдателя»). При таком подходе нет необходимости вводить понятие «скрытая информация», и прирост полезной информации не превышает пропускной способности канала. Однако эт© достигается ценой уменьшения степеней свободы гипотез, которыми может пользоваться наблюдатель. По-видимому, оба подхода являются равноправными. § 6. Частные задачи с несколькими решениями В этом параграфе мы снимаем одно из ограничений, введенных в § 2, и рассматриваем частные задачи, имеющие не менее одного реше- п ния. Это значит, что 2 Р%>^- Неопределенностью задачи А мы по-прежнему будем называть математическое ожидание log/f, где К—среднее число проб, необходимых
92 M. M. БОНГАРД для нахождения какого-нибудь одного (а не всех!) решения частной задачи а-. Теперь формула (3) уже не дает возможности по вероятностям pi и qi найти неопределенность задачи. Проиллюстрируем это примером. Пусть все dj имеют по s ответов. При равномерном распределении вероятностей р{ = — , £=1, 2, .. ., п. Пусть решающий алгоритм поль- зуется распределением вероятностей q{ =—, i = l, 2, ...,дг. Как легко сообразить, среднее число проб для этого алгоритма будет n/s, откуда N (А) = log (n/s). Если же подставить р{ и qi в формулу (3), то получится slog и. В общем случае формула для неопределенности имеет вид -N(A)=^iri\ogqi+^}rijklog(qi + qk)+^} riikt llog(qi + qk + ql)+... i i, k i, k, I n-1 ...+ 2 ri>k^.,)7nlog(qi + qk+...+qm)1 (59) i, k, ...,m где ^ — вероятность того, что выбирается частная задача, которая имеет решение bv причем оно является единственным решением задачи, rit k — вероятность того, что Ь{ и bk одновременно являются решениями и других решений нет, и т. д. Смысл qi остается прежним, в частности п 2 Qi = 1- Суммы в (59) берутся при I ф к; i ф 1\ . . .; i ф т\ кФ /; ... Для п=2 N (А) = - (1 - р2) log q± - (1 - Pl) log q2. Неопределенность в этом случае достигает минимума при qx — -—~~Ръ ; z—рх—j>2 q2 = —— . Если энтропию задачи считать по определению равной I — /?!—р2 минимуму неопределенности, то при п — 2 и р1-\-р2^>1 H(p) = (2-p1-Pt)log(2-p1-pt)-(l-Pl)log(l-p1)- -(l-p2)log(l-A). (60) Таким образом, можно получить некоторое обобщение понятия энтропии, не имевшей определения для случая 2р{>1. § 7. Системы с обратной связью Теперь мы снимем второе ограничение, введенное в § 2 и заключающееся в стабильности q{ в процессе решения задачи. Решающие алгоритмы, которые рассматривались до сих пор, «ничего не помнили». После того как применение И'-алгоритма показало, что, например, Ъх не является ответом, решающий алгоритм продолжал бросать жребий со старым распределением вероятностей д, хотя уже стало известно, что qx можно сделать равным нулю. Этот недостаток можно устранить, например, следующим образом: соединим ^-алгоритм со входом декодирующего устройства. Пусть в случае неудачной пробы по цепи обратной связи посылается сигнал «не bk». Получив такое сообщение, декодирующее устройство делает д^ = 0, а остальные вероятности нормирует к единице. Теперь после каждой неудачной пробы неопределенность задачи уменьшается. Система с обратной связью пользуется на каждом следующем шаге ноеой (уточненной в результате эксперимента) гипотезой. Поэтому в общем случае формулы,
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 93 выражающие неопределенность, для систем с обратной связью получаются очень громоздкими. В частном случае, если решающий алгоритм использует на первом 1 1 шаге q\ = — , на втором шаге q\ — ——— для всех i, кроме одного, п отвергнутого первым опытом и т. д., неопределенность при 2р$=1 i=l имеет вид*) N(A) = \og^. Если частные задачи имеют s ответов, то неопределенность задачи для рассматриваемого алгоритма равна log ' , а сокращение неопре- s-\-1 деленности по сравнению с системой без обратной связи равно AyVH)=log^-log^±l = log(1^r.s4-1)<10g2- При увеличении s (разумеется, всегда s < я) выигрыш стремится к нулю. Причина этого понятна; при большом s ответ в среднем бывает уже найден, когда «перепробована» лишь малая часть всех Ь{. До самого конца процесса решения неопределенность задачи не успевает заметно измениться, и средняя неопределенность мало отличается от начальной. Рассмотренная примитивная обратная связь, сводящаяся к выкидыванию проверенных bk> уменьшает неопределенность задачи для алгоритмов с равномерным распределением вероятностей гипотезы не более чем на log 2. Однако для гипотез с произвольными q экономия может быть сколь угодно большой. Применение системы с обратной связью особенно выгодно тогда, когда начальная гипотеза очень сильно не соответствует действительному распределению р. В § 2 было показано, что при построении решающего алгоритма без обратной связи (с постоянным от шага к шагу распределением q) наиболее выгодным является бросать жребий с распределением вероятностей р. Однако это вовсе не означает, что тот же способ будет наилучшим и для решающего алгоритма с обратной связью. И действительно, как будет показано в § 8, для случая Ър{ = 1 оптимальным будет следующий решающий алгоритм с обратной связью. Упорядочим индексы при Ъ так, чтобы ptl >pi2> . . . >Ptn. Пробуем Ъ1х\ если ответ «ложно», то требуем bt2 и т. д. Таким образом, оптимальный решающий алгоритм с обратной связью фактически обходится без жребия (все выборы происходят с вероятностями единица). Каждый ответ bt характеризуется для этого алгоритма не вероятностью выбора qv а натуральным числом zi — порядковым номером в «очереди на проверку». При повторных решениях частной задачи ajy имеющей ответ Ъ{, решающий алгоритм с жестким порядком перебора будет всегда находить ответ на одном и том же шаге zh. Поэтому неопределенность N{a^) для такого решающего алгоритма равна просто logzt. Отсюда N(A)=^\ р41оВ*4=2\Ptslogzts=j>}pts\ogs, (61) i=l s=l s=i где s — номер pt в ряду pi9 расставленных в порядке убывания. *) Среднее число проб при работе данного алгоритма I=-L(l+2+...+„)=!+!.
94 М. М. БОНГАРД Естественно, что если при построении решающего алгоритма мы исходим из гипотезы q о распределении вероятностей ответов, то в порядке убывания будут расположены qt. Соответственно в формуле (61) s нужно считать номером qt в убывающем ряду q{. Докажем, что в этом случае N{A)= § Pts\ogs<N(plq). (62) s=i Заметим, что имеют место соотношения >^2, 1_ 2 1 . "3" ^ 9<з» 1 ^ Следовательно, logl< — log^lf log2< — \ogqt2, log л < — \ogqtn, •ткуда формула (62) получается автоматически. Допустим, мы имеем два решающих алгоритма с жестким порядком перебора. Один исходит из гипотезы q, а другой —из гипотезы q'. Допустим, что qi=^=q[1 но zi — z\. Мы не сможем по «поведению» отличить один алгоритм от другого. Поэтому имеет смысл говорить, что для алгоритмов с обратной связью гипотезой является не распределение вероятностей, а лишь порядок проверки ответов. Декодирующее устройство, связанное с таким решающим алгоритмом, целесообразно характеризовать таблицей, определяющей очередь проверки ответа bi после прихода сигнала Ck (см. таблицу 5). ь1 6, bi Ьа с. zl, 1 Z2, l zi, 1 zn, l Co z2, 2 2i, 2 • Zn, 2 • T ;.. ch • • zu k • • 22, ft • • zi, k ♦• 2n, k а и л и ц а ... Ст • • • zl, m • • • z2, m • • • zi, m •• • zn, m 5 В столбце zb/if s2>/t, ..., ziuk все целые числа от 1 до /2 встречаются по одному разу. Очевидно, оптимальным будет декодирующее устройство zi% /{, построенное следующим образом. Возьмем матрицу ||di>fc||, где duh определяется но формуле (46). Расставим элементы к-го столбца в порядке убывания: dtl, k>d(2> k> . • . >dtn, k- Пусть i = ts, тогда zuk = s.
о понятии «полезная информация» 95 Учитывая соотношение (62), легко заметить, что формула (47) справедлива и для средней неопределенности задач по отношению к построенной нами системе с жестким порядком перебора после декодирования. Существуют системы, в которых можно исследовать приходящий извне сигнал, можно сосчитать число проб (применений И^-алгоритма), приводящих к отысканию ответа некоторой задачи, но пока что невозможно проследить процесс декодирования сигнала. Примером такой системы может служить животный организм. Существуют также системы, в которых хотя и возможно описать алгоритм декодирования сигнала, но очень трудно выяснить, насколько он близок к идеальному. К таким системам относятся некоторые программы для цифровых машин. В случае затруднений, возникающих у таких систем при решении задач, можно ставить вопрос об их причине. Оттого ли нужно много попыток, что мала поступающая извне информация, или дело в плохой работе декодирующего устройства? При решении этого вопроса иногда может помочь формула (47). Действительно, средняя неопределенность задач может быть определена экспериментально: N(A)=T^gK~, (63) где К — число проб, необходимых системе для решения частной задачи после декодирования соответствующего сигнала, а среднее берется для разных задач и соответствующих сообщений. Естественно, эксперимент должен быть достаточно обширным. В случае нарушения неравенства ЩЯ< Н (R)+if(P)-H(P) + H(p) (64) можно утверждать, что декодирующее устройство является неидеальным. В этом случае заведомо можно построить другое декодирующее устройство, которое для тех же задач (pt,i), той же системы кодирования (Pi,k) и тех же вероятностей задач (Rt) даст меньшую неопределенность. Такой вывод может оказаться полезным при поисках пути усовершенствования некоторых программ. В частности, поиск может вести и сама программа. При исследовании поведения животного в случае нарушения (64) можно предположить, что его «декодирующее устройство» приспособлено не к «миру р, Р и /{», а к некоторому другому «миру q, Q и S». В случае справедливости такого предположения должно выполняться условие T^<N(R/S) + N(I>/Q)-N(P/Q)i-N(p/q), (65) являющееся следствием формул (58) и (63). Выполнение (65) не доказывает справедливости сделанного предположения*), однако нарушение (65) безусловно его опровергает. Удобством является то, что такое опровержение можно получить, не производя дополнительных опытов в «мире q, Q, S».* *) Существует способ более сильной оценки средней неопределенности, заключающийся в построении по g, Q, S оптимальной матрицы |i d\ k ||, а по ней — || « ||.
96 М. М. БОНГАРД Высказанные соображения об оценке качества декодирующих алгоритмов применимы, разумеется, и к системам без жесткого порядка перебора (формулы (37) и (58)). Однако для них эксперимент по выяснению неопределенности окажется значительно более громоздким, так как потребуется большое число раз решать одну и ту же частную задачу после каждого декодирования сигнала*). Имеется еще одно обстоятельство, которое заставляет думать, что оценка декодирующих устройств может принести пользу в первую очередь для систем с обратной связью. Оно рассмотрено в следующем параграфе. § 8. Трудность и неопределенность Вернемся теперь к вопросу, который мог возникнуть еще в самом начале: почему в качестве характеристики трудности задачи для данного решающего алгоритма мы избрали именно логарифм среднего числа проб? Почему не число проб или не квадрат числа проб? Совершенно очевидно, что в разных конкретных случаях «цена» за применения РУ-алгоритма будет весьма различной. Иногда она будет просто пропорциональна числу применений, например, если реализация И^-алгоритма — относительно самое длинное место в счетной программе, а ценим мы машинное время. В другом случае, если много времени и затрат уходит на создание экспериментальной установки, а сами эксперименты (применение И'-алгоритма) «стоят» дешево, целесообразной оценкой трудности будет некоторая функция F(k) такая, что F(l) > F(k)— F(k—1) > 0 при /с>1. Универсального способа оценки трудности не может быть. Что же характеризуется «неопределенностью»? Для ответа на этот вопрос вспомним, что для решения задачи система ведет экспериментальную работу. Система изначально «знает», что ответом является одно из bi, но в нее не заложены сведения, какое именно Ъ{ есть ответ данной частной задачи. Недостаток знаний решающий алгоритм восполняет с помощью опытов. Существует и другой способ получения сведений об ответе задачи. Это использование сообщений, приходящих по каналу связи. Естественно попытаться найти «коэффициент эквивалентности» между этими двумя способами получения сведений. В каких единицах нужно «измерять эксперимент», необходимый для решения задачи, чтобы уметь предсказывать изменения, которые могут возникнуть в этой величине после прихода данного сигнала? Формулы типа (35) или (57) показывают, что связь между «количеством необходимого эксперимента» и свойствами канала связи и декодирующего устройства легко устанавливается, если измерять «необходимый эксперимент» неопределенностью задачи. Может вызвать недоумение, казалось бы, искусственный и непонятный способ вычисления неопределенности — «среднее от логарифмов средних». Однако этот «искусственный» метод иногда приводит к результату, более соответствующему нашим интуитивным представлениям, чем, например, вычисление среднего числа проб. Приведем пример такой ситуации. Пусть имеется задача, для решения которой алгоритм, исходящий из гипотезы о равномерном распределении вероятностей ответов, тратит в среднем 109 проб. Пусть, далее, мы имеем две системы, решающие эту задачу. Первая система обладает следующим свойством: в 99% случаев она решает задачу в среднем за 1000 проб, а в 1 % случаев — за 109 проб. Вторая система в 99% случаев находит решение за 10 проб, а в 1% — за те же 109 проб. *) Это, кстати, не всегда можно осуществить, так как нельзя заставить животное забыть результат предыдущего опыта.
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 97 На вопрос: «какая из систем лучше решает задачу?» — всякий человек ответит: «вторая система заметно лучше». Попробуем сравнить работу систем, опираясь на среднее число проб. Для первой системы среднее число проб равно 0,99 • 1000 + 0,01 • 109^ 107 • 1,0001. Для второй системы 0,99-10 +0,01-109^ 10?. 1,000001. Разница столь ничтожна, что, пользуясь критерием «среднее число проб», мы признали бы обе системы практически равноценными при решении этой задачи. Сравним теперь системы, пользуясь неопределенностью задачи для них (будем брать десятичные логарифмы). Для первой системы неопределенность^ равна 0,99-lg 1000 +0,01-igl09 = 0,99-3 + 0,01-9 = 3,06. Для второй системы 0,99 lg 10 + 0,01 lg 109 = 0,99-1 + 0,01 -9=1,08. Разница очень заметна и хорошо соответствует интуитивному ощущению, что вторая система «почти всегда» решает задачу в сто раз быстрее, чем первая, а в 1% случаев обе системы решить задачу просто не могут. Мы нарочно рассмотрели случай весьма различного числа проб при решении системами разных частных задач. В случае, когда все частные задачи решаются каждой системой примерно за одинаковое число проб, оценки с помощью среднего числа проб не приходят в противоречие со здравым смыслом. Оценка с помощью неопределенности также дает в этом случае осмысленный результат (только выраженный в логарифмическом масштабе). Итак, при сравнении двух систем, решающих некоторую задачу, среднее число проб и неопределенность либо дают согласные оценки, либо, если оценки расходятся, то ближе к интуитивной оценке оказывается неопределенность. Может также возникнуть вопрос о целесообразности понятий «оптимальный решающий алгоритм» или «оптимальный декодирующий алгоритм». Действительно, оптимальный для неопределенности решающий алгоритм может быть совсем не оптимальным, например, для среднего количества применений ТУ-алгоритма *). Покажем, что, несмотря на такое расхождение, во многих случаях выяснение вопроса об оптимальности декодирующего алгоритма в отношении неопределенности может предрешить вопрос о его оптимальности и с других точек зрения, например в отношении числа применений W-алгоритма. Введем понятие «трудность» задачи для данного решающего алгоритма. Пусть F (х) — неубывающая функция, определенная при ;г>1. Трудностъю частной задачи aj для данного решающего алгоритма будем называть Т(а-) = F(K.), где К] — среднее число применений W-алгоритма при решении а;-. Трудностью задачи А назовем: Т (А) = ?р{а,) Т (а,) = 2 р (а,.)/1 (*,-)• (66) *) Для алгоритмов без обратной связи при п = 2 наименьшее число применений ^-алгоритма достигается не при Qi = Pi и 02 =/Ъ» a пРи 01= о7 а » ?2 2Р!-1 ' " 2р2-1 Проблемы кибернетики, вып. 9
98 M. М. БОНГАРД Будем называть F функцией цены трудности. Неопределенность есть трудность с логарифмической функцией цены. Назовем F (х) выпуклой, если при ах > 0, а2 > О и ах -+- а2 = 1 а^ (хЛ) + a,F {х2) < F (аЛ + а.Л). (67) Теорема. /7ра любой выпуклой функции цены, в случае 2jft = l, наименьшей будет трудность для решающего алгоритма, проверяющего Ь{ в порядке убывания вероятностей р{. Вначале заметим, что повторные проверки одних и тех же h{ могут лишь увеличить среднее число проб, а значит, и трудность. Поэтому мы рассматриваем только алгоритмы с обратной связью. Будем считать, что индексы при Ьх расставлены так, что /?1>/?2> . . . >/?а. Обозначим через jiit l вероятность того, что если ответ 6t, то он будет найден на 1-м такте. Очевидно, 1, (68) так как ответ обязательно будет найден не более чем за п тактов. Можно также показать, что i=l 1. (69) Соотношение (69) имеет место благодаря тому, что яь L является одновременно условной вероятностью проверки bi на 1-м такте, если первые 1—1 тактов не обнаружили ответа. Трудность задачи А для решающего алгоритма, характеризуемого матрицей || яь г ||, будет: T(A) = ^PiF(^l.nul). Обозначим Т (А) через /(/?, ;|яЬ1||). Введем функцию /' следующим образом: Г {p. ll«i.I!l) = SftS»i.^(0- t i Благодаря выпуклости F и равенству (68) f(P> К..ID >f'(P. II *i.i ID- Рассмотрим матрицу я1, 1 • • • я1, <i • • • я1, h II < l I (70) (71) (72) . . Я 1, п Ягь 1 • Яг2, i • • • яч, h + a • • • яг2, ^ — а - . я1ь12 — а . • Я*2, h "Г « • • 3tilt n • Н>12,П яп, 1 яп, ii Лп, Z2 Лп (73) I ll изменением четырех элементов, где а > 0, U > 1Х полученную из || л-ь и i2> ix. При этом /' (Р. II «i. i II) - Г (Р> II < i ||) = а (Pil - pi2) [F (/2) - F (/,)] > 0. (74) Свойства (68) и (69) сохраняются после преобразования (73). Пусть яь f —первое отличное от яь х и не равное нулю число в первой строке матрицы ||яЬ1||, а я3(1 —первое отличное от яь х и не рав-
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 99 ное нулю число в первом столбце. Произведем преобразование (73), приняв гх = 1; i2 — s; ^1 = 1; lz = t, а за а взяв меньшее из чисел яь t и jtSi v Если в исходной матрице ||rtifI|| элемент ztltl не был равен единице, то после преобразования в матрице || Ji'it x || в первой строке или в первом столбце станет на один нуль больше. Будем повторять эту операцию до тех пор, пока не получим матрицу вида 0 Я1,2 Я3,2 < 2 71, Z 0 Я2,3 • яз,з • Яп,3 • . 0 2, п Л2 * Л3,п 71, 71 Для этого понадобится не более 2лг — 3 операций. Так как при каждом преобразовании выполняется соотношение (74), то Г(Р> ||*,,«||)>/'(Р, II «?. ill)- Проделаем ту же серию операций со второй строкой и вторым столбцом и т. д. до получения единичной матрицы ||я^||. Очевидно, /'(*. IKi II)>/'(*. II«Ml)- (75) Но /' (р, ||я?лЦ) совпадает с /(р, || я?, г ||)— трудностью задачи Л-для алгоритма, пробующего с вероятностью единица на первом шаге Ь1У на втором Ь2 и т. д. Сопоставив это с (75), (72) и (70), получаем: T(A)>f(p, \\<i\\) = %PiF(i), (76) г чем и доказана теорема*). Так как логарифм является выпуклой функцией, то для него справедлива эта теорема. Отсюда следует оптимальность алгоритма с «жестким порядком перебора», использованная в § 7. Доказанная теорема имеет еще одно важное следствие: для всех выпуклых функций цены трудности существует один и тот же оптимальный декодирующий алгоритм, совпадающий с декодирующим алгоритмом, оптимальным для неопределенности. Поэтому если, например, цена трудности есть число проб (а не логарифм числа проб), то нарушение неравенства (64) все равно сигнализирует о том, что для выбранной цены декодирующий алгоритм может быть улучшен (так как линейная функция выпукла). Итак, во многих случаях можно не уточнять, какой функцией цены трудности мы интересуемся. (А иногда это и было бы весьма затруднительно сделать. Например, как узнать, какую именно функцию числа проб ценит крыса, выбираясь из лабиринта?) В § 2 рассматривалось понятие «оптимальной» гипотезы. Его можно, естественно, распространить на случай нелогарифмических функций цены трудности. Несколько сложнее с понятием «гипотезы, содержащей только истину». В определение (7), кроме неопределенности, входит еще и энтропия распределения q. Что будет аналогом энтропии при других, функциях цены трудности? *) Для некоторых практических приложений целесообразно определять трудность частной задачи а7- через F (К), а не через F (К), как это сделано выше. В этом случае Т (A)=f (р, || я$, t ||). Отсюда следует справедливость доказанной теоремы и для трудности, введенной таким способом. При этом отпадает требование выпуклости функции F (х); необходимо только, чтобы она была неубывающей. 7*
100 M. М. БОНГАРД Пусть F(x) — функция цены трудности. Обозначим через HF(p) минимум трудности задачи А для решающего алгоритма без обратной связи. Легко видеть, что по отношению к рассматриваемой трудности функция HF играет ту же роль, что и энтропия по отношению к неопределенности. В частности, гиперплоскость, касательная в точке t к поверхности с уравнением HF(q)*), выражает трудность задач при гипотезе t (ср. рис. 1). Поэтому, если мы в определениях (7) и (8) заменим H(q) на HF(q), то теорема о совпадении оптимальной гипотезы с сильнейшей гипотезой, содержащей только истину, останется справедливой при оценке трудности с помощью функции F. Например, как показал Н. Д. Нюберг (частное сообщение), при линейной функции цены трудности, HF{p) = {\Y pt)2. Пользуясь вместо г энтропии этим выражением, мы можем говорить о «гипотезах, содержащих только истину» при оценке не по неопределенности, а по среднему числу проб. § 9. Обычная задача на этом языке В §§ 1 и 3 были введены понятия: W-алгоритм, решающий алгоритм, декодирующий алгоритм. Как перевести на этот язык такое привычное всем понятие, как «условие задачи»? Начнем со «школьной» арифметической задачи. «У двух мальчиков есть двенадцать книг. У Коли на две книги больше, чем у Петй. Сколько книг у Коли и сколько у Пети?». Во-первых, условие содержит W-алгоритм. Действительно, в принципе можно найти ответ, генерируя случайным образом пары чисел и проверяя, удовлетворяют ли они условию. Во-вторых, условие является сигналом, который после соответствующего декодирования может сократить неопределенность задачи. В этой второй роли условие содержит также и указание множества объектов (возможных ответов), по отношению к которым И^-алгоритм является высказыванием. В данной задаче это — множество пар чисел. Очень трудно заметить на самом себе или на другом взрослом человеке наличие у «условия» двух существенно разных функций. В явном виде оно проявляется при экспериментах с детьми. Если предложить эту задачу ребенку лет восьми-девяти, уверенно считающему до ста и легко производящему сложение, вычитание и деление на два в пределах первых двух десятков, но не решавшему подобных задач, то он, как правило, не пользуется условием как W-алгоритмом. Он высказывает непроверенные предположения, предпочитая использовать в качестве И7-алгоритма взрослого, давшего ему задачу. При этом, однако, легко заметить, что он пользуется условием для сокращения области поисков (хотя часто и не наилучшим образом). В нашем примере ребенок почти никогда не назовет чисел, больших 12. Очень многие дети пробуют только пары, дающие в сумме 12. Иногда бывают случаи, когда пробуются пары с разностью два. Если ребенок знает дроби, то он все- таки называет только целые числа (количество книг не бывает дробным!), в то же время, если изменить формулировку условия и сказать: «... двенадцать килограммов конфет...», то появятся дробные пробы. Все это указывает на наличие процесса декодирования условия на стадии, когда в качестве И^-алгоритма условие еще не используется. *) HF{p) выпукла, так как через каждую точку этой поверхности можно провести гиперплоскость, не пересекающую HF(p).
О ПОНЯТИИ «ПОЛЕЗНАЯ ИНФОРМАЦИЯ» 101 «Правильно составленное» условие задачи из школьного задачника после оптимального декодирования уменьшает неопределенность до нуля. Это приводит к тому, что иногда в 3—4-м классе ребята умеют выдавать правильный ответ задачи, но не умеют (или во всяком случае не имеют привычки) его проверить. Возможно поэтому с трудом решаются «нестандартные» задачи, в которых оптимальное декодирование условия лишь снижает неопределенность до такой степени, что становится возможным перебор оставшихся вариантов. С этой точки зрения при решении «стандартной» арифметической задачи решающий алгоритм не работает. После декодирования условия неопределенность падает до нуля и «решать» уже нечего. Однако интуитивно мы чувствуем, что «решать» что-то приходится. Это «что-то» есть, по-видимому, некоторая другая задача — синтез декодирующего алгоритма, — которая может иметь весьма большую неопределенность. Рассмотрим теперь задачу совсем из другой области. Пусть ее «условие» звучит так: «найти (построить) устройство, которое, будучи помещенным не ближе 300 м от поверхности 2x2 ж, создает на ней в ясную погоду ночью освещенность не менее 100 люкс». В этой задаче условие также содержит прямое указание на ^-алгоритм, с помощью которого можно узнать, является ли данное устройство ответом задачи. Использовать же условие для снижения неопределенности задачи уже гораздо труднее, чем в первом примере. Такого снижения мы достигаем путем обращения к справочникам, книгам по светотехнике и т. д. (Строго говоря, второй пример от первого отличается лишь степенью универсальности тех сведений, которые необходимы сверх условия задачи.) При этом нужно заметить, что уже указание области объектов, к которым применим W-алгоритм, в первом примере резко сокращает поиск. Там VF-алгоритм можно применить только к парам чисел и просто невозможно испытывать, например, такие объекты, как «корова» или «красный цвет». Во втором же примере РУ-алгоритм может быть применен к чрезвычайно широкому классу объектов. В принципе с помощью W-алгоритма можно проверить, не является ли ответом такой объект: «мужчина-блондин, думающий о сверхновой звезде», причем само условие задачи вовсе не отвергает целесообразности этой проверки. Итак, условие задачи должно обязательно содержать ^-алгоритм. В противном случае не указан способ отличить ответ от неответа и мы говорим: «задача еще не поставлена». Свойства же условия как сигнала, способного сократить перебор, могут быть очень разными у разных задач и, естественно, зависят также от декодирующего алгоритма (того, «что мы знаем еще о данном вопросе»). Заключение «Классическая» теория информации в основном рассматривает взаимоотношения сигнала с каналом связи. Настоящая статья посвящена взаимоотношениям сигнала и получателя сообщения, который использует сигнал для решения некоторой задачи. Этим определяется круг вопросов, где может оказаться полезным рассмотренный в статье формализм. В § 7 приводился пример задачи об оптимальности декодирующего алгоритма, в которой целесообразно пользоваться введенными понятиями. Другим примером задачи, выигрывающей от рассмотрения «полезной информации», является, по-видимому, вопрос об избыточности языка (например, письменной речи). В самом деле, для разных людей (для специалиста и неспециалиста в данной области или для человека грамотного и малограмотного) один и тот же текст имеет разную избыточность. Для
102 М. М. БОНГАРД человека, хорошо знающего грамматику, избыточность текста больше, так как он может исправить опечатку, которую не заметит человек малограмотный. Отсюда прямо следует способ измерения избыточности данного текста для данного наблюдателя. Найдем сначала среднюю полезную информацию, которую получает наблюдатель от одной буквы текста. Для этого проводим опыт, похожий на опыт Шеннона с отгадыванием букв [6], следующим образом: показываем наблюдателю кусочек текста из х букв и просим его назвать вероятности, с которыми он ожидает появления на (х+1)-м месте различных букв алфавита. Пусть q1 есть указанная им вероятность для той буквы, которая на самом деле стоит на (х+1)-м месте. Повторяем опыт L раз, выбирая по жребию участок текста. Если qb есть результат i-vo опыта, то средняя полезная информация, содержащаяся в (х+1)-й букве текста, для этого наблюдателя, знающего предыдущие х букв, будет: Отсюда избыточность « = 1-^ = 1+1^, (77) log n L log п х ' где п — число букв алфавита. Если, следуя Шеннону, считать, что испытуемый полностью использовал знание статистических связей в языке, то полученная избыточность (при х—> оо) и есть величина, интересовавшая Шеннона. Если считать, что испытуемый учитывал не все связи, то мы получаем избыточность для данного наблюдателя. Наконец, отметим, что полученное в § 5 обобщение понятия пропускной способности канала связи (N (P/Q) — Н (iJ)), возможно, окажется полезным при рассмотрении неэргодических источников сообщений. В самом деле, для таких источников гипотеза (Q), построенная на основании предыдущего поведения, не совпадает с действительным поведением (JP), и обычная формула для эргодических источников сообщений (Н (Р) — Н (к)) неприменима. Автор приносит искреннюю благодарность М. Н. Вайнцвайгу, Р. С. Гутеру, А. Н. Колмогорову, А. А. Ляпунову, Н. Д. Нюбергу, Я. Г. Синаю, М. С. Смирнову и А. М. Яглому, ознакомившимся с рукописью и высказавшим целый ряд советов и возражений, которые автор постарался принять во внимание. ЛИТЕРАТУРА |1] Харкевич А. А., О ценности информации, Сб. «Проблемы кибернетики», вып. 4, Физматгиз, 1960. ]2] ЯгломА. М. иЯгломИ. М., Вероятность и информация, М., 1960. [3] Голдман С, Теория информации, ИЛ, 1957. [4] Бон гард М. М., Моделирование процесса узнавания на цифровой счетной машине, Биофизика 6, 2, 1961. (5] Б р и л л ю э н Л., Наука и теория информации, М., 1960. [6] Shannon С. Е., Prediction and entropy of printed English, Bell System Tech. Journ. 30, 1Э51. Поступило в редакцию 1 VII 1961
IV. ПРОГРАММИРОВАНИЕ О СТРОЕНИИ КЛАССА В-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ Н. И. ГЛЕБОВ (КАЗАНЬ) В статье [1] рассматривался класс 91 (К) Л-критериев эквивалентности подмножеств категории К. Приведем основные определения и результаты этой статьи. Пусть К — произвольная категория, объекты которой составляют множество, К — множество всех неединичных элементов категории К и 31ZZK (см. [2]). Подкатегория K1dK называется правильной, если всякий единичный элемент подкатегории Кх является единичным элементом категории К. Наименьшая правильная подкатегория, содержащая 91, называется категорийным замыканием множества 91 и обозначается через if (91). Множества 91х, %l2(Z.K называются эквивалентными, если К(%) = К(%). Пусть Ка есть некоторая операторная категория, определенная на мно- г жестве Еа. В множестве За определено отношение подчинения -<, удовлетворяющее следующим аксиомам: г г г 1) если ^-<?2 и Бг"<Бз> т0 h<h'> г 2) если li-<^2» T0 Аа^-<Аа52 для всякого оператора Аа^Ка (при условии, что оператор Аа определен на ^ и £2). Квазиинвариантом множества ШаКа называется всякий элемент |£За такой, что для г любого Аа из $Щ имеет место А%<%. Совокупность всех квазиинвариантов множества Ш обозначается через S (Ш). Пусть а: К —> Ка — гомо- морфизм категории К в категорию Ка. Если 9icZAT и R = (Ka> <>в)> то R-характеристикой множества 91 называется множество Я (91) = *S(a9l). Множества 9tx, 9l2 CZA' называются R-эквивалентными, если Л^!)^ = Л(912). Справедлив следующий Л-критерий эквивалентности. Для того чтобы множества 911? 912 С А бьг./щ эквивалентными, необходимо, чтобы они были R-эквивалентными. г Таким образом, каждой тройке (Аа, <,а) = Лр отвечает Яр-критерий эквивалентности. Вудем говорить, что R^-критерий слабее Ry-критерия, и обозначать R$<CRy, если из Лу-эквивалентности произвольных множеств 9ii, 9i2 CZ К следует их Яр-эквивалентность. Лр-критерий и Rу-критерий называются равносилъными, если Лр<Луи /?Y< Лр. Объединяя равносильные Л-критерии, мы получаем частично упорядоченное множество Ж (К), элементами которого являются классы равносильных Л-критериев эквивалентности. В [1] было доказано, что частично упо-
104 Н. И. ГЛЕБОВ рядоченное множество ^(К) есть полная структура, единичный элемент которой является классом достаточных й-критериев эквивалентности. Настоящая работа посвящена дальнейшему изучению множества :)i(K). Всякий й-критерий эквивалентности порождает некоторое разбиение DR системы всех подмножеств множества К на классы ^-эквивалентных подмножеств. Для описания свойств разбиения DR введем некоторые определения. Определение 1. Множество НаК называется К-замкнутыму если К{Н)Р[КаН. Очевидно, что пересечение произвольной совокупности /^-замкнутых множеств /f-замкнуто. Определение 2. Система © непустых /f-замкнутых подмножеств множества К называется правильной, если: 1) /££©, 2) вместе с множествами Яа€©, а£/, системе © принадлежит и их пересечение П Яа, если оно не пусто. Очевидно, пересечение произвольной совокупности правильных систем является правильной системой. Каждому классу Qa разбиения DR поставим в соответствие множество На = U N. Множество На принадлежит классу Qa и является максимальным подмножеством множества К, обладающим Я-характери- стикой R(Ha), т. е. Я а Яа, если R(H) = R(Ha). Кроме того, в силу й-критерия эквивалентности множество На /^-замкнуто. Совокупность множеств Яа, соответствующих всевозможным классам Qa разбиения DHy обозначим через ©я- Из вышесказанного следует, что множество НаК принадлежит системе ©я тогда и только тогда, когда Я = \J N. R(N)=R(H) Таким образом, каждому й-критерию эквивалентности соответствует некоторая система множеств ©я. (Иногда мы будем говорить, что й-критерий соответствует системе ©я.) Теорема 1. Система множеств ©д, соответствующая R-критерию эквивалентности, является правильной. Доказательство. Так как система ©я состоит из К -замкнутых множеств и К £ ©я, то для доказательства теоремы достаточно показать замкнутость системы ©я относительно непустых пересечений множеств из ©я- Пусть Яа£©я, а£/, и П На Ф Л. В ©я существует множество Я/, обла- дающее й-характеристикой й (Я/) =Я (П #а)- Покажем, что Я/ = f| На. ail ae/ В самом деле, поскольку Н[ есть максимальное подмножество множества if, имеющее й-характеристику Й(П На), то Я/Z) П На. С другой а£Г ■ ааТ стороны, если Я/ ф: П Яа, то существует элемент а £ Я/ аакой, что а£1 я^П Яа, т. е. при некотором а'£/ имеет место а£На'. Так как a^Hj и ПНааНа,у той(а)^й(Я7)=й(ПЯа)=ЗЙ(Яа0и *(ffa,) = fl(a(J#aO> а£/ ас/ что противоречит максимальности множества На>. Следовательно, Я/CZ П На и теорема доказана. 0.0 Возникает вопрос: всякая ли правильная система © соответствует некоторому й-критерию эквивалентности? Основным результатом данной статьи является теорема 9, в которой устанавливаются необходимые и достаточные условия, при которых
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 105 правильная система (£ соответствует некоторому Я-критерию эквивалентности. Полученные условия позволяют показать (теорема 12) существование некоторого класса категорий, для которых всякая правильная система (£ соответствует некоторому Я-критерию эквивалентности. Пусть © — правильная система и NdK. Тогда через Лт® будем обозначать наименьшее множество Я £ ©, содержащее множество N. В силу определения правильной системы множество N® существует для всякого N ClK. Лемма 1. R(N®*) = R(N). Доказательство. Покажем, что N^^= (J Na. В самом деле, множество Н— [_} Na принадлежит системе (£д и содержит Я(Ла)=Я(Л) множество N. Кроме того, если N aHa£&Ry то R (H) = R (N)ZD R(Ha) и R(Ha\JH) = R(Ha), откуда, в силу максимальности множества Яа, имеем Ha[jHciHai т. е. НаНа. Тем самым мы доказали, что Я есть минимальное множество из S«, содержащее множество N, т. е. iV®** = Н. Из доказанного равенства следует утверждение леммы 1. Лемма 2. R(N1) = R(N2) тогда и только тогда, когда Nfz = Nfn. Доказательство. По лемме 1 имеем R (ЛГ®Д) = Я (NJ и R (ЛГ®-*) = = R (N2). Следовательно, равенство R (N1) = R(N2) равносильно равенству R(NfR) = R(Nf*). (1> В силу максимальности множеств ЛГ®а и NfR, из (1) следует Nf* = Nfn. Обратное утверждение очевидно. Лемма 2 доказана. Лемма 3. Правильная система @х является подсистемой правильной системы @2 тогда и только тогда, когда iV^CZiV®1 при любом NczK. Док а за те лье тво. Если (S^CZS^» то ^®* £ (£2 ПРИ любом NdK, следовательно, N^^[\N^^^2 и, кроме того, N aN®i[}N®*, что в Силу минимальности множества TV®2 дает TV®2 CZ^V®1 П ^®2» т- е- N®2CZ/V®i. Пусть Я g ех и TV®2 CZ N®1 при любом 7V С /Г. Тогда Я®2 d Я®* = Я. Кроме того, по определению множества Я®2 имеем Я CZ Я®2. Следовательно, Я = Я®2£(£2. Лемма 3 доказана. Теорема 2. R^-критерий слабее R^-критерия в том и только том случае, если &RlCZ&n2. Необходимость. По лемме 1 для произвольного множества NCZК имеем: R1(N**Ri) = R1(N), (2) R2(N^) = R2(N). (3> Из (3) в силу условия теоремы вытекает R1(N®k>) = R1(N), откуда, учитывая (2), получаем: B1(N(Sri) = R1(N<£r*). (4> В силу максимальности множества TV fii из (4) следует: и но лемме 3 @Й1с:®д2.
106 Н. И. ГЛЕБОВ Достаточность. Пусть R2 (NJ = R2(N2), где Nv N2 ClK. Тогда по лемме 2 имеем: yvf^ = ivfR2. t (5) В силу леммы 3 из б^С®^ следует: что, учитывая (5), дает: A^divfRin^lK (6) NtCZNf*riN4!*i. (7) Gf (5* Поскольку iVj я1 П iV2Ri6©Bi» то из (6) и (7) следует и в силу леммы 2 имеем i?1(iV1) = i?1(iV2). Теорема доказана. Пусть Да-критериям эквивалентности соответствуют системы (£а, <z£/, и Л/ = ф Ла (определение операции 0 дано в работе [1]). Тогда at/ •справедлива Теорема 3. Система ®/, соответствующая Rj-критерию эквивалентности, является наименьшей правильной системой, содержащей все системы (£а, а £ /. Доказательство. Известно (см. [1]), что при любом NdK «е/ (8) Ra(N) [] Ra>(N) = A для любых a, a' £ /, афа'. J Поскольку /?а-критерий слабее /?/-критерия, то по теореме 2 @aCZ©/, <х£/. С другой стороны, если для некоторой правильной системы (£ имеет место ©aCZ(£, a£/, то по лемме 3 а следовательно, и П#®а=>#® (9) при любом NClK. Но в силу (8) имеем: л®'= U ^Y=n U Ny=r\N\ Я/ (Ny)=Rj (N) a£/ Яа (iVY)=Ra (N) <х£Г откуда/ учитывая (9), получаем: при любом NciK. Следовательно, по лемме 3 и теорема доказана. Пусть S есть полугруппа с системой образующих К и системой определяющих соотношений 21, состоящей из всех соотношений ab = c> справедливых в категории К. В дальнейшем мы будем рассматривать
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 107 категорию К в качестве подмножества полугруппы 5, а под NM, где N, MCIS, будем понимать произведение множеств N и М в полугруппе S. Отметим одно свойство полугруппы S: если ab£Ky тоа£КиЬ£К, т. е. множество S \К является двусторонним идеалом полугруппы S. Пусть NczK; положим N* = {a: аИ^КфК, а£К}} N' = {a: М*аГ\КфА, а£К). Легко видеть, что N* и N', рассматриваемые в качестве подмножеств категории К, являются подкатегориями. Подкатегорию N* будем называть левой сопряженной подкатегорией множества N, а подкатегорию N' — левой производной подкатегорией множества N. Если N= [J Ni9 то 7V*= JJ N* и N' = (J N\. В самом деле, пусть ifc/ iil itl a£7V*, т. е. аЫ^\КфК, следовательно, существует i0£l такое, что аМг0[}КФ Л, т. е. agiVjJdU N*i- Еслиа£ \JN*, то существует i0£l такое, it/ it/ что a£7V*0, т. е. aN\0 f] К Ф Л, а следовательно, и aTVp^ff^A, т. е. a£N*. Пользуясь первым равенством, аналогичным образом можно доказать и второе. Из этих равенств, в частности, следует монотонность операций * и '. Кроме того, из определения подкатегории N' следует, что Nfaf]KdNf (10) при любом а£К. Лемма 4. Если ab^HciK, то aKf)KczH'. Доказательство. По определению категории существуют единичные элементы е'а, е"а£.К такие, что е'аа = а и ае"а — а. Так как e'a{ab) = ab£e'aH[}K, т. е. е'аН[}КфА, то е^Я*. Пусть c£aKf}K, т.. е. существует элемент Ъ' £ К такой, что c = ab'; тогда е'ас£Н*с и еас = e'aab' = ah' £ К, т. е. Я*сП#=^Л, и с£Н'. Следовательно, аК[}КаН'- В частности, a = aea£ aKf]K, т. е. a £ Я'. Лемма 4 доказана. Из леммы 4 следует, что НаН'. Из других свойств операции ' отметим следующие. Если a £{&}', то {а)' = {Ьу (здесь {а}' и {6}' суть левые производные подкатегории множеств, состоящих соответственно из элементов а и Ь). Если ех и е2 — различные единичные элементы категории К, то {е^' []{е2}' = А. Отсюда, в частности, следует, что если c^{e1}f и eg if, то c = elt Определение 3. Множество SCZS называется правым К-идеа- лом, если из ab£S и &£А" следует a (bKf)K)dS. Очевидно, категория К и полугруппа S являются правыми АГ-идеа- лами. Кроме того, в силу (10) левая производная подкатегория множества N есть правый if-идеал. Пересечение любого множества правых .йС-идеалов является правым ^-идеалом. В том случае, когда категория К является полугруппой, S = К и понятие правого if-идеала совпадает с понятием правого идеала. Пусть S есть некоторое множество из полугруппы S, а f(a) = Pa, где a£S, PaCZS, — отображение множества S в систему своих подмножеств. Определение 4. Отображение /(a) называется монотонным, если из а£Рь следует PaCZPb. Определение 5. Отображение /(a) называется стабильным справа, если из а£Рь, с£К и ас, bc£S следует ас£РЬс. Отображение
108 Н. И. ГЛЕБОВ f(a) будем называть каноническим, если оно* одновременно монотонно и стабильно справа. • Пусть Я —некоторое множество из K[)S. Определение 6. Будем говорить, что отображение f(а) согласовано с Я, если: 1) из aZH'ftS, &£Я следует Ha[)SaPa, Pbaf)SdPa\ 2) из а£Н следует K[}PadH. Очевидно, если определить отображение /(а), положив Pa = S при любом а £ S, то оно будет каноническим и, кроме того, будет согласовано с Я, если Kf)SaH. Лемма 5. Пусть L — некоторая подполугруппа S, удовлетворяющая условиям ЯС£, (11) LH[)K(^H. (12) Тогда отображение f(a) = Pa = La, где a£»S, PaClS, является каноническим отображением, согласованным с Я. Доказательство. Если а £ Рь, то Pa = Lad LPb (Z L2b czLb = Pb и ac£Pbc = Lbc = Phe, т. е. отображение /(a) —каноническое. Кроме того, из b£H и (И) следует На a La = Ра и Pba — LbaCLLa — Pa\ из а£Н и (12) следует Ра[]К = Laf]KdH, т. е. отображение /(a) согласовано с.Я. Лемма доказана. Определение 7. Будем говорить, что отображение /(a) обладает свойством F(g, если при любых a£*S, NCZK из aNClPa следует aN^CZPa и a(N®)'ClS. Лемма 6. Если правильная система (St является подсистемой правил! ной системы (£2 и отображение /(a) обладает свойством F^. , то оно обладает и свойством F$ . Справедливость леммы следует из монотонности операции ' и из леммы 3. Рассмотрим произвольное множество отображений /а(я) = -Раа)' где а £ S(a), P^ d S(a\ а £ /. Через // (а) обозначим отображение множества S{1) = П S(a) в систему своих подмножеств, определяемое следующим at J образом: U {а) = Р<7> = П Раа) (а 6 S(/), Р<7> с 5(/)). at/ Лемма 7. Отображение fi(a) является каноническим, если каноническими были отображения /а(я), а£/. Доказательство. Если а£РьТ\ то agi^00, а £/, и в силу монотонности отображений fa{a) при любом ag/ имеем PaClPb, следовательно, Р^ = f| P(aa) CZ f| /)[,a) = Р{ь\ т. е. отображение // (а) моно- a£/ a£/ тонно. Аналогичным образом устанавливается и стабильность справа отображения //(а). Лемма 8. Если при любом ag/ отображение /а(я) согласовано с некоторым множеством 7V(a), то отображение //(а) согласовано с jv(/)=n^(a). Доказательство. 1) Если a£(N{I))' f[S{I) n b g7V(/), то b giV(a), a £ /, и в силу монотонности операции' при любом ag/ имеем
О СТРОЕНИИ КЛАССА R-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 109 л £ (iV(a))' f| S(a\ откуда по условию леммы лг(а)аП5(а)с:^а), Pia)af]Sw(^P(aa). Из последних соотношений следует: 2) Если a£N(r\ то ag7V(a), ag/, и К [] Р{аа) CI N(a\ ag/, откуда -следует: k^p^cin^. Лемма доказана. Лемма 9. Если при любом ag/ отображение /a(a) обладает свойством F§, то и отображение fi{a) обладает свойством Fg. Доказательство. Если aNciPa\ где а £ S \ N С^, то при любом a £ / aNdP^ (a£S{a\ NaK). (13) По условию леммы из (13) следует: /с^> ag/; a(7Ve)'CZ5(a), o€/, т. е. а^СГП Р{а' = Р{1\ а(7У®)'С1П^(а) = 5(/). Лемма доказана. Рассмотрим произвольную правильную систему (£ и некоторое множество Н £ @. Определение 8. Множество Н называется выделимым в @, если существуют правый Jt-идеал S, содержащий левую производную подкатегорию множества Я, и каноническое отображение /(a) = Ра (а £ S> PadS)y согласованное с Я и обладающее свойством F^. В противном случае множество Я называется невыделимым в (£. Понятие «выделимость» является центральным в этой статье. Теорема 4. Множество К выделимо в (£. Для доказательства теоремы достаточно положить 5 = 5 = /^ при любом а £ S. Легко видеть, что в этом случае все условия выделимости будут выполнены. Теорема 5. Если множества Яа6@> а£/, выделимы в @ и Я/ = = Р|//а^=Л, то множество Hi выделимо в (£. Доказательство. Для каждого a £ / существуют правый iT-идеал S{a\ содержащий Яа, и каноническое отображение fa(a) = P£) {a^S{a\ jPaa)(Z5(a)), согласованное с На и обладающее свойством F$a В силу леммы 7 отображение // (а) = jP(a7) (a £ S(/)) является каноническим, а по леммам 8 и 9 оно согласовано с Я/ и обладает свойством F^. Кроме того, множество £(/)=П»5(а) является правым /^-идеалом
110 Н. И. ГЛЕБОВ и содержит Я/, так как в силу монотонности операции ' и условия теоремы H'ldHid S(a) при любом ag/. Теорема доказана. Теорема 6. Если правильная система (^ является подсистемой правильной системы (£2 и множество Н^^ выделимо в @х, то Я выделимо в @2. Доказательство. Поскольку Я выделимо в &v то существуют правый /Г-идеал S> содержащий Я', и каноническое отображение f(a) = Pa(a£S> PadS), согласованное с Я и обладающее свойством F$ . По лемме 6 отображение /(a) обладает свойством Fg . Теорема доказана. Теорема 7. Если существуют элементы а, Ъ^К и множество NdK такие, что аЪ£Н, (14) aNdHa^K, (15) aN®bf){K\H)=£A, (16> то множество Я невыделимо в (£. Доказательство. Предположим, что теорема неверна, т. е. существуют элементы а,Ъ£К и множество NczK, удовлетворяющие условиям (14) —(16). Кроме того, существуют правый К -идеал, содержащий Я', и каноническое отображение j(a) = Pa(a£S, PaClS), согласованное с Я и обладающее свойством F$. Тогда из (14) в силу леммы 4 и условия 1) согласованности отображения /(a) с Я следует: Haf]S(^Pa. (17) Так как aNaK, то aNdaNf]K(^aKr\K, что в силу леммы 4 и соотношений Н' dS, aNdHa дает: aNciHaf]S. (18) Из (17) и (18) следует: aNdPa. (19). В силу свойства Fg из (19) следует: aN*dPa, откуда в силу стабильности справа отображения /(a) получаем: aN®bf)SdPab. (20> С другой стороны, из (14) и условия 2) согласованности отображения /(a) с Я следует: РаЬ[\К^Н, что, учитывая (20), дает: Но в силу леммы 4 аЛп^ПЯсЯ. (21) следовательно, aN^bftK daKf]KdH'dS, aNhflKftS^aN^bftK
СТРОЕНИИ КЛАССА R-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 111 и соотношение (21) принимает вид или аЛп(х\я) = а, что противоречит (16). Обнаруженное противоречие и доказывает теорему. Следующая теорема дает достаточные условия выделимости в том предположении, что категория К является полугруппой. Теорема 8. Если категория К является полугруппой и при любых а£К и NaK из aN CZ На [J a следует aN®^Ha (J а, то множество Н выделило в 6. Доказательство. Положил! S = S ( = К) и L = H[Je (где е — единица полугруппы К). Поскольку множество Н является /f-замкнутым, то L есть подполугруппа, удовлетворяющая условиям (11) и (12). Следовательно, по лемме 5 отображение / (а) = Ьа = На (J а является каноническим отображением, согласованным с Н. Кроме того, по условию теоремы из aNczLa (NczK) следует aN® ClLa, а соотношение a(N®)'aS выполняется тривиальным образом, т. е. отображение f(a) обладает свойством F$. Таким образом, множество Н выделимо в @. Теорема 9. Для того чтобы существовал R-критерий эквивалентности, соответствующий правильной системе (£, необходимо и достаточно, чтобы каждое множество i?G© было выделимо в @. Необходимость. Пусть Д-критерий эквивалентности определяется операторной категорией Ки заданной на множестве Е19 подчине- 1 нием -< и гомоморфизмом а1:К—^К1. /?-критерию соответствует некоторая правильная система (£д. Система (£д состоит из всевозможных множеств На CZ К, характеризующихся следующим свойством: На есть максимальное подмножество множества К, обладающее ^-характеристикой R(Ha). Следовательно, если Н% есть максимальное подмножество множества К, обладающее о^-квазиинвариантом ££3^ то непустое множество HciK принадлежит @д тогда и только тогда, когда оно предста- вимо в виде Н= П Нь гДе в случае Н(Н) = А полагаем f]H^ = K. Поэтому Я^б@я, если Н%ФА, и в силу теоремы 5 для доказательства необходимости условия теоремы 9 достаточно доказать выделимость в (£д непустых множеств Н%у 1>^Е1. Итак, пусть Я^бЁд, £06-i- Очевидно, элемент а£К принадлежит множеству Н%0 в том и только том случае, если £0 входит в область определения оператора оха: S(1) —> S(2), т. е. £0£Е(1) и ага\0 < |0. (Здесь и в дальнейшем через оаЕ,у где а —гомоморфизм категории К-в операторную категорию Klf a£K и ^fE^ мы обозначаем образ элемента £ при отображении оа.) Через о[а обозначим оператор о[а: Е(1)—> Е(3), осуществляющий отображение множества Е(1) на множество S(3) и совпадающий на S(1) с оператором оха: S(1)—^Е(2). Для каждого а£К оператор о\а определяется однозначным образом. Пусть К[ = {о[а : а£К} и S1 есть
112 Н. И. ГЛЕБОВ некоторая полугруппа частичных преобразований множества Ех [3], содержащая множество операторов К[. Поскольку ог: К—>К1 — гомоморфизм, то отображение о[: К —> К[ можно продолжить до гомоморфизма о': S —>Sj, положив о' (аг ... ап) = о[ал . . . а[ал (ai g #, i = 1, . '. ., п). Определим теперь множество SdS я отображение f (а) = Ра(а£ 5, Pad S). Элемента £ S принадлежит множеству S в том и только том случае, если £0 входит в область определения оператора а'а, т. е. а'а£0 имеет смысл. Далее, элемент b£S принадлежит множеству Pa(a£S) 1 в том и только том случае, если а'&£0 -< ff'a£0. Докажем, что таким образом определенные множество S и отображение /(а) удовлетворяют всем условиям выделимости в ©я множества #£0. Пусть ab£S, Ъ £ К и с£а(ЬК f| /f), т. е. £0 входит в область определения оператора о'(ab) и c = ald, bd£K. Тогда произведение a^-c^d определено в jft^, т. е. область определения оператора o[d содержит область значений оператора о\Ьу следовательно, £0 входит в область определения оператора а'с = а' (ab)-a[d. Таким образом, а(ЬК [} K)CZ'S, т. е. множество S есть правый /£-идеал. Кроме того, если а£#£0, то #|// П К Ф Л, т. е. существует элемент d£K такой, что da£K и dH^ [) К Ф Л. Последнее условие в свою очередь означает существование элемента а'£#|0 такого, что da' ^К. Следовательно, произведения ■Gyd-Gfl и о^-ога' определены в К1у но в силу определения операторной категории это означает, что области определения операторов o^i и ога\ а вместе с тем и операторов а[а и о[а' совпадают. Поскольку а' G#£0, то £0 принадлежит области определения операторов о[а и о[а\ т. е. a£S. Тем самым доказано, что правый /f-идеал 5 содержит левую производную подкатегорию множества Н%0. Отображение/(a) является каноническим. В самом деле, если а£Ръ и с£РаУ т. е. 1 o'alQ -< o'b£0 и 1 o'cl0 < a'a£0, то по аксиоме подчинения 1) имеем: 1 o'cl0 < o'blQ1 т. е. Если a £ Рь, с £ К и ас, be £ S, то 1 a'a£0 < o'bl0 и элементы a'a£0, a'6£0 входят в область определения оператора о[с. Следовательно, по аксиоме подчинения 2) имеем: 1 о[с{о'а10) < о[с(о'Ь1„), т. е. ас 6 Рас.
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ ИЗ Отображение f(a) согласовано с Я^,. В самом деле, если а^Н^ и с £ Нца f] S, то существует элемент d^H^ такой, что c = da, и £0 принадлежит области определения оператора o'c = o[d-o[a, следовательно, о[ dl0 принадлежит области определения оператора о[а. Так как d £ Я^, то 1 и по аксиоме подчинения 2) имеем: 1 т. е. 1 о'с%и < о[а£0. Следовательно, Если а б Я^, Ъ g Н^ и с б JPba f) 5, то существует элемент d £ Рь такой, что c = da, и £0 принадлежит области определения оператора о'с = = o'd-o[a9 следовательно, o'dl0 принадлежит области определения оператора о[а. Так как d£Pb и Ь^Н^, то o'dl0 < а'6£0, а'6£0 < £о, откуда по аксиомам подчинения т. е. 1 о'с%0 < о'а\ь. Следовательно, Если а€#?0 и 6бРа П#. то И а'^0 < а'а£0, откуда по аксиоме подчинения 1) следует: о'Ъ10 < 10. С другой стороны, по определению множества Н^ всякий элемент Ъ£К, обладающий а^квазиинвариантом £0, принадлежит множеству Я^. Следовательно, ра[)Кан1о. Наконец, отображение /(a) обладает свойством F%R. Действительно, если aNaPa{a£S9 NCZK) и b£aN®Ry то существует элемент c£N®R & Проблемы кибернетики, вып. 9
114 Н. И. ГЛЕБОВ такой, что Ь = ас, и для всякого элемента d£N имеем: т. е. По лемме 1 следовательно, т. е. o'at0£R(N). R(N®R) = R{N)9 o'at0£R(N®*) <j'bt0 = o'c(o'aZ0)<a'at0f aN**CZPa. Если c£(N®R)'9 то по доказанному выше существует элемент c'£N®R такой, что области определения операторов а[с и о[с' совпадают. Но оператор а^с' определен на а'а|0, следовательно, и а[с(а'а10) имеет смысл, т. е. a(N®R)' CZS. Необходимость доказана. Достаточность. Пусть правильная система (5 = {#0, а£/} такова, что всякое множество На £ © выделимо в (£. Рассмотрим некоторое множество На € @, где а £ /. По условию существуют правый /Г-идеал S(a\ содержащий Н'а, и каноническое отображение /а (а) = Р^ (а G S(a\ Р(аа) (Z 5(а)), согласованное с На и обладающее свойством /^g. Построим /?0-критерий эквивалентности, которому соответствует правильная система @а такая, что На £ @a С ®. Для этого на множестве Еа={Ео> %i€> 10а.е£К\К9 agS(a)}, где £0, ^ — некоторые фиксированные элементы произвольной природы, определим операторную категорию Ка следующим образом. Каждому единичному элементу е£ К поставим в соответствие множество ХесЗа; если e£Hi9 то Хе = {l09 lxe9 t0a:a£ (S(a) [) S(a)e) [} Те}; если e£#i, то Хе = foe, Z0a:at (S(a) f) S(a)e) (J Te}; здесь Те = {а:а{е}'[)Р(аа)фЛ}. Очевидно, Xei = Xejj тогда и только тогда, когда е, = е2- Определим, далее, для всякого а £ К оператор где еа и епа — соответственно левая и правая единицы элемента а. Для этого положим AaS0 = ?oa»
О СТРОЕНИИ КЛАССА К-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 115 если 10£Хе^9 и Aa(l0b) = l0ba9 если l0b£Xe'. Чтобы это определение было корректным, необходимо показать, что образ Aag всякого элемента gG-Xy принадлежит множеству Хе». Для элемента g^a это очевидно. Пусть g0£ Хе>, т. е. еа^Н^ тогда в силу (10) ag#d. Поскольку HadS(a) и а = ае"аgS(a)e"a9 то a£S{a)r}Sia)ea и Aat0 = Z0a£Xe». Если t0b£Xe>, то либо Ъ б 5(0) П 5<%а, либо Ь 6?V. Пусть Ь б *S(0) Г) 5(а)(?а, т. е. существует элемент cgS(ct> такой, что Ь = сеа и сеаб5(0). (22) Так как 5(0) есть правый /ST-идеал, то из (22) следует Ьа = сеаа £ 5(0), Кроме того, Ьа = Ьае£ б 5(а)<?а. Следовательно, Ьа g S(a) fl S{a)eHay т. е, Aa (g06) = l0ba б Хе*. Пусть, наконец, Ь£Ге', т. е. существует элемент сб {еа}' такой, что Ьс£ Рь. Если с б jfiT, то в силу свойства F$ отображения /а (а) и свойств операции ' имеем: ЬКГ = Ь{сГсЬ({с}®Гс5(0), откуда следует bag &{<?«}'СSva); если cgX, то с = еа и foa€S(a), что дает ba=beaa£Sia) (так как 5(0) есть правый ЛГ-идеал). Следовательно, в обоих случаях имеем ba£S{a) [} S(a)ea, т. е. Aa(g06) = g06a£Xe*. Таким образом, корректность определения оператора Аа:Хе* ->Хе» доказана. a a Операторы Аа\Хе* ->Хе», а£К, и только они являются элемен- a a тами #a. Покажем, что Ка есть категория. Для этого определим отображение оа:К->Ка посредством равенства aaa = Aa, a£K, и докажем, что aa есть гомоморфизм. В самом деле, имеем aaa = Aa, aa6 = Ab и oa(ab) = Aab. Поскольку произведение ab определено в К, то епа = ёь и Хе<г =Хе/, следовательно, произведение АаА6 операторов Aa: Xt> -* Хе» и Аь: Хв' ->• Хе» существует в смысле умножения в операторных категориях. Кроме того, еа = е'аъ и еъ = еяаъ> следовательно, Хе*=Х * и -Х> = a ab Ь __j = XeV Если Ъ0£Хе>9 то ao a АаАь?0 = Аь (Aal0) = Ab(Z0a) = \йаЬ = АаЬ£0; если £0cgXe'f то КАь &ос) = Аь (Аа (10с)) = Аь (g0ca) = g0cafc = ЛаЬ (g0c); и, наконец, AaAb (g^) = Аь (Aa (g^)) = Ab (g^ = = Аь (Б^ь) = g^ = g^ = Aab (tie'ab) = Aob (lxe'Q). Таким образом, aa (ab) = Aab = AaAb = aaa.aab, т. е. отображение aa категории /f на множество Ка является гомоморфизмом. Так как произведение AaAb определено в том и только том случае, если произведение ab определено в К, то Ка есть категория. 8*
116 Н. И. ГЛЕБОВ а Определим на множестве Еа отношение -< следующим образом: а 50а *< So^ т°гда и только тогда, когда а£Рь; а ( £оа < £о тогда и только тогда, когда а б На (J (J Рь; а во всех остальных случаях отношение -< не определено. а Покажем, что отношение -< удовлетворяет аксиомам подчинения. В самом деле, если 10а < %0Ь и 10Ь < £0с, то а£Р(ьа) и Ь£Р{са)9 откуда в силу монотонности отображения /а (а) следует Р(6а) сР{са\ т. е. а б Р™ и 10а < 10с. Если l0a < l0b и l0b < £0, то а б Да) и 6 б Яа (J [ J ^°\ сеяа т. е. либо аб^ьа) и &б#а, либо agPj0 и Ь^Р^ при некотором с' б #а, что в силу монотонности отображения /а (а) дает а б /)(с") и с' б #а, и мы в обоих а а случаях имеем а б U Рс $ т. е. 10а<10. Таким образом, отношение -< транзитивно. а Пусть 10а -< 10Ь и оператор Ас:Х0'-^Хв'/ определен на 10а и £0Ь. Тогда а£Ръа) и ас9 bc£S(a\ откуда в силу стабильности справа отобра- а жения /а (а) следует ас^Р^У, т. е. Ас(%0а) = Ъ0ас <l0bc = Ac(%0b). Если 10а <19 я оператор Ас определен на £0а и £0, то а б На (J U ^ьа) п Боа» £о € ^е'- Возможны два случая: либо а£На, либо agP^P при некотором Ь'£На. Поскольку |0бХе', то ес$На, а следовательно, и с£На. Из Ь'£На и сб#а в силу согласованности отображения /а(я) с Яв получаем: Я„сП5(а)с4а) />^сП5(а)С^а). а Так как ас€ то в обоих случаях ас £Р(са\ т. е. Ас(£0а) = £0ас<£0с = О = АС£0. Таким образом, отношение -< является отношением подчинения. а Пусть /?0 = (/Г0, -<, аа) и /?а-критерию эквивалентности соответствует правильная система (5а. Покажем, что система (5а содержит множество На и является подсистемой исходной системы 6. Если #£ есть максимальное подмножество множества К9 обладающее аа-квазиинвари- а ,антом 5бЗа, и Н^ФА, то //^бба- Поскольку £0а -< £0, а б //а, то Ha(ZHi0 и, следовательно, #^б@а- с Другой стороны, если а^Н^9 о, t . ю £0а = Аи£0-<£0, следовательно, a6#aU [J /Т. Если бы имело место ьен, а
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 117 при некотором Ь' g Яа, то в силу согласованности отображения fa (а) с На P[Vf]KczHa9 т. е. а£Яа. Таким образом, ^о = Ньо € ©а- а Пусть Я$ е @а, где Б == £0а £ Sa. Тогда £0ab = Ab (%0а) -< £0a, Ь g #6, т. е. аН^аР^К откуда в силу свойства F$ следует аН® ClP^K Так как для всякого элемента ig/f имеет место Ь £{<?£}', то для б£Я$ мы имеем: а{еь}'Л*ав)*А, т. е. а£Гв',и оператор Аь, где Ь£Я. , определен на £0а, причем о » a Ab Uoa) = loab < £oa> т. е. множество Я$ обладает аа-квазиинвариантом £ = £0а. Поскольку HtdHi и по определению множество Я$ является максимальным подмножеством множества К, обладающим а0-квазиинвариантом £, Если Я£(£0, то Я= П #$ и, следовательно, по определению пра- £еяа№ вильной системы Я б 6. Таким образом, eacze. По доказанному для всякого a £ / может быть построен Я0-крите- рий эквивалентности, которому соответствует система (£0 такая, что Яа б 6a (Z (£. Следовательно, (S=U6a. (23) afcl Пусть Я/=0Яа. По теореме 3 Я/-критерию эквивалентности соответ- ствует минимальная правильная система (£/, содержащая все системы @0, а б/, откуда, учитывая (23), следует: Теорема доказана. Используя теорему 9, легко установить существование достаточного Я-критерия эквивалентности ([1], теорема 2). В самом деле, если такой Я-критерий существует, то ему должна соответствовать максимальная правильная система (£/, т. е. система, состоящая из всех /^-замкнутых подмножеств множества К. Поэтому для доказательства существования достаточного Я-критерия эквивалентности достаточно показать, что произвольное /f-замкнутое множество HCZK выделимо в (£/. Предварительно заметим, что при любом NCZK K(N)f)K = S(N)r)K (24)
118 Н. И. ГЛЕБОВ И N®i=K(N)[)K, (25) где 5(ЛГ)- О N\ Пусть L — некоторая подполугруппа S9 удовлетворяющая условиям (11) и (12) Г в частности, в качестве L можно взять £(Я) = (J ЯМ. fe=i Тогда по лемме 5 отображение / (a) = Pa = La(a£ S) является каноническим отображением, согласованным с Я. Кроме того, если aNaPaiaZS, NczK), то при любом целом А>1 из aNkClLa получаем aN^CZLaN CZ La = Pa. Следовательно, aS(N)CZPa, откуда в силу (25) и (24) aN®i =a(K(N)r)K) = a(S(N)f)K) CZaS(N)^Pa, т. е. отображение f(a) обладает свойством F$ . Таким образом, каждое /Г-замкнутое множество Я выделимо в ©i, чем и доказывается существование достаточного Я-критерия эквивалентности. Применим полученные выше результаты к группам. Пусть К есть группа, а Я —произвольное ЛГ-замкнутое множество неединичных элементов группы К. Очевидно, если е есть единица группы К, то множество H\Je является подполугруппой К. Справедлива Теорема 10. Для того чтобы множество Я было выделимо в (£0 = [К9 Я}, необходимо и достаточно,чтобы при любом а£К выполнялось отношение аНаНа. Необходимость. Пусть множество Я выделимо в (£0 и существует элемент а£К такой, что а~1Н (£.На~1, т. е. Наф.аН. Тогда существует элемент с£К\Н такой, что ас б На. Выберем элемент b£K так, чтобы аб£ Я, и обозначим через N множество, состоящее из одного элемента с. Так как с£К\Н, то N®° = K. Кроме того, aN®ob = aKb = K\ab ZD К\Н, т. е. а^оЬ[](К\Н)Ф Л. (26) Таким образом, существуют элементы a, b£ К и множество NCZ К такие, что ab£H, aNClHa = Haf]K и выполняется соотношение (26). Отсюда по теореме 7 следует невыделимость в 60 множества Я. Полученное противоречие доказывает необходимость условия теоремы. Достаточность. Так как для всякого множества NdK имеет место a^aN, то из aNClHa{]a следует aN(ZHa. По условию теоремы при любом а£К имеем аНаНа, т. е. а'гНаС2Н. Следовательно, если aNatla, то Ncia^HaCZH и N®° = H9 aN** = aHCZHaC:Ha\Ja.
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 119 Таким образом, для всякого множества N С К, удовлетворяющего условию aNczHa\Ja, имеет место aN**CHa\Ja. Следовательно, по теореме 8 множество Н выделимо в ©0. Теорема доказана. Теорема 11. Если Кх есть подгруппа К, то для того чтобы существовал R-критерий эквивалентности, соответствующий системе <£о = {^» ^ifT^}> необходимо и достаточно, чтобы Кг была нормальным делителем К. Доказательство. По теореме 4 множество К выделимо в 60. Если подгруппа Кг является нормальным делителем группы К, то для любого а£К имеет место a (^ Г) #) CZ (#,(-)#)<*, я по теореме 10 множество К1[]К выделимо в @0. По теореме 9 из выде- лимости в @0 множеств К и Кг[]К следует существование Д-критерия эквивалентности, соответствующего системе @0. С другой стороны, если существует /?-критерий эквивалентности, соответствующий системе (50, то в силу теорем 9 п 10 при любом а 6 К имеет место Следовательно, подгруппа Кх является нормальным делителем группы К. Теорема доказана. Теорема 12. Для того чтобы всякой правильной системе (5 соответствовал некоторый R-критерий эквивалентности, необходимо и достаточно, чтобы группа К была абелевой или гамильтоновой. Необходимость. Пусть К1 есть произвольная подгруппа К. Поскольку существует Д-критерий эквивалентности, соответствующий системе (В0={К, K1f)K}, то по теореме 11 подгруппа Кх является нор^ мальным делителем группы К. Следовательно, группа К является либо абелевой, либо гамильтоновой. Достаточность. Пусть (£ — правильная система и Н — произвольное множество из @. В силу теоремы 9 для доказательства существования /?-критерия эквивалентности, соответствующего системе @, достаточно доказать выделимость в (£ множества Н. Но ввиду теоремы 6 для этого достаточно доказать, что множество Н выделимо в(£0 = {АГ, #}С(5. По теореме 10 множество Н выделимо в ©0, если аНаНа при любом а£К. Очевидно, в случае абелевой группы последнее условие всегда выполняется, поэтому нам остается доказать, что оно выполняется ив случае гамильтоновой группы. В самом деле, пусть К — гамильтонова группа и Г — циклическая подполугруппа К, порожденная элементом b б К, для которой при некотором а б К имеет место аТфТа. Очевидно, если бы ab£Ta, то аГсГа. Следовательно, ab£ Га, т. е. ab ф Ьпа
120 Н. И. ГЛЕБОВ при любом целом п > 0. С другой стороны, так как группа К гамиль- тонова, то aGcZGa, где G — циклическая подгруппа, порожденная элементом Ь. Таким образом, при некотором целом п > 0 должно иметь место равенство ab = b-na. (27) Кроме того, bG'dG'b, где G' — циклическая подгруппа, порожденная элементом а. Следовательно, при некотором целом т Ф 1 имеет место Ъа = атЬ. (28) Из (27) и (28) следует: ba = bn+1ab = ambt откуда 6n+i = a™-i (29) и Ьп^а = ат. Многократно применяя к левым частям равенств Ьп*1а = ат и bnab = a соотношения Ьа = агпЬ и ba~1 = a~mb9 получим: 6nafc = a™V+1 = a, что в силу (29) приводит к равенствам 2m^-i=e a^n+m-2==e Но при тф\9 по крайней мере, одно из чисел mn+1 —1 и тп-\-т — 2 отлично от нуля, следовательно, элемент а имеет конечный порядок. В таком случае в силу (29) элемент b имеет тоже конечный порядок. Значит, подполугруппа Г совпадает с подгруппой G и аТсТа. (30) Таким образом, для всякой циклической подполугруппы Г имеет место (30) при любом а£К. Поскольку произвольная полугруппа пред- ставима в виде объединения своих циклических подполугрупп, то предыдущее утверждение справедливо для произвольной подполугруппы группы К. Множество H\Je является подполугруппой, следовательно, a(H{je)CZ(H]Je)a9
О СТРОЕНИИ КЛАССА Я-КРИТЕРИЕВ ЭКВИВАЛЕНТНОСТИ 121 а вместе с тем и аНаНа при любом а£К. Теорема доказана. Достаточно полное представление о строении правильных систем, соответствующих /?-критериям эквивалентности, можно получить из теоремы 13, которая является обобщением теоремы 10. Теорема! 13. Для того чтобы множество Н £ (5 было выделимо в 6, необходимо и достаточно, чтобы а~1На £ (£ при любом а£ К. Необходимость. Элементы а £ К9 Ь £ а_1Я и множество N = a~xHa удовлетворяют условиям (14) и (15) теоремы 7. Поскольку множество Н выделимо в 6, то в силу теоремы 7 условие (16) этой теоремы должно нарушаться, т. е. имеет место a (a^Haf b[)(K\H) = Л, или aia^HafbdHlJe. Из последнего соотношения в силу выбора элемента b следует: (a'1Hafcia-1(<Hl]e)b'l = a-1Hb-1[ja-1b-1CZa-1Ha]Je. Так как еЦа^На)® и аГЩаа^На)*, то a'1Ha^{QT1Hafi т. е. а_1#а£б. Достаточность. Так как а хНа £ (£, а £ К, то для произвольного множества NaK, удовлетворяющего условию aNCZHalJa, т. е. NtZa'iHa, имеем: Л^скЛЕГа, или aN^CZHaClHa{ja. Следовательно, в силу теоремы 8 множество Н выделимо в ©. Теорема доказана. Из теорем 9 и 13 следует, что правильная система (5 соответствует некоторому Л-критериго эквивалентности тогда и только тогда, когда вместе со всяким множеством #£(£ она содержит все множества a~lHaf а£К. Отсюда, в частности, следует, что совокупность правильных систем ©, соответствующих всевозможным .ff-критериям эквивалентности, замкнута относительно операции пересечения. В применении к задаче о представимости элемента а£К ъ виде произведения элементов из множества NciK [1] это означает, чта
122 Н. И. ГЛЕБОВ существует наислабейший /?-критерий эквивалентности, обладающий следующим свойством: элемент а представим в виде произведения элементов из N, т. е. a£K(N)9 тогда и только тогда, когда R(a)ZDR(N). Система (£, соответствующая этому, в некотором смысле простейшему, Л-критерию эквивалентности, является наименьшей правильной системой, содержащей все множества a~1(K(N)[]K)а, а£К. ЛИТЕРАТУРА [1] Глебов Н. И., Об алгебраической эквивалентности подмножеств категории, Сб. «Проблемы кибернетики», вып. 8, Физматгиз, 1962. [2] К у р о ш А. Г., Лившиц А. X. и Ш у л ь г е й ф е р Е. Г., Основы теория категорий, УМН 15, вып. 6 (96), 1960. J3] Л я п и н Е. С, Полугруппы, Физматгиз, 1960. Поступило в редакцию 31 X 1961.
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ Р. И. ПОДЛОВЧЕНКО (ЕРЕВАН) Построение программы, реализующей некоторый алгоритм на электронной вычислительной машине (ЭВМ), начинается с составления схемы счета для этого алгоритма; последняя представляет собой специализированную запись алгоритма в терминах операторов и логических условий, выполняемых ЭВМ. Следующим этапом на пути построения программы является переход от схемы счета к соответствующей ей схеме программы. Алгоритм такого перехода для некоторого класса схем счета рассмотрен в работах [1 — 5]. В настоящей статье разбирается задача, приводящая к схеме счета специального вида, для которой упомянутый алгоритм перехода к схеме программы неприменим. Предложенный здесь прием построения схемы программы назван методом свертывания циклов исходной схемы счета. В статье используется язык логических схем, описанный и примененный в работах [1 — 5]. 1. Пусть А = (а19 а2, ..., ап)—точка ^-мерного пространства с целочисленными координатами и В —множество, состоящее из точки А и всех <эе проекций на координатные подпространства любого числа измерений. Рассмотрим следующую задачу: построить алгоритм, который на множестве В определяет максимум модуля любой симметрической функции ф от п целочисленных переменных*). Требуемый алгоритм должен быть реализован в виде программы. 2. В целях построения этого алгоритма зададимся определенным порядком перебора элементов множества 5. Для этого разобьем множество В на п попарно непересекающихся подмножеств B{h\ k = 1, 2, .. ., и, где B{h) состоит из всех проекций точки А на всевозможные /с-мерные подпространства. Будем задавать /с-мерное подпространство с помощью вектора (iu i2> ...,ife) с целочисленными компонентами, удовлетворяющими условиям: : 1<Ч< *2<---< *ь<и; компоненты этого '"вектора "представляют собой порядковые номера координатных осей, на которые натянуто данное подпространство. Легко видеть, что всякий пересчет всех векторов (ilf i2, ...,y описанного выше типа приводит к упорядочиванию элементов множества Z?(ft). Мы остановимся на следующем способе пересчета: пусть компонента ix пробегает последовательность значений 1, 2, ..., п+ 1 — к; для каждого фиксированного значения it = ij компонента i2 пробегает последователь- *) Предполагаем, что алгоритм вычисления функции <р имеется.
124 Р. И. ПОДЛОВЧЕНКО ность значений ij + l, *J + 2, . ..,л + 2 — /с; вообще, для каждого фиксированного значения fl компоненты ii% Z=l, 2, ...,/с—1, компонента iI+1 пробегает последовательность значений i? + l, i? + 2, ..., и + Z+l—/с. Если теперь сами множества 5(ft), /с = 1, 2, ..., п, рассматривать в порядке, соответствующем возрастанию индекса /с, то мы получим правило пересчета всех элементов множества В. Такое упорядочивание элементов множества В превращает В в последовательность. Перебор элементов последовательности В начнем с первого и будем сопровождать вычислением функции ф для каждого из рассматриваемых элементов. Пусть таким образом рассмотрен отрезок В последовательности В и определено число \х, являющееся максимумом модуля ф на множестве В. К отрезку В присоединим следующий элемент А последовательности В9 новое значение [i полагаем равным тах(ф(Л), \i). Действуем таким образом до тех пор, пока не исчерпаем всех элементов из В. Легко видеть, что мы получили описание требуемого алгоритма. 3. Для реализации предложенного алгоритма в виде программы будем предполагать, что: а) координаты точки А хранятся в ячейках а + 1, а+ 2, ...,а + п*) соответственно; б) существует такой оператор R, который вычисляет значение функции ф в точке (xlt Xo, ...,жп), если перед работой этого оператора числа хи х2, ..., хп хранятся в ячейках р + 1,р-|-2, ...,р + и соответственно; значение функции ф (xlt x2l ...,xn) оператор R помещает в ячейку у*. Пусть компоненты вектора (г\, /2, ..., ik), задающего некоторое А-мерное подпространство (1 < /с< л), хранятся в ячейках у+ 1, у+ 2, ... .. ., у-\-к соответственно. Построим оператор, который определяет координаты точки Л*, являющейся проекцией точки А на данное подпростран ство. Для этого введем операторы о* = (о->(р + о), Lts((o + 0-^(P + 0), 1 = 1, 2, ...,п, и составим произведение M(ft) = DXD2 ... DnLi Ц ... Uk = ft Di П Lr Функционированием последнего координаты точки А* помещаются в ячейки Р +-1, Р + 2, ..., р + л, т. е. подготавливаются условия для работы оператора R. Рассмотрим схему ... 1 2 3 m ••^k.1 + i)^ih)Wh)Rf(ih)p(ik>Xh)\...f(im)p(im>Xm),\... 3 2 1 ^ J(h) P(h>K)U(h)P (h>K)\f(h)P (h>K)\ > гдеХт = м+ l + m —/с — числа, хранящиеся в ячейках б + га, т= 1, 2, ..., к (1 < к < п). Легко проверить, что схема S(ft) реализует перебор *) Здесь и в дальнейшем ячейки с различными обозначениями будем считать различными.
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 125 элементов последовательности B^k\ описанный в п. 2, сопровождая его вычислением функции ф для каждой из рассматриваемых точек. Предположим теперь, что ячейка т] содержит максимум модуля функции ф на множестве U я(|); 4=1. 2,..., fc-i тогда схема 1 2 m ...•((«*-!+l)-*^)iM«k>Rp(hl<|Y*|)f(Y*-*»l)f/(Wx h m 2 1 XP(ik>K)\---f(iJp(im>K)t'--f(h)p{h>h)\f(h)p(ii>h)t позволяет определить максимум модуля функции q> на множестве U £(i); i=l, 2,..., h последний оказывается записанным опять в ячейке т). Введем теперь оператор U, который при заданном к (1</с<га) определяет величины Х3, 5=1, 2, ..., /с, используемые в схеме T(fe). Пусть ячейка б хранит число Х0 = п+1 — /с, а оператор Us, 5=1, 2, ..., к, вычисляет Х8 = ХзЛ +1 и помещает в ячейку б + s\ тогда схема программы оператора U может быть записана в виде *): Ufc = (U, -> U.) \ U, F <*) р (U, > UM) |. Решение всей задачи реализуется схемой ((и + 1) - б) (0 -> Л) / (- б) UJ™/ (- б) U2T<* .../(- б) Од^Стоп, (1) где оператор / (— б) уменьшает на единицу число, находящееся в ячейке б. 4. Приведение схемы (1) к более компактному виду упирается в последовательное решение двух задач: 1) переход от оператора М(Л>, входящего в схему Т(/°, к такой соответствующей ему схеме программы, строение которой не зависит от величины /с; 2) преобразование схемы Т</1) в эквивалентную ей схему, не зависящую по своему строению от /с. Займемся решением первой из этих задач. Для этого оператор M(ft> запишем в виде произведения DL(/°, где D=ffDi. i=l L = LilL{2 ... L. # Число и строение сомножителей произведения D не зависят от /с; схема программы для D 1 1 D = (D1->Di)lDiF(0p(D|>Dri+l)f обладает тем же свойством. Построим и для оператора L(ft) схему программы, не зависящую по своему строению от /с. Введем для этого оператор L0^(a^p) *) Индекс к в обозначении схемы Uft указывает на то, что входящее в схему логическое условие A>(U8>Ufcbl)t исполыует информацию (оператор Ufetl), зависящую от £. Аналогичными причинами обусловлена индексация схем Ь*л, Шк, 5(л, ^mk и 9**t рассмотренных ниже.
126 Р. И. ПОДЛОВЧЕНКО и рассмотрим вспомогательную схему L"» = Ф (L0) у +1, 4L) ЧЛ> (L0, Y + 2,2L) >L ... Ф (L0, Y + ft. ftL) "L = = fj {Ф(Ь„, y + r,'LyL}, Г=1 здесь через Ф (L0, y + r, rL) обозначен оператор формирования, который с помощью числа ir (хранящегося в ячейке у + г) переводит оператор L0 в оператор Цг и помещает последний на место элемента rL схемы Lk (г= 1, 2, ..., /с)*). Легко убедиться в том, что по выполняемым функциям схема L(h) эквивалентна схеме L(fe); вместе с тем для схемы Lik} можно составить схему программы, руководствуясь известным правилом перехода от схемы счета к соответствующей ей схеме программы, см. [1, 3]. Обозначая через Фг оператор формирования Ф(Ь0, y + r,L)t г = 1, 2, ..., к сяему программы для L(/° запишем в виде U = (Ф, -> Ф,) J ФГЬР (г) р (Фг > Ф,+1) f. Так как схема L* по своему строению не зависит от /с, то требуемая схема программы для оператора М(/° имеет вид mh = (Dx -> Dt) J DtF (0 p (D, > Dntl)} (Фх -Фг) 1ФГЬГ (г) р (Фг > Фл+1) |. 5. В схеме T<h\ ft=l,2, ...,п, оператор M(ft> заменим схемой Шк и введем следующие обозначения: (l-iJsC,, ((*,„_!+ l)->*J = Cm> m = 2,3 ft; fVm) = fm' P{im>K) = Pm. I»= 1, 2, . . ., ft; aRkRp(l4l<lY'l)t(Y*-4)i = afc. После этого схема T(ft> примет более обозримый вид 12 m ft ft m 2 1 N</,> = C11C2| ... Cm| ... Ckl%kfkPht ... /„jU ... /лТ/iPit- Займемся преобразованием схемы в эквивалентную ей и не зависящую по своему строению от к. Для этого с помошью граф-схем зафиксируем те элементы схемы N \ которые выполняются в ней после m функционирования группы fmpm f (1 < m < /с). Рассматривая случаи: 1) /71=1, 2) т = к, 3) 1 < ттг < к, каждый раз после логического усло- тп т вия рт\ = p(im>^m) убудем ставить две стрелки с пометками 1 и О, которые указывают группы элементов, выполняющиеся после проверки этого логического условия, соответственно в случаях, когда рт= 1 (т. е. im>hm) и рт = 0 (т. е. im < Xm). Обе группы элементов условимся обрывать на первом встречающемся в них логическом условии; завершение процесса функционирования схемы N(/i) будем отмечать символом ') Программная реализация оператора Ф (L0, Y+r» rL) рассмотрена ниже, в п. 10.
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 127 «Стоп». Действуя таким образом, получим: 1 1) m=l: /jft -> Стоп, 2) т = к: fhPh ^ о 3) 1< т < к: fmPf1 Заменяя произведение -* (IICv)V^; v=2 /fe-lPfe-1' 1 * /m-lPm-1' —► ( ft cv)»k/*A- k П cv v=m-fl соответствующей ему схемой программы Стк = (Сж -> Cv) \ F (v) Cvp (Cv > Cfc) f. объединим три случая в один следующим образом: 1 fmPm ' 4 4 » Р (ст = СО t Стоп | /^р^, 5_ 5 -* р(ст#с,)|Стл^/л. (2) Введем теперь в рассмотрение оператор F( —ттг), воздействующий на элементы /т, рт и Ст (последний играет роль начальной информа- ~ 4 ции для схемы Cmh и используется в логических условиях р (Сш = Сг) \ 5 и P(Cm=^Cfc)t), и операторы (f-h -> /J, (pk -> pm), (Ck -> CJ, задающие начальный вид переменным элементам /m, pm и Ст. С помощью этих операторов граф-схема (2) может быть преобразована в схему 1 -+ р(СтфС1)\¥(-т)\1 Стоп, 5 ~ 6,7 i fmPv -г» р (с- ф G*) t cmft (/* -> /J {ph -> jO (cfc -► cj j «k t; (3) последняя допускает запись в форме строки *): Jp(Cm Ф Cfe) tCmft (/ft->/J {Ph-+pm) (Ск -> CJ J*fc x xt/mPmtPtGm^QJtPt-w)?!. (*> Заметим, что при функционировании схемы N(ft) первому выполне- k нию группы элементов fhph | предшествует выполнение произведения UICvK; (5> v=l *) В^ схеме (4) и вытекающей из нее схеме 9?^ опускается символ «Стоп», играющий в предыдущих рассмотрениях чисто вспомогательную роль.
128 Р. И. ПОДЛОВЧЕНКО с другой стороны, если функционирование схемы (4) начинается при з тФку то первому выполнению группы fkph\ в схеме (4) предшествует выполнение произведения Cmh (/k->/J (Ph -> Рт) (Ch ->Cm) 3tft. (6) Если в последнем произведении взять т равным нулю, то оно будет включать в себя произведение (5); поэтому достаточно схему (4) умножить слева на оператор (С0—>Ст), чтобы по выполняемым ею функциям она была эквивалентна схеме N(ft). Выполняя это умножение, мы придем к схеме 9lft = (C0-^Cm)Jp(CTO#Cft)t(Cm^Cv)lF(v)Cvx X р (Cv > С„)} (/„ -> U {Рн ->Рт) (С* -> С J J *Л /« X ХРт\р{СтфС1)\¥(-т)\1 Схема 9lft эквивалентна схеме а следовательно, и схеме Tv '; так как, кроме того, строение схемы У1к не зависит от /с, то она полностью решает задачу 2), сформулированную в начале п. 4. Переход от схемы T(ft) к схеме 9lft можно квалифицировать как свертывание циклов схемы Т( \ Задачи, решение которых приводит к схемам, аналогичным Т(/1) и, следовательно, допускающим свертывание циклов, будем называть задачами со свертывающимися циклами. 6. Возвратимся к решению основной задачи, поставленной в п. 1. Так как схема У1к эквивалентна схеме T(fe\ fc = l, 2, ..., л, то схема ((„ +1) _> 6) (0 -> Л) П {/ (- б) IVJIJ Стоп (7) будет эквивалентна схеме (1), решающэй нашу задачу. Схеме (7) {соответствует следующая схема программы: ((п +1) -*8) (А -* fh) (А -> рк) (С, -+ Cfc) (Ф2 -* Ф/1+1) X X(U2^Uh+1)(0^Ti)I/(-PAF(^(kl)f Стоп; (8) здесь оператор F(fc) воздействует на элементы fh9 pk, Gk, 0>ftfl и Ufc4, играющие роль информации для схем У1Н и Ufe. Схема (8) не только решает нашу задачу, но и выгодно отличается от схемы (1) своей компактностью. 7. Прежде чем перейти к составлению программы, реализующей схему (8), рассмотрим еще один вариант преобразования схемы N(fe) в схему, эквивалентную ей и не зависящую по своему строению от к. Легко проверить, что схеме №> = (1 -^ у {vj ft) p (t, > хх)} (ft = i) эквивалентна схема схеме N(2) = (1 -+ it) I ((i, +1) -* »,) J %f (is) p (f, > X.) |/(4)P (*, > X,)} (* = 2)
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 129 эквивалентна схема 1 2 О N<2> = (0-» i,)If &)р(i, < X,)|(h -* Ш / (h)p(i*<K)№\\; вообще, схеме s-i N(s) = (i^J-1)|((i1 + i)-^i2)!((i2+i)->y|...(as.2 + i)->^1) I x X((is.1 + l)->is)hj(is)p(is>K)U(h.i)P(h.i>K-i)S\l ■■■ ...f(is)p(i3>K)tf(i2)p(h>h)\f(h)p(h>h)\ (s=l, 2, .... ft) эквивалентна схема N(s) = (0 -^ гх) {/ ft) /> & < Xt) f (ix -> i.) 1 f(it) P (it < K) t X 3 2 s-1 x (is -* У | / (i„) ^ (i, < b,) f ... (i,., -»• »,.,) 4. / (i,.!) x x/>(««.!< Vi)'t2(*.-i-> *.Н/(«'.Ж«'.<ь.)Т ®.tl- Заменяя в последующих рассмотрениях схему эквивалентной ей схемой N(/l), введем обозначения (0 -> ix) s Q, (^ -> «J = Cm, m = 2, 3, .... ft; /(»'m) = /m. />(»m<*m) = A». ГП= 1, 2, . . . , к; тогда схема N(h) запишется в виде N(ft) = Сх | /1Л t С2 \ /2/>2 t С3 \ /зй t • • • Cm_1 | /„.^„..i f X ^ m ^ m—1 _ m-|-l ^ m ^ k—1 ^ h— 2 X Cm j /m/?m f Cm+1 j fm+xPm+i f • • • Cfe-1 j fk-lPk-1 t X _ ft _ k-1 feO хС,|/Л f 3tkfl- Аналогично тому как это было сделано в п. 5, зафиксируем группы элементов схемы N(/°, которые выполняются в ней после функциониро- ~ ш—1 вания группы fmpm f (1<^<A): 1) го = 1 : /xA —^ G2/2/;2, 2) /и = ft-: /fc/?ft. —> Стоп; о 0" > fk-lPk-l'y 3) 1< 77i< к : /тЯ | > ^m+Vm+lPm+l* ~^ fm-lPm-1- 0 Объединяя три случая в один, получим граф-схему 4' _ 9 Проблемы кибернетики, вып ,--^ р (Cm = Cft) t Щ 11 Cm+1/,n+1pm+1, 3 3 I-—» p (Cm = Cx) f Стоп j fm_j>m_v (9)
130 Р. И. ПОДЛОВЧЕНКО Используя операторы переадресации F(ra)n F(—га), каждый из которых воздействует на элементы С^, fm и рт, граф-схему (9) преобразуем в схему ?-*..*. ~ i--^ Р(Ст ФСК)\¥(т)Стt, №Л fmPn 1-г> р(СтфС1)\Р(-т)П Стоп, допускающую запись в форме строки: !akV/m?mb(Sm#CJk)tF(m)emtb(5m^C1)tP(-m)tt Последнюю схему умножим слева на операторы (Сх —> Ст), (/х —>/т), ~ ~ б (рх —> /?т) и стрелку \ безусловного перехода, приводящего к оператору С^; полученная схема \ = (сх -> Cj (/, -* /т) (^ -> ?т) f J »ft V /т Я, t /> (ст ¥= cft) f x XF(m)Jcmt{/)(C„l^C1)tF(-/n)tJ- эквивалентна схеме N(fe), а следовательно, и схеме N(fe) и не зависит по своему строению от к. 8. Каждой схеме X, функционирование которой рассматривается при некоторых фиксированных начальных условиях, можно поставить в соответствие о (X) — число тактов работы машины, необходимых для выполнения этой схемы X. Построенные выше схемы N(k), 9t fe и sJih функционируют при одних и тех же начальных условиях, поэтому было бы естественным сравнивать эти схемы по величине чисел a(N(/l)), a(9lfe) и a(9lft); однако подсчет этих чисел слишком сложен. Поэтому мы поступим следующим образом. Вместо схем N(ft), Шк и йк будем сравнивать между собой схемы N( \ 91*. и 91/*, где схема N(fe) получена из N(l) путем замены операторов Ст, т = 1, 2, . . ., /с, операторами С™ ~ (1 —> im), а схемы Щ и 91* представляют собой результат применения к схеме N(/l) преобразований, описанных соответственно в п. 5 и в п. 7. Соотношения между числами a(N(/l)), a(9tfe), <j($fe), с одной стороны, и числами a(N(/l)), а(Щ), а(9Й), с другой стороны, должны быть аналогичными. Действительно, структура схемы N( } совпадает со структурой схемы N(/l); далее, легко проверить, что схема 91*. получается из схемы %lh заменой операторов Ст операторами С*п, т = 1, 2, . . ., /с, а схема 91/1 —из схемы 9lft заменой операторов С^ операторами С™ = (0 —> гт), га = 1, 2, . .., к. Кроме того, схемы 9t£ и Sflfe (что следует из характера преобразований пп. 5 и 7) эквивалентны схеме N(/l). Занимаясь подсчетом чисел a(N(/°), a (91*) и a(91/*), мы будем исходить из следующих предположений: а) выполнение оператора 2Ife (в условиях рассматриваемого нами функционирования схем N(ft), 9t/* и 91/*) требует £/t тактов работы машины; б) выполнение оператора F( —га) схемы 91* и каждого из операторов F(ra) и F(—га) схемы 9i£ требует трех тактов работы машины; в) для выполнения каждого из остальных элементов схем N(/i), 9t£ и У1к (в том числе и безусловных переходов) требуется один такт работы машины.
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 131 В схеме N(fe) число повторений внутренних циклов не зависит от т состояния счетчиков внешних циклов. Поэтому элементы /т, рт\ и Ст_и (при т = к вместо C^+i нужно брать %к) схемы N } функционируют в ней ^ifx^. . . [гтраз, где \ix = Xt — 1, i = 1, 2, . . .,т(т = 1, 2, .... /с), т. е. число a(N( ^) выписывается сразу ___ fe-i a(N(fe)) = (2 + ^)fxlfx2... щ + 3 S №••• I*m+1- Так как схема Щ эквивалентна схеме N(ft), то группа элементов з 1тРт\ схемы Щ(т = 1, 2, . . ., /с) функционирует в ней тоже fi^ . .. \im з раз. Из них \1г\12 .. . fxm_xl раз логическое условие рт\ пропускает (см. верхнюю строку схемы (3)) к; группе элементов, для выполнения которых требуется 5 тактов, если т Ф 1; 1 такт, если /тг = 1; и 1x^2 . . . |Am_i(M'm"~ 1) Раз оно пропускает (см. нижнюю строку 7 схемы (3), опуская в ней знак безусловного перехода |) к группе элементов, выполнение которых требует \3(к — т) -4-5-|-£ft] тактов, если т Ф к; (l + £ft) тактов, если т = к. Так как, кроме того, первому функционированию группы элемен- з тов fhph\ схемы 31* предшествуют зл+б + с тактов работы, то общее число тактов, необходимых для выполнения схемы $£, будет выражаться суммой к fe-1 <У{Щ) = 2 2 ^1^2 . • • Vm+ S {5^fX2 . . . Цт_х + m=l m=2 -{-[3(k-m) + 5 + ik][il[ii ... цт_,(^т_1)} + + 1 + [3(А-1) + 5 + Ск](ц1-1) + 5ц1|х, ... цк_г + + (1 + Wl*il*.-.. Pft-i(^-l) + 3/c + 6 + Cft = ft-2 Аналогично рассмотренному проводится подсчет числа а (Щ); последнее равно m=l Из сравнения чисел о(Щ) и а(9^) мы видим, что схема 91£ «экономичнее» схемы Sft* (следовательно, схема 9ife «экономичнее» схемы 9^); самой «экономичной» из рассмотренных схем N(ft\ Щ и Щ: является схема N(fe) (т. е. среди схем N(fe), 91 fe и 9tk — схема N(fe)). 9. В качестве условной вычислительной машины (УВА1), для кото- ой составляется программа, возьмем трехадресную машину, описанную 9*
132 Р. И. ПОДЛОВЧЕНКО в работе [1]. Приведем список некоторых из операций У13М и их краткое описание. Через х и у мы будем обозначать числа, хранящиеся в ячейках, номера которых указаны в I и II адресах команд. Через z мы обозначим число, выработанное арифметическим устройством и помещаемое в ячейку, номер которой указан в III адресе команды. Если число х есть код некоторой команды, то через х мы обозначим код реализуемой этой командой, а через х — код адресной части операции, команды. Список некоторых из операций УВМ № п/п Название операции Обозначение Определение Перенос числа Сложение команд Безусловный переход Сравнение чисел Сравнение чисел по модулю Сравнение чисел на равенство Стоп ПЧ СК б. п. < KI Операции передачи управления X —2 x = z, x-\-y = z всегда если х < у если | х |< | у | если х = у остановить машину управление передается по III адресу Пусть в ячейках а и у находятся команды 0) а b с (10) со а-\-и b + v c-\-w (11) выполняющие произвольную операцию со из нашего списка; здесь и, v, w — некоторые целые числа (как положительные, так и отрицательные). Будем считать, что, каковы бы ни были команды (10) и (11), команда СК а р Y осуществит преобразование команды (10) в команду (11), если в ячейку р поместить соответствующим образом подобранное число; это число назовем условным,^ будем считать его не зависящим от со и записывать в виде Далее, если 0 и V W 0 их *>i wY
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 133^ И 0 и2 "2 w2 — условные числа, хранящиеся в ячейках аир соответственно, и существует условное число 0 и1А-и2 *>1+*>2 Wi-\-w2 то будем считать, что последнее всегда может быть получено (в ячейке у) в результате выполнения команды ск а р Y 10. Для составления программы, реализующей схему (8), запишем последнюю в развернутом виде: ((n+l)->6)(/1^/fe)(^-^ipft)(C1->Cft)(02^Ofetl)(U2-^Ufttl)x X (0 ->- л) 1 / (- б) (Ux -* U.) I U„F (sj p (U, > Ufttl) f (С, -* CJ 1 х p(Cm # Cfc) f (Cm -^ Cv)I F (v) Cvp (Cv > C„) | (h -* /J (^ -> jO X xp(Or>Okti)tRi»(hl<lY*l)t(Y*-^4)i /mPmfX X^(Cm^C1)tF(-m)t|FW/'(6<l)tCTon. (12) Напомним, что координаты точки A = (av a2, ..., ап) хранятся в ячейках <х.+ 1 н- а + л; в ячейках р + 1 ч- Р + п помещаются координаты точки (xv х21 ..., ха)у для которой оператор R вычисляет функцию ф; в ячейках у+1^-у + к(1^.к^п) хранятся числа iv i2, . .., ik, а в ячейках бн-б + А; (1< /с< и) — числа Х0, Хх, ..., Xk. Каждый из элементов ФГ, C,n, /w, pm, U4, /( — б).иБ{(1< г, /га, 5, г< п)> входящих в схему (12), запишем с помощью команд, выполнимых УВМ. Начнем с оператора формирования ФГ=Ф(Ь0, y + r, L), строящего оператор Цг, 1<1г<дг. Оператор Lir записывается в виде команды пч а-Кг Р+'г поэтому, если команда ПЧ а р ! (оператор L0) хранится в ячейке /, а в ячейке у + r находится число 0 h 0 *г то команда СК t у + г А
134 Р. И. ПОДЛОВЧЕНКО строит оператор L|r и помещает его в ячейку А, т. е. при надлежащем выборе ячейки А эта команда будет реализовать оператор Фг. Итак, в ячейке у + r, г— 1, 2, . . ., к (1< /с< дг), хранится число 0 h 0 *г пусть, кроме того, в ячейке у хранится 0, а в ячейке q-\-\— число 0 1 0 1 тогда для любого иг = 1, 2, ..., &(1</с<Аг) оператор Ст реализуется командой ск Y+w—1 <7+1 у + т а оператор /т — командой СК Y+™ g+i Y + m 3 3 Реализация логического условия рт \ — р (im > ^m)f в виде команды *) < 6-р"1 -у + т 3 t требует задания числа Кт в виде 0 Ат 0 Am Это приводит к тому, что оператор Us, подсчитывающий число A.s, s = 1, 2, . . ., к (1 < /с< п), записывается в виде команды СК 6 + s— 1 3 + 1 6 + 5 Число Х0, хранящееся в ячейке б, используется оператором Ult а поэтому задается в виде 0 п + 1 — к 0 п + 1 — к следовательно, оператор ф( —б) реализуется командой СК 6 Я + 2 6 *) Здесь стрелка t заменяет номер ячейки (пока неизвестный), в которой находится команда, реализующая логическое условие р (Ст ф Ck) t схемы (12).
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 135 где ячейка q + 2 хранит число 0 1 . — 1 0 ~ " 1 — 1 число п +1, засылаемое в ячейку б в начальный момент счета, задается в виде 0 л + 1 0 л+1 а число 1, используемое логическим условием р(б<1)|, —в виде 0 1 0 1 Наконец, оператор Dt, i=l, 2, ... .,п, реализуется командой пч У р+* Приведем таблицу размещения в памяти УВМ условных чисел, используемых операторами переадресации схемы (12): Ячейка \±Я+1 9 + 2 <7 + 3 ?+4 <7 + 5 7 + 6 Условно с число 0 0 0 0 1 — 1 0 0 0 —1 0 1 0 0 1 0 — 1 1 1 -1 0 1 0 0 Условное число (14) будем хранить в ячейке q+1. Отметим теперь, что оператор (С0—-> Ст) эквивалентен оператору формирования Ф(СХ, q + 2, Cm), строящему С0 из оператора Сх при помощи условного числа (13). Следовательно, в схеме (12) оператор (С0—^ Gm) может быть заменен оператором формирования Ф(С1? q + 2, Cm). Аналогично операторы (Ф2 —> Фк+1) и (U2-^Ufe+1) могут быть заменены операторами формирования Ф(Фх, д + 3, Фк+1) и Ф (Ul9 g + 1, Ufe+1). Выполняя эти замены, придем к схеме, которую назовем схемой (1^'). Составим таблицу размещения в памяти УВМ команд, задающих началь-
136 Р. И. ПОДЛОВЧЕНКО ный вид переменным элементам схемы (12'); при этом для каждой команды используем обозначение реализуемого ею элемента схемы. Команда L0 1 /i Pi Ci Фх Ячейка t t+i t+2 * + 3 t+A Команда Ul Dx Dn+1 fk Pk Ячейка * + 5 t + 6 t + 7 * + 8 f + 9 Команда ch <t>ftn Uft+1 Cm Ячейка '+10 *+u * + 12 *+13 Принимая во внимание все рассмотренное выше, построим программу для схемы (12') (в графе «примечания» против каждой команды будем ставить реализуемый ею элемент схемы). п/п 1 /+1 / + 2 / + 3" /+4 /+5 / + 6 / + 7 / + 8 / + 9 / + 10 / + 11 / + 12 /+13 /+14 / + 15 / + 16 / + 17 /+18 / + 19 / + 20 / + 21 / + 22 ^оп ! 2 ПЧ пч ПЧ пч ск ск пч ск пч ск < ск = пч ск < пч пч пч пч Ai 3 <7 + 7 <+1 t + 2 t + 3 * + 4 /+5 У 6 * + 5 / + 10 /+10 * + 3 *+13 * + 13 / + 17 / + 17 *+8 * + 9 * + 10 * + 6 А2 4 g + 3 g+1 g + 2 g + 1 / + 12 q + 2- * + 10 ?+l *+Ю A3 5 6 * + 8 * + 9 *+10 * + ll t+12 Ц 6 / + 10 / + 10 /+10 * + 13 / + 22 /+17 / + 17 / + 16 / + 34 / + 35 / + 13 / + 23 Примечания 6 ((n + l)-+6) (/i->/ft) (Pi -> Pk) (Gi-^Cft) Ф(Фц?+3, Ofe,i) <D(Ulff + l, Ufe + 1) (0-^л) /(-6) (Ux-^Us) P(Us>Ufe + 1)t Ф^, ? + 2, Cm) />(Cm^Cfe)t (Cm -* Cv) F(v) Gv p(Cv>Cfe)t (/fc "* /m) (Pk ~+ Pm) (Cfc -* Cm) (Dx-^Dt) ■ ! i I 1
ОБ ОДНОЙ ЗАДАЧЕ СО СВЕРТЫВАЮЩИМИСЯ ЦИКЛАМИ 137" № п/п 1 / + 23 /+24 / + 25 / + 26 / + 27 / + 28 / + 29 / + 30 / + 31 / + 32 / + 33 / + 34 1 / + 35 / + 36 / + 37 / + 38 /+39 / + 40 / + 41 / + 42 / + 43 / + 44 / + 45 / + 46 / + 47 Аоп 1 2 ск < пч ск < б. п. |<| пч = ск ск ск б. п. ск СК | ск ск ск < ^Стоп Ai 3 / + 23 / + 23 ' + 4 / + 27 "/jb27 .J <Y* <Y* H-13 / + 34 / + 35 *+13 * + 8 * + 9 *+10 - * + ll * + 12 <7 + l A2 4 ? + 4 t-rl (7 + 3 * + ll Л Ч-з ?+2 g+5 <7 + 2 flf+i g + 6 g + 1 <7+3 g+i 6 Аз 5 / + 23 / + 23 / + 27 / + 27 / + 27 и / + 34 Л / + 41 / + 34 / + 35 / + 13 / + 34 * + 8 * + 9 . * + 10 * + ll *+12 /+8 Примечания 6 Di F(i) ■^(Di^Dn+i) t (Ф1 -* Or) Фг Ь(Д = / + 28) F(r) 2 />(ФГ >Ofe+i)t R 0 Whi<lY*l)t (Y* -> Л) /m 3 Pm t 4 /> (Cm Ф Ct) t ) F(-/h) J 6 t ) | ) F (A) 1 J s p(fi<t)t В -заключение отметим, что к задачам со свертывающимися циклами принадлежат, например, следующие задачи: а) определение ранга матрицы порядка п посредством подсчета ее миноров к-то порядка, /с=1, 2, ..., п\ б) вычисление коэффициентов характеристического полинома матрицы порядка п через миноры к-то порядка, опирающиеся на главную диагональ этой матрицы, /с=1, 2, ..., п.
138 Р. И. ИОДЛОВЧЕНКО ЛИТЕРАТУРА (1] Ляпунов А. А., О логических схемах программ, Сб. «Проблемы кибернетики», вып. 1, Физматгиз, 1958. [2] Арсептьева Н. Г., О некоторых преобразованиях схем программ, Сб. «Проблемы кибернетики», выи. 4, Физматгиз, 1960. [3] Подловченко Р. И., Отыскание собственных значений матриц методом последовательной диагонализации на ЭВМ, Сб. «Проблемы кибернетики», вып. 6, Физматгиз, 1961. [4] Подловченко Р. И., Об основных понятиях программирования. II, Сб. «Проблемы кибернетики», вып. 3, Физматгиз, 1960. |5] Подловченко Р. И., О преобразовании схем программ и их применении в программировании, Сб. «Проблемы кибернетики», вып. 7, Физматгиз, 1962. Поступило в редакцию 9 XI 1961.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ Т. М. ТЕР-МИКАЭЛЯН (ЕРЕВАН) Для решения задач на АЦВМ А. А. Ляпуновым был предложен операторный метод программирования, при котором составлению самой программы предшествует составление так называемых логических схем. При этом зачастую содержательно совершенно различные задачи приводят к схемам счета с одинаковой структурой. Поэтому для стандартизации и автоматизации программирования представляется целесообразным изучение схем программ для отдельных классов таких задач. В настоящей заметке рассматривается класс задач с «ветвящимся» процессом, решение которых на АЦВМ связано с программированием схем счета, заданных рекуррентными соотношениями. Образно выражаясь, рассматриваются правила обхода узлов дерева, графически изображающего такие ветвящиеся процессы (рис. 1). В первом параграфе (т'-4/ -о sod машиш ,{m-/j - о sod чалове/ш т -о sod машины пттппппг Рис. 1. рассматриваются два примера задач указанного класса, а во втором параграфе строится схема программы для решения этих задач на АЦВМ. Все изложение ведется в терминах упомянутого операторного метода, описанного в работе [1]. § 1. Примеры задач с ветвящимся процессом счета В качестве первого примера мы рассмотрим какую-нибудь игру и поставим перед собой следующую задачу: исходя из любой заданной игровой ситуации, просмотреть все возможные дальнейшие продолжения этой игры и на основании этого выбрать ход, обеспечивающий победу, если,
140 Т. М. ТЕР-МИКАЭЛЯН конечно, таковой существует. Для простоты мы рассмотрим один из вариантов игры в крестики и нулики. Игра ведется на квадратной доске, содержащей т клеток (}/га=26). Один из партнеров выбирает знак крестика, другой — знак нулика. Игра заключается в серии ходов, выполняемых поочередно противниками. Каждый ход заключается в занятии играющим своим знаком одной из свободных клеток игральной доски. По соглашению сторон один из игроков начинает игру, которая заканчивается, когда все клетки оказываются занятыми. Игрок получает очко, если его знаком оказываются занятыми подряд р клеток строки или столбца игральной доски (р < ~|/га). Выигрывает тот из противников, который наберет большее количество очков. Предположим, что описанная игра ведется между человеком и АЦВМ. Очередной ход машины мы назовем выгодным для машины, а очередной ход человека — безопасным для машины, если, независимо от того, как в дальнейшем будет играть человек, машина всегда сможет выиграть данную партию. Нам надо составить программу, по которой машина после каждого хода человека просматривала бы все возможные продолжения и на основании этого делала бы очередной, выгодный для нее ход. Для определенности мы предположим, что человеком избран знак нулика, а машиной — знак крестика, и что первый ход делает человек. Перенумеруем клетки игральной доски натуральными числами от 1 до га. Рассмотрим 2т2 ячеек ak[; $ht; t = l, 2, . . ., га; к — О, 1, . .., га—1. Состояние 2-й клетки игральной доски после к-то хода будем изображать с помощью ячейки am_ky t. При этом если клетка свободна, то в соответствующую ячейку передается нуль, если же клетка занята знаком крестика или нулика, то в ячейку передаются числа \-а и —а соответственно, а > 0. Ячейки $kt нам понадобятся для кодирования некоторой вспомогательной информации. Заметим, что число 2га2 используемых ячеек можно сильно сократить за счет более экономного способа кодирования. Так как это отразится лишь на характере зависимости вводимых ниже операторов от параметров к и t и совершенно не повлияет на структуру получаемых расчетных формул, то мы на этом останавливаться не будем. Для составления схемы счета мы введем некоторые операторы. Через В0 мы обозначим оператор, который из анализа ячеек а()1у £ = 1, 2, ...,га, т. е. из анализа ситуации на доске после последнего хода машины, выясняет, выиграла ли машина данную партию, и если да, то помещает в ячейки pof, / = 1, 2, ..., га, единицы, а если проиграла, то —нули. Через См (Git) мы обозначим оператор, который передает содержимое ячеек akl, / = 1, 2, ..., t — l, £ + 1, ..., пг> й = 1, 2, . ..,га—1, в ячейки ak-i,h а в ячейку afe_lf передает код знака крестика (нулика). Через A'kt (А£,) обозначим оператор, который из чисел, хранящихся во всех ячейках (3fe_1? р 1 = 1, 2, ...,га, к=-1, 2, . . ., га— 1, выбирает наименьшее (наибольшее) и передает его в ячейку $kl. Наконец, через \iht мы обозначим логическое условие t^f = И* (аы = °) t> &= 1, 2, . .., га; * = 1, 2, . . ., га, которое проверяет, равно ли нулю содержимое ячейки akt (т. е. свободна ли t-я клетка после (га —/с)-го хода), и если да, то передает управление соседнему справа оператору, а если нет, то передает управление по стрелке.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 141 Предположим, что человеком уже сделан (т — s)-u ход (рис. 1), з = 2р+1, р=0, 1, ...,^-—1. Чтобы составить программу, которая просматривает все возможные продолжения, мы начнем такой просмотр «с конца», т. е. проанализируем сначала т-й ход машины, потом (т — 1)-й ход человека и т. д., пока не дойдем до (m — s)-ro хода человека. Итак, пусть человек выполнил свой (т — 1)-й ход (напомним, что ситуация, сложившаяся к этому моменту на игральной доске, должна изображаться в ячейках ап, а12, . . ., а1тп). На игральной доске осталась одна свободная клетка с некоторым номером t0. Обозначим через В5 оператор, который находит эту клетку, вписывает в нее знак крестика и, если машина выиграла эту партию, помещает в ячейку pUo единицу (а в остальные ячейки ри, /—1, 2, ..., t0— 1, £0~rl> •••• т> вписывает нули), а если машина проиграла эту партию, то оператор В2 во все ячейки рш * = 1, 2, ...,m, помещает нули. Легко видеть, что описанный оператор может быть выражен через введенные выше операторы по формуле *) Вх = (0 -> Р„)... (О -* р1т) ци f С* В0 А'п \ ц„ \ х i m 2 2 т X ^12^0^12 1* * -Hlmt Clm В0 А[т \ = т. тп т = Г! {(О-Рг)} П {|iirtCrrB0AJrW. r=i r==i Предположим теперь, что машина выполнила свой (т — 2)-й ход. Обозначим через В2 оператор, который помещает во все ячейки P2i, ^=1, 2, ...,m, единицы, если оба возможных после этого (т— 1)-х хода человека безопасны для машины. Если же некоторый (т— 1)-й ход человека —занятие клетки £0 знаком нулика —опасен для машины, то в соответствующую ячейку Рг/0 оператор В2 передает нуль. Оператор В2 может быть представлен с помощью оператора Ва в следующем виде: В2 = (1 -» P2i). ..(!-> P2JH211 C^Ai'j^ f X i 2 2 m . X ^22^*1^22 Y * • * hm t ^2?nB1A2m у = = П Ш ~>M} П {^rtC^A'arj}. r=i r=i Пусть теперь человек сделал свой (m —3)-й ход. Назовем ходом -(/?, д) занятие q-i\ клетки игральной доски знаком крестика или нулика при р-м ходе. Обозначим через В3 оператор, который помещает в ячейки рз,, * = !> 2, ...,га, нули, если все три возможных следующих хода машины невыгодны для нее. Если же некоторый (т — 3, /0) ход выгоден для машины, то в соответствующую ячейку Рз/0 оператор Вл *) Через (а->Р) обозначен оператор, который передает число а в ячейку р.
142 Т. М. ТЕР-МИКАЭЛЯН передает единицу. Этот оператор имеет вид i ;3 = (о -► М... (О -* p3m) ha t c.Ib.a;, |ц321 x 1 2 2 m x C^2B2Ag2 \ ... ji3m f СзтВ2Азт | = m m m = П {(°-"Рз«')} П {^зг|А^В2Азг|}. f'=l t"=i По аналогии, если машина выполнила свой (иг —2/?)-й ход, то оператор В2р, который помещает нули в те и только те ячейки р2р, t0, для которых (т —2/?+1, t0) ход человека опасен для машины, а во все- остальные ячейки |32р( t вписывает единицы, имеет вид 1 2р. т) М'гр, 1 t ^2р, lB2p_iA2p, 1 ^И^р, 2 f X 2 „ m X С2р, 2B2p_iA2p> 2 l- • .И"2р, rnt^p. шВар^Агр, m| = m m m = П {(i^fW)} П (l*2p.rtC02p1rB2p.1A5p.r|}. (1) Если, наконец, человек сделал свой (m —2/? —1)-й ход, то оператор В2р+1, который вписывает единицы в те и только те ячейки p2p-i-t,*o> для которых (т— 2р, t0) ход машины выгоден ей, а во все остальные ячейки помещает нули, имеет вид 1 В2р+1 =(1-* P2p+1, l)' • .(1-^P2p+l,m)fA2p+l. ltC2Xp+b lB2pA2p+l, 1^2Р+Ь 2t X 1 & 2 wi X C210+1, 2B2 A2p-fi, 2 | • • -^2p + l, mt^p+i, mB2pA2p+l,m| = m m m = П {(1->P2P+I,r)} П {^p+i.rtC2xp+1,rB2pA2p+1, r|}- (2)> r=i f"=i Теперь уже нетрудно записать схему счета B^s>, по которой машина выбирает выгодный для нее (т — я+1)-й ход после того, как человек сделал свой (m — s)-ii ход, s = 2p+l\ Эта схема будет иметь вид m B<e>=B,JI{ii(P8i = l)t Печать ф\}. (3) i=i При этом в формуле (3) оператор Bs должен быть выражен по формуле (2), в ней оператор В8_г заменен по формуле (1), в этой последней оператор Bs_2 заменен вновь формулой (2) и т. д. до тех пор, пока мы не придем к оператору В0. Таким образом, при замене в формуле (3) оператора Bk через оператор Bk_t необходимо пользоваться формулой. 1) для четных к и формулой (2) для нечетных к.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 143 Чтобы записать формулы (1), (2) и (3) в более компактном виде,, введем следующие обозначения: ч=< Д {(1-^Р/гг)}, если к=2р, Г=1 т £*kt—\ pX П {(°"*Р«')Ь еслиЛ=2/>+1. Г С^, если к = 2р, у, Си, если й = 2р+ 1, _| А£,, если /с = 2/?, ft'~l Afe«, если fe = 2p+l, m Tfc = П {|x(Pfc^ = 1)t Печать «/» \}y ft = l, 2, . . ., m\ / = 1, 2, ..., /п.. 0 Если еще ввести знак рекурсии Д, то искомую схему счета можно- k=s будет записать в виде ВС) = Д{Вк}Г„ (4> ft=S тп bh=Lhn{^itGkA-iAft(|}, (5) f = l 5=1, 3, . . ., т — 1, о где знак рекурсии R означает, что в формуле (4) оператор Bk должен быть заменен по формуле (5) на оператор Bs, в нем оператор Bs_1 вновь по той же формуле заменен на Bs_2 и т. д. до тех пор, пока в формуле (4) мы не придем к оператору В0. Для описания второго примера *) задач с ветвящимся процессом счета рассмотрим функцию трех переменных G (х, у, z), которая при 0<я, у, z< 1 удовлетворяет уравнению dG{\y'z) =G{x,z,z)G(z,y,z) (6> и начальному условию G{x,y,z)\ = В(х,у), 0<х, г/<1, |z=0 где В (#, у) — заданная функция**). Поставим задачу об отыскании значений этой функции при значениях z, равных единице, т. е. об отыскании функции G(x, у, 1), 0<х, т/<1. *) На этот пример автору указали А. Г. Гюльмисарян и О. К. Богарян. *) Вопроса существования функции G (х, у, z) мы не касаемся. См. [2].
144 Т. М. ТЕР-МИКАЭЛЯН Для решения этой задачи разобьем стороны единичного куба •0<;г, г/, z<l на s равных частей длиной h и обозначим точки деления через (xit у , zk) соответственно; £, /, /с = 1, 2, . . ., s. Для простоты точку с координатами (xiy yjy zk) обозначим тройкой чисел (i, /, к). Если в уравнении (6) заменить производную первой разностью, то уравнение для узлов построенной сетки примет вид G(*i> У у zh+i) = G(xi' У г zh) + hG(xi9 zk, zk)G(zk, yjy zh)y или, пользуясь введенными обозначениями, G(i, /', ft+l) = G(i\ /', k) + hG{i, /с, k)G{k, /, к). (7) •С помощью этой формулы, исходя из значений функции G(i> /', 0) = = B(i, j) в нулевом слое, можно найти значения функции G(i, /, 1) в первом слое, исходя из этих значений, найти значения функции G во втором слое и т. д., пока мы не дойдем до последнего слоя*). Чтобы решить таким способом задачу на АЦВМ, необходимо для хранения промежуточных данных использовать (1+5)2+2(5+1) ячеек запоминающего устройства. Действительно, для хранения всех значений /с-го слоя необходимо (1 + я)2 ячеек; кроме того, при переходе «с /с-го слоя на (/с+1)-й можно помещать вновь полученное значение в точке (г, /, /с+1) в ту же ячейку, в которой хранилось значение -функции в точке (г, /, /с), если только г, j ф к; для хранения значений функции G в точках (/с + 1, /, /с+1) и (£, /с+1, /с+1) необходимо использовать еще 2(^+1) ячеек памяти. Постараемся найти метод решения задачи, позволяющий определить значение функции G в точке (г, /', s) s-то слоя, используя для хранения промежуточных данных лишь 3s ячеек памяти. Запишем для этого «формулу (7) для значения k = s: G(i,j,s) = G(i, /, s-l) + hG(i, 5-1, 5-l)G(5-l, /, 5-1). Каждое из трех значений функции G в (s— 1)-м слое, входящих в правую часть этой формулы, может быть вычислено по той же самой формуле: G(i, /\ s-l) = G(i, /, s-2) + hG(i, 5-2, 5-2)G(5-2, /, 5-2), G(i, s-l, s-l) = G(i, 5-1, s-2) + AG(i, 5-2, 5-2)G(5-2, 5-1, 5-2), G{s-1, /, 5-l) = G(5_l,/>-2) + /2G(5-l,5-2,5-2)G(5-2,/,5-2). Каждое из семи различных значений функции G в (s-— 2)-м слое, входящих в правые части этих формул, может быть в свою очередь представлено через значения функции G в (5—3)-м слое и т. д. до тех пор, пока значение функции G(i> /, s) не будет выражено через значения функции G в нулевом слое, которые могут быть вычислены по функции В(х, у). В этих формулах значение G{i, /, к) функции G в некоторых точках (£, /, к) будет, вообще говоря, встречаться несколько раз. Если такие значения функции G вычислять только один раз, то это не дает никакой экономии в ячейках. Если, однако, вычислять эти значения каждый раз заново, то объем ячеек, необходимых для хранения промежуточной информации, можно будет сократить. *) Вопроса сходимости такого конечноразностного метода мы также не капаемся.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 145 Дадим описание алгоритма, позволяющего вычислить значение G(i, /, s), так что одновременно в каждом слое хранятся значения функции G только в трех точках. Введем для каждого слоя ft = 0, 1, . . ., s— 1 две группы ячеек aft, ah, ak и pfe, pki pk , в которых будем хранить следующую информацию. Предположим, что в данный момент счета необходимо вычислить значение функции G(i, /, ft 4-1) в (/с+1)-м слое. Для этого в ft-м слое нужно иметь значения функции G в трех точках: (i, /, Л), (*, &, ft), (ft, /, ft). Координаты этих трех точек будут храниться в ячейках а£, а£, а£" соответственно*). В ячейках (5£, (5£, р^" будут храниться соответственно значения G(i, /, ft), G(i, ft, ft), G(ft, /, ft) функции G в указанных трех точках. Заметим теперь, что точки (£, /, ft), (it ft, ft), (ft, /, ft) находятся по точке (i, h A+l) qo следующим трем правилам: точка (£, /, ft) находится уменьшением на единицу третьей координаты точки (£, /, ft+1); точка (г, ft, ft) находится по точке (£, /, ft) приравниванием в ней второй координаты третьей; точка (ft, /, ft) находится по точке (i, /, ft) приравниванием в ней аервой координаты третьей. Введем теперь некоторые операторы. Пусть параметры (£, /, 0) некоторой точки (xl9 yjt 0) нулевого слоя хранятся в ячейке £. Обозначим через В оператор, который по координатам (г, /, 0)» хранящимся в ячейке £, строит точку (xi9 т/;), вычисляет значение функции B(xit y^ л помещает его в ячейку х\. Через G мы обозначим оператор, который по значениям G(i, /, ft), G(i, ft, ft), G(ft, /, ft), хранящимся соответственно в ячейках Л1» Лг» Лз» вычисляет значение G(i, /, &+l) = G(i, /, ft) + AG(i, ft, ft)G(ft, /, ft) u помещает его в ячейку г\. Пусть, далее, параметры (£, /, ft) некоторой точки (xiy yj9 zk) хранятся в ячейке a£; ft = 0, 1, ..., s—1; t=l, 2, 3. Обозначим через: ф£ = [aJi — ПН -+ a^_i] — оператор, вычитающий из содержимого fc=l, ..., 5 — 1, третьего адреса ячейки а[ единицу £=1, 2, 3 и передающий полученный результат в ячейку a£_i; *) Слова «координаты (i, /, к) некоторой точки (х{, yj, zk) хранятся в ячейке а» означают, что числа i, /, к хранятся соответственно в 1, II и III адресах ячейки а. Ю Проблемы кибернетики, вып. 9
146 Т. М. ТЕР-МИКАЭЛЯН Фо = [а'о ■ Т| = = К(и. & = 0, 1, 2, 3 III)-* .... s a"k] -1 — оператор, передающий содержимое ячейки а'0 в ячейку £; — оператор, приравнивающий второй адрес содержимого ячейки ak третьему адресу и помещающий полученный результат в ячейку a"k\ Т| == — оператор, приравнивающий первый адрес = Га' (I 1Ш-*а'"1 содержимого ячейки а^ третьему адресу ь _. О \ s_ \ и помещающий полученный результат в ячейку (Xfe"; Dk = — оператор, передающий содержимое ячеек = №-+Ц1)Ф'к-*Чг) (РГ-Лз)] Р*' К' ?*" В ЯЧеЙКИ Л1' Л2) Лз соответ- ственно j /С = 0,1,. . ., 5—1 А^ = [т] —> Pfe] — оператор, передающий содержимое ячей- fc=l, 2, . . ., s— 1; £ = 1, 2, 3 ки т] в ячейку р&. Обозначим, наконец, через Gijk оператор, который по координатам (i, /, /с), хранящимся в ячейке aki вычисляет значение G(i, /, к) и помещает его в ячейку *т]. Выпишем представление этого оператора для различных значений к через операторы, введенные выше. Легко видеть, что если обозначить через В0* оператор *) В0= 6JBAJ ВДВА» (8) T^JBA»D0G, то оператор Gi^1 примет вид СШ = Ф|В0. Оператор В0 по параметрам (i, /, 0), хранящимся в ячейке а^ вычисляет величину G(i, /, 1) и помещает ее в ячейку г\. В операторе Giit принят следующий порядок формирования параметров различных точек (исходя из точки (i, /, 1), хранящейся в ячейке с^) и соответствующих значений функции G: (*. /, 1), (*, /, 0), G(i9 /, 0), (i, 0, 0), G(i, 0, 0), (0, /, 0), G(0, /, 0), G(i9 /\ 1). Далее, если обозначить через Вх оператор Вх = Ф'ЛК Т*Ф^В0А* TJOJBoAJDiG, то оператор Gif2 примет вид С^ = Ф1ВГ Здесь оператор Ф\, исходя из точки (i, /, 2), хранящейся в ячейке а'2, формирует точку (£, /, 1) и помещает ее в ячейку с^, а оператор Вх по этой точке вычисляет величину G(i, /, 2) и помещает ее в ячейку т]. Точно так же если в ячейке a's хранится точка (it /, 3)» то оператор 0^ = Ф'В2, *) Оператор В0 записан в несколько строк, чтобы явно выделить его структуру. Аналогичная запись используется и в дальнейшем.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 147 где В2= Ф'ВХА' Т'Ф'В^О, вычисляет величину G(i, /, 3) и помещает ее в ячейку г\. Порядок формирования координат точек и вычисления соответствующих значений функции G в операторах Gtil, Gi;2, Gi;3, Gi;4 приведен в таблице 1. Таблица 1 «; 0 1 о/о 1 010 о/о 020 010 020 0/0 010 о/о 030 010 030 020 010 020 030 010 ! 030 о/о ! ою ! 0/0 020 ! ою ! 020 1 о/о ! ою ! о/о 1 1 1 «п 0 юо юо 100. 1 юо юо 100 200 200 100 юо юо 100 юо юо 100 200 200 100 300 300 100 300 300 100 200 200 100 «1 0 £/0 по 1/0 £20 по 120 2/0 210 1/0 £30 но 130 £20 по 120 230 210 130 3/0 310 1/0 320 310 120 2/0 210 1/0 ! а? 1 1/1 * 121 * 1/1 * 131 * 121 * 131 * 1/1 * 121 * 1/1 * «? 1 £11 * HI * 211 * ill * ill * 211 * 311 * 311 * 211 * а* l i/i * £21 * 2/1 * £31 * £21 * 231 * 3/1 # 321 * 2/1 * «о 2 2/2 * ; 232 * 2/2 * а20 2 £22 * £22 * 322 * «1 2 i/2 * £32 * 3/2 * *l 3/3 • <*! 8 £33 ♦ al 3 £/3 * a1 4 *>4 1 1 J • } * i i f 1 | i \ i i l 1 • { ! i 1 * Строки этой таблицы изображают состояния ячеек ah в различные моменты времени. При этом мы предполагаем, что «время» на этой схеме растет по вертикали сверху вниз и по горизонтали справа налево,. Начальным моментам соответствуют те клетки первой строки, в которых стоят координаты (i, /, 1), (i, /, 2), (i9 /*, 3) и (i, /, 4) соответственно. Если в некоторой строке, двигаясь справа налево, мы доходим 40»
148 Т. М. ТЕР-МИКАЭЛЯН до последней заполненной клетки, то следующей рассматривается самая правая заполненная клетка в соседней снизу строке. Появление звездочки ниже параметров (&', /', /с') (в одном с ними столбце) означает, чтЬ в данный момент вычислено значение G(i\ /', к') и помещено, согласно нашему условию, в одну из ячеек Р^, f=l, 2, 3. При этом появление звездочки в к-и слое, т. е. передача числа в любую из трех ячеек %, Р£, р^", означает, что значения функции G в предыдущем слое больше не нужны, т. е. ячейки Р^-ь Рл_ь Рь'-i можно теперь очистить для хранения других значений функций в (к— 1)-м слое. Как легко видеть, по этой таблице в каждом слое достаточно хранить одновременно координаты не более трех точек (эти три точки /с-го слоя хранятся в ячейках aky a£, а^") и трех соответствующих значений функции G (эти значения хранятся в ячейках р^, Р&, р^"). Вместе с тем из той же таблицы видно, что некоторые значения функции G в одних и тех же точках приходится вычислять по многу раз. Совершенно аналогично обозначим через Bfe_x оператор, который, исходя из координат (г, /, ft — 1), хранящихся в ячейке схй_ь вычисляет величину G(i, /, к) и помещает ее в ячейку tj. Тогда оператор Gb jt fc+b вычисляющий величину G(i, /, ft+1), исходя из координат (£,/, ft+1). хранящихся в ячейке a£+i, может быть записан в виде где TlOlBfc^AJDfcG. Введем искусственно оператор Т^, который как бы приравнивает в ячейке ak ее третий адрес самому себе. Тогда оператор Bh будет записан в виде TtOtBfc^AJDfcG или, если ввести обозначение а=т!Ф1, <=1, 2, 3, то Bk=fi {CiB^AijDkG. (9) t=i Пусть координаты точек (£, /, s) хранятся в ячейке а, а оператор Ф вычитает из третьего адреса содержимого ячейки единицу и помещает результат в ячейку а--!. Тогда оператор Gijs, вычисляющий величину '£■■(** /V $) = G(xi9 yjt 1) и помещающий результат в ячейку т), будет иметь вид или же Gl,e = a>f!{CL,B._1AJ-.}D..1G.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 149 Здесь оператор Bs_2 должен быть выражен по формуле (9) через В3_а, оператор Bs_3 в свою очередь выражен по той же формуле через В8_4 и т. д. до тех пор, пока мы не придем к оператору В0, который вычисляется по формуле (8). Если воспользоваться уже введенным в предыдущем примере знаком рекурсии и обозначить через Р оператор, отпечатывающий содержимое ячейки rj, а через [(i. /, s)->aj — операторг передающий в ячейку а параметры (i, /, s), то схема счета, последовательно вычисляющая и отпечатывающая значения функции G(x, у, 1) в узлах сетки, примет вид П П (К*. Л *)-*«] GiysP}, где Giys = 0 R {Bft}, ft=s-2 а Bk=IJ {C'fcB^A^DkG. (10) Чтобы еще сократить число используемых ячеек, заметим, что оператор Cfe = ТйФь выполняет следующие функции: в ячейке afe содержимое £-го адреса приравнивается третьему адресу, результат помещается в ячейку ад, а потом из содержимого третьего адреса ячейки а^ вычитается единица и результат помещается в ячейку a'h-i. Ясно, что для выполнения этих операций нет нужды хранить в каждом слое все три точки (i, /, к), (i, /с, /с), (/с, /, /с), а достаточно хранить лишь одну точку (/, /', к). Точки (i, к, к) и (к, /, к) можно, по мере надобности, строить в рабочей ячейке £ (одной и той же для всех /с), формировать с ее помощью точки (г, /с, /с—1) и (/с, /, к— 1) и помещать их в ячейку (Хй_1. В результате этого отпадает необходимость в ячейках ак и afe", а достаточно иметь лишь одну ячейку aft, которую мы впредь будем обозначать просто ак. Таким образом, оператор С(к берет ячейку afe, приравнивает в ней t-u адрес третьему, вычитает из третьего адреса единицу и помещает результат в ячейку ак_г. В равной мере из трех ячеек (3^, |3£ и {$£" можно было бы исключить ячейку В&", так как непосредственно после передачи в нее результата с помощью оператора Ль ее содержимое с помощью оператора D передается в ячейку г)3. Таким образом, оператор А?г можно было бы исключить и свести общее число ячеек, хранящих промежуточные результаты, к 3s: s ячеек ак и 2s ячеек Pfe и Р£. Однако мы будем в дальнейшем рассматривать тот вариант, который использует также и ячейки %". Заметим, наконец, что зависимость оператора Ск от параметра t не означает, что с изменением t меняются адреса ячейки, содержимое которой преобразует оператор С£. При изменении t изменяется характер преобразования, выполняемого оператором С!к над содержимым одной и той же ячейки ак: в зависимости от значения t третий адрес ячейки ак ставится соответственно на место £-го адреса в той же ячейке ак. Однако легко видеть, что оператор Сь может быть так организован, чтобы эти изменения осуществлялись в самом операторе С£ в зависимости от значения параметра t. Это же замечание было* бы справедливо и в отношении операторов, введенных в первом примере, если бы там мы прибегли к более экономному
150 Т. М. ТЕР-МИКАЭЛЯН методу кодирования информации. Например, вместо целой ячейки $kt можно воспользоваться всего одним разрядом, что было бы особенно удобно, если бы число разрядов в одной ячейке памяти было бы не меньше числа клеток на игральной доске. § 2. Составление схемы программы для ветвящихся процессов Чтобы составить схему программы, описывающую изученные в первом параграфе ветвящиеся процессы, рассмотрим оператор В0 и операторы Akt и Cfet, зависящие от двух параметров каждый, и обозначим через Bk оператор Bfc = CklBk_1AklCk2bk_1Ak2 . .. GftmBft_1Aftm = 771 = II {Cw<fc)Bfc_A,(Mb *=1. 2, ...,/«. Обозначим через B(s) оператор m m в(8)= II {cs;(s) II {c,.,,^.-!, ... m m -•• II {G2((2) U {C1((,)B0A1((1)}A2((2)} ... Ae-1 t(f_t)} A w}. (H) Согласно введенным обозначениям этот оператор может быть представлен в виде В(6>=Д{ВЙ}, (12) k=S В*= П {Ckt(b)Vk-i\t(k)h A=l, 2, ...... (13) о Напомним, что знак R означает, что в формуле (12) вместо опера- fc=s тора Bk должен быть подставлен оператор Bs, заданный формулой (13), в нем оператор В$_г заменен по той же формуле оператором Bs_2 и т. д. до тех пор, пока мы не придем к оператору В0. Для составления схемы программы, вычисляющей оператор В , рассмотрим сначала тот частный случай, когда в формуле (13) отсутствует оператор Ckt, т. е. рассмотрим оператор 771 В„= П {Вь.ЛиЬ *=1, 2, •-., *• Для составления схемы программы, вычисляющей оператор B(s)=£{Bfe}, (14) k=S рассмотрим таблицу 2, в которой выписаны операторы В0 и Akt в той последовательности, в которой они выполняются в операторе B(s\ В этой таблице операторы выполняются в порядке их следования по строке, и после выполнения последнего оператора в данной строке (начиная с первой строки) выполняется первый оператор в следующей строке. В правом верхнем углу прямоугольников стоят операторы Вх, В2, В3,..., обозначающие совокупность операторов, заключенных внутри прямоугольников.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 151 Для управления порядком выполнения оператора Akt введем s счетчиков Yi» Y2» •••» Ys> c помощью которых порядок выполнения Таблица 2 _ [Ж [4 4 44- [$4*44*- [44,44* •• [4444?--. (44,44»- l^ 4/ 4» *в - с с _: -4 4J«H^ ••••44^4* -44Л14.*,, -•44»"Щ4» _44^4^1 -44^4* 1 15 : "Ч14Д : 44» 41 'jjw 4/ 51 4, £ 4. 4, 44 44т 44- 4» 4* 4* 4* 4^4, 4444. --44* 4* 4* 4» 4* - 4-/.- 4w 4 4 44, 44» 4.» 4» 4„ 4- 4, ^„Яям о и о /2 О /иг 2т зт 4т 5/п s~/,m sm операторов в таблице 2 описывается четырьмя нижеследующими правилами *): 1) В0А1§-1+1; 2) кк - В0, если yk < m; •3) Afe -уД+1 -fe+i+1, если ук = /п, Л < s; 4) Ak - Стоп, если yk = mt k = s. Третье из этих правил, например, означает, что после выполнения оператора должен выполняться оператор если ук = т и к < s. Vft+i.Yft+1+l* *) Знаком у обозначено содержимое ячейки у.
152 Т. М. ТЕР-МИКАЭЛЯН Согласованный порядок выполнения операторов Aktt B0 и изменения содержимого счетчиков yk может быть представлен в виде схемы, изображенной на рис. 2. ~<0~r0)(0~j;/ fO+j.^ i (Mj{K+7-;>jty-tJ* Ц^/77 V^ /-/77 \\ $s*fO-yoJf0-tf- #</7 (3~M%*7~2>J(%-tJ ^v-;>;fvv;/ -w-%; A n ^ C/770/7 Рис. 2. В этой схеме приняты следующие обозначения: (a -j- 1-* а) — означает оператор, который увеличивает на единицу содержимое ячейки а; (О -*■ а) — означает оператор, который передает нуль в ячейку а; (р-^/с) — означает оператор, который придает индексу к оператора Akt значение р\ (Yi -*" 0 ~~ означает оператор, который придает индексу t операто- i = l,2, ...,s pa Akt значение, равное содержимому ячейки у{. Кроме того, чтобы сделать исследование ячейки Yj аналогичным исследованию ячеек Y2» Уз» •••» Ys» введена искусственно ячейка Yo- Если перейти от «плоскостного» изображения этой схемы к «линейному», то схема счета, вычисляющая оператор B(s\ запишется в виде (0^Yo)(0^Yi).--(0->Ys)tU^('<™)HB0 1 2 ?l*(Yi<'»)t(l-^*)(Yi + l-*Yi)(Yi-*Ol*(«<'»)t(0-*Yo)t ф ei 0 0 ei l^(Y2<^)t(2-^/c)(Y2+l-^Y2)(Y2^0p(i<^)t(0^Y0)(0^Yi)t «2 в2 ij*(Y.<n»)t(3-*&)(Y,+ l-^Y,)(Y.-^Ot*(<<'«)t(0-^Yo)(0-'-Yi)(0-»-Y.)T £3 0 п Р.-1 lv(yP<™)\(p-+b)(yP + l-+yp)(Vp-+t)v(t<™)\(0-+y0)...(0-»yp_iyl ер 0 << ip(y,<m)\(s-+k)(ya+l-»ys)(ya^t)li(t<m)\(0-*y0)...(0-+y,_l)b 8s 8S 4 Стоп.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 153- Воспользуемся знаком произведения и приведем эту схему сначала к виду Й {(0 — Yi)} t Ф Afcl|x (* < и») f фВ0 1=0 1 2 II* (Yi < »») t (1 "^ *) (Yi+ l-"Yi)(Yi-"*)!*(*< и) t П {(0-^Ye)}t El 0 q=0 0 Ги (Y« < m) f (2-> Л) (Y/ +1 -* Y.) (Y. -* *) I*(* < »*) t EI{(0-*Ye)}t e2 £ : .г og=o о TV (Y. < »») t (*7 *)'(Y. + 1 -* Y.) (Ye "* 0 I* (* < ™) t П {(0 -*- Y,)} t- e.s 8s ' 0 q=0 0 \ Стоп. Применив еще раз знак произведения, мы приведем эту схему к окончательному виду: I]{(0-*Yi)}HAMn(«<'»)HBe '-О 1 2 f П MYp<™)t(/>-^)(YP + l^YP)(Yp-^)M'<m)t V=l e 0 Jo{(0-^Ye)}jI}CTon. Характерной особенностью этой схемы является то, что в ней «действующий» «арифметический» оператор Ам вынесен за знак произведения. Это сделано для того, чтобы оператор Akt входил в схему только один раз, независимо от значения параметра s, т. е. независимо от «глубины» s вложенных циклов в рекуррентной формуле (14). В силу этого при реализации этой схемы (см., например, схему программы на стр. 156) переадресация будет выполняться не над «арифметическим» оператором Ам, а над операторами управления такими, как логическое условие \i(yp < т), и операторами формирования (ур + 1 -> ур) и (yp-+t). От величины s в этой схеме зависит лишь верхний предел произведе- 8 ния [{ . р=1 Так как операторы формирования типа (y-*t) и (р->Л), вырабатывающие значения параметров к и t у оператора AktJ обычно менее экономны, чем операторы переадресации, то сейчас мы составим схему программы для той же задачи, но с использованием только операторов переадресации и восстановления. Для составления такой схемы счета мы введем ячейки б2, 63, ...,6S, в которых будем формировать числа, удовлетворяющие следующему условию: если Aft_1>r Aw, где /с>1, — два последовательных оператора в одной строке таблицы 2, то t'+\ = t. Чтобы определить закон формирования чисел bh, мы перепишем таблицу 2 в виде таблицы 3, в которой вверху между каждыми двумя операторами, стоящими рядом в одной строке, вставлена пара чисел (а, (5), которая указывает, на сколько единиц должны быть изменены соответ-
154 Т. М. ТЕР-МИКАЭЛЯН ственно первый и второй параметры предшествующего оператора, чтобыи получить параметры последующего. Такое же значение имеет Таблица з; щ 1 An A, • ^ ' A, I LJL.1?— _ ^PJ *' 1 ' *2,m-r . 'J \m ^J *J2 £^\ f-2rm*2J '41 ' 4/77-/ 1 ^4 я» „M<5V JQOmrLtQtHW /atjaj... m n& /■n /..2 .... A/m Aaoi (f,OJ *3m not л3т /l(t'0i (r.o/ "to (t.Ot no/ Л5т *5m лпо' ~"s-/,m 4, /} /Js/n Стол а пара чисел ах и pif стоящих справа от последнего оператора в каждой строке (кроме последней строки). Иными словами, запись означает, что а запись означает, что A(ua'P) A. * = *' + p, AgbW /0 + 04=1, * + Р1 = 1. откуда, кстати, следует, что ax = 1 — /с, На основании таблицы 3 мы можем составить схему счета, изображенную на рис. 3. На этой схеме через F (a/c, fit) обозначен оператор, который увеличивает значения параметров к я t оператора Akt на а и f единиц соот-
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 155 ветственно; через (An-»-Aw) обозначен оператор, который передает первоначальный вид Ап оператора Akt на его рабочее место. Кроме ячеек б2, ..., 6S, введена еще ячейка 5lf в которой ведется счет числа выполнений оператора Аи, когда второй индекс пробегает - ££->?, №~a,Jf04£T/{-m^rjr-/77+#2J ~{-m+%) 1 .«^-Га^иЩ^- \ \ /f < Л W^^/f =£ —/77+/ Ж £r№'-4"'4-*"4'7& А~- C-m~4tf-7*-ct,jf;-3<-:fi)- ks А-О ы Л^ {-/77+£,H-/n~d£jf-2+a7)(1J$43;J- \5Г f0s+My{tif4X4rfiJ >£/770Л Рис. 3. значения 1, 2, ..., т. Для единообразия счет в ячейке Ьх ведется не от 1 до т, а от — т-\-1 до 0. Переходя к линейному изображению схемы 3, мы получим: (АХ1 -* Аи) (0 - 04) (0 -> рх) П {(_ т -> б,)} f J F (aft, p0 Ahl (i (6 < 0) f | B0 f ц (6X<0) | 2 3 (61+l-^61)(61^6)tt(61 = -m+l)J(a1-^a)(p1-^p)4(0-^a)(l-^p)J |(l-a) fl {^(6p<0)t(6p + 1^6p)(6p^6)(6p-^P)[i(6p<0)t p=2 5 0 (_p+l->ai)(l_6^Pi) ЦК-»»-^,)}^} Стоп Чтобы составить схему счета, соответствующую общим рекуррептным соотношениям (12) и (13), достаточно рассмотреть таблицу 4, в которой наглядно изображена последовательность выполнения операторов Cfer В0, Ам в формуле (11). Введем, как и раньше, ячейки Yo» Yi» •••» Ys» которые будут управлять последовательностью выполнения оператора Akt. Разница с предыдущим случаем заключается в том, что если непосредственно после преобразования содержимого ячейки уг получаем у j</n, то после
156 Т. М. ТЕР-МИКАЭЛЯН выполнения соответствующего оператора А£ - управление должно "передаваться оператору С, «+i* Таблица 4 £/ &*/-••с* £ г ^я- [_4, |._.1 4 ^ ^ 4 4> ! 4 4.J 4/1 ~"^А.| ul L... J4J 4/ ^ 4 4^7 4-Л7 4*7 4v7/- J&, aw Вслед за выполнением этого оператора должна выполняться такая последовательность операторов: Q-i,iQ-2,1 • • • С11В0. После выполнения оператора В0 надо, как и раньше, провести анализ ячеек Yo> Yi> •••»Ys- Графически эта схема изображена на рис. 4. Ее обычная запись имеет вид (»-**') (1-Of[{(0-Y,)} 1=0 icft^(*'-l"**')(l-*-Ol*(ft' = 0)tBotJAM|i(* = m)t 1 2 1 * Д{ц (Yp < m) Iip^k) (Yp+* "*Yp) {ур ~*f) •*{< < m) J (/>-Wc')(YP + 1^0PII {(0->Y„)}tl} Стоп. Q=0 0 Чтобы составить схему счета для формул (5) и (10), рассмотрим сначала тот случай, когда оператор Bk имеет вид Схема счета, соответствующая этому случаю, будет отличаться от иредыдущей схемы двумя особенностями. Во-первых, после выполнения оператора Afem, /c=l, 2, ...,s, должен выполняться оператор Dft; так как после оператора D^ должен выполняться оператор Ak, ^ - , то от Dh управление передается внутрь произведения по параметру р.
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 157 Во-вторых, перед каждым выполнением оператора Сь'ь к' =s, s— I, ..., 1, должен выполняться оператор W, а для этого в случае, когда t' = \ (т. е. либо в начале счета, либо после того, как бывает выполнено Л>0 +(s~k)t?+t)(o-~%tf0+%j~-. ro+%)—*-Н^ \+£r>,S/r'-7~*?f/~t'/ ? * °*t 1 ^(ыУфы'Но+я*- Ж^ (24c'j(;pM'jfO~-%)fCh%J- t=/7? <~t';/0^o№~y7H^!jj. J C/770/7 Рис. 4. условие /с' = 0), управление должно передаваться оператору hv, а от него уже — оператору С^. Эта схема имеет следующий вид: (*-*А')(1-ОП{(0-^У«)} 1=0 I Lft. | Ck>r (к' - 1 -»• к') (1 -*» f) |i (Л' = 0) t B0fjAw|i(« = i»)tDkt 2 1 5 2 в 5 I П {\p(yP<m)\(p-+k)(yp + l-+yp)(yp-+t)VL{t<m)l р-1 о р-1 (р-»*Ж + 1-»*') П {(0->YQ)}t4} Стоп. (15) q=0 0 По этой схеме мы построим схему программы на основании известных [3] формальных правил (над оператором стоит его номер в этой схеме): {(0->Yo)^(O^YOMO^)!(O^Yi)F(W)M' = H-l)t 6 4 9 1 10 11 12 13 | U- |Cft^r №' - 1 -* A') (1 -* О |i (&' = 0) f 4
158 Т. М. ТЕР-МИКАЭЛЯН 14 15 0 16 17 18 19 B0^Akl[i(t = m)\Dh J 2 20 21 MV- (Yi < m) -> ц (Yp < m)} {(Yl + 1 -* Yi) "* (Yp + 1 "* YP» 22 23 24 {(Yi^0^(yp^')H(Yi+i->0-4yp + i-+0}(i-^) 5 25 26 27 28 29 lv(yP<m)Up-+k)(yp + l->yp)(yp->t)[i(t<m)^ 30 31 (P-^ *') (Yp+ !-*«') 32 33 7 34 35 36 37 38 {(O^Yo)^(0-Y(7)}(0"-><7)4(O^Yq)F(^)/(^)^(g = p)tt 7 0 3 39 40 41 42 |F(/>)/(/J)li(/J = S+l)tCTOD. 5 В таблице 5 приведена соответствующая программа, составленная для условной вычислительной машины, описанной в работе [1]. Таблица 5 Адрес команды Lr+i 2 3 4 5 6 7 8 9 10 И 12 13 14 1 15 16 17 18 19 20 21 22 23 24 25 26 Код операции ПЧ 1 пч пч пч + + УП2 ПУВ ПУВ — пч УП2 ПУВ ПУ ПУВ УП2 1 ПУВ ПУ пч пч пч пч пч УПз пч IA «S» «1» ь «0» «1IIIA» «1» / — — к' «1» к' — — — t ?2 £з £4 «1» YP р НА — — — *+5 1 «S+1» — — ф\ь — «0» — — т — — — — — «т» I IIIA к' V 5+5 1 5+5 I S+5 *<k- <Vr 1 k( V 5+9 Bo 5+20 A« g+Ю 5+25 5+25 5+27 5+28 5+31 p 5+39 к Адрес команды 27 28 29 30 31 32 1 33 34 35 36 37 38 39 40 41 42 43 44 45 Ki и g* и и . Код операции + ПЧ УП3 пч + пч пч пч + + УП2 ПУ + + + , + + УП2 Стон ПЧ УП3 + пч + IA Yp Yp t Р «1» Si «0» «0» «1IIIA» «1» <7 — «1IA» «1II,HIA» «IA» «IA» «1» P «0» Yi «1» Yi «1» HA «1» — m — Y0 p q p — 5+25 5+27 5+28 5+31 P *+l — m Yi Yi 1 IIIA Yp 1 5+16 *' f 5+34 q Y, ff+34 * £+34 S+16 S+25 S+27 S+28 £+31 P ff+25 Y<u ff+39 Yi t ' В этой программе номера операторов и адреса соответствующих команд совпадают вплоть до 38-го оператора и лишь 39-й оператор F(q) состоит из четырех команд с g + 39 по g-\- 42. Поэтому номера операторов в программе не приведены. Кроме того, через «а» обозначен номер ячейки, в которой хранится число а\ ячейка, в которой вырабатывается
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 159 значение некоторого параметра iy обозначена просто знаком i. Через ПУВ —передача управления с возвратом — обозначена команда, передающая управление подпрограмме, после окончания которой управление возвращается к прерванному месту основной программы. Как видим, вся программа состоит из 45 команд, пяти стандартных приказов (хранящихся в ячейках til — £5), шести констант (0; 1; II; III; 1III; Ш, III), десяти рабочих ячеек (st s+1, т, к, ty к', t', p, g, Z) и (т+1)-й ячейки Yo» Yi» • • •» Ym- На двухадресной машине М-3 та же программа вместо 45 команд состояла из 48 команд, пяти стандартных приказов, трех констант, десяти рабочих ячеек и (т + 1)-го счетчика Yo» Yi» •••> Ут- При этом операторы А, В, С, D, L были просто пропущены. В таблице 6 приведены данные о времени работы машины для различных значений s и т. С помощью специальной программы было подсчитано, что в случае 5 = 4, m =10 (т. е. для случая десяти тысяч узлов) машина выполнила 331095 операций, из которых на долю условных передач управления пришлось 57 773 и на долю передач чисел (включая восстановление команд) — 134 442 операции. Остается рассмотреть тот случай, когда оператор Bk имеет вид т Таблица 6 м 1 2 3 4 8 8 4 6 3 т 9 4 3 9 Число увлов ms дерева 256 256 729 729 Время работы машины М-3 в минутах и секундах 0'4" 0'2,5" 0'8,5" 0'6" JY9 5 6 7 8 S 10 8 4 5 т 2 3 10 10 Число узлов ms дерева 1024 6561 104 105 Время работы машины М-3 в минутах и секундах 0'1Б" Г12* 1'2Г 13'29" ! При этом мы будем предполагать, что для любого /с=1, 2, ..., 5 существует хоть одно такое ц » Для которого а^(ь> = 0. Особенность этой формулы заключается в том, что каждый раз перед выполнением оператора См должно проверяться условие \х (akt = 0). Если aht = 0, то процесс вычисления остается тот же, что и в предыдущем случае, если же akt Ф 0, то дальнейший порядок счета зависит от значения параметра t. Если t < m, то необходимо перейти к проверке условия aft?f+1 = 0, если же t = m, то необходимо выполнить оператор Dh. Чтобы упростить структуру схемы, мы, однако, будем в этом случае передавать управление не оператору Dfe, а к тому месту схемы, где формируются значения параметров к и t оператора Akt. После того как эти значения выработаны, перед передачей управления оператору Aht опять проверяется условие afe( = 0. Здесь, при akt Ф 0 мы вновь различаем два случая. Если t < т9 то необходимо перейш к анализу условия аь,*+1=0; если же £ = //?, то необходимо передать управление оператору Dft. Таким образом, требуемая схема имеет вид (*^A:')(l^OlI{(0^Yi)} ,т=о
160 Т. М. ТЕР-МИКАЭЛЯН \ Ch.t> (к' -1 -> к') (1 -»- Г) |х (Л' = 0) j B0J|Aw|i(« = m)||DkJ I П. U I* (YP < m) Up -у к) (Yp + 1 -* YP) (YP -* О l*('<m)ttll*Ki4fc0)tt 7 8 О У J(P^^')(Yp+1^0 Д {(0-^ Ye)}|*(afct * 0)Jj{} Стоп. (16) Программа, соответствующая этой схеме, составленная для машины J/-3, состояла из 65 команд, пяти стандартных приказов, трех констант, одиннадцати рабочих ячеек и wifl ячеек Yo» Yi> •••» Ym- В эт0 число не входят команды, формирующие адреса ячеек а^, а^г, и подпрограммы операторов А, В, С, D, L. К этим операторам, а также к операторам (л,(а^ = 0) и (i(aft'r = 0), в самой программе имеются только команды передачи управления с возвратом (на это ушло 8 команд из 65). Подпрограммы этих операторов были снабжены командами, которые каждый раз после выполнения данного оператора отпечатывали текущие значения его параметров. Например, для случая т = 8 и s = o> т. е. для случая, когда игральная доска состоит из восьми клеток и на ней свободны только три клетки —2, 4 и 6-я,— операторы А, В, С, D. L были выполнены в следующем порядке: ^3^32 L2C24 С26 ^filB^O^iePl L^BoAhDj А24 A2l.D2A32 34 ь,с22 С-20 LiC^jBoAjgDj L1C12B0A12D1 А-,, A26D.,A34 с», L.CL. С,, L1C14B0A14D1 A2.> L1L*i2L>oA12^i А24^оА.^6 D»
О ПРОГРАММИРОВАНИИ ВЕТВЯЩИХСЯ ПРОЦЕССОВ 161 Если, наконец, верхний предел знака рекурсии R в формуле (12) равен не нулю, а некоторому s' — 1 < s, то в этом случае достаточно, во-первых, заменить в формулах (15) и (16) произведения .s s p— i II - II. II соответственно на произведения s > V-I п . п. и 1=б'—[ p=s' q=4'— 1 п, во-вторых, заменить логическое условие и. (А/ = 0) условием и. (А/ = s' — 1). При этом формула в="д1{вк} h=s означает, что мы будем осуществлять подстановки до тех нор, пока оператор В не будет выражен через Bs^_i (т. е. выполним подстановки 13^ в Bs, Bs в ВчЛ, ..., Вв* в B^_t). Заметим, наконец, что и в схемах (15) и (16) можно было бы заменить операторы формирования на операторы переадресации и восстановления, но мы не будем этого делать. ЛИТЕРАТУРА [1] Ляпунов Л. Д., О логических схемах программ, Сб. «Проблемы кибернетики», вып. 1, Физматгиз, 1958. [2] Соболев С. Л., Некоторые замечания о численном решении интегральных уравнении, Известия АН СССР, серия математическая 20, 1956, 413—436. [3] П о д л о в ч е п ко Р. И., Об одном преобразовании схем программ и его применении в программировании, Сб. «Проблемы кибернетики», вып. 7, Физматгиз, 1962. Поступило в редакцию 3 XI 1961. И Проблемы кибернетики, вып. 9
V. ТЕОРИЯ ИГР АЛГОРИТМИЗАЦИЯ И ПРОГРАММИРОВАНИЕ ЗАДАЧИ ПОИСКА В ЛАБИРИНТЕ И). В. ГОЛУНКОВ (КАЗАНЬ) Под лабиринтом здесь понимается прямоугольник, разбитый на клетки, причем некоторые общие стороны смежных клеток, а также все стороны клеток, совпадающие со сторонами прямоугольника, отмечены (см. рис. 2 и 3; отмеченные стороны выделяются жирной линией). Центры клеток назовем пунктами, пункты смежных клеток будем называть соседними, а прямую, соединяющую два соседних пункта,— коридором. Если общая сторона двух смежных клеток отмечена, то скажем, что коридор между этими пунктами закрыт. В противном случае коридор будем называть открытым. Один из пунктов может быть выделен. Будем обозначать его rtl и называть искомым. В начальный момент можно находиться в любом пункте лабиринта (обозначим его гп). Из каждого пункта разрешается двигаться по любому из имеющихся коридоров (будем говорить о верхнем, нижнем, правом, левом коридорах такого-то пункта и обозначать их буквами «В», «Н», «П», «Л»*)). Но перейти из пункта в соседний с ним пункт можно только в том случае, если коридор между ними открыт. Задача заключается в том, чтобы, двигаясь таким образом по лабиринту, начиная с гп, либо найти путь из гн в ги, либо обнаружить, что такого пути нет**). Если путь из г1Г в гп существует, то будем говорить, что г и достижим из ги. При движении будут отмечаться все пройденные пункты, а также закрываться некоторые коридоры. Для хранения информации о пройденном пути необходима память. Под памятью понимают множество X элементов ху, х2, ..., хп произвольной природы (для задачи поиска в лабиринте п можно выбрать равным числу пунктов лабиринта). Пусть имеется множество А элементов информации а. Состоянием памяти X называют отображение G : X —> А, так что состоянием ячейки памяти х £ ^ является элемент информации G(x). Примем в качестве А множество из пяти элементов: В, Н, П, Л, О. Пусть, например, ячейке памяти xi в некоторый момент отнесена буква «П». *) В таком случае для любых двух соседних пунктов либо правый коридор одного из них совпадает с левым коридором другого, либо верхний одного — с нижним другого. **) Несколько лет назад К. Шенноном была сконструирована мышь, которая не только отыскивала некоторую клетку в лабиринте, но и накапливала опыт при своем движении. Например, при вторичном помещении мыши в одну из клеток лабиринта она, отыскивая ту же клетку, делала гораздо меньше ошибок, чем в первый раз. (См. К. Э. Ш е н и о п, Играющие машины. Кибернетический сборник, 1, ИЛ, 1960, стр. 105.) *1L
164 Ю. В. ГОЛУНКОВ Это значит, что состояние этой ячейки указывает, что двигаться нужно из пункта по правому коридору. Сопоставление ячейке памяти буквы «О» означает, что ячейка не содержит никакой информации. В дальнейшем вместо «сопоставления ячейке памяти буквы «О» (одной из остальных букв)» будем говорить о вычеркивании (засылании) такого-то коридора из памяти (в память). Алгоритм решения поставленной выше задачи можно описать следующим образом. В пункте rQ — ?'u выбирается один из коридоров этого пункта. Если он окажется закрытым, выбирается другой, и так до тех пор, пока не будет обнаружен открытый коридор. Тогда из г0 по найденному открытому Рис. 1. После проверки логических условий двигаться но стрелке с плюсом, если условие выполнено, и по стрелке с минусом в противном случае. коридору следует перейти в новый пункт, который обозначим через 7Х, далее отметить пункт г0 и заслать в первую ячейку памяти хх тот коридор пункта i\, который ведет в /*0. Предположим теперь, что был пройден коридор пункта rk_l и достигнут пункт rk, причем коридор пункта гк, ведущий в пункт гк_х, был заслан в ячейку памяти хк. Дальнейшее решение задачи осуществляется согласно блок-схеме (рис. 1), если начать с проверки условия pv В блок- схеме приняты следующие обозначения: pL — пункт гк совпадает с ги; р2 — пункт гк не отмечен (ранее не был пройден); Д2 — выбрать один из неиспробованных коридоров пункта гк (к числу испробованных сначала относится коридор между пунктами rh и 7vi); р.4 — выбранный в результате действия Д2 коридор закрыт; Д% — упомянутый выше коридор отнести к испробованным; р4 — испробованы четыре коридора пункта гк (тупик); д4 _ перейти в предыдущий пункт гк_г (состояние ячейки памяти хк укажет требуемый для этого коридор), «закрыть» коридор между rkl и гк, вычеркнуть из хк хранимый там коридор; Ро — rk-i совпадает с г0; дь — коридор пункта гк_х, хранимый в ячейке хк_Л1 отнести к испробованным и перейти к выполнению Д2, уменьшив к на единицу; д1 _ перейти из гк в пункт — обозначим его через 7/i+1, — к которому ведет коридор пункта гк, выбранный действием Д2; отметить пункт гк, заслать в ячейку хк+1 коридор пункта гк+1, ведущий из r/i+1 в гк; перейти к проверке условия рх, увеличив к на единицу; 0L, 02 — поиск прекратить. Прекращение поиска согласно Ох означает, что искомый пункт, а вместе с ним и путь из гн в г„ найдены. На рис. 2 показан один из путей, найденный согласно описанному алгоритму.
ЗАДАЧА ПОИСКА В ЛАБИРИНТЕ 165 Пусть после останова Ох коридор искомого пункта ги оказался засланным в ячейку памяти хр. Так как при движении по лабиринту из памяти вычеркивались коридоры, пройденные дважды, то в ячейках памяти хг, #2, ..., хр осталась информация о кратчайшем для данного поиска пути из г„ в ги (на рис. 2 пункты этого пути помечены кружочками). Далее, те коридоры, ведущие в тупики, которые в ходе поиска были пройдены, стали теперь закрытыми. А так как при встрече пройденного Рис. 2. Рис. 3. пункта выполнялось действие Д4, то закрытыми окажутся еще некоторые коридоры. Если в измененном таким образом лабиринте убрать отметки с пунктов и провести в нем поиск, то к закрытым коридорам добавятся аналогичным образом новые. В результате нескольких таких повторений можно добиться того, что в лабиринте останутся открытыми коридоры лишь одного-единственного пути из гп в ги. На рис. 3 закрытые в результате первого поиска коридоры — отмеченные стороны клеток — показаны пунктиром, в результате второго поиска — галочкой V, третьего —- зигзагом, четвертого — волной (задача поиска решалась на ЭВМ, о чем будет сказано ниже). Предположим теперь, что поиск прекращен согласно 02. Если все коридоры начального пункта оказываются закрытыми, то это означает, что гп не достижим из г„; если же хотя бы один из них открыт, следует вновь начать поиск из ги. Можно было бы пронумеровать все пункты лабиринта и при поиске засылать в ячейки памяти хх, х2, ..., хп не коридоры, а номера пройденных пунктов. Тогда достаточно включить в алгоритм проверку еще одного условия — принадлежность каждого нового пункта найденному ранее пути, с дальнейшим движением по этому пути в случае выполнения условия, чтобы полученный алгоритм полностью описывал поведение мыши Шеннона. Алгоритм поиска в лабиринте был запрограммирован и реализован на одноадресной машине «Урал-1». При этом информация о лабиринте кодировалась различными способами. Их описание и сопоставление проведенных экспериментов даются ниже. Кроме того, очевидно, что находимый путь из /•„ в г1и равно как и время его нахождения, зависит от способа
166 Ю. В. ГОЛУНКОВ выбора коридора, проводимого действием Д2. Результаты сравнения различных способов выбора коридора также будут даны. Рассмотрим первый способ кодирования информации о лабиринте. Он связан с методом автоматической проверки условий [1], который заключается в следующем. Пусть конечное множество А элементов информации а разбито на непересекающиеся подмножества Ах, А2, ..., Ат. Предположим, что ход решения задачи зависит оттого, какому из подмножеств множества А принадлежит некоторый элемент а£.4. Именно, если а£At, то управление должно быть передано ячейке bt. Отнесем каждому элементу информации ячейку памяти машины. Содержимым последней должна быть команда безусловной передачи управления ячейке bt, если элемент информации, которому отнесена данная ячейка, принадлежит подмножеству At. Пусть, например, элементу информации а отнесена ячейка памяти х. Проверка описанного условия проведется автоматически, стоит только передать управление ячейке х. В задаче поиска в лабиринте элементами информации А являются центры и стороны клеток. В некоторой промежуточной ситуации вся информация разбивается на следующие подмножества: А1 — искомый пункт (ги), А2 — не отмеченные пункты (не пройденные ни разу), А3 — отмеченные пункты (пункты, пройденные хотя бы раз), Л4 — закрытые коридоры, А5 — открытые коридоры. Рассмотрим в качестве примера следующую ситуацию: в некотором пункте/? обнаружен открытый коридор, ведущий в пункт q. Если q^Ax, то поиск следует прекратить; если q£A2, то осуществляется переход в пункт q выполнением Дх\ если же q£As, то это означает, что сделана петля, поэтому начинается возвратное движение по петле согласно Д4. В программе управление нужной ячейке передается автоматически: передача управления ячейке памяти, сопоставленной пункту q, откуда происходит новая передача управления уже требуемой ячейке. Автоматически в программе проверяются условия рг, р2 и рг. Вся программа состоит из четырех отдельных подпрограмм I, II, III, IV (на блок-схеме алгоритма пунктиром обведены части, реализуемые этими подпрограммами). Подпрограммы содержат соответственно 31, 22, 8, 39 команд. Память машины распределена так, что расстояние *) от любого пункта до верхней и до нижней стороны его клетки (левой и правой) одинаково. Отсюда очевидно, что расстояние между любыми двумя соседними пунктами по вертикали (горизонтали) одно и то же. Местонахождение в лабиринте определяется номером ячейки, сопоставленной пункту. Переход из любого пункта в соседний с ним справа (слева) пункт реализуется так, что к адресу ячейки пункта прибавляется (вычитается) одно и то же число — расстояние между соседними пунктами по горизонтали. Аналогично реализуется переход в соседний пункт по вертикали. Именно эти два расстояния со знаками плюс или минус характеризуют четыре коридора любого пункта. При таком расположении лабиринта в памяти машины некоторым ячейкам следовало бы соотнести вершины клеток. Таких ячеек будет *) Мы говорим для краткости о расстоянии между двумя элементами информации, понимая под этим абсолютную величину разности между адресами ячеек памяти машины, отнесенных этим элементам.
ЗАДАЧА ПОИСКА В ЛАБИРИНТЕ 167 больше, чем пунктов лабиринта, поэтому их удобно использовать для хранения информации о пройденном пути. Преимущества метода автоматической проверки условий — в экономии времени работы машины, что достигается, во-первых, за счет того, что другие способы кодирования информации о задаче увеличивают программу, а во-вторых, — и это главное — за счет убыстрения выполнения проверки многозначных условий. В нашей программе лишь два условия проверяются автоматически — одно двузначное и одно трехзначное, — но уже одно только это экономит более трех процентов машинного времени (для лабиринта рис. 2). Заметим, что этот метод особенно выгоден при решении задач методом Монте-Карло, где производятся многократные испытания обычно с проверкой многозначных условий. Однако он весьма расточителен, если говорить об оперативной памяти машины: в задаче поиска в лабиринте каждому центру и каждой стороне клетки отводится целая ячейка памяти машины. Под руководством Р. Г. Бухараева решается задача модернизации существующих ЭВМ в сторону их приспособления к решению задач методом статистических испытаний (создание на первом этапе приставки к машине [1]). Решение этой задачи позволит снять вопрос о малости объема оперативной памяти машины. Но пока что мы можем говорить лишь о 2048 ячейках. Максимально вместимый в такую память лабиринт (с учетом программы) может иметь 22 х 21 клетки. Вкратце остановимся на способах выбора коридора, осуществляемого подпрограммой П. Первый способ — выбор с помощью случайных чисел. Число zIL умножалось на (za-~l) и нормализовалось. Из полученного таким образом числа zrl+l выделялись два разряда. Записанное в них число — 0, 1, 2 или 3 — сопоставлялось одному из коридоров. Среднее время поиска в лабиринте рис. 2 со случайным выбором коридора при одних и тех же гп и /и оказалось равным 6 мин. 38 сек. (среднее по 10 поискам), причем однажды для поиска машине потребовалось всего 1 мин. 12 сек., а максимальное зафиксированное время поиска — 10 мин. 40 сек. Путь, показанный на рис. 2, был пройден машиной за 7 мин. 20 сек. Заметим, что на последующие за ним поиски в измененном лабиринте машина затратила 5 мин. 40 сек., 2 мин. 18 сек., 2 мин. 30 сек. и, наконец, «пробежала» по единственному полученному пути, который показан на рис. 3, за 1 мин. 50 сек. Другие способы выбора коридора — детерминированные. Согласно одному из них, при переходе в неотмеченный пункт машина сначала пыталась двигаться в стороны — вправо по ходу движения, затем влево и лишь в случае неудачи осуществляла движение вперед. Время поиска в этом случае оказалось равным 6 мин. 32 сек. Если же машина пыталась двигаться сначала влево, затем вправо и, наконец, вперед, то для нахождения пути с теми же начальными данными ей потребовалось 3 мин. 44 сек. Затем машина была «настроена» на прямолинейное движение: сначала делала попытку двигаться вперед и лишь в случае неудачи проверяла правый (левый) коридор, затем левый (правый). Машина затратила на поиск пути с точно теми же начальными данными 9 мин. 2 сек. (4 мин. 23 сек). Таким образом, время, затрачиваемое на поиск пути при детерминированных способах, оказалось в двух случаях из четырех значительно меньше среднего времени поиска со случайным выбором коридора, а в од-
168 Ю. В. ГОЛУНКОВ ном — они почти совпали. Однако это вовсе не означает, что вторые способы — детерминированные — окажутся всегда выгоднее первых. Выбирая коридор случайным образом, можно найти множество путей, тогда как при строго определенном порядке выбора коридора и при одинаковых начальных условиях найдется лишь один путь. К тому же время поиска в последнем случае сильно зависит от лабиринта, расположения закрытых и открытых коридоров. Поэтому в общем случае, по-видимому, предпочтение следует отдавать все-таки вероятностным способам. Возможность использования другого способа кодирования информации о лабиринте была указана автору А. А. Ляпуновым. Каждому элементу информации относилась не ячейка памяти, а лишь один разряд ячейки. Одна группа ячеек была отведена под пункты. Прохождение пункта отмечалось здесь так, что в соответствующий разряд заносилась единичка. Другая группа ячеек была отведена для коридоров, по которым можно двигаться вверх-вниз, третья группа — для левых-правых коридоров. Каждому коридору отводился один разряд ячейки. Если коридор закрытый, то в разряд, ему отведенный, засылалась единичка. Разряды, соответствующие открытым коридорам, содержали нули. Две бегающие единички определяли местонахождение в лабиринте. Их оказалось очень удобно использовать для проверки условий р2 и р3. Наконец, четвертая группа ячеек хранила информацию о пройденном пути. Только «ячейками» хх, х2, ..., хп являлись не целые ячейки памяти машины, а пары разрядов. В эти разряды засылались числа 0, 1, 2 или 3, сопоставленные коридорам В, Н, П, Л. Такой способ кодирования оказался весьма рациональным в смысле экономии машинной памяти: используя лишь оперативную память, можно проводить на машине поиск в лабиринте размером 67x84. Подпрограммы I, II, III и IV имеют теперь 48, 40, 8, 133 команды. Как и ожидалось, время поиска в этом случае увеличилось. Среднее время по тем же поискам составило 8 мин. 28 сек., т. е. в 1,29 раза больше. Например, путь, показанный на рис. 2, был найден машиной за 9 мин. 18 секунд. Таким образом, выигрывая здесь в размерах лабиринта, проигрываем во времени. Но выигрыш гораздо значительнее проигрыша. Поэтому можно сказать, что для решения задачи поиска в лабиринте второй способ кодирования выгоднее первого. Интересно заметить, что можно в некотором смысле объединить эти два способа: каждому элементу информации отнести, как во втором способе, один разряд ячейки, только в одной и той же ячейке будут разряды, отнесенные и пунктам, и левым-правым коридорам. В этом случае часть разрядов остается неиспользованной — те разряды, которые приходятся на вершины клеток. Бегающая единичка и номер горизонтали определяли в этом случае местонахождение в лабиринте. Сравнение с предыдущими — первой и второй программами — дает следующие результаты: программа содержит всего 218 команд и проще по построению, чем вторая; среднее время поиска 7 мин. 13 сек., т. е. всего в 1,09 раза больше, чем в первом случае; максимальный вместимый во внутреннюю память машины лабиринт может иметь 68x73 клетки, т. е. незначительно меньше, чем во второй программе.
ЗАДАЧА ПОИСКА В ЛАБИРИНТЕ 169 Объединение двух различных способов показало наилучшие результаты (см. таблицу). 1-я программа 2-я программа 3-я программа Число команд в подпрограммах I и ш ! 31 22 8 48 ! 40 1 8 70 ! 33 i 8 IV 39 133 107 Всего команд 100 229 218 Максим. размер лабиринта 22X21 67x83 68x73 Среднее время поиска 6 м. 38 с. 8 м. 28 с. 7 м. 13 с. ЛИТЕРАТУРА | Бухара ев Р. Г., ХасановФ. Э., Моделирование вероятностных процессов на ЭВМ «Урал». Р1тоговая научная конференция Казанского государственного университета имени В. II. Ульянова-Ленина за 1960 год (краткое содержание докладов), Казань, 1961, 50—55. Поступило в редакцию 3 VII 1961.
ОБ ОДНОМ МЕТОДЕ ОЦЕНКИ СИТУАЦИИ ПРИ ИГРЕ В КРЕСТИКИ И НУЛИКИ III. О. СВАЛЯН И Т. М. ТЕР-МИКАЭЛЯН (ЕРЕВАН) В настоящей заметке излагается алгоритм и приводятся примеры игры в крестики и нулики между человеком и автоматической цифровой вычислительной машиной. Игра ведется на квадратной доске, состоящей из 36 клеток (6x6). Один из партнеров выбирает знак крестик (X), а другой— (0). Игра заключается в серии ходов, выполняемых поочередно противниками. Каждый ход заключается в занятии играющими своим знаком одной из свободных клеток игральной доски. Один из играющих начинает игру, которая кончается, когда все клетки оказываются заполненными. Игрок получает очко, если его знаком оказываются заняты подряд три клетки строки или столбца игральной доски. При этом одна и та же клетка может учитываться только два раза: один раз в строке и один раз в столбце (следовательно, четыре или пять подряд занятых клеток приносят одно очко, но шесть подряд занятых клеток приносят два очка). Выигрывает тот из противников, который наберет большее количество очков. Основной принцип выбора очередного хода машиной заключается в том, что каждая свободная клетка доски получает некоторую оценку. Машина выбирает ту из клеток, оценка которой оказывается наибольшей, а если таких несколько, то выбор одной из них считается несущественным и определяется особенностями программы. При выработке оценки некоторой клетки машина в одинаковой степени учитывает ценность этой клетки и для нее самой и для ее противника. Иными словами, машина как бы старается, во-первых, набрать наибольшее количество очков и, во-вторых, не дать своему противнику сделать того же. Алгоритм оценки состоит из ряда проверок, в результате которых одна и та же свободная клетка получает различные оценки. Все полученные оценки одной клетки суммируются, и таким образом получается итоговая оценка каждой свободной клетки; по этой оценке машина и выбирает свой очередной ход. Чтобы описать алгоритм оценки, мы введем несколько обозначений, которые упростят изложение. Строки и столбцы игральной доски мы назовем линиями. Направление линий установим по строке слева направо, по столбцу — сверху вниз. Таким образом, игральная доска как бы состоит из 12 направленных линий. При выработке оценки свободной клетки проводится анализ клеток, соседних с нею в одной линии, и, таким образом, одна и та же клетка исследуется, во-первых, в двух различных линиях и, во-вторых, в данной линии она может исследоваться несколько раз. Как мы уже отмечали, все оценки, полученные в результате таких проверок, суммируются и дают итоговую оценку клетки. Мы будем говорить далее, что на данной линии взято очко, если на ней имеются три подряд располо-
172 Ш. О. СРАПЯЫ и Т. М. ТЕР-МИКАЭЛЯН женные клетки, занятые одним и тем же знаком Заметим, наконец, что поскольку машина определяет ценность каждой свободной клетки как для себя, так и для противника, то при каждом ходе оценка каждой свободной клетки не изменилась бы, если бы знаки крестиков и нуликов заменили друг на друга. Теперь мы можем дать детальное описание алгоритма оценки свободной клетки, который зависит от того, взято ли уже на данной линии очко или нет. В соответствии с этим мы рассмотрим отдельно два случая. А. На данной линии одной из сторон взято очко. Здесь возможны четыре следующих случая. 1. Остальные три клетки данной линии свободны; тогда все они получают оценки Таблица I 3 4 5 6 7 8 9 70 77 72 73 74 75 76 77 78 79 2D 27 22 23 24 25 26 >27 28 29 ЗО 3/ Vz х х х # %!/Z XXX %tefeххх х х х 2 3 х х х х 2 х 2 х х х х г г х 2 2 х х х 2х2ххх 2 2 х х хх Z хх х 2 х 2х ххх 2 х 2 х х х 2 ххх х х 5 х х 5 х х 5 .х х х х 5 х х х х 5 х х х х\ 5 х х х х х х х 2 2 0 х х х 2 © 2 х х xq 2 2 0 2 2 х х х 2 0 2 х х х 2 2 0 х х х х х х 5 © © х х х © 5 0 хх х 0© 5 0 0 5 ххх 0 5 0 х х х 50 0 х х х х х х х по 1/2 балла каждая. 1 1 1 1 I I || гг 1 1 1 1 1 1 1 1 1 1 1 Г 1 1 _lJ i i 1 11 i [Т 1 1 1 1 1 1 1 Рис. 1. 2. Среди остальных трех клеток одна занята тем же знаком, а две другие свободны; тогда каждая из них получает оценки в 2 балла. 3. Среди остальных трех клеток две заняты тем же знаком, а третья свободна; оценка этой клетки принимается равной 5 баллам. 4. Среди остальных трех клеток имеется хоть одна, занятая противоположным знаком. Этот случай распадается на два: а) если очко взято не на крайних клетках, то остальные свободные клетки оцениваются в 0 баллов; б) если очко взято в трех крайних (слева или справа на линии) клетках и в остальных клетках имеется только один противоположный знак, то две свободные клетки получают оценки по 2 балла каждая, а если две клетки заняты противоположным знаком, то клетка, оставшаяся свободной, получает оценку в 5 баллов. Заметим, что в самой программе все случаи, когда хоть одна свободная клетка линии, на которой уже взято очко, получает ненулевую оценку, сведены в 31 шаблон (см. таблицу I). В этой таблице предполагается, что на линии очко взято знаком крестика. Если это не так, то все знаки крестика и нулика в таблице I надо заменить друг другом. В свободные клетки шаблонов вписаны соответствующие оценки. Сравнение линии с этими шаблонами выясняет все случаи ненулевых оценок и одновременно определяет оценку свободных клеток данной линии.
МЕТОД ОЦЕНКИ СИТУАЦИИ ПРИ ИГРЕ В КРЕСТИКИ И НУЛИКИ 173 В. На данной линии очко еще не взято. В этом случае клетки линии исследуются в порядке их следования по линии слева направо по следующим правилам. 1. Если исследуемая клетка свободна, то машина рассматривает две соседние с ней справа клетки; если обе они свободны, то все три клетки получают оценки по % балла каждая; если же хоть одна из них занята, то мы переходим к анализу клетки, следующей за данной клеткой. Таблица II 2. Для удобства описания алгоритма оценки в случае, когда исследуемая клетка занята, мы введем еще несколько понятий. Дополним игральную доску восемью линиями по две с каждой из ее сторон и полученную доску назовем расширенной (рис. 1) в отличие от собственно игральной доски, которую мы теперь будем называть основной. Все добавленные клетки заполним знаком минус. 0 0 Рис. 2. Назовем окрестностью клетки основной доски на данной линии четыре клетки расширенной доски, расположенные по две справа и слева от нее. На рис. 1 обе окрестности заштрихованной клетки (по строке и столбцу) обведены жирной линией. Теперь мы можем продолжить 1 / 'г 3 1 4 5 6 7 1 в 9 1 ;о 1 7/ 72 1 73 1 /4 75 76 77 7в 79 20 27 22 23 24 25 26 27 28 29 ЗО 37 32 33 34 35 36 37 Зв 39 1 40 47 42 ЛЗ \ \2 3 хЗ 2\ \0 4 х х 4\ \2 3 х 5 х # Ох 2 2\ \ОЭ х х 5 \0 0 х 5 х о 2 х зг\ 0 4 х х 4\ © О х 5 х 0 0 х 2 2\ © 0 х х 5\ © © х 5 х х О х 3 2\ х О х х 5\ х О х 5 х хе к 2 2\ х э х х 5\ х © х 5 х -2 х 3 2\ — 4 х х 4\ - О х 5 х - © х 2 2\ - © х х 5 - © х 5 х - - х 2 2\ - - х х 5\ х 5 х 2 3 х 2®\ 2 3 х 2 - 2 2 х © - 2 2 х © 0 2 2 х © х 2 2 х 0 0\ х О х х 4\ О 5 х Х®\ О 5 хх А е2 х 2®\ 2 2 х - -\ - 2 х 2 © - 5 х х 0 Q 2 х 2 - 0 5 х х © © 5 х х -| Рис. описание алгоритма оценки в случае, когда исследуемая клетка занята каким-либо знаком. В этом случае получают оценки те свободные клетки ее окрестности на данной линии, которые принадлежат основной доске. Сами оценки зависят от расположения знаков (крестика, нулика и минуса) в окрестности и сведены в 43 шаблона, перечисленных в таблице П. В этой таблице предполагается, что исследуемая (средняя) клетка занята знаком крестик (если это не так, то в таблице II все знаки крестиков и нуликов надо заменить друг другом). В эту таблицу включены только те случаи расположения нуликов, крестиков и минусов, при которых хотя бы одна из свободных клеток окрестности получает ненулевую оценку. Если, например, имеет место случай, изображенный на рис. 2, то мы полагаем оценку двух свободных клеток равной нулю и не включаем этот случай в таблицу П. Если же имеет место ситуация, изображенная на рис. 3, то этот случай предусмотрен шаблоном 13, из которого видно, что первая свободная клетка получает оценку в 0 баллов, вторая — в 3 балла и третья — в 2 балла. Оценка в 0 баллов для первой свободной клетки может показаться странной. Однако это становится ясным, если учесть, что анализ клеток проводится слева направо и что ситуация, изображенная в трех левых клетках шаблона 13, имеется в трех правых клетках шаблонов 3, 6 и др.
174 Ш. О. СРАПЯН и Т. М. ТЕР-МИКАЭЛЯН Таким образом рассматриваемая клетка ранее уже получила необходимую оценку. Так же как в случае Л, машина вырабатывает оценки с помощью сравнения окрестности исследуемой клетки со всеми шаблонами таблицы II. После того как все свободные клетки окрестности данной занятой клетки оценены, мы переходим к исследованию клетки, следующей за ней справа. Как мы уже отмечали выше, различные оценки, получаемые таким образом одной и той же свободной клеткой, суммируются и дают итоговую оценку. Проиллюстрируем правила оценки свободной клетки на нескольких примерах. Пронумеруем строки основной доски римскими цифрами, а столбцы — латинскими буквами. В этих обозначениях клетка Vd на рис. 4 / I ш ш F И X 0 7,5 0 X X X 6,5 ® X 3 a b с d e / Рис. 4. / Я Ж ш V и \2,5 \2,5 0 X X X 15 3,5 2,5 X 0 0 3,5 3,5 X 0 X 2,5 3,5 3,5 0 .х 0 3 15 2 3,5 3,5 3 15 7 15 зА 3,5\ У /J a b с d e / / п ш IF V £7 7 3 35 3,5 15 J 3 3 3,5 3,5 Z 15 2,5 0 X 0 3,5 35 X X 0 X 3.5 3,5 0 X X 0 3 3 0 х ] щ з\ 7,5\ 7 1 Рис. 5 а д с d e / Рис. G. получает оценку в 6,5 балла, которые слагаются из 4 баллов, 0 баллов и 2 баллов при исследовании клетки Vb (таблица II, шаблон 20), клетки Vc (в таблице II для этого случая нет шаблона) и клетки Ve (таблица II, шаблон 41) по строке V и 0,5 балла при исследовании вдоль столбца d (правило А, 1). Клетка IV с получает оценку в 7,5 балла, которые слагаются из 2, 0,5 и 0 баллов при исследовании клетки IV а (таблица II, шаблон 25), клетки IVЪ (правило В, 1) и клетки IVе (таблица II, шаблон 36) вдоль строки IV и из 2 и 3 баллов при исследовании клетки IIс (таблица II, шаблон 19) и клетки Vc (таблица II, шаблон 29) вдоль столбца с. На рис. 5 и 6 приведены два примера игровой ситуации и оценки свободных клеток, выработанные машиной. Эти ситуации изображают состояния на игральной доске после седьмого хода человека в партиях № 2. и№ 4 соответственно, приведенных б таблице III. В первом случае машина выбрала клетку 1с и во втором IVа. Заметим, что программа организована так, что из нескольких клеток с равными оценками машина выбирает первую из них при обходе игральной доски слева направо по строкам. В таблице III приведены примеры пяти партий. Первую из них машина сыграла сама с собой и свела вничью со счетом 2—2. В партиях № 2 и № 4, которые также закончились вничью, противник машины брал первое очко на шестом ходу (ходы, в которые одна из сторон берет очко, взяты в рамку), а машина брала свое первое очко на девятом. В связи с этим первые шесть ходов этих партий были повторены, после чего машина начинала играть за обе стороны. Можно было надеяться, что, продолжая игру за человека, машина сохранит образовавшееся преимущество в одно очко и, следовательно, будет найдена партия, в которой разработанный алгоритм оценки проигрывает. Эти две партии приведены в таблице III под номерами 3 и 5. Счет в каждой из этих партий оказался таким же, как в партиях № 2 и № 4 соответственно. Из этого можно заключить, что алгоритм оценки (во всяком случае для партий № 2 и № 3), «выпуская» вперед противника, «уверен», что сумеет нагнать его и свести к ничьей. Интересно отме-
МЕТОД ОЦЕНКИ СИТУАЦИИ ПРИ ИГРЕ В КРЕСТИКИ И НУЛИКИ 1/5 титъ, что в партиях № 4 и № 5 после шестого хода совпали все ходы вплоть до четырнадцатого, а остальные четыре хода хотя и отличаются немного друг от друга, но уже не вносят никакого изменения в результат игры. При этом противник машины в четвертой партии был совершенно незнаком с алгоритмом, по которому играла машина. Таблица III 1 /V-° \/?арта а?ода 7 2 3 4 5 1 в 1 7 8 3 70 77 72 73 \/4 Г75 76 77 73 \Сче/л №/ м-з Шс Folic Ша Д7а Да Ше IV/ Пе Id If Vb 7 la Шс Ше - - 2 м-з ш IFd lid шь IFd По Ше л/ 1е ш/ lb 7с 7 Ша Wd - - - 2 №2 вех Шс 7с TFd П7а 7а \WP\ т Id Ша Ш/ шь // ш\ Ше 11с Ше V - 2 м-з md IFc mi Ша Fd ИЬ 1с 1а пв По лу 1е П 7е Шd Щ] - - 2 №3 Человел м-з Шс Fc IFd П7а Fa \м\ ШЬ Id lb ПЬ Шс 1е \ж\ в/ Не Fc Шd - 2 ' м-з шп П7с Fd Ша Fb Ио Ис 1а Ш\ ШЬ Шс Пе П Ш/ V/ т Ше - 2 №4 Человек Шс IFd Ше lid Де т Id Ша ЛЬ lb ш Fc F ш Ш/ Иа Шс г/ 3 MS Md Шс Ше По Ше // Ша Па И ШЬ 7Ь \Ш\ F Ш 17/ 7а ИЬ 3 №5 Уемж М-З Шс ШП Ше ДП Пе т Id Ша ШЬ lb Ul\ Fc 7 Ш Ш/ Иа ШЬ 3 м-з\ шд Шс Ше До Ю // Ша 1 Па W ШЬ Fb \Ж\\ 7 щ Ш/\ Fa Шс 3 X X X X © © ©" © © X X X X © X X © © © © © X X © X X X © © х © / Л ш ш У ш © X © X X X © © X X © © X X о X ©1© X © X © © © © X © X X X X © X / Л ш ш У и ©;© © X X X X X © X © © © X X ©" X X © © X © X X © X © X © X X © © © / в ш ш У и © © © X © X X X © © © © X © X © X X X X © X X X ©1© X X © © © X X © X У п ш Л У ш © © © X © X х! х X © © © X © X © X © ~ © X X х © X X © © © © © X X © abedef abode/ abedef abode/ abede/ Всего машина сыграла 23 партии с различными лицами, из которых 13 выиграла и 10 свела вничью. Большое число ничейных результатов объясняется тем, что для удобства программирования правила игры были упрощены (взят ограниченный размер доски, диагонали доски совсем не рассматривались). Поэтому достижение ничейного результата не представляет большого труда, а сторона, делающая второй ход, вообще всегда может свести игру к ничьей. Скажем несколько слов об организации самой программы. Для изображения одной линии расширенной доски используется одна ячейка .машины М-З, содержащая 10 восьмеричных разрядов. Каждый из этих восьмеричных разрядов используется для изображения одной клетки в порядке их исследования по линии. При этом знак минус кодируется числом 2,
176 Ш. О. СРАПЯН и Т. М. ТЕР-МИКЛЭЛЯН крестик — числом 3 и нулик — числом 1. Свободные клетки игральной доски кодируются нулем. Таким образом, каждая клетка основной доски изображается два раза: один раз как принадлежащая столбцу и один раз- строке. Для подсчета оценки каждой клетки игральной доски выделены две ячейки, в которых накапливаются оценки при исследовании этой клетки отдельно вдоль строки и отдельно вдоль столбца. По окончании оценок содержимое этих двух ячеек складывается, что дает итоговую оценку клетки. Таким образом, для изображения игральной доски отводятся 12 ячеек и для накопления оценок — еще 72 ячейки. Заметим еще, что замена крестиков на нулики и нуликов на крестики (т. е. замена троек на единицы и наоборот) выполняется всего в семь команд следующим образом: чтобы заменить тройки единицами, достаточно выделить (с помощью операции логического умножения) средние разряды каждой восьмеричной цифры, изображающей состояния клеток основной доски, и сдвинуть их иа один разряд вправо. Чтобы заменить единицы на тройки, достаточно выделить средние разряды указанных восьмеричных цифр и сдвинуть их иа один разряд вправо (полученный набор обозначим через ах), затем выделить младшие разряды первоначальных восьмеричных цифр и из результата вычесть аг (обозначим полученный набор через а2). Теперь достаточно сдвинуть а2 на один разряд влево и к результату прибавить а2. Такая замена производится, разумеется, не в самой таблице II, а над окрестностью исследуемой клетки, выделенной в рабочую ячейку*). Всего программа состоит из 20S двухадресных команд, 117 ячеек занято под стандартные приказы, константы и шаблонки и 107 ячеек используются в качестве рабочих ячеек. На выбор одного хода машина расходует от двух до четырех секунд. Поступило в редакцию 1 VII 1901. *) Замену крестиков на нулики и нуликов на крестики проще, вероятно, сделать следующим образом: из константы, соответствующие восьмеричные цифры которой равны 4, вычесть окрестность клетки и результат логически умножить иа константу, восьмеричные цифры которой равны 3.— Прим. ред.
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ ИГР JE. J5. ЯНОВСКАЯ (ЛЕНИНГРАД) Итеративный метод решения матричных игр был предложен Брауном [1 ], а сходимость его установлена Робинсон [2]. Дальнейшие исследования по этому вопросу см. в [3, 4]. В настоящей работе показывается, что итеративный метод, аналогичный методу Брауна — Робинсон, может быть применен к решению биматричных игр. Описание итеративного метода для решения биматричных игр [5] состоит в следующем: предполагается, что игра играется много раз. В первый раз игроки выбирают свои стратегии произвольным образом, а в дальнейшем на t-м шаге каждый из игроков предполагает, что другой игрок будет применять смешанную стратегию, накопленную за предыдущие t — 1 шагов, и выбирает против нее наилучшую чистую стратегию. Именно, пусть Г(а,в) — биматричная игра с матрицами JL, В. На £-м шаге первый игрок выбирает г-ю строку, где а второй игрок выбирает /-й столбец, где ^bijxh-i = m*xXbiJXit-i> х ] t здесь Xit , yj — частоты, с которыми игрались £-я строка и /-й столбец за t—1 шагов соответственно. Положим xt = (xit* x2t> • > x™t)> yt = (yie. V2t> • • •, Vnt). Целью настоящей статьи является, установление того факта, что если такая «фиктивная» игра играется много раз, то последовательности max S а1}у}-9 max 2 Ъ^х* i i ; i i сходятся к выигрышам соответственно первого и второго игроков в некоторой ситуации равновесия. Существование ситуаций равновесия было доказано Нэшем [6] (см. также [7]). Рассмотрим биматричную игру Г(л,в>, в которой матрицы Л и В имеют размеры тхп. Для любого вектора В = (rv . .., rk) под max В (min В) будем, как обычно, понимать его максимальную (соответственно минимальную) компоненту. Определение 1. Система (U, V) m-мерных векторов ?7(0), 17(1), ..., Z7(*),... ии-мерных векторов F(0), F(l), ..., V(t)9 ..., назы- 12 Проблемы кибернетики вып. 9
178 Е. Б. ЯНОВСКАЯ вается аппроксимирующей вектор-системой игры Г(д9в)* если V{0) = k2(XB + D2) (kv /с2>0, Dlf D2 — произвольные фиксированные m-мерный и л-мерный векторы, X£Sm, Y£Sn, где под Sr, как обычно, понимается множество- г векторов р = (pv ..., рг), для которых /^ >0, i = 1, ..., г и ^ р{ = 1)г !7(* + l)=!7(0 + ^.j, F(* + l)=F(0 + JBi. где А.у обозначает /-й столбец матрицы Л, 2^. обозначает i-ю строку матрицы В, и номера i и / выбираются таким образом, что vi(t) = msx F(0» и{(г)^=тах 17(f). Определение 2. Если (17, V) — аппроксимирующая вектор-система игры Г(л,л), то i-я строка матрицы В называется существенной в интервале (t,tr), если существует t19 t^t1^t't такое, что ui(t1) = max Utyi). Аналогично /-й столбец матрицы А называется существенным в интервале (t, t'), если существует t2, £<£2<£', такое, что Vj (/2) = max V(t2). В дальнейшем под (vv v2) будем понимать пару выигрышей игроков в некоторой ситуации равновесия. Определение 3. Равновесная стратегия X первого игрока называется правильно смешанной, если существует такая ситуация равновесия (Ху У), что Ai.YT = v1 для всех i = l,...,m. Аналогично равновесная стратегия Y второго игрока называется правильно смешанной, если существует такая ситуация равновесия (X, Y), что XB.j=v2 для всех /=1, ...,гс. Определение 4. Если A, J5 —матрицы игры Г(А,в), то пара подматриц А\ В', соответственно матриц А, В, называется игровой парой, если подматрицы А\ В' образованы пересечением строк и столбцов с одинаковыми номерами. Лемма 1. Если в интервале (s% s + t) все строки существенны, та max U(s +1) — min TJ (s + t) < 2at; если в интервале (s, s + t) все столбцы существенны, то max V(s + t)-minV(s + t)<i2bt, где a = max \atj |, 6 = max \bij\. i, ; i, j Доказательство. Пусть min U(s +1) = uj (s +1). Ввиду существенности / в (s,s + t) существует f, 0<£'<f, такое, что ui(s-{-t,) = = max U(s + t'). Кроме того, очевидно, при любом V uj(s + t,)<uj(s + t) + a(t — t,)^uj(s + t) + at. Следовательно, max U(s + t')-m\n U(s + t)<at. (1)
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ ИГР 179 На каждом шаге max U(t) может увеличиться не более чем на а, поэтому max U(s + t) — max V(s +1')< at. (2) Из (1) и (2) получаем, что max U(s +1) — min U(s +1) < 2at. Доказательство для V(t) аналогично. Лемма 2. Если в игре Г(л,в) существуют правильно смешанные равновесные стратегии у обоих игроков, то из max А ¥Т — min A YT < г следует: \maixATT-v1\<Ce\ а из max XB — min XB < е следует: | max XB — v2 | < Се, где С —число, постоянное для данных матриц А, В. Доказательство. Докажем первое утверждение (второе доказывается аналогично). Пусть (X, Y) —такая ситуация равновесия, для которой X — правильно смешанная равновесная стратегия. Положим A = r-r = (filf ...,6n). Тогда max4AT-min4AT = max^(rT-YT)-min^l(rT-i?T) = = max J. YT — min ATT < e> так как max А YT = min AYT = vx по определению правильно смешанной равновесной стратегии. Пусть максимальной компонентой вектора AYT является его первая компонента, тогда max ААТ = АГЛТ = 2 arj6r Положим, далее, 2агА — 2«iA = 8i» i = l, ..., г —1, г+1, . ..,го, i i 2б, = о. Заметим, что е{< е. Соотношения (3) можно рассматривать как систему го уравнений с п неизвестными 6lf ...,6^. По условию эта система совместна. Если она имеет единственное решение, то его можно найта по формулам Крамера и при этом |mzxAYT-v11 = | max ААТ | = | 2 aTjbi | < Се. у Если система имеет бесконечное множество решений, то положим некоторые из компонент А равными нулю, а остальные снова определим 12* (3)
180 Е. Б. ЯНОВСКАЯ по формулам Крамера. Для полученного решения Д' имеем: IS «,/*;|< Се. (3') з Так как 4и 4' являются решениями системы (3), то для всех i 2 arfij — 2 flrA' = 2 «i A — 2 <*i A'= e» У з i i где 0 не зависит от i, и, следовательно, max А Дт — min ^1 Дт = max А\'т — min ^1ДТ. Обозначим Y1—Y — Д\ тогда ^.Г1т = ^(Г-Д')т = Л(Г-Д)т-0 = ^Гт-0, тде в —n-мерный вектор, все компоненты которого равны 0. Следовательно вектор AY\ имеет равные компоненты. В силу (3') остается показать, что они равны vv Если Y1^Sny то (X, F2) является ситуацией равновесия, и утверждение доказано. Пусть теперь Yi$Sn. Соединим точку Г\ «с Y, и пусть X'Y1 + (1 — X') F —точка пересечения полученного отрезка чс симплексом Sn. Для всех 0<^<1 вектор A(XY1 + (l — X)Y)T имеет равные компоненты, кроме того, для 0<h<V векторы XY1 + (l — X)Y принадлежат Sn, и поэтому (X, ^Fx+(1 — X) Y) является ситуацией равновесия для указанных X. Следовательно, компоненты вектора A (J^F1 + (1 — X) Y)T равны vx. Так как ^>0и 1Г имеет компоненты, равные v19 то и AYX имеет компоненты, равные vx. Следствие. Если в игре Т(Л,в) существуют правильно смешанные равновесные стратегии у обоих игроков, то для любой аппроксимирующей вектор-системы (Z7, V) игры Т(а,в) из max U(t) min U (t) *i + * ~ *i+* <8 следует а из следует max 17(0 <с(г+*^)- max V (t) min V (Q ma'FW-p,|<c(e+3*'^'P'1). г^е С —число, постоянное для данных матриц А, В. Доказательство. 17(0= U(0) + tATj=klD1 + k1AYj+ tATj = = fc1D1 + (fc1 + <)^I'T. где Тогда ^х - Лх+< *! + * ' ,—Т /17(0 *ipi ^ ^maxU(t) , ftimaxIPtI тах^Г =max^-^T-irT7j<-^qr7-+—^+7— . ^-^Т • С U(t) ftiDi Л . minJ7(t) ^ max | Z>t | ■mm Л Г =min^irTF-jrqTj>-^T1 h+t
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ ИГР 181 Вычитая из первого неравенства второе, получим: По лемме 2 i т. е. max A YT — v± max U (t) 1 < с(.+*™> Доказательство второго утверждения аналогично. Теорема 1. Для любой аппроксимирующей вектор-системы игры Г(^, в) по любому е>0 можно найти такое t*9 что для всех t>t* I max U (t) maxF(Q < <-+5^f?il). ft2 + i <c(t Zr2 шах | D2 *2 + ul). где Oj, v2—выигрыши в некоторой ситуации равновесия, а С — число, постоянное для данных матриц А и Б. Доказательство. Для матриц 1x1 утверждение теоремы справедливо, так как V (t) = (*! + <) «11+М>1. так что для всех t тривиальным образом max V (t) *i+* \maxV(t) I *2 + ' _ *l'l Pi I *1+* ' ft, I 2>i I ft4 + i fti+f maxF'(f') Предположим, что теорема справедлива для всех игровых пар подматриц А', В', т. е. по любому е > 0 найдется такое t'v что для всех ? > t\ max V (О _ ,;, I < с / + ^тах|РЦЛ ^ где (17', F') —аппроксимирующая вектор-система для игры Г(Л\ в>)> Пусть ^ = тах^, где максимум берется по всем игровым парам подматриц матриц А, В. При доказательстве теоремы рассмотрим отдельно три случая. 1-й случай. Существуют правильно смешанные равновесные стратегии у обоих игроков. Возьмем £>—J- и рассмотрим интервалы (tyt + tj), (t + tl9 t + 2t1). При этом могут иметь место следующие возможности. а) В каждом из интервалов все строки существенны. Тогда из леммы 1 следует, что |тах #(* + *!) —min lT(* + *i) | < 2atl9 | max U (t + 2tx) - min U(t + 2t±) | < 2atv
182 Е. Б. ЯНОВСКАЯ и поэтому max 17 (t+*i) m\n U (t+ti) ki+t+h h+t+t,. maxf7(t+2<i) minV(t+2t1) _2££i_ < 2a<t <8. На основании следствия из леммы 2 имеем: max U(t-\-t-C) <Ч«+^^)' max AT *! + *+*! лх t7(f+2fi) I <r/r. | 3timax|Pt|\ и для любого 0<r<2fx |maxt7(<4-r) „ | ^ л /~ „ , ^maxl^l^ Покажем это, например, для r=0 | max U (t) — max U(t + tx) | < at1% (4) max «7(0 maxt7(f-Hi) max t7 (t+fi) max 17 (f-ftt) < max 17 (<-Hi) <i [^ r о (5) (6) (?) /o\ maxU(« + 'i) тт //\ /я\ что следует из (2) и ограниченности величины , , , ' . Из (4), (6) Л1ТГТ *1 и (7) следует, что max U (t) ki+t <Ч*+^^) Для остальных значений г справедливы аналогичные рассуждения, поэтому для 0<г<2^ справедливо неравенство (5). б) В (/, £ + *i) все строки существенны, а в (* + *lf- t + 2^) какая- нибудь строка несущественна. Применяя к интервалу (t, t + tj) лемму 1 и следствие из леммы 2, мы имеем: |Е£^±£1»_„1|<с(. + А=Ш). (8) Пусть в (t-\-tly t + 2tx) несущественна 5-я строка. Удалим ее из матриц А, 13 и образуем аппроксимирующую вектор-систему для получившейся игровой пары подматриц А\ В'\ 1Г(0)= 1С (* + *!); F'(0)=F(*+O; U' (Г) = [(fcx + t + t1 + t')AYT + kM* = = ^ + t + h + t')(AYT + ki+kt£l+t,ys ; j (9) V (*') = (k1 + t + t1 + f) ХВ + к2П2 = = {kt + t + t1 + t')X'B'+ktDt + {kt + t + t1 + t')J>t = где ТУ — некоторый га-мерный вектор, а под wt понимается вектор w с удаленной 4-й компонентой.
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ ИГР 183 Для любого *'€[(), *J max С" (Г) = max 17(/ + ^ + Г) и, стности, maxCT'^) __ max 17(* + 2*0 Но по индуктивному предположению _ _ _ _ _^ I max V (£,) ча- *i + '+2'i т. е. V[ <C 8 *(£l+* + *i)max *i-H+*i *i+'+2*i max U(* + 2*i) ■1>;|<с(< *i+*+2* Из (8) и (10) следует, что | vx — v[ | < С2е. Так как е произвольно мало, а игровых пар конечное число, то vx = v[. Проводя рассуждения, аналогичные проведенным в пункте а), мы получаем, что и в этом случае для любого 0<r<2f1 max U(t + r) ki+l + r <с(г Axmax I Dt *! + * + П (11) в) В (t, t + tx) какая-нибудь строка несущественна, а в (t + tly t + 2t1) все строки существенны. Этот случай аналогичен случаю б). г) В обоих интервалах (t> t + tj, (t + tv t + 2tx) какая-нибудь строка несущественна, а в (t, t-\-2t^) все строки существенны. Пусть v[, с^' —выигрыш первого игрока в некоторой ситуации равновесия в играх, образованных игровыми парами подматриц Ау J2, получаемых удалением строк, несущественных соответственно в интервалах (£, t-\-tx)t (t-t-tly t-\-2tl). В этом случае v'1 = v"1 = vl и для 0<г<2/1 выполняется неравенство (И). д) В (t,t-\-2tl) какая-нибудь строка несущественна. Опять получаем ■v[ = v[ и для 0<г<2/х Далее вместо интервалов (£, f4-fx), (t + tly t-\-2t1) рассмотрим аналогичным способом интервалы (t + tly £ + 2^), (£ + 2^, t + 3tx) и т. д. Если хоть в одном интервале длины 2tx все строки существенны, то для max 17(0 <cf> Arx max | Dx | )• где С постоянно для данной матрицы А. Если же во всех интервалах длины 2tx какая-либо строка несуще- •ственна, то для г > —- max U(t) << e-f )• где c^ —выигрыш первого игрока в некоторой ситуации равновесия в игре, образованной игровыми парами подматриц А, В, получаемых удалением строки, несущественной в каком-либо интервале длины tv Аналогично доказательству, проведенному в пункте б), можно показать, что v[ одинаково для всех игровых пар подматриц.
184 Е. Б. ЯНОВСКАЯ Покажем, что 1^ —выигрыш первого игрока в некоторой ситуации равновесия в игре Т(АуВ). Каждым последовательностям U(t), V(t) соответствуют последовательности стратегий Xt, Yv где U(t)= U(0) + tAYj, V(t)=V(0) + tXtB. Пусть X, !F —пределы какой-нибудь сходящейся подпоследовательности стратегий, соответствующих последовательностям U(tn)> V(ta)- Если для всех i равенство max V(tn) = u{ (tn) выполняется при бесконечно многих значениях л, то вектор AYT имеет равные компоненты, и, следовательно, по лемме 2, Y — равновесная стратегия второго игрока и для всех i = 1, ..., m At.YT = v^ Так же как в пункте б.), получаем, что v[ = v1. Пусть теперь для некоторого i указанное равенство выполняется конечное число раз. Тогда, очевидно, ХС является равновесной стратегией первого игрока в игре Г(^',в'), где матрицы А\ В' получены из матриц А у В удалением i-й строки. Пусть (Х\ , Y) — ситуации равновесия в игре Г(4',в'). По определению ситуации равновесия v'1 = X?A'YT>XiA'YT для всех Х- £Sm_lt XiBYT>XiBYT для всех Y£Sn\ так как ^aijyj^fv[ и ^ = 0, то из неравенств (12) следует, что j v[ = XAY>XAY, XBY>XBY. Следовательно, (X, Y) — ситуация равновесия в игре Г(А,в) и v1 = v[.. Итак, для t > —- max U(t) ki + t <Че+^^) 2-й случай. У первого игрока не существует правильно смешанной равновесной стратегии. Прежде чем приступить к рассмотрению 2-го случая, докажем следующее утверждение. Если у первого игрока не существует правильно смешанной равновесной стратегии, то для всех аппроксимирующих вектор-систем, удовлетворяющих условиям кх max | D11< С, /с2тах |2>2| < С, (13) найдется t0 такое, что для всех t > t0 в любом интервале длины tx какая-нибудь строка несущественна. Доказательство разобьем на два случая. а) У второго игрока существует правильно смешанная равновесная стратегия. Покажем сначала, что для любой аппроксимирующей вектор-системы, удовлетворяющей условиям (13), найдется такое t0, что для всех t>tQ в интервале (t, t + tj какая-нибудь строка несущественна. Действительно, если бы это было не так, то в силу леммы 1 можно было бы выбрать такую сходящуюся подпоследовательность стратегий второго игрока,
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ" ИГР 185 соответствующую последовательности U{t)y что для предельной стратегии Y вектор AYT имел бы равные компоненты. Пусть (X, Y) — ситуация равновесия, для которой Г—правильно смешанная стратегия. Тогда (X, Y) также является ситуацией равновесия, так как векторы AY и ВХ имеют равные компоненты. Таким образом, X — правильно смешанная стратегия, что противоречит условию у1верждения. Следовательно, для любой аппроксимирующей вектор-системы (U, V) либо найдется t0 такое, что в интервале (t0 — tl9 t0) все строки существенны, а для £>£0 в любом интервале (t, t + tj какая-нибудь строка несущественна, либо в каждом интервале длины tx какая-нибудь строка несущественна. В последнем случае t0 положим равным нулю. Предположим теперь, что утверждение неверно. Тогда найдется последовательность аппрокси" мирующих вектор-систем (Uin\ Vin)) такая, что соответствующая последо^ вательность /(1) /(2) ЛП) &0 , «<0 , . . ., «<0 , ... неограниченно возрастает и для любого п к[п) max | D[n) | < С, к[п) max | D<n) | < С. Заметим, что /с(1п) и /с2п) всегда можно считать ограниченными, так как векторы Dc1n) и D2n) произвольны, и к ним можно добавить любую часть векторов соответственно. Выберем из последовательностей fc^maxlX)*70!, ft2n) max 12>2n) | любые сходящиеся подпоследовательности, и пусть кг max | J^ | и к2 max | 2>21 — их пределы. Нетрудно видеть, что аппроксимирующая вектор-система, начинающаяся с к1У Dly /c2, D2, имеет бесконечное число интервалов длины tly в которых все строки существенны. Полученное противоречие доказывает случай а). б) У второго игрока не существует правильно смешанной равновесной стратегии. Предположим, что для некоторой аппроксимирующей вектор-системы существует бесконечное число интервалов длины t19 в которых все строки существенны. Покажем в этом предположении, что существует лишь конечное число интервалов длины t19 в которых все столбцы существенны. Действительно, в противном случае по лемме 1 из последовательностей стратегий, соответствующих последовательностям Tj(t)9 V (t), можно было бы выбрать такие сходящиеся подпоследовательности стратегий соответственно второго и первого игроков, что для предельных стратегий векторы AYT и ХВ имели бы равные компоненты, т. е. пара (X, Y) представляла бы ситуацию равновесия, где Г—правильно смешанная стратегия. Удалим из матриц А9 В несущественный столбец. Тогда по индуктивному предположению ,. max U (t) , ,. max F (03 hm к A-t = Vi> hm k -l< t-+co где v[y v'2 — выигрыши игроков в некоторой ситуации равновесия в игре Т(а\в')> а Л'у В' — игровая пара подматриц, полученная из А> В удалением несущественного столбца. По предположению из последовательности т**х * ' можно выбрать сходящуюся подпоследовательность стра- ki+l T тегий такую, что для предельной стратегии Г вектор AY имеет равные компоненты. Так как решение игры Т(а>,в') является решением
186 Е. Б. ЯНОВСКАЯ игры Г(л,в), что следует из пункта д) 1-го случая теоремы, то второй игрок в игре Г(л,Б) имеет правильно смешанную равновесную стратегию, что противоречит условию. Равномерная ограниченность величины t0 доказывается так же, как в 1-м случае. Утверждение доказано. Приступим к доказательству теоремы во 2-м случае. Рассмотрим интервалы (t0, t + tx), (£0 + *р ^о + 2^). По доказанному выше в каждом из них какая-нибудь строка несущественна. Рассматривая аппроксимирующие вектор-системы соответствующих игровых пар подматриц, получим, что для 0<г<2^ I КЛ-ЧЛ-r -*1|<G^e+ kl + to + r J' Рассматривая интервалы (*0 + *i» ^o + 2^), (^ + 2^, ^0 + 3^) и т. д., получим, что для t > t0 Доказательство того, что v[ является выигрышем первого игрока в некоторой ситуации равновесия в игре Г(л,в), совпадает с доказательством, проведенным в пункте д) 1-го случая теоремы. 3-й случай. У первого игрока существует правильно смешанная равновесная стратегия, а у второго игрока не существует правильно смешанной равновесной стратегии. Существует лишь конечное число интервалов длины tv в которых все столбцы существенны и i. max U (t) , ,. maxF(/) / Если существует бесконечное число интервалов длины tv то для U(t) справедливо утверждение леммы 2. 9/7/ Рассмотрим t > —-. Если существует лишь конечное число интервалов длины tly в которых все строки существенны, то либо во всех интервалах длины ti какая-нибудь строка несущественна, либо найдутся интервалы (t, £ + *i)» (* + *i» t-\-2ti), в одном из которых все строки существенны, а в другом какая-нибудь строка несущественна. Используя доказательство 1-го случая теоремы, получим, что для U (t) справедливо утверждение леммы 2. Далее доказательство совпадает с доказательством 1-го случая. Доказательство для V(t) аналогично. Оценка скорости сходимости итеративного процесса дается следующей теоремой. * Теорема 2. Если матрицы игры Г(л,т?> имеют размер тхп, где т-\-п^З, то для любой аппроксимирующей вектор-системы^ удов- летворяюгцей условиям (13), 1 < Cxt m+n"2 , i <C2t ™+ri-* , где Cv С2 —числа, постоянные для данных матриц А и В. max U (t) , max U (t) max V (t) *!+*
ИТЕРАТИВНЫЙ МЕТОД РЕШЕНИЯ БИМАТРИЧНЫХ ИГР 187 Доказательство. Рассмотрим игру с матрицами размера 1x2. Мы имеем: y2 = max2? = biy vl = ai9 U(0) = kl(ATT + Dl)t V(0) = k2(B + D2), V(t) = k2(B + D2) + tB, V(t) „ . k2D2 k2+t = B max V (t) k2 + t < k2+t • к2тг\ах\ D2\ Cx k2 + t t ' Для любой аппроксимирующей вектор-системы, удовлетворяющей условиям (13), существует t такое, что для t > t max V(t) = vi(t)t U(t + T)=U{t) + tvlt max XJ(t-\-t) tvx | max U (t) < max U(t) kt+l+t *i + * v, <$ Аналогичное утверждение теоремы справедливо для игры с матрицами размера 2x1. Предположим, что теорема справедлива для всех игровых пар подматриц A, JJ. Тогда для произвольной аппроксимирующей вектор- системы игры Г(Л',л'), где А\ В' — любая игровая пара подматриц А% J3, удовлетворяющей условиям (13), |тахС7'(/) *i-M < C't ™+*-з . Если существует t0 такое, что для любой аппроксимирующей вектор- системы, удовлетворяющей условиям (13), некоторая строка несущественна во всяком интервале длины t\ то по индуктивному предположению тах*7(/) VH <Cst m+n-3+oM^ ^т; Если же всякая строка существенна бесконечное число раз в интерва- _ £> лах длины t'$ то из доказательства теоремы 1 следует, что для t > С'А — max U (t) <Се + 0(1), (14) где /' таково, что для любой аппроксимирующей вектор-системы игры Г(^',в'), удовлетворяющей условиям (13), для t>t' I max XT (t) По индуктивному предположению max XT (t) v'i <e- (15) ki + t v[ < C't ™+*-3 + <r). для всех t.
188 Е. Б. ЯНОВСКАЯ Пусть e = C't rn+n-з # Тогда (15) выполняется для t > w+n_a. Итак, С Р С для £> 4 = m * а выполняется (14), это и значит, что l^^-t^^rTO + ^l). Аналогичным рассуждением получаем: \^M-v2\<c2t-^^+o(l). Так как m + n>3, то О Г —Л входит в Ct ™+n-2 , и теорема доказана. ЛИТЕРАТУРА [1] Brown G. W., Iterative solutions of games by fictitious play, activity analysis of production and Allocation, Cowles Commission for Research in Economics, Monograph 13, Wiley & sons, Inc., New York, 1951, 374—376. [2] Робинсон Дж., Итеративный метод решения игр, Матричные игры, Физ- матгиз, 1961. [3] Ш а п и р о Г. Н., Замечание о вычислительном методе в теории игр, Матричные игры, Физматгиз, 1961. [4] Брэйтуайт Р. Б., Конечный итеративный алгорифм для решения некоторых игр и соответствующих систем линейных уравнений, Матричные игры,. Физматгиз, 1961. [5] Воробьев Н. Н., Ситуации равновесия в биматричных играх, Теория вероятностей и ее применения 3, 1958, 318—331. [6] Н э ш Дж., Бескоалиционные игры, Матричные игры, Физматгиз, 1961. [7] Воробьев Н. Ы., Конечные бескоалиционные игры, УМН 14, 4 (88), 1959, 21—56. Поступило в редакцию первый вариант 7 IV 1961,. окончательный вариант 2 XI 1961.
VI. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЭКОНОМИКИ МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЛЕКТРОННЫХ ЦИФРОВЫХ МАШИНАХ Н. Л. БУСЛЕНКО (МОСКВА) § 1. Вводные замечания В связи с широким внедрением в народное хозяйство средств комплексной автоматизации и механизации повышается интерес к методам исследования производственных процессов, позволяющим получить полезную информацию для проектирования, создания и ввода в действие автоматических станов, автоматических линий, автоматизированных цехов и заводов. Производственные процессы современных автоматизированных предприятий, снабженных системами автоматического управления, средствами телемеханики и электроники, являются весьма сложными процессами, характеризующимися исключительно напряженным режимом во времени, а также огромным количеством переплетающихся и сложно взаимодействующих случайных факторов. При исследовании производственных процессов с упомянутыми выше целями нельзя ограничиться изучением отдельно взятых, изолированных состояний процесса. Нельзя также пренебрегать действием случайных факторов. Для обоснованного решения задач, возникающих на практике, необходимо располагать информацией, описывающей динамику процесса и следствия всевозможных складывающихся в динамике случайных обстоятельств. Заметим, что получение информации, характеризующей динамику функционирования сложной системы, в общем случае не может быть обеспечено путем исследования отдельных элементов системы или отдельных элементарных операций. Для этого, как правило, необходимо изучать процесс в целом, уделяя особенно серьезное внимание взаимодействию отдельных элементов и совместному действию различных случайных факторов. Широкое использование эксперимента для исследования сложных производственных процессов путем натурных испытаний оказывается дорогостоящим и трудным в организации. Исследование сложных производственных процессов, с достаточной для практики полнотой и точностью учитывающее главные действующие факторы, на наш взгляд, может быть построено на основе моделирования производственных процессов на электронных цифровых машинах. Сущность рассматриваемой здесь методики моделирования состоит в реализации на электронной цифровой машине универсального назначения специального алгоритма, который воспроизводит, вообще говоря, формализованный производственный процесс. Моделирующий алгоритм позволяет по исходным данным, содержащим сведения о начальном состоянии процесса и его параметрах, получить информацию о состояниях процесса в произвольные моменты времени. Он состоит из некоторого
190 Н. П. БУСЛЕНКО количества операторов, объединяемых в специальные группы — подал го- ритмы. Каждый подалгоритм выполняет одну из следующих функций: 1) моделирует какую-нибудь элементарную операцию исследуемого* процесса, 2) учитывает взаимодействие элементарных операций и осуществляет объединение их в единый производственный процесс, 3) обеспечивает согласованную работу отдельных подалгоритмов при реализации модели на электронных цифровых машинах. Влияние случайных факторов на течение процесса имитируется при помощи случайных чисел с заданными, или вырабатываемыми в процессе моделирования, вероятностными характеристиками. Информация о состояниях процесса, получаемая в результате работы моделирующего алгоритма, должным образом обрабатывается и используется для решения практических задач. Заметим, что интересные для практики сведения о производственном процессе можно получить, рассматривая отдельные реализации построенного упомянутым образом случайного процесса. Однако обстоятельное исследование производственного процесса связано с определением статистически устойчивых средних характеристик, вычисляемых по большому количеству реализаций. Легко видеть, что с точки зрения оценки искомых параметров производственного процесса по результатам многократного моделирования рассматриваемая процедура имеет смысл схемы независимых статистических испытаний. Поэтому для оценки точности результатов моделирования и назначения необходимого количества испытаний можно воспользоваться соответствующими правилами математической статистики. В связи с исследованием производственных процессов методом моделирования на электронных цифровых машинах возникают следующие основные проблемы: 1) построение формализованной схемы процесса, доступной с точки зрения простоты для моделирования на современных универсальных цифровых машинах и обеспечивающей необходимую точность решения практических задач; 2) построение компактных и удобных для использования моделирующих алгоритмов и программирование их в системе команд конкретной электронной цифровой машины; 3) формулировка и разработка методики решепия задач исследования операций применительно к производственным процессам с использованием результатов моделирования. В настоящее время методика машинпого и вообще математического исследования динамики произгодствепных процессов находится лишь в стадии становления. Поэтому общие методы, пригодные для производственных процессов самой различной природы, еще ждут своей разработки. Сейчас можно говорить лишь о частных приемах или, в лучшем случае, о методике, охватывающей некоторые практически важные классы производственных процессов. В частности, настоящая статья посвящена рассмотрению принципов формализации и моделирования производственных процессов поточного изготовления штучных изделий. § 2, Принципы формализации производственного процесса Для того чтобы получить возможность моделировать производственный процесс на электронных цифровых машинах, необходимо его полностью формализовать. Вид формализованной схемы процесса существенно зависит как от структуры самого производственного процесса, так и от тех целей, ради которых предпринимается моделирование.
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 191 Прежде чем переходить к рассмотрению существа формализации, остановимся кратко на выяспении структуры производственного процесса и связанного с ним комплекса оборудования, на выборе основных учитываемых факторов, а также проследим связь между задачами, подлежащими решению при помощи создаваемой модели, и информацией, перерабатываемой машиной в процессе моделирования. Производственный процесс поточного изготовления штучных изделий будем представлять в виде последовательности отдельных операций. С точки зрения исследования динамики производственного процесса нет необходимости учитывать разпицу между технологическими операциями и другими видами производственных операций (подготовка материалов, транспортировка полуфабрикатов, упаковка и т. д.). Для формализации производственного процесса поточного изготовления штучных изделий, как будет показано ниже, достаточно рассматривать только следующие виды операций: 1) операции обработки полуфабрикатов, 2) операции сборки изделий, 3) операции управления. Если для сборки изделия требуется п типов деталей, а т из них изготавливаются вне рассматриваемого технологического процесса, то для обеспечения производства необходимо иметь, -по крайней мере, одну линию сборки изделий и п—т линий изготовления (обработки) деталей, поступающих на сборку. Конкретный производственный комплекс (стан, цех, завод и т. д.) может состоять из нескольких идентичных или различных (если речь идет о производстве различных изделий) линий сборки и нескольких линий обработки для каждой детали. Наконец, некоторые поступающие на сборку полуфабрикаты сами могут быть получены в результате сборки из более мелких деталей, как производимых в пределах рассматриваемого технологического процесса, так и поступающих извне. Каждая из упоминающихся здесь линий в общем случае состоит из нескольких станков или агрегатов, выполняющих операции обработки и сборки. Устройства, выполняющие операции управления, предназначены для обеспечения согласованной работы отдельных станков в линии и линий в производственном комплексе. При формализации производственных процессов поточного изготовления штучных изделий обычно оказывается целесообразным учитывать следующие основные группы факторов: 1. Случайный характер интервалов времени, регламентирующих чередование различных состояний процесса (темп подачи полуфабрикатов на отдельные линии, станки и агрегаты, длительность производственных операций, время подготовки оборудования к работе и т. д.). Эти интервалы времени зависят от сочетания многочисленных обстоятельств, складывающихся в процессе производства, и поэтому их расчетные значения строго не выдерживаются. 2. Режим занятости элементов производственного комплекса (поступление очередного полуфабриката к элементу до окончания операции над предыдущим полуфабрикатом, образование очередей полуфабрикатов, простои оборудования и т. д.). Эти факторы могут приводить к разнообразным следствиям, существенно сказывающимся на течении процесса. 3. Надежность элементов производственного комплекса (отказы и поломки оборудования, закономерности, связанные с ремонтом вышедших из строя станков и агрегатов). Здесь необходимо главное внимание обратить на судьбу тех экземпляров полуфабрикатов, при обработке которых происходит отказ.
192 Н. П. БУСЛЕНКО 4. Режим износа (стойкости) инструмента и постепенный выход оборудования из рабочего состояния (разладка отдельных станков, агрегатов и производственного комплекса в целом, порядок замены инструмента и наладки оборудования). 5. Причины образования брака при выполнении производственных операций. Основными моментами при этом являются зависимость возможности появления брака от складывающихся в процессе производства условий и мероприятия, которые проводятся в случаях обнаружения бракованных изделий. ***-\ 6. Случаи срыва производственного процесса в целом или на отдельных его участках по причинам как связанным, так и не связанным с рассмотренными выше факторами. В последнем случае имеются в виду главным образом те срывы процесса, которые происходят за счет низкого качества материалов, нарушения режима подачи энергии, нарушения требований техники безопасности. Математическая модель, построенная с учетом перечисленных факторов, охватывает, как показывает анализ многих конкретных процессов поточного производства штучных изделий, все наиболее существенные стороны динамики производственных процессов этого класса. Она обеспечивает возможность решения основных задач исследования производственных процессов, таких как оценка производительности (количества выпускаемых изделий за смену) технологического комплекса и отдельных станков; оценка качества выпускаемой продукции (доли брака) и дифференциация доли брака по причинам, его порождающим; оценка относительного времени производительной работы элементов производственного комплекса и времени простоев; оценка относительного количества срывов процесса и случаев выхода технологического оборудования из рабочего состояния, и т. д. Чтобы получить возможность решения перечисленных задач, обычно требуется фиксировать и выводить из машины на печать следующие результаты моделирования: — среднее количество изделий, выпускаемых в течение заданного промежутка времени (например, за смену); — среднее количество деталей, обработанных каждым станком; — среднее количество бракованных деталей и изделий; — среднее количество случаев некачественной обработки деталей каждым станком по каждой из причин, порождающих брак, а также каждым станком по всем причинам вместе взятым; — среднее время производительной работы каждого из элементов производственного комплекса; — среднее время простоев каждого элемента производственного комплекса по каждой из причин, вызывающих простои, а также каждого элемента по всем причинам вместе взятым; — среднее количество срывов производственного процесса по каждой из причин, вызывающих срывы, а также по всем причинам вместе взятым; — среднее количество случаев нарушения нормальной работы каждого из элементов производственного комплекса по каждой из причин, их порождающих, а также каждого элемента по всем причинам вместе взятым, и т. д. Получение такого рода результатов может быть обеспечено лишь в том случае, если в перерабатываемой в процессе моделирования информации содержатся сведения, необходимые для их формирования. Поэтому в составе информации, перерабатываемой машиной, по крайней мере, в качестве промежуточных данных, должны фигурировать:
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 193 — моменты начала и конца работы данного элемента производственного комплекса с каждым экземпляром изделий и деталей всех типов, имеющих отношение к рассматриваемому производственному процессу; — признаки, характеризующие «нормальное» и «ненормальное» исполнение каждой производственной операции; — значения, которые принимают параметры, характеризующие данное изделие или полуфабрикат, в результате выполнения каждой технологической операции; — значения, которые принимают параметры, описывающие состояние элементов производственного комплекса (станков, линий, агрегатов и т. д.), в результате выполнения каждой операции. В самом деле, все перечисленные выше результаты моделирования могут быть сформулированы, если известны моменты начала и конца производственных операций и признаки «нормальности» их исполнения. Однако оказываются необходимыми и значения параметров изделий и элементов производственного комплекса, так как они в общем случае определяют собой длительность операций и вероятности, в соответствии с которыми реализуются упомянутые признаки. Например, длительность операций обработки может зависеть от размеров или температуры полуфабриката, а вероятность появления брака — как от состояния полуфабриката/так и от степени износа инструмента. Рассмотрение данных, используемых в процессе моделирования, позволяет более определенно очертить круг математических схем, применяемых при формализации производственного процесса и его элементов. В связи с этим необходимо сделать следующие замечания. При принятых выше предположениях о структуре процесса и учитываемых факторах технологический процесс поточного производства штучных изделий оказывается случайным процессом. Случайные величины, которые представляют собой параметры, описывающие состояния процесса, можно разделить на два класса: 1) непрерывные (например, моменты начала и конца операций, перемещения изделий на конвейерах, некоторые характеристики станков и полуфабрикатов: размеры, температура и т. д.), 2) целочисленные (например, количество изделий, обработанных тем или другим станком, количество полуфабрикатов, находящихся в очереди, количество случаев выхода элементов технологического комплекса из рабочего состояния и т. д.). Практически производственный процесс рассматривается как слгучай- ный процесс с дискретным временем. С одной стороны, это объясняется удобством преобразования таких процессов при использовании численных методов анализа (с применением электронных цифровых машин). С другой, — в целях экономии времени, расходуемого на решение задачи, можно построить моделирующие алгоритмы так, чтобы в памяти машины фиксировалась информация только о некоторых особых состояниях процесса. В качестве особых состояний обычно выбираются состояния, относящиеся к таким моментам времени, когда хотя бы один из целочисленных параметров изменяет свое значение. В простейших случаях производственные процессы поточного изготовления штучных изделий можно представлять в виде марковских процессов: распределения вероятностей для параметров следующего (особого) состояния определяются значениями параметров, соответствующими данному состоянию^ и не зависят от предыдущих состояний. Некоторые производственные процессы частного вида в этом случае могут быть изучены аналитическими методами при помощи аппарата теории массового обслуживания, теории надежности и т. д. В более сложных 13 Проблемы кибернетики, вып. 9
194 Н. П. БУСЛЕНКО случаях, когда последействие процесса оказывается существенным, использование схемы марковского процесса приводит обычно к весьма громоздким соотношениям между параметрами, что увеличивает время решения задач, и к перегрузке памяти машины промежуточными результатами. В таких ситуациях, как правило, оказывается более выгодным рассматривать производственный процесс как процесс с последействием и использовать соответствующие приемы моделирования. Переходя к описанию формализованных схем для отдельных производственных операций и производственного процесса в целом, будем стремиться охватить по возможности наиболее общий случай процесса с последействием. Начнем с математического описания полуфабрикатов. Состояние и свойства полуфабриката (изделия, детали, заготовки, сборного узла и т. д.) в любой момент времени можно задавать при помощи ряда характеристик. Среди них будем различать количественные характеристики — параметры полуфабриката ап а2, ..., ап (например, габариты, вес, температура, величины, характеризующие свойства материала, и т. д.) и качественные характеристики — признаки полуфабриката гг, г2,..., гт (например: годен, негоден, проверен, прошел обработку на данном станке, смазан и т. д.). В общем случае параметры ап а9, ..., ап и признаки гх, г2, ..., гш являются случайными величинами: параметры — непрерывными, а признаки— дискретными (как правило, с возможными значениями нуль и единица). Для их исчерпывающего вероятностного описания требуется задать совместную функцию распределения. Практически некоторые параметры и признаки можно считать неслучайными, изменяющимися закономерно, а имеющими место флуктуациями пренебрегать. Тогда они окажутся фиксированными или заданными функциями времени и других характеристик. Некоторые параметры и признаки можно считать хотя и случайными, но не зависимыми от остальных. В связи с этим, а также в связи со стремлением использовать наиболее простое математическое описание полуфабрикатов при решении прикладных задач почти никогда не встречается случай задания совместной функции распределения более чем для двух-трех случайных величин. Нередко случайные величины задаются в рамках корреляционной теории, особенно когда речь идет о параметрах полуфабриката. Признаки, которые необходимо считать случайными, обычно полагают независимыми друг от др^га, и каждый из них задают вероятностью Pk, где к — номер признака. Перейдем к рассмотрению производственных операций. Под операцией обработки будем понимать такой элементарный акт производственного процесса над данным полуфабрикатом, в результате которого хотя бы один из параметров или признаков полуфабриката изменяет свое значение. В отличие от этого операция сборки предполагает участие не менее двух полуфабрикатов. Среди них удобно различать ведущий полуфабрикат (сборный узел) и ведомые полуфабрикаты (детали,присоединяемые к узлу). В результате операции сборки ведущий полуфабрикат изменяет значение хотя бы одного из своих параметров и признаков за счет присоединения к нему ведомых полуфабрикатов, а участвующие в операции ведомые полуфабрикаты прекращают существование. Операции управления сами по себе не изменяют физических параметров или признаков полуфабрикатов и непосредственного отношения к обработке и сборке не имеют. В результате операций управления вырабатывается некоторая информация, используемая для управления технологическими операциями и производственным процессом в целом, и, в конце концов, изменяются состояния и режимы работы оборудования.
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 195 Легко видеть, что любой производственный процесс поточного производства штучных изделий можно свести к последовательности конечного числа операций. Очевидно также, что такое представление процесса не является однозначным. В самом деле, исходя из вышеизложенного, мы могли бы под операцией понимать любой акт изменения значения только одного из параметров или признаков полуфабриката. Вместе с тем под операциями можно также понимать любые объединения последовательных актов такого рода. При практическом решении задач удобно производственный процесс разбивать на последовательность таких операций, чтобы каждая из них выполнялась одним из реально существующих элементов производственного комплекса. В дальнейшем такие элементы будем называть: для операций обработки — станками, для операций сборки — сборочными приспособлениями или агрегатами, для операций управления — управляющими устройствами. Рассмотрим более детально формализацию операций обработки. Заметим, что при формализации производственных операций всех видов (обработки, сборки, управления) учитываются практически одни и те же факторы и применяются одни и те же математические схемы. Существенная разница между упомянутыми операциями состоит в логической структуре тех подалгоритмов, которые используются для их моделирования. Поэтому при формализации операций обработки мы подробно остановимся на описании действия учитываемых факторов и на соответствующих математических схемах. Для других видов производственных операций будут в дальнейшем указаны лишь наиболее важные особенности. В первую очередь необходимо указать способы определения моментов начала £(н) операции. Наиболее широко распространены следующие предположения относительно начала операции. 1) Операция может начаться в произвольный момент времени, если выполнены необходимые для этого условия: станок готов к работе и к станку уже поступил очередной полуфабрикат. Пусть ^п> — момент поступления к станку очередного полуфабриката, £<к) — момент окончания операции над предыдущим полуфабрикатом, т(г> — время на подготовку станка и инструмента к работе. Тогда j №\ если *<K> + T<r><*<n>f *Н =1 *(к) + т<г>, если *(к> + т(г> >*(*). ^ 2) Операция может начинаться только в моменты времени, отстоящие друг от друга на величину т(Т> длительности такта. Пусть ^ — некоторый момент, являющийся началом отсчета времени. Если совместно выполняются неравенства tQ + k%m < Tx<t0 + (к +1)т(т>; А = 0, 1, 2, ..., • (2) T2<tQ + (k + l)xW, где под 7\ и Т2 понимаются № или № + %№, взятые в любом ^порядке, то *(н) = 'о + (й+1)т(Т). (3) Момент tfjp поступления очередного i-ro полуфабриката к /-му станку может быть в ряде случаев строго детерминированной величиной, определяемой закономерностями синхронизации отдельных операций производственного процесса. Часто приходится считаться со случайными колебаниями величин t№. Эти колебания могут быть учтены двумя путями. Первый из них основан на введении случайных приращений &<п) величин t§\ имеющих заданные законы распределения. Второй 13*
196 Н. П. БУСЛЕНКО ± путь состоит в представлении величин fW в виде случайных потоков однородных событий в смысле теории массового обслуживания (см. [2], [3]). Подходящие для этой цели математические схемы рассматриваются в [3]. При выборе того или другого пути учета случайности величин f№ необходимо принимать во внимание следующее обстоятельство. Поток однородных событий является весьма удобной и сравнительно легко реализуемой схемой представления величин № для случая, когда разности A*№ = *(n) ._*(п) (4) для всех значений индекса удовлетворяют условию Д*№>0, т. е. когда очередность следования полуфабрикатов не нарушается при переходе их от одного станка ^ другому, или это обстоятельство оказывается практически несущественным. В противном случае (что часто имеет место в действительности) использование потоков однородных событий затрудняется и оказывается более удобным вести учет случайности моментов прохождения полуфабрикатов через отдельные станки при помощи приращений bt^K Время подготовки станка и инструмента к работе после окончания операции т(г> обычно считается случайной величиной с заданным законом распределения (часто используется показательный закон /(Z) = Xe~kz). Длительность такта т<т), как правило, предполагается фиксированной. Если необходим учет случайных колебаний величины т(Т>, можно для этой цели использовать случайные приращения 6т(Т) с заданным законом распределения. Момент окончания операции № может быть определен в соответствии с соотношением £<к> = № -\- т<оп), где т<оп) — длительность операции. О величине т<оп) речь будет идти ниже. При идеальной синхронизации производственного процесса каждый раз выполнялось бы равенство *<n) = *(K) + T(D# # (5) Однако на практике это равенство не выполняется, в связи с чем имеют место случаи ожидания полуфабрикатов у занятых станков и даже образования очереди полуфабрикатов, а также случаи простоя станков из-за отсутствия полуфабрикатов. Необходимо обратить внимание на следствия, к которым упомянутые явления могут привести. Пусть поступающий очередной полуфабрикат застает станок занятым. В этом случае наиболее часто используются следующие предположения о дальнейшем течении производственного процесса. 1) Полуфабрикат ожидает начала операции, а нормальное течение производственного процесса при этом не нарушается. 2) Происходит срыв производственного процесса. Могут быть случаи, когда обрабатываемый или поступающий полуфабрикаты, или оба вместе, исключаются из производственного процесса (уходят в брак) с вероятностями, соответственно равными Plf P2 или Р12. В частных случаях эти вероятности могут быть равными единице. 3) Полуфабрикат ожидает начала операции в течение интервала времени т(ж>. Если то производственный процесс протекает нормально. В противном случае в момент времени г<п)4-т(ж) полуфабрикат исключается из производственного процесса (например, из-за падения температуры полуфабриката
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 197 ниже установленного предела при длительном ожидании). При этом могут быть сделаны различные предположения относительно судьбы исключенного полуфабриката: а) уходит в брак; б) возвращается на обработку в момент начала простоя соответствующего станка; в) дорабатывается вручную или каким-нибудь другим способом, и т. д. Величина т(ж> считается либо фиксированной, либо случайной с заданным1 законом распределения. Рассмотрим теперь ситуации, связанные с образованием очереди полуфабрикатов. При этом, как правило, используется следующая1 формализация. Если количество п полуфабрикатов в очереди меньше' некоторого (заранее заданного) п*, производственный процесс протекает нормально. При п = п* вырабатывается признак «прекратить подачу полуфабрикатов». В некоторых случаях это не сказывается на нормальном течении производственного процесса (например, если полуфабрикаты поступают из склада), в других случаях — приводит к срыву работы отдельных станков или всего процесса в целом. Следствием прекращения подачи полуфабрикатов оказывается то обстоятельство, что через некоторое время п будет равно заданному п** < п*. Это служит основанием для выработки признака «возобновить подачу полуфабрикатов». Для многих конкретных процессов могут быть- использованы частные случаи описанной схемы. Несомненно, встречаются и такие процессы, для которых требуется построение принципиально отличной формализации. На других возможных схемах течения' процесса в случае образования очереди полуфабрикатов мы останавливаться не будем. Пусть теперь имеет место такое положение, что в момент £<г) готовности станка к работе очередной полуфабрикат отсутствует, т. е. *(п> > f(r)f (7) г(г) = г(к) + т(г)# (8); При этом используется обычно одно из следующих предположений. 1) Станок не работает до момента #п). Нормальное течение производственного процесса не нарушается. 2) Станок работает вхолостую. Нормальное течение процесса не нарушается. В отличие от предыдущего предположения учитывается время работы станка, которое необходимо для оценки износа или разладки оборудования. Перейдем к рассмотрению схем, связанных с учетом надежности элементов производственного комплекса, в частности станков. Встречающиеся на практике случаи отказов удобно разбить на два типа: 1) отказы, характеризующиеся возможностью сравнительно быстрого ввода станка в строй (допустим, путем замены инструмента или другой детали), и 2) отказы, связанные с более длительным ремонтом станка. Моменты наступления отказов, /(от)__в случае быстрого ввода оборудования в строй и /(от) — для длительного ремонта, считаются случайными величинами, которые задаются вероятностями безотказной работы P[t] и Р [t] соответственно как функциями времени, протекающего с момента окончания последней наладки станка. В отношении взаимосвязи между отказами того или другого рода было использовано следующее предположение. Если в момент £(°т) произошел отказ первого рода, то вероятность ~P[t] не изменяется. Когда же в момент времени £(°т> происходит отказ второго рода, производится переоценка вероятностей P[t] и ~P[t]: определяется время ремонта'
198 Н. П. БУСЛЕНКО т<р) оборудования и момент ввода его в строй ^от) + т(р>; вероятности Р[№ТЦ и P[£(°T)J пересчитываются таким образом, чтобы моментом последней наладки являлся момент времени £(0T) + т<р>. Интервалы времени, потребные для ремонта: т(р) —в случае отказа цервого рода и т<р> — в случае отказа второго рода — предполагаются независимыми случайными величинами с заданными (для каждого типа отказов) законами распределения. В зависимости от типа отказа судьба полуфабриката, при обработке которого случился отказ, может оказаться следующей: 1) обработка полуфабриката будет продолжена после ввода станка в строй; 2) обработка полуфабриката после ввода станка в строй должна начаться сначала; 3) полуфабрикат уходит в брак. Рассмотрим один из возможных вариантов учета постепенной разладки технологического процесса (например, износа инструмента и др.). Постепенная разладка технологического процесса ухудшает с течением времени качество обработки полуфабрикатов и уменьшает производительность станков. Конкретными следствиями разладки процесса могут служить: увеличение доли брака, увеличение рассеивания параметров изделия (например, размеров), увеличение продолжительности операции и т. д. Для того чтобы формализованные схемы процессов достаточно точно отражали реальные явления, необходимо показатели, характеризующие качество продукции и производительность процесса, рассматривать как случайные функции времени, отсчитываемого от момента очередной наладки процесса. Несколько более подробные сведения об этих случайных функциях и способах их задания будут рассмотрены ниже. Для предотвращения существенного влияния разладки процесса время от времени проводится его наладка. Наладочные работы начинаются либо по истечении фиксированного заранее выбранного времени работы, либо в зависимости от результатов текущего предупредительного контроля производства. Пусть, например, контролируются размеры изделия. Обозначим текущее значение контролируемого размера хь. Изделия считаются годными, если xi не выходит за некоторые фиксированные пределы: а < х% < Ъ. (9) В заводской практике часто наладку производственного процесса считают целесообразным проводить еще до того, как неравенства (9) начинают нарушаться с частотой, существенно отличающейся от нуля. Показателями целесообразности наладки могут служить: выход среднего значения размера изделия х = — ^ х% за пределы некоторого интервала, лежащего внутри интервала (а, Ъ)\ существенный рост дисперсии размера S2 = — 2j (xt — х)2 или ег0 размаха xmax — хт\п и т. д. Важнейшей характеристикой производственного процесса является длительность т(оп> выполнения операции. Будем пользоваться одним из двух основных предположений о величина т(оп>: либо длительность той и другой операции считается фиксированной (такое предположение хорошо соответствует сути дела в тех случаях, когда данный станок имеет жесткий такт работы, а случайные колебания оказываются несущественными), либо она считается случайной. Во втором случае, как правило, принимается, что вероятностные характеристики этой случайной величины зависят от параметров и признаков полуфабриката (например, длительность обработки металлов резанием зависит от размеров полуфабриката, а горячей штамповки — от температуры и т. д.), а также от состояния станка
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 199 и инструмента (например, от времени, прошедшего с момента смены инструмента). Во многих случаях при обработке деталей можно принять следующую формализацию. Пусть случайная величина т(оп> достаточно хорошо описывается средним значением ЛПт<0П>] (норма времени) и дисперсией /)[т(оп)]. Обычно М[т(°пЦ зависит в основном от свойств полуфабриката (размеров, температуры, характеристики материала и т. д.), а /)[т(°п)] определяется главным образом состоянием станков и инструмента (например, временем, прошедшим с момента наладки оборудования). Рассмотрим методику математического описания закономерностей, связанных с появлением брака при выполнении операции. Основной характеристикой здесь является вероятность брака р^\ задаваемая для каждой операции. Обычно предполагается, что вероятность брака зависит от параметров и признаков полуфабриката, а также от состояния станка и инструмента (времени, прошедшего с момента наладки). При обычном, не очень детальном описании производственного процесса можно ограничиться указанием зависимости вероятностных характеристик величины р(бр) только от параметров, характеризующих состояние станков и инструмента. Иногда целесообразно рассматривать брак как следствие выхода некоторых параметров изделия за заданные пределы. В этом случае необходимо учитывать зависимость вероятностных характеристик параметров изделия от факторов, влияющих на вероятность появления брака. Выше было отмечено, что в результате операции обработки изменяются параметры и признаки изделия. Параметры изделия после операции (или отклонения их от нормы) необходимо считать случайными величинами. Представляется достаточным учитывать зависимость вероятностных характеристик параметров и признаков изделия от состояния станка и инструмента (времени, прошедшего с момента наладки), длительности операции, а иногда и от значений параметров и признаков полуфабриката перед операцией. Необходимо также фиксировать изменение свойств станка и инструмента после каждой операции. Степень износа (разладки) зависит от длительности операции (или номера операции, если ее длительность фиксирована) и от параметров и признаков обработанного полуфабриката. На этом мы закончим изложение принципов формализации операций обработки полуфабрикатов. Перейдем к рассмотрению особенностей, которые характерны для операций сборки и управления. Начнем с операции сборки. Относительно начала операции сборки могут быть сделаны различные предположения. Обратимся сначала к предположениям, аналогичным тем, которые рассматривались в связи с операцией обработки. Предположим, что в сборке участвуют сборный узел и m деталей. Пусть ^п) — момент поступления на сборку узла, а №*\ tS$, •••»^JJl) — моменты поступления деталей. Если операция сборки начинается в момент готовности всей совокупности элементов, то по аналогии с (1) *(«> = max {tf\ *(п>, *{п>э .. ., *(.п), *(к) + Т(г)}. (10) Могут быть сделаны и более сложные предположения, например, различные элементы операции сборки начинаются по мере поступления соответствующих деталей или по мере готовности агрегатов, выполняющих эти элементы. В таком случае удобно операцию сборки расчленить условно на несколько отдельных операций. Если операция сборки может начаться только в момент начала такта сборочного агрегата, то по аналогии с соотношениями (2) и (3)
200 Н. П. БУСЛЕНКО можем записать '(н) = *о + (А+1)т(т>, если выполнены условия Г1<*о + (*+1)*(Т). T2<t0 + (k + l)TV), (И) Tm^<t0 + (k+l)xmy t0 + krm<Tm^<t0+(k + l)x^\ где под Т19 Т2, ..., Гте+1, Гт+2 понимаются tf), *<у>, *(Ю + т(г>, взятые в любом порядке. Особенностью формализации операции сборки является неравноправность сборного узла и деталей, поступающих на сборку. Например, в случае простоев или отказов оборудования судьба узла должна быть описана достаточно детально, в то время как в отношении судьбы деталей такой необходимости нет. При формализации операцию сборки удобно представлять в виде последовательных этапов, которые можно условно назвать установкой деталей на узле, креплением деталей и регулировкой узла. Время установки т(.у) обычно считают случайной величиной с заданным законом распределения. Иногда т|у> полагают т^у) = тах {т(.у>}, где r{V — случайное время установки /-й детали. Время крепления т(.кр> часто можно считать фиксированным, а время регулировки т(Рег) —случайным. Факторы, связанные с образованием очередей деталей, учетом надежности и наладки оборудования, образованием брака, могут быть включены в формализованную схему такими же путями, как это делается применительно к операции обработки. Относительно учета брака иногда целесообразно иметь в виду следующую особенность. Если среди деталей, поступающих на сборку, появляются бракованные, они отбрасываются. В связи с этим может произойти задержка начала сборки до момента поступления качественной детали. Заметим, что в условиях принятой формализации параметры и признаки изделий (аг, а2, ..., ак, г1У г2, ...,гт) играют менее существенную роль в операции сборки, чем в операции обработки, где они определяют значения ряда основных характеристик процесса. Другие особенности операций сборки не являются принципиальными и относятся главным образом к учету того обстоятельства, что в сборке участвует несколько полуфабрикатов. В результате операций управления вырабатывается информация, необходимая для согласованной работы отдельных элементов производственного комплекса. Типичными примерами операций управлений могут служить: операции регулирования основных параметров производственного процесса (например, скоростей работы станков и агрегатов, усилий,, температур и т. д.); операции распределения полуфабрикатов между параллельно работающими станками или линиями; операции выработки признаков прекращения или возобновления подачи полуфабрикатов в зависимости от длины очереди перед тем или другим станком; операции контроля качества выполнения производственных операций (выработка признаков, определяющих необходимость замены инструмента или переналадки оборудования) и т. д. При формализации операций управления должны быть записаны операторы или алгоритмы, которые точно или приближенно воспроизводят
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 201 ту переработку информации, которая свойственна реальным операциям управления. Кроме того, должны быть указаны исходные данные, которые необходимы для работы операторов и алгоритмов. Результатами, полученными при выполнении операций управления, являются либо команды исполнительным устройствам, изменяющим параметры производственного процесса, либо фиктивные признаки, сообщаемые станкам и агрегатам, которые фигурируют в соответствующих логических условиях, регламентирующих течение процесса. При моделировании операций управления иногда приходится считаться с тем обстоятельством^ что регулирующие устройства работают с ошибками, имеющими случайный характер. Поэтому значевдаяинараметров процесса всегда будут несколько отличаться от тех, которые вырабатываются в результате операций управления. Для математического описания ошибок необходимо задавать соответствующие законы распределения или, чаще, корреляционные характеристики. ^ На этом мы закончимкраткое рассмотрение принципов формализации производственных процессов. Изложенные здесь схемы были использованы для построения математических моделей различных производственных процессов, связанных с потовым изготовлением штучных изделий. § 3. Структура моделирующего алгоритма При построении алгоритмов, предназначенных для моделирования на электронных цифровых машинах производственных процессов поточного изготовления штучных изделий, наиболее существенными вопросами являются разработка логической структуры моделирующих алгоритмов и формирование реализаций случайных величин и функций, имитирующих влияние случайных факторов на течение процесса. Мы остановимся здесь на типичных случаях моделирования основных производственных операций, уделяя главное внимание структуре моделирующих алгоритмов. Способы формирования на электронных цифровых машинах реализаций случайных процессов рассматриваются в [3] и др. Начнем с операции обработки полуфабрикатов. Естественно, что структура алгоритма, моделирующего операцию обработки, зависит от выбранной формализованной схемы операции. Поэтому мы примем за основу достаточно общий случай операции обработки, охватывающий основные факторы, учитываемые при моделировании. Рассмотрев структуру моделирующего алгоритма для этого случая, мы остановимся на особенностях, возникающих в связи с другими распространенными схемами формализации. Будем изучать следующую формализованную схему операции обработки изделий. Изделие (полуфабрикат) с номером i поступает к станку в момент времени tW и характеризуется параметрами ^ и ^. Если станок свободен, он приступает к обработке изделия в момент времени №\ В противном случае изделие поступает в очередь и ожидает освобождения станка. Время ожидания не ограничено. Когда число т изделий в очереди достигает величины т*, подача изделий к станку прекращается. Возобновление подачи изделий производится по признаку т < т**. Номинальная длительность т(.оп) i-й операции является случайной величиной, вероятностные характеристики которой зависят от параметров^ изделия а и г, а также от интервала времени, прошедшего с момента последней наладки станка до начала обработки i-ro изделия. В процессе работы станок может выходить из строя. Различаются два типа
202 Н. П. БУСЛЕНКО отказов. Вероятность безотказной работы для первого типа ^[^j], для второго—Р[Т2]. В случае отказа первого типа ремонт производится за время т^), время наступления отказа второго типа при этом не изменяется. Когда происходит отказ второго типа, время ремонта равно т^>, и при этом моменты отказов обоих типов определяются заново. Если отказ станка произошел в период обработки i-ro изделия, то после ремонта обработка его продолжается с временем доработки т<д). Периодическая наладка станка производится тогда, когда суммарное время работы станка 2 т(г°п) достигает заданного значения Т. Время наладки т(н> — случайное, с заданным законом распределения. В результате выполнения операции изделие может оказаться годным или бракованным. Брак наступает с вероятностью р{б&, которая является функцией параметров изделия а, г и времени, прошедшего с момента последней наладки станка. Если i-e изделие оказалось бракованным, производится подналадка станка за время т<р>, и время очередного сбоя первого рода пересчиты- вается заново. По известным ^н) и времени занятости станка т(3) (с учетом т(.°") и возможного ремонта, наладки или доработки) определяется момент конца операции £(.к) = г(.н> + т(.3). Аналогично определяется момент готовности станка к обработке нового изделия tW{ = г(.к)-)-т(г>, где т<г> — случайная величина с заданным законом распределения, имеющая смысл времени подготовки станка к операции. Параметры изделия после операции будем обозначать а и г. Когда текущее время t от начала процесса достигает значения 7\ обработка следующего изделия не производится. Результаты моделирования обрабатываются и выдаются на печать. Для построения моделирующих алгоритмов используем ряд операторов. Будем рассматривать следующие классы операторов: Ai — вычислительные операторы, Ф| — операторы, связанные с формированием реализаций случайных процессов; Ki — операторы, обеспечивающие подсчет количества полуфабрикатов, обладающих заданными свойствами; Pt и pi —логические операторы. Передача управления изображается следующим образом. Вверху справа от знака оператора (любого, кроме логического) ставится номер оператора, которому передается управление. В случае логического оператора вверху и внизу справа от знака оператора ставятся стрелки; справа от верхней стрелки ставится номер оператора, которому передается управление, если проверяемое условие выполнено, а справа от нижней стрелки — номер оператора, которому передается управление, если условие не выполнено. Например, Р22419 означает, что управление от Р22 передается оператору № 16, если условие, проверяемое оператором Р22, выполнено, и оператору № 19, если оно не выполнено. Передачу управления данному оператору будем изображать числами, обозначающими номер оператора, от которого передается управление, поставленными вверху перед знаком данного оператора. Например, 12>21К2б означает, что оператору К2в управление передается от операторов №№ 12 и 21. Обозначение передачи управления оператору, непосредственно следующему за данным, опускается. Передача управления данному оператору от предыдущего изображается лишь в том случае, когда данному оператору передается управление от нескольких операторов.
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 203 Для изображения логической схемы алгоритма, моделирующего операцию обработки рассматриваемого вида, нам потребуются следующие операторы: Фх — формирование очередного значения #г>; р2 —проверка условия £(.п> < ^г); р3 —проверка условий т > 1; К4 —прибавление единицы к количеству изделий в очереди (тЧ-1); А5 —запись величин ^п> в специально отведенные ячейки памяти; Аб — переход к обработке очередного изделия (нахождение тт{Йп>}); Ф- — формирование величины ^н>; р8 —проверка условия t'f) < Г; Р9 —подалгоритм моделирования процесса выполнения самой операции обработки изделия (в данном алгоритме оператор Р9 имеет смысл проверки годности изделия после обработки); К10 —подсчет количества обработанных (годных) изделий; Ки — подсчет количества бракованных изделий; Ф12 —формирование величины £(г); К13 — вычитание единицы из количества изделий в очереди (т — 1); р14 — проверка условия (3 > 0; (3 = 0 означает, что подача изделий прекращена, (3 = 1— что подача изделий производится; р16 —проверка условия т < т**; А1в — формирование признака (3 = 1; Р17 — проверка условия т < т*; A1S — формирование признака (3 = 0; Aj,,-—обработка и выдача результатов моделирования; Я — окончание вычислений. Обозначения операторов, имеющих один и тот же смысл, но используемых в разных местах схемы, отличаются только значением дополнительного индекса, например, Кь Кьа и К4б- Операторная схема алгоритма, моделирующего операцию обработки изделий, для принятой выше формализации может быть представлена следующим образом: 14.1б,17ф1. р|4б. рз^. Kt. д5. 8,ММ8Ав. ф7. pt9. Al9; Я; P9j.11; Кю; Klt; • Ф12; Kt3; pj|; р15{6; А16; 2К4б; А5б; р{ь А?8. (12) Оператор Р9 представляет собой подалгоритм моделирования процесса выполнения самой операции обработки изделия. Для его расшифровки введем дополнительно следующие операторы: Ф20 — определение Т|0П) и 4К); Ф21 — формирование ближайшего значения гс и признака со: в соответ ствии с Р[7\] и Р[Т2] определяются T{fT) и Т{Г\ а затем *(c6) = min{7fT), Т(20Т)}; если Г(Г} < 7fT), co=l, в противном случае со = 0; р22 — проверка условия £(сб) < ^к); А23 — подсчет ^ т(г°п) — рабочего времени станка; р24 —проверка условия ^Ti <jT; ^25"" формирование т(Г) в соответствии с заданньш законом распределения; А^ —определение £(г) момента готовности станка с учетом времени наладки, если таковая имела место; А27—определение вероятности сбоя р(сб>;
204 Н. П. БУСЛЕНКО pffl —проверка условия £ < р(сб\ где £ —случайное число с равномерным распределением в интервале (0, 1); в случае выполнения условия £ < р<сб> обрабатываемое изделие оказывается бракованным; Ф29 —выбор значений параметров изделия at и г^ после обработки; рзв — проверка условия со > 0; 4£ \m+7;feovepeck/A 56 уктпам/т/ае t[nJ | I \77epem7/ro6pad |__ **Лоудвва¥. изделия» ■ —^_p— 7 (нем/еапф*^ g \i№ офа- * рошг/1/з- j 72 ■'U! , ~i—; /s\ /77-; j 79 эр1Ы7Х77пз1/шдма\ 77 \впфше деталей \ Рис. 1. Блок-схема алгоритма, моделирующего^операдию обработки изделий. Ф31 — определение новых значений Г(1Сб) и tiP) и начала отсчета времени t\°} для сбоя первого типа; А32 —сравнение Т^ с новым значением Т[сб\ нахождение min{r(ic6), T$ } и признака со в соответствии с правилом, описанным при определении оператора Ф21; Ф33 — определение новых значений Т^\ 40) и т(2Р); Ф34 — определение времени доработки т<д> изделия после ремонта станка и нового значения t •(к). А85 - определение новых значений 7f6), Г(2сб), min {T(j*\ г£сб)}, *(i0) и о> после очередной наладки станка;
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 205 Ф3в — определение времени т(н), затрачиваемого на наладку станка, и момента £(к) окончания наладки; Ф37 —определение т<р> для случая получения брака; Ф38 — определение Т{{6\ min{7(ic6), r(2c6)}, t{0) и со после подладки станка; (г) A9<J — определение нового значения г' с учетом подналадки станка. от олератора /Vs д 20 \ «"^h pgjgffi а оператору №70 (подсчет калместеа /г олерал/ору №7/ (лодсчет каличестеа офодотамыхч/здем/ф фюхаваммыхизделий/ Рис. 2. Блок-схема подалгоритма «выполнение операции обработки изделия» (оператор № 9 в блок-схеме алгоритма, моделирующего операцию обработки (рис. 1)). Теперь операторную схему подалгоритма Р9 можно представить в виде 8Ф20; Ф2г, рЦ°; 22*34А2з; р24|35; Ф25; 25'36А26; А27; рут. Ф*°; 22г1 • <Ъ ь 31,33д34. 30^32. 32^23. • 24 д . m26. 28m . д . дП Моч Р30|33» ФзЬ А32, Ф33.1 Ф34, А35, Фзб, 4>31i А38; А39.(1о) Для наглядности на рис. 1 показана блок-схема алгоритма, соответствующая (12), а на рис. 2 — соответствующая (13).
206 Н. П. БУСЛЕНКО Очевидно, что если в (12) вместо оператора Р9 подставить (13),. получим: 14.1в,17ф1. р£4б; рз^; Ki. As. 3,5.15,18^. ф?; р^20. Ai9. д. 8Ф2о; Фгг, рУ°; 22,34а23; р24135; Ф25; 25>36А26; а27, P|f; гЪ10. 22« . m . 31, 33 а 34. 30^.32. 32^23. 24 А . ^.26. Ф29; г Р30|зз' ф31» А32? Фзз; Фз4; А35; Фзе, 28Ф37; А38; Aji; 29Klo2; 39КИ; 10'ИФ12; К13; РЦ; р15|6; а}6; 2К4б; А5б; ptf; A?8. (14) Рассмотрим теперь некоторые модификации формализованной схемы. Ранее мы предполагали, что в момент Т работа станка прекращается, т. е. изделие, имеющее t\H)r> T', на обработку не принимается. Теперь используем другое предположение: в момент Т (т. е. при ^п) > Т) прекращается подача полуфабрикатов, а все поступившие к станку изделия обрабатываются. Для того чтобы представить операторную схему алгоритма, соответствующую такому предположению, введем дополнительно операторы: р40 — проверка условия *jn) < Г; А41 —формирование признака / = 0; р42—проверка условия / > 0; р43 — проверка условия m > 0. Операторная схема рассматриваемого алгоритма имеет вид "•"•"Фи P40I41*. р146; Рз,6; к*; а6; «.мм».*..**^. Ф7; Рош; К!2; вКи;10и1Ф12; К13; рЦ*; рЦб; 43'43бФ19; Я; *2р|«; Pi6;e? ф!е; 40a«i; рЦ119; 2Ф4б; Ф5б; рЦ; ofe, (15> где Р9 представляется, как и прежде, в виде (13). Блок-схема алгоритма (15) приводится на рис. 3. Перейдем к следующей модификации основной схемы (12) операции обработки. Пусть изделие, поступающее к станку, ожидает готовности станка к началу обработки не более чем т(ж> сек. По истечении времени т(ж> изделие на обработку не поступает (например, из-за падения температуры ниже допускаемого предела) и остается необработанным. Для построения соответствующего моделирующего алгоритма нам потребуются дополнительно следующие операторы: А44 — формирование максимального значения времени ожидания изделия в очереди А^0 = max {*(г) — ^п)}; г р45 —проверка условия Atio < т<ж>; К4в — подсчет количества необработанных изделий по причине ДЦ > т(ж)- Логическая схема алгоритма, моделирующего операцию обработки при этих предположениях, может быть представлена в виде 8в,1*.1в.17ф1; р,4б. р^; К4. Аб. *«.6.»8а44; pie; К4в; Ki36; Pi«*t; 3'15'45А6; Ф7; pj»; Ф19; Я; 8P911i; Kl§; 9КИ; 10'1!Ф|2; к.з; рП; p15J6; ф!6; 2к4б; А5б; Pj<; Att (16) Аналогично могут быть построены схемы алгоритмов, моделирующих операцию обработки изделий и при других предположениях о характере процесса.
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 207 Перейдем к рассмотрению операций сборки изделий. Многие факторы, такие как следствия образования очереди полуфабрикатов, надежность и наладка оборудования, образование брака и т. д., включаются в моделирующие алгоритмы вполне аналогично случаю операции обработки. лримахаj9=0 437$ (ру\ признанаj9=7 ^апамшате tf//7J \ \/7epeztK?/fофа7к7г\ xeove/xok аздеяаЛ 7 \ &?/ш/7от/ае //Н——*' 73 I /77-7 Рис. 3. Блок-схема алгоритма, моделирующего операцию обработки полуфабрикатов. Для того чтобы проиллюстрировать особенности построения моделирующего алгоритма, рассмотрим процесс сборки изделий достаточно общего вида. Предположим, что выпускаемое, в результате данного производственного процесса изделие собирается на конвейере. На сборку поступает ведущая деталь (.основа сборного узла) — деталь № 1 и ведомые детали №Л!г 2, 3, ..., /, присоединяемые к сборному узлу. Обозначим через t{i момент начала /-й сборочной операции над /-м узлом. Тогда t}. представляет собой момент подачи конвейером /-й ведущей детали к месту производства первой сборочной операции. Очевидно,
208 Н. П. БУСЛЕНКО что tLj одновременно является (для жесткого конвейера) моментом подачи (/—1)-го изделия к месту выполнения второй сборочной операции, а (/— 2)-го изделия к месту выполнения третьей операции и т. д. Поэтому величину tij можно представить в виде где ft = / + (/-l)Z + i-l. (17) Величины t1} будем считать случайными величинами, вероятностные характеристики которых определяются режимом производственного процесса. Для описания схемы алгоритма, моделирующего работу конвейера, введем операторы: p0i —подалгоритм, моделирующий i-ю операцию сборки (подробно рассматривается ниже); Ки — счетчик количества изделий, над которыми успешно произведена i-я операция сборки; K2i — счетчик количества срывов £-й операции сборки. Кроме того, рассмотрим операторы: Ф47 —формирование величин txi\ А48 — запоминание значений txi; р49 —проверка условия *1;. < Т; р50 —проверка условия i < /; К51 — прибавление единицы к номеру ведущей детали /; К52 — прибавление единицы к номеру операции i; А53 — формирование i = 1; А54 — формирование i = /. Схему алгоритма для моделирования работы конвейера можно представить в виде 52'54Ф47; А48; pJ50; А19; Я; «рД»; Км; А53; 50'53P0i|2i; Ku; К& 0tK2i; аЦ- (18) Перейдем к рассмотрению моделирования i-й сборочной операции. Для определенности примем следующую формализацию. В момент tif начинается проверка качества очередной детали 1-го вида. Проверка имеет продолжительность t(i"p). С вероятностью р(бР> деталь может оказаться бракованной. В этом случае она отбра ывается и заменяется новой. Если деталь оказывается годной, можно приступить к операции сборки. Продолжительность сборки t(i/6). Если к моменту /*; операция сборки не закончена, происходит срыв процесса и /-й сборный узел в дальнейшем не рассматривается. Для удобства будем рассматривать не только операцию сборки как таковую, но и связь ее с соответствующей операцией обработки ведомой детали. Вспомним схему (12) алгоритма, моделирующего операцию обработки. Представим ее, для краткости, в следующем виде: Ai; Ф7; pj4»; A„; 8А19, (19) где Ат задается выражением 14,16,17-v ,6 . TJ* . А . 3,5,15,18д /ОГ\\ Фь Р£, Р3|6; н4, А5, А6, (А)) а Ап может быть представлен в виде 8Р91и; К|§; 9КИ; 10-иФ12; К13; P|J; РЩ6; Al6; 2К4б; А5б; р}'; А?8. (21)
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННЫХ ПРОЦЕССОВ НА ЭЦМ 209 Введем операторы: А55 — определение значений ti-\ Абв — формирование v = 1; р57 — проверка условия п% > 0 (^—количество деталей i-ro вида, имеющихся в наличии у сборочного конвейера); р58 — проверка условия v > 0; К59 — вычитание щ — 1; Ф6[) —формирование Т|?р); К61 - прибавление единицы к количеству проверок г ведомых деталей при выполнении сборочной операции; Ф62 - формирование продолжительности операции сборки т({/б); А63 — формирование момента окончания операции сборки tty; рб4 —проверка условия 4у) < tfj\ Ф65 — формирование параметров сборного узла после i-й операции; р66 —проверка условия $р < t*j\ К67 —сложение nt-\-vf где v принимает значения: единица (если после обработки получили годную деталь) и нуль (если после обработки получили брак); А68 -- формирование v = 0. При этих предположениях схема алгоритма, моделирующего операцию сборки и увязку ее с обработкой ведомой детали (p0i), имеет вид 50,53A5ft; A56; 56,ei.68p57ii; p58i2.; к59; Ф60; р28;62; кЦ 28Ф62; Аез; P64i2i; Фбг5; "••%; Ф7; р^г; а& 6gaii; kJ7. (22) На практике обычно приходится иметь дело с более сложными формализованными схемами производственных процессов, а значит, и с более громоздкими моделирующими алгоритмами. Однако представляется, что сказанного достаточно для того, чтобы понять структуру моделирующих алгоритмов для типичных производственных процессов поточного изготовления штучных изделий. Остановимся кратко на обработке результатов моделирования. В общем случае нестационарного производственного процесса для определения средних значений искомых параметров, например среднего количества R(t0, t) выпущенных изделий за интервал времени (£0, £0-М), необходимо использовать результаты моделирования множества реализаций процесса. Разбивая интервал (£0, £0 + 0 на подынтервалы и определяя среднее по множеству R(t0> t) для каждого подынтервала, можно построить R как функцию t0 и t. На практике часто производственные процессы можно считать (для интервалов времени, достаточно удаленных от начала процесса) стационарными эргодическими случайными процессами. В этих случаях можно ограничиться моделированием одной, достаточно продолжительной реализации и оценивать искомые параметры как средние по времени. Например, для стационарного процесса R(t0, t) = R(t) = rt, (23) где г —среднее количество выпущенных изделий за единицу времени. Величина г может быть приближенно определена следующим образом. Пусть производственный процесс продолжался Т единиц времени и за этот период выпущено Кт изделий. Тогда г*Щ-. (24) 14 Проблемы кибернетики, вып. 9
210 Н. П. БУСЛЕНКО Аналогично могут быть получены оценки и для других параметров технологического процесса. Рассматриваемая^в^настоящей статье методика моделирования производственных процессов использовалась для решения практических задач. Один из такого рода примеров излагается в следующей статье настоящего выпуска. Автор пользуется возможностью выразить признательность А. А. Ляпунову и Л. А. Люстернику за оказанную помощь и поддержку данного направления работы. ЛИТЕРАТУРА [1] Ляпунов А. А., О логических схемах программ, Сб. «Проблемы кибернетики», вып. 1, Физматгиз, 1958. [2] X и н ч и н А. Я., Математические методы теории массового обслуживания, Труды МИАН СССР, т. 49, 1955. [3] Б у с л е н к о Н. П., Шрейдер Ю. А., Метод статистических испытании (Монте-Карло) и его реализация на электронных цифровых машинах, Физматгиз, 1961. (4] Б у с л е н к о Н. П., Моделирование производственных процессов на электронных цифровых машинах,] ДАН 144, №5 (1003—1006), 1962. Поступило в редакцию 3 V 1961.
МОДЕЛИРОВАНИЕ ПРОИЗВОДСТВЕННОГО ПРОЦЕССА АВТОМАТИЗИРОВАННОГО СТАНА ПЕЧНОЙ СВАРКИ ТРУБ Г. А. АЛИЕВ, Н. //, БУСЛЕНЯО, Г. П. КЛИМОВ, А. И. ПАЗАРЕНКО (МОСКВА) § 1. Формализация процесса*) В настоящей статье рассматривается моделирование технологического процесса одного из типов автоматизированного стана печной сварки труб. Автоматизированный стан печной сварки труб представляет комплекс оборудования, выполняющего последовательность операций по массовому изготовлению водогазопроводныхтруб методом печной сварки. Заготовкой служит штрипс (горячекатаный стальной лист) в рулонах, готовой продукцией являются порезанные на мерные длины трубы определенного товарного вида — с подрезанными торцами, с резьбой на одном конце и навернутой муфтой на другом, промасленные и упакованные. Технологический процесс (рис. 1) имеет поточный характер, т. е. операции выполняются в строгой последовательности и каждый из видов оборудования выполняет по одной операции. По характеру потока весь агрегат делится на три участка. Первый из них — участок подготовки штрипса — образует один поток, работающий прерывисто. Каждый из поступающих рулонов проходит следующие основные операции: разматывание, правку, обрезку переднего и заднего концов, сварку переднего конца с задним концом предыдущего рулона, сварку заднего конца с передним концом следующего рулона, снятие грата (нароста, образующегося вдоль сварочного шва) и нагон петли. Последняя операция является характерной особенностью данного участка и необходима для создания запаса штрипса в связи с тем, что операции на следующем участке производятся при постоянной скорости штрипса, а на данном — требуют его остановки. Второй — горячий участок — образует один поток, работает непрерывно, без остановок, с постоянной скоростью. Над бесконечным штрип- сом (трубой) на этом участке производятся следующие основные операции: нагрев, обдув кромок от окалины, формовка и сварка штрипса в трубу (в формовочно-сварочном стане), редуцирование до получения нужного диаметра и толщины стенки (в редукционном стане), калибровка до получения точной формы и размеров (в калибровочном стане), порезка бесконечной трубы на мерные длины и сбрасывание труб на холодильник (формирование поперечного потока). С холодильника трубы поступают поштучно на делительное устройство. *) ii выполнении работы по формализации рассматриваемого производственного процесса, помимо авторов, принимали участие также сотрудники Электростальского завода тяжелого машииостроения Н. А. Полякова, Р. Т. Дацкевич и Л. А. Гайдабука. 14*
/ 1 i? 1 м^ * J i i \ ^ i 3 ^ ii / { 1 ^& i 1 *> ^ ^ Ъ ^ ^ ^ 53 t , ^1 ^ 1 i ^ i ^ 1 IP ^1 ^ 1 3 Скла& готовой продукции Усталов/ш Для г/рсмаеловни t I ~Т Муф/поналерто*/нг?/е стати J I I I I L СЛ h П I Левые резьбонарезные станни -J I „ I \ , 1 L 1 i— Правые резьбонарезные станни —I 1 . ) I . 1 L- 1 Г 1 Г Ладравличесние прессы J I I L 1 Г PpotfyeovH&e сл7анни J I I I I L 1Г Левые | трублллдреэные станки J L 1 Г 1 Г Правшл>//ые машины J L —i i— Яровые л?руа"оло#ревные слуанни J I . I I , I L. Делительное ушройстло О р« и о и о я S (-1 о к о и и I о н о в О.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 213 Наконец, третий — участок холодной отделки — образует четыре параллельных потока операций поштучной обработки труб. С делительного устройства трубы в определенном порядке поступают на четыре одинаковые поточные линии, на которых подвергаются следующим основным операциям: правке, подрезке правого и левого торцов, продувке, испытанию на гидропрессе, нарезке резьбы на правом и левом концах, навертыванию муфты на одном из концов и промасловке. Работа участка без перебоев при остановке по каким-либо причинам отдельных станков обеспечивается в течение некоторого времени наличием промежуточных складов труб между станками. Затем трубы увязываются в пакеты и отправляются на склад. Прежде чем рассматривать детальное математическое описание основных производственных операций, необходимо наметить задачи, ради решения которых разрабатывается математическая модель процесса, и определить перечень учитываемых факторов. На этом основании можно установить систему исходных данных, необходимых для исследования процесса, и указать величины, фиксируемые при моделировании. Основными задачами исследования данного производственного процесса будем считать: 1) оценку производительности стана, отдельных линий и станков; 2) оценку качества выпускаемой продукции и классификацию доли брака по всевозможным причинам; 3) оценку вариантов структуры стана и состава оборудования; 4) оценку вариантов технологического процесса.и режимов работы оборудования при различных значениях основных параметров процесса. В соответствии с этим целесообразно учитывать следующие факторы: 1) темп поступления полуфабрикатов на станки и агрегаты; 2) время, затрачиваемое на выполнение тех или других производственных операций; 3) следствия, к которым приводит накапливание очереди полуфабрикатов у различных станков; 4) случаи выхода технологического оборудования из рабочего состояния; 5) причины появления брака; 6) причины срыва процесса в целом и на отдельных линиях. При учете перечисленных факторов основными исходными параметрами, характеризующими процесс, будут: 1) структурные и конструктивные характеристики оборудования, порядок чередования операций, размеры, расстояния между агрегатами, емкости промежуточных складов и карманов для хранения бракованных труб и т. д. 2) параметры, характеризующие состояние полуфабрикатов (толщина, ширина и механические свойства штрипса, размеры и свойства труб и т. д.); 3) параметры, характеризующие технологический режим (времена и скорости обработки и транспортировки, силовой и температурный режим операций и т. д.); 4) параметры, характеризующие надежность технологического оборудования (поломки, неисправности, износ инструмента, наладка агрегатов и т. д.); 5) параметры, характеризующие зависимость качества изделий и состояния оборудования от характера течения процесса. Чтобы закончить предварительную характеристику предпринимаемого исследования, перечислим величины, которые целесообразно фиксировать в процессе моделирования. Эти величины будут служить своего рода
214 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО критериями, позволяющими анализировать производственный процесс, оценивать различные его свойства. Основными критериями могут служить: количество труб, выпускаемых за смену; доля бракованных труб; относительное время производственной работы станков и агрегатов; количество срывов процесса — количество остановок линий из-за неполадок (критерием остановки линии является переполнение промежуточного склада перед правильной машиной); общее количество остановок отдельных станков из-за неполадок; этот показатель отличается от предыдущего тем, что не каждая остановка станка приводит к срыву процесса; общее количество труб на промежуточных складах —максимальное, минимальное, среднее. Помимо основных показателей, описывающих определенные стороны процесса в целом, обычно используется некоторое количество вспомогательных, характеризующих свойства отдельных элементов оборудования и их поведение. К ним относятся: количество бракованных труб на отдельных видах оборудования (разделение по причинам); относительное время использования оборудования для каждой из линий и для отдельных станков, загрузка которых наиболее интересна с точки зрения прдводимых исследований; время простоев каждого из видов оборудования, классифицированное по причинам: из-за неполадок, из-за плановой смены инструмента, из-за переполнений последующих промежуточных складов; количество остановок каждого из видов оборудования, классифицированное по причинам; количество труб на промежуточных складах перед каждым станком: максимальное, минимальное, а также закон распределения количества труб на промежуточных складах во времени. Этот закон распределения выявляется путем подсчета относительного количества времени, в течение которого каждое из возможных количеств труб находилось на промежуточных складах, и т. д. Перечисленные величины дают возможность провести достаточно детальный анализ рассматриваемого процесса с точки зрения решения поставленных выше задач. Перейдем к построению формализованной схемы производственного процесса. Чтобы избежать повторений, связанных с рассмотрением аналогичных операций, мы остановимся подробно на формализации участка холодной отделки труб. В дальнейшем будут рассмотрены некоторые, наиболее специфические элементы производственного процесса, связанные с участком подготовки штрипса и горячей линией. Делительное устройство Делительное устройство производит распределение поступающих на него труб на четыре поточные линии. Каждая последующая труба поступает на линию, номер которой на единицу больше номера линии, на которую поступила предыдущая труба. Если предыдущая труба поступила на четвертую линию, то последующая поступает на первую. Интервалы времени между поступлением труб на делительное устройство задает горячая часть стана. Эти интервалы при
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 215 данном режиме работы стана, вообще говоря, могут изменяться. Они не могут быть меньше какого-то минимума, но в большую сторону в отдельных редких случаях могут отклоняться весьма значительно, когда из-за тех или иных неполадок в горячей линии часть прокатываемого металла уходит в брак. При больших перерывах между поступлением труб очередная труба посылается делительным устройством на одну из четырех линий, номер которой случаен, а каждая последующая распределяется по вышеуказанному правилу. Так работает делительное устройство в нормальном режиме. При работе делительного устройства возможны сбои. Например, возможна посылка трубы не на ту линию, на которую она предназначалась, а на одну из соседних или даже на самую дальнюю. Иногда может оказаться, что одна из линий неисправна или оказывается переполненной. Тогда делительное устройство переходит на другой режим и распределяет все поступающие трубы по трем работающим линиям. В случае же, когда неисправны две линии, делительное устройство все трубы посылает не на поточные линии, а в специальный карман. Эти трубы выбывают из процесса. Такой режим работы длится до тех пор, пока одна из переполненных линий не станет готовой к приемке труб с делительного устройства, и тогда последнее снова начинает распределять трубы по работающим линиям. Для характеристики работы делительного устройства необходимо задавать следующие параметры: t{ — интервалы времени между поступлением труб на делительное устройство; ^, где со — помер линии,— время транспортировки [труб от начала делительного устройства до каждой^изУпоточных линий; Г^.— время ухода труб с делительногоТустройства. Обозначим через Ti моменты поступления|труб на делительное устройство. Тогда имеют место следующие соотношения^между^параметрами: 1 Oi= ^ i -Г £д- Кроме перечисленных параметров должны быть указаны: р — вероятность сбоя в работе делительного устройства, т. е. вероятность того, что по тем или иным случайным причинам труба попадает не на ту линию, на которую предназначалась; (р_2, р_1У р+1, р+2) — условные вероятности попадания труб при сбое на i каждую из соседних линий такие, что р_2+Р-1+Р+1+Р+2=1- Режим согласованной работы делительного устройства с каждой из поточных линий характеризуется: то> _ текущим количеством труб на промежуточных складах между делительным устройством и правильными машинами на каждой из линий; щш — максимально возможным количеством труб на каждом из этих промежуточных складов. При согласовании работы делительного устройства с горячей частью стана необходимо иметь в виду, что промежутки времени между поступлением труб диктуются режимом работы последней. Когда же горячая часть не моделируется, необходимо охарактеризовать закон распределения интервалов времени между поступлением труб. Исходя из характера реального ^процесса, функцию плотности f(z) для интервалов времени zi между момен-
216 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО тами поступления последовательных труб удобно задавать в виде (2) / 0 при z</min; /(z>-U*e-^npnZ>W ( } Очевидно, что средняя плотность такого потока будет равна А=1+«тщ- (3) В качестве показателей, характеризующих работу делительного устройства, принимаются: число труб, поступивших на делительное устройство; общее время работы делительного устройства; количество труб, поступивших на каждую из поточных линий; количество случаев сбоя в работе делительного устройства, в том числе: количество случаев попадания труб на одну из ближайших линий; количество случаев работы делительного устройства на три линии; количество случаев работы делительного устройства «в карман»г когда две линии переполнены; число труб, ушедших в карман. Математическая модель процесса функционирования делительного устройства может быть представлена в следующем виде (рис. 2). Оператор 1 вырабатывает время поступления очередной трубы на делительное устройство. Если участок отделки труб моделируется изолированно, то интервалы времени t- между моментами поступления последовательных труб формируются в соответствии с функцией плотности (2). В другом случае, когда моделируется весь процесс работы стана в комплексе, темп поступления труб на делительное устройство диктуется режимом горячей линии. Оператор 2 производит оценку состояния отдельных линий участка отделки труб (готова к работе, неисправна, переполнена). Это необходимо для того, чтобы соответствующим образом подготовить алгоритм для реализации правила или жребия, связанного с выбором линии для обработки очередной трубы. Оператор 3, названный счетчиком количества труб, выполняет две функции. С одной стороны, здесь ведется подсчет общего количества труб, поступающих на делительное устройство, а с другой,— здесь фиксируется количество труб, поступавших на делительное устройство после остановки процесса или другого достаточно длительного перерыва в подаче труб. Величина к необходима в дальнейшем для решения вопроса о порядке привлечения линий к обработке очередной трубы. Логический оператор 4 проверяет условие /с>1. Если это условие выполнено (не первая после перерыва труба), то управление передается оператору 5, который реализует жесткое правило привлечения линий в порядке очереди. В противном случае оператор 6 вычисляет вероятности для первоначального выбора линии, а оператор 7 реализует выбор линии по жребию. Реализация жребия состоит в сравнении случайного числа /?•, имеющего равномерное распределение в интервале (0, 1), с вероятностями рг, р2, ..., рк событий Аг, А2, ..., Ак. Событие Ai наступает тогда, когда -1 Номер выбранной по жребию (или по жесткому правилу) линии фиксируется оператором 8.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 217 Оператор 9 вычисляет (или выбирает из памяти, если она задана заранее) вероятность сбоя в работе делительного устройства, а логический оператор 10 путем реализации жребия устанавливает наличие или отсутствие- 8 \ Расчет вероятности оля первоначальноео \ вы дар а линии 7 > ' Выдор линии по жребию 71 \ Pucvem вероятностей для вь/дора линии \ ори сбое i*> \ \ £х*ср линии при croc по шреди/о i —>- —>- Определение времени поступления п?руды 2 ' \ Оценка состояния линий 3 1 Счет*/их холичее/ява трудн уЗ\ °( ',- - V У 1 /Г -> / 1" ■** 8 Очетчин номеров занимаемы* линий s i Раачеп? вероятноати сдоя * / /7раверна\ V сдоя J /з J# Определение длины L по номеру линии /4 t Г Определение времени предь/еания труды на 1 делительномустройстве ♦ 1 Расчет времени ухода трубъ/ о делитель- [ ного устройол7ва 5 Вь/дор линии 1 по правилу Рис. 2. Блок-схема процесса функционирования делительного устройства. сбоя. Следствием сбоя может быть привлечение различных линий с соответствующими вероятностями, зависящими от номера линии, зафиксированного оператором 8. Эти вероятности формулируются оператором 11. Оператор 12, реализуя жребий, определяет номер той линии, на которую поступает труба в случае сбоя. Оператор 13 определяет в зависимости от номера линии, выбранного оператором 12, величины L — длины пути транспортировки труб от начала делительного устройства до входа в соответствующую линию.
218 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО Операторы 14 и 15 предназначены соответственно для определения времени пребывания трубы на делительном устройстве и для вычисления времени ухода трубы с делительного устройства. Рассмотренная схема описывает формализованный процесс работы делительного устройства как такового. Поэтому на ней не показаны операторы, формирующие и фиксирующие те параметры, которые были перечислены выше как характеристики состояний процесса. Ввод в схему таких операторов не представляет затруднений и не является принципиальным с точки зрения моделирования процесса работы делительного устройства. Правильная машина На правильной машине одновременно может правиться только одт* труба. После правки трубы поступают к правому подрезному станку. Таков нормальный режим работы машины. Картина усложняется при появлении отклонений от нормального режима работы. Возможны случаи брака при правке. Эти плохо выправленные трубы выбывают из технологического процесса и к правому подрезному станку уже не поступают. Возможны случаи, когда промежуточный склад между правильной машиной и последующим станком оказывается переполненным. Тогда правильная машина останавливается. В результате остановки начинают накапливаться трубы перед правильной машиной. В конце концов, могут наступить переполнение и этого промежуточного склада и, как следствие, прекращение подачи труб в данную линию. При формализации процесса функционирования правильной машины необходимо учитывать флуктуации следующих параметров, характеризующих ее работу: Т7^ — времени появления труб на входе в данную поточную линию; tTl — времени транспортировки труб от делительного устройства до правильной машины; Тиц — моментов подхода трубы к правильной машине; Тн — времени правки трубы; Тц — моментов окончания правки. Между указанными параметрами имеют место соотношения: Ти ii = ^Oi + ^Ti» Тц = Тп а + Гц (при отсутствии очереди); (5) Тц = Тц-{+1ц (есть очередь). Все перечисленные параметры являются случайными величинами. При формализации процесса мы будем описывать их следующим образом. Моменты времени Т°К полностью определяются темпом подачи труб € делительного устройства в линию. Поэтому нет необходимости задавать закон распределения этой случайной величины. Наоборот, в процессе моделирования (при необходимости) можно накопить статистический материал для оценки закона распределения величины T%v Случайные колебания времени транспортировки труб tT{ в случае рассматриваемого технологического процесса оказываются несущественными, поэтому достаточно задать среднее значение /Ti. Отсюда и из соотношения (5) становится ясным способ описания случайной величины Тпц. Время правки труб ти считаем случайной величиной, независимой от Тпц и имеющей заданный закон распределения /(ть). Для данного процесса плотность /(ти) не известна и должна быть оценена по экспериментальным данным. В настоящее время распределение tli принимается равномерным в заданных пределах.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 219 Дополнительно к изложенному выше необходимо задать вероятность появления брака при правке (р) или указать способы ее определения при моделировании. Режим согласованной работы правильной машины с последующим станком характеризует емкости складов т® и т%, совершенно аналогичные описанным выше. Определение еремеш поступления трубя T„n Подсчет нолместеа поступиешшг труб к 5 \ f Тпп + тп °\ \-f 1 4 ^Г л= к-кобр dS~^\ * °[ ? - - V -< 1 п^и 1 ■' ^ 8 ffodcvem нолместеа , обрабол/аннш труб кф " &~ 7 T ifl-O + tn Расчет вероятности ffpa/ta Ю[Проверка^ фанта \/ \ появления брака 11 flodcvem ноличества браноеаннш труб Ю Определение момента выхода труб/?/ us правильной машины Рис. 3. Блок-схема процесса функционирования правильной машины. В процессе моделирования необходимо фиксировать следующие величины, характеризующие работу правильной машины: количество труб, прошедших через правильную машину; общее время работы машины; количество труб, ушедших в брак; время простоя машины по причине переполнения последующего промежуточного склада;
220 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО время простоя машины по причине переполнения промежуточного склада между делительным устройством и самой правильной машиной; функцию распределения количества труб на промежуточном складе перед правильной машиной. Математическая модель процесса функционирования правильной машины представлена на рис. 3. Здесь правильная машина рассматривается как простейшая система массового обслуживания, имеющая одну линию и время занятости ти. Некоторой особенностью этой системы является специфический режим появления и исчезновения очереди труб. В операторе 1 формируется момент подхода трубы к правильной машине Тпц в соответствии с (5). Оператор 2 подсчитывает количество к труб, поступивших к правильной машине. Логический оператор 3 проверяет условие /с>1. Если это условие не выполнено (поступила первая труба), то управление передается оператору 5. Оператор 5 определяет момент окончания правки трубы (Гин-г ти)- и передает управление оператору 8. Оператор 8 подсчитывает количество обработанных на правильной машине труб /гобр. Оператор 9 вычисляет вероятность появления брака в течение данной операции, а логический оператор 10 определяет по жребию, появился брак или нет. Если условие, проверяемое оператором 10, выполнено (брак имеется), управление передается оператору 11 для подсчета количества бракованных труб. В противном случае управление передается оператору 12 для определения момента выхода трубы из правильной машины. Если условие &>1 выполнено, управление передается оператору 4, который определяет количество п труб в очереди (к—/собр) и передает управление логическому оператору 6. Оператор 6 сравнивает п с нулем. Если п=0 (очереди труб нет), управление передается оператору 5. Дальнейшую работу схемы в этом случае мы уже рассматривали выше. Пусть теперь пфО (имеется очередь труб); тогда управление передается оператору 7. Оператор 7 определяет момент окончания правки труб следующим образом: время выполнения операции правки прибавляется к моменту выхода из правильной машины i—1 трубы. Это допустимо в силу того, что при наличии труб в очереди правильная машина не простаивает. Затем управление передается оператору 8. Дальнейшая работа схемы была рассмотрена выше. Правый подрезной станок Правый подрезной станок, установленный на некотором расстоянии за правильной машиной, производит подрезку (снятие неровностей) правого торца трубы. Станок работает автоматически. Непрерывно движущиеся вместе с бесконечной цепью захваты через определенные промежутки времени захватывают по одной трубе и подают ее к одной из резцовых головок, которая выполняет операцию подрезки. По окончании обработки эти же захваты подают трубу к стеллажу за станком. Одновременно в станке находятся четыре трубы. В момент захвата четвертой первая поступает на стеллаж за станком. Возможны отклонения режима работы станка от нормального. В ряде случаев может появиться неисправность в работе станка, требующая определенного времени для исправления, при этом станок останавливается. Имеют место также систематические остановки на определенное время для смены износившегося инструмента. В ряде случаев при выполнении one-
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 221 рации может появиться брак; при этом возникает необходимость остановки «станка на подналадку. Бракованные трубы выбывают из процесса. В качестве математической модели данного станка используется простейшая система массового обслуживания (см. модель правильной машины). При формализации процесса функционирования наряду с параметрами, аналогичными описанным выше для правильной машины, должен быть учтен ряд дополнительных параметров, характеризующих работу станка ^в приведенных ниже обозначениях учитываемых параметров индекс 2 соответствует порядковому номеру данного станка): Т3 2i — момент захвата трубы станком; At2 — интервалы времени между прохождением захватов. Между учтенными параметрами имеют место соотношения Т Т А. г (Ь) Л- 2г = 1 з 2г "Т т2* Момент захвата трубы определяется по-разному в зависимости от количества труб на промежуточном складе перед станком: J Г32 (i-i) +A£o ПРИ наличии труб на складе, 3 г \ T32Q + At2-m при отсутствии труб, где Г32о характеризует начальное положение захвата при пуске станка, a m — количество тактов станка с момента начала работы. Кроме того, должно удовлетворяться условие О < Т3 2j — Т3 о (г- 1) < At2. Введенные выше параметры характеризуют лишь идеальную работу •«станка. Необходимо учитывать дополнительно такие факторы, как возможность появления брака (задается вероятность брака р) и случайные колебания времени наладки станка после появления брака (задается функция плотности /(#)). Для учета режима надежности оборудования и смены инструмента задаются: время смены инструмента; вероятность поломки станка; функция распределения времени починки станка. Режим согласованной работы данного станка с последующим и предыдущим станками характеризует текущее и максимальное количество труб на промежуточных складах (соответственно т%, т{?3 и т£, га{?2). Раснределение времени наладки станка при появлении брака, описываемое функцией плотности f(x), обычно считают равномерным в заданном интервале (t™™, t™f). Считаем, что функция распределения времени ремонта станка при поломке имеет вид (2). При моделировании рассматриваемого производственного процесса целесообразно фиксировать, кроме величин, аналогичных вышеописанным для правильной машины, следующие величины: общее время простоя станка по причине наладки после брака; количество случаев смены инструмента; общее время простоев из-за смены инструмента; количество случаев поломки станка; общее время простоев из-за поломки станка; суммарное время простоев станка.
222 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО Математическая модель процесса функционирования правого подрезного станка во многом сходна со схемой, представленной на рис. 3 для ■равйльной машины. Она приводится на рис. 4. Существенными особен- Оаределение момента поступления/яру fa Tni Счетчик количества труб, поступивших /с стая/су А Определение количвотщ трубв ачереби 5 Расчет момента захвата 1 Tpt ^Tja+Afym V^^4 х о( ~~п V ч.——»^ Я-^и 1 б Счетчик труб, принятых стан/гом к^схв 7 Расчет момента захватш Расчет времена смены т и момента готовности^ станж я работе Расчет вероятности сбоя 72 Расчет времени ремонта и момента гатавнасти я работе Расчет л/аментаешода трубы из станяа 14 73, '17рове/7ка\ 01 фанта \лаявления i браяа Счетчик количества бракованных труб Рис. 4. Блок-схема процесса функционирования правого подрезного стапка. ностями этой схемы являются учет возможной смены инструмента и возможности сбоя в работе станка. Операторы 1, 2, 3, 4 совершенно аналогичны описанным выше операторам 1, 2, 4, 6 предыдущей блок-схемы. Операторы 5 и 7 производят
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 223. расчет моментов захвата трубы со стеллажа в станок: первый — для случая, когда в промежуточном складе нет труб (п=0), второй — когда запас труб перед станком имеется (гс>0). Далее управление передается оператору 6 для подсчета труб, поступивших в данный станок на обработку, и затем оператору 8, который проверяет, не наступило ли время менять инструмент (критерием смены является количество обработанных инструментом труб). Если смена необходима, то управление передается оцератсь ру 9 для подсчета по закону распределения времени смены и последующего момента готовности станка к работе и далее — оператору 10. Ему же передается управление от оператора 8 в случае отсутствия смены инструмента. После расчета вероятности сбоя оператор 11 по жребию определяет наступление момента поломки станка. Если сбой имеет место (поломки), то управление передается оператору 12 для подсчета времени ремонта и момента готовности к работе и далее оператору 13 для установления па жребию факта появления брака и оператору 14 для подсчета числа бракованных труб, если брак имеет место. Если брака нет, а также в случае, когда нет сбоя, от операторов 13 и 11 управление передается оператору IS для подсчета момента выхода трубы из станка. Работа левого подрезного станка описывается вполне аналогично. Отличными могут быть только некоторые числовые значения параметров. Рассмотренная схема используется также для формализации процесса функционирования правого трубонарезного станка. Продувочный станок Продувочный станок производит продувку внутренней плоскости труб для ее очистки от окалины и стружки. Характер его работы и круг учитываемых факторов аналогичен предыдущим станкам. Разница лишь в том, что для этого станка стойкость инструмента оказывается достаточно большой и ее при формализации можно считать неограниченной. В остальном блок-схема функционирования оказывается одинаковой. Таким же образом работает и муфтонаверточный станок. Гидропресс Гидропресс производит испытание труб на герметичность под давлением. Характер его работы и круг устанавливаемых факторов в основном аналогичны продувочному станку. Разница в том, что появление брака при операции свидетельствует о неисправимых дефектах трубы и не требует переналадки станка. Бракованные трубы поступают в специальный карман, откуда при его наполнении убираются краном. Таким образом, для этого станка вводятся дополнительные характеристики: текущие количества труб в кармане для брака; максимально возможное количество труб в кармане; время остановки станка, необходимое для уборки труб из кармана. В остальном блок-схема функционирования аналогична схеме для продувочного станка. Трубонарезной левый станок Данный станок установлен за трубонарезным правым станком и в основном аналогичен последнему. Режим работы станка отличается наличие*м кармана за станком для оракованных труб.
.224 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО Особенности, связанные с наличием кармана, реализуются при построении математической модели так же, как это сделано при описании работы гидропресса. Установка для промасловки труб Установка для промасловки завершает операцию обработки труб в потоке. Она производит промасливание наружной поверхности труб. Характер работы станка в основном аналогичен характеру работы правильной машины. Разница в том, что для этого станка необходим учет времени наладки станка в случае появления брака. Другое отличие состоит в отсутствии промежуточного склада за станком, который при переполнении делал бы необходимой остановку станка. В остальном блок-схема функционирования аналогична описанной выше схеме для правильной машины. Имея формализованные схехмы работы всех перечисленных станков и устройств, можно перейти к рассмотрению вопросов увязки их в единый процесс для каждой линии и для всего участка холодной отделки труб. Для характеристики работы поточной линии как единого целого будем использовать следующие критерии качества: общее количество труб, обработанных на каждой из линий; общее время работы каждой из линий; общее количество брака на каждой из линий; длительность перерывов между подачами труб на каждую из линий в случае их переполнения и некоторые другие. Для обеспечения возможности получения в результате математического моделирования картины работы участка холодной отделки труб как единого целого необходимо стыковать между собой отдельные линии. Связующим звеном здесь является делительное устройство, распределящее трубы по различным линиям. Работу делительного устройства мы описали выше. Заметим, что при построении моделирующего алгоритма можно воспользоваться тем обстоятельством, что формализованные схемы работы отдельных станков имеют некоторые общие черты. Это позволяет построить такую, обобщенную схему работы станка, которая в разных частных случаях могла бы служить для моделирования работы всех станков. Легко заметить, что в данной задаче этому требованию удовлетворяет блок-схема моделирующего алгоритма для левого трубонарезного станка. Ее многократное применение для моделирования работы всех станков позволяет составить общую схему из двух частей — схемы делительного устройства и схемы универсального станка, присоединив к ним необходимое количество операторов для перестройки работы модели со станка на станок и с линии на линию. § 2. Построение алгоритма и решение задачи Этот параграф посвящен построению алгоритма для моделирования участка холодной отделки труб и решению задачи на вычислительной машине. Для построения алгоритма и реализации его на вычислительной машине будет удобно участок холодной отделки труб представить в виде, указанном на рис. 5. В качестве исходных данных (параметров производственного процесса) были выбраны величины, приведенные в таблицах 1, 2 и 3.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 225 Эти величины в основном получены на базе проектных характеристик оборудования. Параметры надежности взяты из опыта и достаточно хорошо согласуются с собранными статистическими данными. Некоторые отличия в исходных данных между отдельными линиями объсняются различием ДУ | ^0 Со Со Со с, с, с, с, — ^ с8 Се св с8 Рис. 5. Принципиальная схема стала, участка холодной отделки труб. ДУ—делителыше устройство; C.v —- v-й станок па линии, 1 <; v <; 8; С — склад готовых труб. их размещения в пролетах цеха. В таблице 1 даны необходимые для моделирования временные параметры, вероятности брака и емкости карманов для бракованных труб. Время наладки станков считается случайной Таблица 1 Параметры танки \. Трубопра- вильная машина . . . Трубопод- резиой правый станок Трубопод- ре;шои ле- мыи станок Продувочный станок Гидропресс Трубонарезной правый станок Трубонарезной левый станок Муфтона- п ер точный станок . . Промаслов- ка .... Время захн. Д/ :\ 3 3 3 3 3 о ' Время обработки [сек] т 2,5 9 9 9 18 9 9 9 3 Веро- нтн. брака 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 Время наладки 'min [сек] — 60 60 60 — 60 60 60 60 'max [сек] — 300 300 300 — 300 300 300 300 Веро- ятн. поломки 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 Время ремонта 'min [сек] 600 600 600 600 600 600 600 600 600 X 0,00083 0,00083 0,00083 0,00083 0,00083 0,00083 0,00083 0,00083 0,00083 Стойкость инструмента "труб — 1000 1000 — —- 1000 1000 — — 'смены [сек] — 120 120 .— — 120 120 — Объем кармана брака [труб] — 1 — — — 860 — 860 — -~— !■'> Проблемы кибернетики, вып. {)
Ост. случайлого\ числа 2 /е ttas н e tmin — Счетчин числа труб k+/ в случайного числа целой част 0 t Выбор "номера линий Г4 /5 /6 17 выяснение и ри/г- жил занятости а/ линии Г;/, Zrtt;x(to)4 выбор номера линии oo+f(mod4) Ofs) Счетчил занятш линии ю. *л-г Определение ноличеслт срывов и времени простая^ £2 ft ^2pt ш к+к,;0=>к случайногл\ числа ft О =±х(ш) Ors) 0#дор номера линий u)+f(mod4\ 28 I номера линий ш+1(тоа!4)\ 23 f F(s+co) Определение но\ 02 f f \личествалбоее\ наванлту/о лини/оивре- \мени простоя 42 Y 33 Определение времени подхода трубы Счетах числатрубЛ h уоступови/щг^л нстанну нао)-ли/ящ Олред времена простоясганнаХ из-зао/псут- ств ил труб V 43 44 4S случайного} числа времени tno</v\ tno4V***/irUryi\ *поч»+У Определение ноличества поломан стал\ на и времени простоя Счетчин числа труд, обработанные после смены инструмента\ к$+1 47 Определение /_ {временисмены\ инструмента tc»SnO=**$ 52 \случайного\ числа 55 ♦ Г числа Определение времени 4^1 , ^ , wa/rv 0налу^\ \\(*Ma/nr^ayki, tw+Г Оор.нолбра/щ Шсганмивре- \мени простоя\ аз-заналадни Еб'>Ев*ма//\/> (У'/ 53 ем/гости ха/мана орана Опр времени tOMV ожидания захвата |-Н 57 времена ожидания \ трубы своей очереди одработ/ги ta*rv~f"7 53 SO Оореремениготв\ . \ностсганнаобсщ Y*yn/nr следу/ощ. грущ п?5-г 00 SL <7у^ 05 С+1 00 f(v+4) 33 А 03 08 С-1 \ ' 00 Ffv-4) f ]37 71 0(s) 'А Рис. 6. Блок-схема алгоритма реализации математической модели производственного процесса участка холодной отделки автоматизированного стана печной сварки труб. Проблемы кибернетики, вып. 9.
226 Г. А. АЛИЕВ, Н. 11 ВУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО величиной с равномерным распределением в интервале (*™,j£' *™алХ)# Время ремонта имеет показательное распределение с параметром к в интервале (*min> °о). Стойкость инструмента характеризуется количеством труб, после обработки которых происходит замена инструмента, и средним временем, затрачиваемым на выполнение замены. В таблице 2 даны интервалы времени, в течение которых производится транспортировка труб от станка к станку, а в таблице 3 —предельная емкость складов перед станками для всех линий. Приведем теперь блок-схему (рис. 6) алгоритма реализации математической модели рассмотренного производственного процесса. По составленной программе были проведены расчеты на вычислительной матине «Стрела» в Вычислительном центре МГУ. Таблица 2 ~~~ -—^^^^ Номер линии ~~-^___^^ Время ^^~~^^^^_^ Время (сек) пребывания на делит, устройстве 1. tT транспортировка к правильной машине 2. tT к правому подрезному станку .... 3. tT к левому подрезному станку . . . . 4. tT к станку продувки | 1 9 20 19 4 4 2 26 16 14 4 4 3 42 13 11 4 4 4 59 10 ,11 4 4 ~ ~-~——___ Номер линии ~~"-"---^ Время -^^_ 5. tT к гидропрессу . 6. tT к правому нарезному станку .... 7. /т к левому нарезному станку .... 8. /т к муфтонаверточ- ному станку .... 9. tT к промасловке . 1 5 29 4 5 7 2 5 27 4 5 И о 5 70 4 5 8 4 5 70 4 5 12 Таблица 3 Номер линии Емкость склада 1 32 200 1 82 82 2 26 87 82 82 3 23 175 82 82 4 1 2 1 180 821 821 Номер линии Емкость склада —и 1 100 330 82 125 50 2 100 280 82 125 54 3 100 350 82 125 35 1. Перед правильной машиной 2. Перед трубоподрез- ным правым станком 3. Перед трубоподрез- ным левым станком 4. Перед продувочным станком 5. Перед гидропрессом 6. Перед трубонарезным правым станком 7. Перед трубонарезным левым станком 8. Перед муфтонавер- точным станком . . 9. Перед промасловкой 100: 350, 82| 125- 37; Заметим прежде всего, что в самом начале «проигрывания» модели текущие параметры, встречающиеся в блок-схеме, как, например, s, \\ msVy N3y /с, Tnv, T^rv, fcSv, k% и др., равны нулю. В операторах 1 — 2 по случайному числу^ с равномерным законом распределения на интервале (0, 1) находится случайное число ti (промежуток времени между двумя последовательными поступлениями труб) с пуассоновской функцией распределения, имеющей параметр X и сдвинутой вправо на £miD, т. е. из соотношения U = U -[-In (1-Я*),
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 227 где ^min — минимальный промежуток времени между двумя последователь- ными поступлениями труб. Момент времени поступления трубы Т\ равен 2^ (оператор 3). Если условие, указанное в операторе 4, оказывается выполненным, то происходит передача управления следующему по порядку оператору, в противном случае следует останов, т. е. по истечении кремени Т0 (времени «проигрывания» модели) работа модели прекращается. Определяется общее число к труб, поступивших на стан (оператор о). Для первой трубы (/с=1) с одинаковой вероятностью выбирается номер со любой линии. Для последующих труб (к > 1) номер со выбираемой линии получается прибавлением единицы по модулю четыре к предыдущему номеру линии (операторы 6 — 9). Далее происходит настройка всех операторов для работы на со-линии (оператор 10). Выясняется состояние склада перед первым станком выбранной линии (оператор 11). Если этот склад переполнен, т. е. текущая емкость т® склада перед первым станком достигла его предельной емкости mfii (в этом случае соответствующая линия считается занятой), то происходит «рассасывание» занятой линии, заключающееся в том, что время поступления трубы на делительное устройство 7\ посылается на место времени Т„\ подхода (оператор 33) трубы к первому станку со-линии и вырабатывается признак «рассасывания» х=1 (оператор 12); в противном случае (иг? < aw см) управление передается оператору 20, где проверяется, есть ли сбой в работе делительного устройства. После «рассасывания» (операторы 33 — 70) вновь проверяется, так же как и в блоке 11, состояние выбранной линии (оператор 13). Если она опять окажется занятой, то выясняются и фиксируются причины занятости (последний из стоящих подряд переполненных складов перед станками и т. д.), количество таких случаев 2Х1, время рассасывания 2^ и вырабатывается признак занятости со-линии х (со) = 1 (оператор 14). Далее выбирается следующий по циклу номер линии (оператор 15). Если условие, проверяемое оператором 18, где N3 — число занятых линий, оказалось выполненным, т. е. если оказалось, что заняты две или более линий (это означает срыв и работе стана), то управление передается следующему оператору по стрелке с индексом 1, где определяется общее количество 221 срывов и общее время 22^ «рассасывания» всего стана. Кроме того, общее число труб, поступивших на стан, фиксируется в дополнительном счетчике к1 труб, а основной счетчик очищается (операторы 17—19). Последнее делается для того, чтобы при последующем включении делительного устройства номер линии для обработки первой трубы выбирался бы с одинаковой вероятностью. Если оказалось, что занята лишь одна линия, то управление от оператора 18 передается оператору 10 и далее проверяется состояние линии, номер которой уже выбран в операторе 15. Если эта линия оказалась незанятой (т. е. если склад перед первым станком этой линии не переполнен), то по случайному числу Rt проверяется, есть ли сбой в работе делительного устройства (т. е. имеется ли «перескок» трубы на другую линию). Кроме того, очищается признак занятости со-линии 0=фх(со) (операторы 20 — 21). В случае сбоя по случайному числу Rt определяется номер линии, на которую «перескочила» труба (операторы 23—28). Номер со-линии определяется следующим образом. Числа 0,4 и 0,6 делят интервал (0, 1) на три части. Если выбранное случайное число Л46(0; 0,4), то «перескок» происходит на следующую по циклу линию; если /?{£[0,4; 0,6), то «перескок» происходит на дальнюю линию, если Л46[0,6; 1), то «перескок» происходит на предшествующую линию. Далее выясняется состояние линии, на которую «перескочила» труба (оператор 30). В случае занятости линии i:>*
228 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. II. КЛИМОВ, А. И. НАЗАИШКО определяется общее количество 231 «перескоков» на занятую линию и время простоя 23£t (оператор 31). Труба, «перескочившая» на занятую линию, выбывает из процесса трубоотделки. В случае незанятости линии, на которую перескочила труба, как и в случае отсутствия сбоя в работе делительного устройства (оператор 21), определяется общее количество М& труб, поступивших на аз-линию (оператор 32). Этим оканчивается работа делительного устройства. Для поступившей трубы уже выбран номер линии. Остается обслужить трубу на этой линии. В дальнейшем существенными будут следующие понятия: время T*nv подхода очередной трубы к последней трубе на складе (s, v)-ro станка, где ,5 —номер линии, v —номер станка на линии (для данного процесса это время совпадает с временем подхода трубы к (s, v)-My станку), и время Tbrv готовности (s, v)-ro станка обработать очередную трубу. Соотношение между ними указывает или на увеличение очереди перед соответствующим станком (в случае, когда Tsnv < Tsrv), или на готовность станка обработать трубу, ожидающую своей очереди (в случае, когда Tsnv^Tbrv)- Время Tsrv готовности (s, v)-ro станка обработать очередную трубу складывается из времени готовности этого станка обработать предыдущую тРУбу, промежутка времени между двумя последовательными захватами (или времени обработки трубы станком, если станок обрабатывает одновременно лишь одну трубу), времени починки станка в случае его поломки, времени смены инструмента в случае необходимости, времени наладки станка в случае обработки предыдущей трубы с браком (для станков, выясняющих бракованность поступившей трубы, это время равно нулю), времени очистки кармана брака в случае его переполнения и, наконец, времени ожидания захвата. Время Tsnv подхода трубы к (sy v)-My станку складывается из времени окончания обработки ее на предыдущем станке и времени транспортировки к данному станку. Время же окончания обработки трубы складывается из времени готовности станка обработать трубу и времени ее обработки на станке. Далее, если переполнен склад перед (s, v)-m станком, предыдущий станок прекращает работу и возобновляет ее одновременно с началом работы следующего станка. В этом случае время Tsrv посылается на место времени Г*, v-i- Теперь продолжим описание блок-схемы. Определяется время Т*пх подхода трубы к (s, v)-My станку (оператор 33). Если на складе перед станком и на станке нет труб (msv — текущее количество труб, находящихся на складе перед (s, v)-m станком и на самом станке), то перед тем как к msv прибавить единицу, записывается время 24(7^ — ^rv) простоя станка из-за отсутствия труб и время Tsnv посылается на место времени Tsrv (операторы 34—36). В случае готовности станка обработать тРУбу (оператор 37) при наличии трубы тп% > 0 (оператор 38) начинает обрабатываться очередная труба. Промежуток времени Atv между двумя последовательными захватами (или время обработки трубы для станков, не имеющих устройства захвата) посылается в некоторый накопитель (оператор 39; у — содержимое накопителя). По случайному числу Rt выясняется, произошла ли поломка станка (операторы 40 — 41). Если условие, проверяемое в операторе 41, выполнено (произошла поломка), то управление передается следующему по порядку оператору, который по случайному числу R{ (т. е. из соотношения tn04 v = *mm v — -j— lii (1 — #i)* где tm\n v — минимальное время починки v-ro станка) находит £поч v — слу-
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 229 чайное число (время починки v-ro станка) с показательной функцией распределения, имеющей параметр A,v и сдвинутой вправо на tm[nv. Кроме того, время починки складывается с содержимым у накопителя (операторы 42 — 43). Далее фиксируется общее количество 251 поломок (s, v)-ro станка и общее время 25£Ш)Ч v простоя этого станка из-за починки (оператор 44). После этого, так же как и в случае отсутствия поломки станка (оператор 41), определяется количество /4 труб, обработанных после смены инструмента (оператор 45). Смена инструмента происходит после обработки определенного числа (зависящего от станка) труб. Если число труб, обработанных после смены инструмента, достигает предельного значения &ov, то время tCMV смены инструмента складывается с содержимым у накопителя и счетчик числа труб, обработанных после смены инструмента, очищается (оператор 46 — 47). Далее, как и в случае отсутствия смены инструмента (оператор 46), по случайному числу Н{ выясняется, происходит ли обработка трубы с браком (операторы 48 — 49). В случае брака, т. е. если Rt<C #бр> по случайному числу Rt определяется время tnanv наладки из соотношения , .miri i / лпах .min \p £цал v — ^нал v ~Т ^сиал v снал \v*4» где Сал\> (Caj?v) — максимальное (минимальное) время наладки v-ro станка. Это время наладки складывается с содержимым у накопителя (операторы 50 — 51). После этого определяется общее количество 261 брака на (s, v)-m стайке, общее время 26£иа^ простоя из-за наладки и вырабатывается признак брака а=1 (оператор 52). Если брака нет, т. е. условие, проверяемое блоком 49, не выполняется, то управление передается оператору 56. Далее, определяется текущая емкость klv кармана брака (оператор 53), которая затем сравнивается с предельной емкостью fcfiv (оператор 54). В случае переполнения кармана (условие» проверяемое оператором 54, выполняется) время t04V очистки перепол- нившегося кармана бракованных труб складывается с содержимым у накопителя, а текущая емкость этого кармана очищается (оператор 55). Если условие, проверяемое в операторе 54, не выполняется (карман брака не переполнен), то управление передается оператору 56. Наконец, определяется время ожидания захвата трубы. Если во время починки, наладки станка, смены инструмента, очистки кармана брака устройство захвата продолжает работать, то время toniV ожидания захвата определяется из *0Ж„ = дЦ1-{^}}-, где {я}—дробная часть числа х; в противном случае tomv — 0 (оператор 56). Полученное время ожидания захвата складывается с содержимым накопителя (оператор 57). Теперь в накопителе находится общее время ожидания следующей трубой своей очереди обработки. Складывая это время с имеющимся временем Tsrv готовности, получим время Tsrv готовности (s, v)-ro станка обработать следующую трубу. Кроме того, определяется общее количество /t\, труб, прошедших через (s, v)-fi станок (оператор 58). Далее текущая емкость ?п\, уменьшается на единицу (оператор 59). Оператор 6(1 предназначен для построения функций распределения количества труб на складе перед каждым станком (см. рис. 7). Вкратце поясним, как это выполняется. В памяти вычислительной машины для каждого (,*\ v)-ro станка можно выделить mSQV подряд рас-
230 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО положенных ячеек (здесь raov — предельное значение для текущей емкости гг%). В /с-й из этих ячеек, 0</r<raov, фиксируется, сколько раз текущая 4 Частота А Частота 7 линия 77 линия 'Сошчеаши труб 7862РЗ + Частота Ш линия Частота ТУлиния 7{оличес/пво труб /г'оличшш/ труб 750 763 Рис. 7. Графики распределения количества труб на складе перед вторым (правым подрезным) станком каждой линии. емкость т% принимала значение /с. По этим данным можно построить функцию распределения количества труб на складе перед (s, v)-m станком. Если предельные емкости складов велики, как в рассматриваемой задаче, то для этого потребуется большой объем памяти машины. Поэтому целесообразно выбрать разумное число точек для построения упомянутых выше функций распределений. В рассматриваемой задаче функция распределения количества труб на каждом складе строилась по 16 точкам. Легко проверить, что все числа 16(4v + .9) + |l, где v, s. jx —целые числа, удовлетворяющие условиям 0<v<8, 0<s<3, 0<|х<15, различны. Расположение их в памяти машины указано на рис. 8. Для каждой предельной емкости тЬх подбирается число jxv > 0 ( например, |xv= —] такое, что [(lXvWv]< 15, где [х] — целая часть числа я, тогда в ячейке с номером 16 (4v + s) + \i фиксируется, сколько раз т% удовлетворяло условию |x = [|xvmv]. Оператором 60 заканчивается обработка трубы на (s, v)-m станке. Если теперь текущая емкость т% равна предельной /r?ov, то время Т*ТУ готовности посылается на место вре- v^ i>=8< f S=2 S=3 S=7 S=2 о 1 75 76 37 32 \ 47 43 33 1 /*= \ t*= \ P= \ P= \ Рис. 8.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 231 мени Tr.v-i (операторы 61, 63). Если труба была обработана на станке с браком (операторы 48 — 52), т. е. если а=1, то управление от оператора 62 передается оператору 37, с которого начинает обрабатываться очередная труба на этом же станке. В противном случае управление передается по стрелке оператору 64. Операторы 64 — 69 настраивают блок-схему для обработки очередной трубы на следующем (или предыдущем, если (sy v)-n станок был последним на 5-й линии) станке. Здесь через С обозначено содержимое счетчика номера станка. В заключение отметим, что операторы 10, 29, 66 и 69, в которых записан F(i + n)y являются операторами переадресации, изменяющими значение параметра / на п в операторах, где встречается этот параметр. Операторы 16, 22 и 71 являются операторами восстановления по параметру .9. Поясним ■еще назначение оператора 38. Если, например, на (s, v)-m станке была длительная починка, а на складе перед следующим станком было мало труб, то время r^v-j-i подхода трубы, обработанной на (s, v)-m станке после окончания починки, окажется больше времени Г?, v+i готовности (s, v + l)-ro станка обработать очередную трубу. Когда все трубы на (s, v + 1)-m станке будут обработаны, время TsUy v+1 опять-таки окажется больше времени TliV..\.\. В этом случае оператор 38 запрещает обработку не поступившей трубы на (s, v + 1)-m станке и посылает нас на предыдущий станок. Этим завершается описание блок-схемы. Программа решения этой задачи, составленная для машины «Стре- ла-4», состояла из 262 команд. Количество вспомогательных констант и рабочих ячеек, используемых в программе, равно соответственно 29 н 160. Одна труба обслуживалась на машине в среднем менее чем за 0,5 сек. Источником случайных чисел послужила подпрограмма выдачи псевдослучайных чисел, построенная авторами. В основу ее был положен пример Чемпернуона [9]. Подпрограмма выдавала псевдослучайные числа с периодом, большим чем 241. При «проигрывании» на машине одной семичасовой смены работы стана требуется более чем полмиллиона псевдослучайных чисел. Программа предусматривает вывод на печать следующих характеристик работы стана: 1. Количество труб, поступивших на стан на каждую линию и обработанных каждым станком. 2. Производительность общая каждой линии и каждого станка. 3. Брак в процентах общий по линиям и станкам. 4. Время простоя каждого станка по причинам: а) из-за поломки, б) из-за смены инструмента. в) из-за наладки в случае брака, г) из-за очистки переполнившегося кармана бракованных труб, д) из-за непоступления труб, е) из-за переполнения склада перед следующим станком. ж) из-за ожидания момента захвата. 5. Время «рассасывания» занятой линии. 6. Время «рассасывания» всего стана из-за занятости хотя бы двух линий и количество срывов процессов. 7. Функция распределения количества труб на складах перед каж- цым станком (см. рис. 7). 8. Количество «перескоков» трубы на занятую линию. В результате одного из расчетов, который соответствовал 2 час. М мин. работы участка отделки, были получены следующие основные результаты.
232 Г. А.-АЛИЕВ, Н. П. БУСЛЕНКО, Г. II. КЛИМОВ, А. 11. НАЗАРЕНКО 1. Полное количество обработанных труб на каждой линии и на каждом станке. Из 10 017 поступивших на линию труб обработано 8305 труб, в брак ушло 88 труб, а остальные 1524 трубы скопились на промежуточных складах; количество труб, обработанных каждым из станков, представлено в таблице 4. Таблица 4 х. Станки Линии ^\ I II III IV Правильная машина 2493 2488 2485 2477 Правый подрезной станок 2476 2456 2435 2463 Левый подрезной станок 2368 2446 2411 2451 Станок для продувки 2321 2384 2337 2384 Много- позиц. гидропресс 2302 2380 2272 2307 Правый нарезной станок 2247 2096 1977 2235 Левый нарезной станок 2227 2080 1917 2221 Муфто- naiu-p- точный станок 2170 2045 1907 2173 Станок для про- мас- ловки 2101 2008 1873 . 2163 2. Имели место пять случаев поодиночного переполнения отдельных линий и прекращения подачи на них труб. 3. Один раз в течение 67,8 сек. имело место переполнение двух линий. За это время 68 труб ушло в карман за делительным устройством. 4. Получены законы распределения количества труб на всех 36 про межуточных складах. Некоторые примеры распределения частот представлены графиками на рис. 7. Кроме того, зафиксированы величины, связанные с количеством слу чаев появления неисправностей станков и временем их исправления, с частотой появления брака и временами наладки станков, а также сменой инструмента на всех станках. Последние данные введены в число выходных величин и находятся в хорошем соответствии с заданными входными статистическими данными по браку, надежности и смене ин струмента. Из полученных результатов практически наиболее ценными являются данные по производительности всего участка и законы распределения труб на промежуточных складах. Они дают возможность обоснованно подойти к оценке таких важных факторов, как надежность, объемы про межуточных складов, структура участка (планировка потоков между участками и линиями). Результаты расчета позволяют судить о производственных возможностях участка холодной отделки труб. Расчет, основанный на применении изложенной выше методики, дает материал, позволяющий достаточно глубоко изучить такие сложные системы, какими являются, например, автоматизированные прокатные станы. На этом мы закончим рассмотрение участка холодной отделки труб. Станки и устройства, работающие на других участках (участок подготовки штрипса, горячая линия), имеют много общего с рассмотренными выше. При формализации процессов работы этих станков и устройств можно воспользоваться приемами, которые мы уже применяли.- Поэтому мы не будем подробно излагать сведения, относящиеся к формализации всех процессов. В заключение остановимся кратко лишь на некоторых и;* них, имеющих существенные особенности, а именно, рассмотрим тянущие ролики № 2 (участок подготовки штрипса) и редукционный и калибровом ный станы (горячая линия).
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 233 Тянущие ролики № 2 Тянущие ролики № 2 установлены на участке между стыкосварочной машиной и нагревательной печыо и совместно с тянущими роликами № 1, 3, 4 выполняют работу по транспортировке штрипса и по поддержанию необходимого запаса его в петлях. Между роликами № 1 и № 2 образована напольная петля, между роликами № 2 и № 3 петля опущена в яму. В процессе работы ролики включаются и выключаются в зависимости от величины предыдущей и последующей петель. Если последующая петля уменьшается и достигает определенного минимума, ролики № 2 включаются и за счет несколько большей скорости, по сравнению с роликами № 3, производят нагой петли между ними. Когда величина петли достигает определенного максимума, ролики останавливаются. Ролики останавливаются также и тогда, когда достигает минимально допустимого значения петля между роликами № 1 и № 2. Включаются в этом случае они вместе с предыдущими роликами (если последующая яма не переполнена). Так работают тянущие ролики № 2 в нормальном режиме работы. 'nycftai 'ocmi 'nyc/cai+1 'ocmi+1 Рис. 9. График функции v = f(t). В ряде случаев может произойти застревание штрипса в роликах, тре бующее остановки роликов на некоторое время для исправления. В некоторых случаях может иметь место запутывание петли в яме, которое тоже будет требовать времени для исправления. Оба эти факта могут оказаться опасными с точки зрения срыва процесса прокатки из-за исчерпывания запаса штрипса перед печью. Работу тянущих роликов № 2 в нормальном режиме характеризуют следующие параметры: ул = fx (t) — режим работы предыдущих тянущих роликов (№ 1) — скорость движения штрипса; ^imin — минимальная длина передней петли; Lx — текущая длина передней петли; v2 = f2 (t) — режим работы тянущих роликов № 2; о, =. /3 (t) — режим работы тянущих роликов № 3; ^2max — максимальная длина последующей петли; ALo — нормальное колебание длины последующей петли в работе; L2 —текущая длина последующей петли; L10—начальная длина предыдущей петли; £20 — начальная длина последующей петли. Функции / (t) имеют вид, изображенный на рис. 9. При этом переходными режимами мы пренебрегаем. Для описания этих зависимостей необходимо задать: v — скорость транспортировки штрипса роликами; Гост -моменты времени остановки роликов в процессе работы; Тпуски - моменты времени пуска роликов после остановки.
234 Г. А. АЛИЕВ, Н. П. БУСЛЕНКО, Г. П. КЛИМОВ, А. И. НАЗАРЕНКО Между этими параметрами существуют соотношения т т о о т т U = £*о + 5 t* С) Л - )| /з ^ Л; о о )СТ г ^ост г 5 U(t)dt- J f3(t)dt + L20^ L,inax; 0 о 1 г Гпуска г ^ /2 (О Л - jj /з (О Л -f L20 - L2 in»x - А£2 о о тост j тост j J /,(OA- J f2(t)dt + L10 = Llmin: 1 пуска г 7К2) 71(1) 1 пуска j — ■*■ пуска j» I 71 \ /о (*) #* = 2j ^ ( ост? пуска i) Ч" У (■« ' пуска п)« (*> где Т(2) << Т <^ 71(2) * пуска п \ -* \ ■*■ остп- пуска/ Для описания работы тянущих роликов с учетом отклонений их режима от нормального необходимо учесть при формализации ряд дополнительных факторов: р\2) — вероятность застревания штрипса в тянущих роликах № 2 (на единицу длины штрипса); 7 (4истр) —закон распределения времени, расходуемого на исправление застревания; /(i2) — длину штрипса, пропущенную роликами к моменту застревания: /?г2)— вероятность запутывания штрипса в яме (на единицу длины): / (*з!п) — закон распределения времени исправления запутывания; /j2) — длину штрипса, пропущенную роликами к моменту запутывания. Между этими параметрами имеют место соотношения: г(2) L ост г П2> ?>= ^ /.С)А; ТЧ2> — Т<2> I /<2) * пур.ка. г-М — -* ост г "Г •'Застр» пуска, г-И 'f = J /,(0 ctt: m TW — Т(2) _1_ /<2) 1 пуска, j+l — ■*■ ост.? "Г ^зап- Показателем качества работы тянущих роликов № 2 считаем длину ■ штрипса, пропущенную ими за время работы: i=\f*(t)dt. (Ю) Математическая модель процесса функциониронания тянущих роликов представлена на рис. 10.
Расчет длены и/трилса, пропущенного тянущumi\ роликами №7 ~lj восстановление длине/ \&/грипса, пропущенного гя\ ЧуЩЛЛ/U /70J7U/f0Ml/№2-lA Расчет длине/ предыдущей петли восстановление длины шгропса, пропущенного гя- нущ1/мироллштЖ?3-Ц Расчел? длины последующей петли Lj — lj-fa Расчел? вероятности застревания и/гриле а е тянущих рал л/гах /3 13 /77роверна\ фа/ел?а \ J застревания ^3] Расчет вероятности запутывания * и/трип с а в яме ^/Рроеер/ш\ фанта запутывания ^0\ Расчет времени стоянии Расчет мамента останоет 77 Расчет времени стоянии 73 Расчет момента остановни /5 Расчет времени исправления 14 Расчет момента застревания 73 Расчел? времени исправления 73 Расчет момента запутывания 23 Расчет времени пусна тянущих ролиное 27 Расчет длины и/трилса,\ пропущенного тянущи^ ми ролинами №2-12 }'ис. 10. Блок-схома процесса функционирования тянущих роликов ,\<? 2.
236 Г. А. АЛИЕВ, Н. II. ЬУСЛЕНКО, Г. II. КЛИМОВ. А. И. ЫАЗАРЕЫКО На основании результатов, полученных операторами 1 и 2, оператор 3 рассчитывает длину петли перед роликами и затем оператор 4 фиксирует момент, когда петля перед роликами достигнет минимума. Если минимум достигнут, управление передается к операторам 5 и 6 для расчета момента остановки и времени стоянки; если минимум не достигнут, то операторы 7 и 8 производят расчет длины петли в яме, а затем проверяется, не достигла ли эта петля максимальной длины (оператор 9). Если да, то производится расчет необходимых данных, связанных с остановкой роликов (операторы 10, 11), если нет, то ролики не останавливаются и управление передается операторам 12, 13, 14 и 15 для уста новления по жребию факта остановки штрипса, а также для расчета момента застревания штрипса в роликах и времени его исправления. В случае, если застревание не наступит, управление передается опера торам 16, 17, 18 и 19 для проверки факта расчета момента запутывания штрипса в яме и времени исправления запутывания. Оператор 20 во всех случаях служит для расчета времени пуска тяну щих роликов, а 21 подсчитывает на основе полученных из предшествующих операторов данных длину штрипса, прошедшего через тянущие роли ки № 2. Редукционный и калибровочный станы Редукционный стан стоит в линии горячей прокатки и осуществляет редуцирование труб до получения нужного диаметра и необходимой толщины стенки. Сразу же вслед за редукционным станом стоит калибровочный стан. Станы состоят из нескольких клетей. В нормальном режиме прокатка ведется непрерывно. Скорости входа и выхода трубы обратно пропорциональны входному и выходному сечению трубы и считаются постоянными. По выходе из калибровочного стана бесконечная труба режется на мерные длины. В ряде случаев имеют место отклонения режима работы редукцион ного и калибровочного станов от нормального. Может произойти разрыв трубы между клетями. Наиболее опасным местом в этом отношении является поперечный сварной шов на стыке двух рулонов штрипса. При обрыве трубы нарушается беспрерывная прокатка и появляется опасность застревания движущегося с большой скоростью переднего конца трубы в различных неровностях. В случае застревания и запутывания происходит авария и много металла уходит в брак, во-первых, потому, что запутыва ние не сразу замечают и значительное количество металла успевает накопиться, и, во-вторых, потому, что во всех случаях выбрасывается весь металл между местом запутывания и ножницами, установленными перед редукционным станом. Эти ножницы, собственно, и служат для ликвидации аварии — отрезают запутавшийся конец и делают возможным его удаление из стана. В дальнейшем — при начале прокатки в редукционном стане заново — прохождение переднего конца опять связано с опасностью запутывания. Таким образом, при всяком отклонении режима работы станов происходит некоторый перерыв в появлении готовых труб ня выходе из калибровочного стана. При формализации процесса работы редукционного и калибровочного станов могут быть использованы следующие параметры: V0 — скорость трубы при входе в первую клеть редукционного стана; 17к — скорость трубы при выходе из последней клети калибровочного стана; /\, — площадь сечения трубы при входе в первую клеть редукционного стана:
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 237 Ак — площадь сечения трубы при выходе из последней клетикалибро- вочного стана; /т — длина готовых труб после порезки; Т{ — моменты времени появления готовых труб у летучей пилы за калибровочным станом. Между этими параметрами существуют соотношения: VK: Ti+1- T _l_ т 1* ' vK • (11) Для обеспечения достаточно полного соответствия между формализованным и реальным процессами необходимо учесть ряд дополнительных факторов, характеризующих процесс работы: У шва — времена появления у входа в редукционный стан мест трубы со сварочным швом, соответствующим месту стыковки двух рулонов; рх — вероятность обрыва шва в редукционном и калибровочном станах; /(^оор)—закон распределения мест обрыва по длине станов; L — координату места обрыва шва (считая от входа в стан); /обр — величину потерь металла при обрыве (уходят впоследствии в брак); Гподх — момент подхода оборванного конца к пиле; р2—вероятность запутывания переднего конца трубы при прохождении через стан; /(Z/зап) — закон распределения мест запутывания по длине стана; /зап — величину потерь металла при запутывании. Для расчета величины потерь при запутывании необходимо также учитывать: F(L) — закон изменения площади сечения прокатываемой трубы по длине стана; / (At) — закон распределения интервалов времени между моментом запутывания и моментом начала исправления аварии; /(*пр) — закон распределения длительности простоев, необходимых для ликвидации последствий запутывания трубы; ^обр — момент времени обрыва шва; Гзап — момент времени запутывания переднего конца; Г„ач — момент времени окончания исправления последствий аварии и начала работы. Между упомянутыми параметрами имеют место соотношения: Ч)б]1 обр = т„ ' пап — * обр ~ *■ нач — J зап ~ /°пбр = 2./т; о ^зап vk ) F(L)dL> ■^обр А* + W, 'Г = -^-[>о-1''"о-Л*+ \ F(L)dL] О * подх — ■* I ьобр (12)
Расчет времена побхоба местстына Тшда Расчет вероятности обрыва а/ва (/7равер/га\ п фанта 1 обрыва "73 Расчет па закону распределения места обрыва Laffp Расчет момента обрыва гфоввругаУ фаша \0 запутывания в 17 Расчет поза/гону распре- беления условного мв- ста запутывания L3(m Лобсчет момента времени изготовления очередной, трубы W Расчет по золону распре\ беления времени At J5 /бровернс ] f фанта вторичносо\ запутывания А 14 Расчет па занону распределения места запутывания Расчет момента начала проиесса 71 12 13 Расчет величины потерь металла Расчет по занону распределения времени исправления Расчет момента времени запутывания Рис. 11. Блок-схема процесса функционирования редукционного и калибровочного станов.
МОДЕЛИРОВАНИЕ АВТОМАТИЗИРОВАННОЙ СВАРКИ ТРУБ 239 Приведенные выше факторы достаточно полно характеризуют работу редукционного и калибровочного станов как единого целого. Не исключена возможность, конечно, что в ряде случаев может оказаться целесообразной большая детализация отдельных узлов стана. Показателями качества работы редукционного и калибровочного станов считаются следующие величины: число полученных готовых труб; время простоев из-за нарушений процесса, общее и дифференцированное по причинам; величина потерь металла, общая и по различным причинам. Математическая модель процесса функционирования редукционного и калибровочного станов представлена на рис. 11. Оператор 1 — оператор расчета моментов времени подхода мест стыка двух рулонов к редукционному стану. Расчет ведется на основе данных, полученных при моделировании предшествующего участка. Для данного участка эти величины являются входными параметрами. Оператор 2 осуществляет проверку факта подхода (в данный момент времени) шва к стану. Если шов еще не подошел, управление передается оператору 17 для подсчета момента времени изготовления очередной трубы. В противном случае с помощью операторов 3 и 4 производится проверка факта обрыва шва. Если обрыва нет, то — передача оператору 17 для подсчета момента времени появления очередной трубы. Если же обрыв имеет место, то управление передается операторам 5, 6 для расчета места и момента времени обрыва. Затем операторы 7, 8, 9 проверяют факт запутывания переднего конца в случае обрыва. Особенность схемы взаимосвязей этих операторов заключается в том, что они учитывают условную вероятность запутывания при данном месте обрыва. Если запутывания нет — передача оператору 17, если есть, то управление передается операторам 10, 11, 12 для подсчета потерь времени и металла при аварии. Затем операторы 13 и 14 производят расчет моментов времени запутывания и начала процесса у ножниц после ликвидации последствий аварии. Логический оператор 15 проверяет, будет ли запутывание при прохождении переднего конца трубы через стан в случае, когда процесс начинается заново. Если нет, то управление передается оператору 17 для подсчета времени появления трубы у пилы, если да — то оператору 16 и далее опять оператору 10 и т. д. для определения места запутывания, потерь металла и времени. Авторы пользуются возможностью выразить благодарность Л.А. Лю- стернику (МГУ) А. И.Рыбкину, Н. И. Покровскому, А. М. Длину (Мос- облсовнархоз), И. И. Казакевичу и П. В. Бибикову (Электростальский завод тяжелого машиностроения) за помощь в организации работы и ряд ценных советов. ЛИТЕРАТУРА [1] Л я п у н о в А. А., О некоторых общих вопросах кибернетики, Сб. «Проблемы кибернетики», вып. 1, 1958. |2] Ляпунов А. А., О логических схемах программ, Сб. «Проблемы кибернетики», выи. 1, 1958. [3] X и н ч и н А. Я., Математические методы теории массового обслуживания, Тр. Матем. ин-та им. В. А. Стеклова, т. 49, изд-во АН СССР, 1955. [4] Бусленко Н. П., Решение задач теории массового обслуживания методом моделирования на электронных цифровых вычислительных машинах, Сб. «Проблемы передачи информации», вып. 9, изд-во АН СССР, 1961. |5] Бусленко Н. П., Ш р е й д е р Ю. А., Метод статистических испытаний (Монте- Карло) и его реализация на электронных цифровых машинах, Физматгиз, 1961.
240 Г. А. АЛИЕВ, И. П. БУСЛЕНКО, Г. II. КЛИЛОВ, А. 11. НАЗАРЕНКО (6] Алиев Г. А., и К л и мо в Г. П., Методика построения математической модели задачи теории массового обслуживания, Тр. ВЦ АН Азерб. ССР, вып. 1, 1962. [7] К л и м о в Г. П. и Ал и ев Г. А., Решение на вычислительных машинах некоторых задач теории массового обслуживания методом Монте-Карло, Вычислительная математика и математическая физика, 5, 1961, 1)33—935. |8] К л и м о в Г. П., Моделирование на электронных цифровых машинах некоторого класса систем массового обслуживания, Вычислительная математика и математическая физика, 5, 1961, 935—940. ■|9J Champernowne D. G., The construction of the decimals normal in the scale of ten, London. Math. Soc, 8, 1933, 254—260. • 10] Емельянснко П. Т., Шевченко А. А., Б о р и с о в С. И., Трубопрокатное и трубосварочное производство, Металлургиздат, 1954. В редакцию поступили первый вариант о V 1961, окончательный вариант 16 VI VM\2.
VII. ПРОЦЕССЫ УПРАВЛЕНИЯ В ЖИВЫХ ОРГАНИЗМАХ «ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ И ИХ БИОЛОГИЧЕСКОЕ ЗНАЧЕНИЕ Ж. А. МЕДВЕДЕВ (МОСКВА) 1. Введение. Краткие сведения о механизме репродукции нуклеиновых кислот и проблеме кодирования последовательности аминокислотных остатков при синтезе белка Общеизвестно, что при синтезе белков и нуклеиновых кислот должна воспроизводиться их специфичность, основным показателем которой является последовательность мономеров, из которых состоят полинуклеотид- ные и полипептидные цепи. Механизм воспроизведения нуклеиновых кислот, и прежде всего дезо- ксирибонуклеиновой кислоты (ДНК) *), изучен в настоящее время настолько точно, что синтез ДНК может быть осуществлен in vitro с воспроизведением специфичности, т. е. последовательности нуклеотидов, характерной для того или иного образца ДНК, взятого в качестве «затравки». Этот синтез происходит посредством образования дополнительной (комплементарной) полинуклеотидной цепи вдоль исходной, взятой в качестве «затравки». На рис. 1 приведена схема такого синтеза (Джосс, 1961). На схеме справа показана исходная полинуклео- тидная цепь, к поверхности которой, создаваемой азотными основаниями, образующие новую комплементарную полинуклеотидную цепь. Последовательность нуклеотидов в новой цепи предопределена затравочной цепью (матрицей) в результате химической комплементарности азотных оснований (тимин образует пару только с аденином и цитозин только с гуанином). Однако если новая цепочка будет взята в качестве затравки, то вдоль ее поверхности может образоваться лишь полинуклеотид, идентичный исходному. В клетках ДНК присутствует в форме двойного поливу клеотида, состоящего из свернутых в спираль двух комплементарных ^*£№ Рис. 1. Механизм "ферментативного синтеза ДНК (по Джоссу). пристраиваются нуклеотиды, \) Сокращения терминов: ДНК — дезоксирибонуклеиновая кислота, РНК — рибонуклеиновая кислота, А — адснин, Г — гуанин, Ц — цитозин, У — урацил, Т — тимин, АТФ — аденозинтрифосфориая кислота. 16 Проблемы кибернетики, вып. 9
242 Ж. А. МЕДВЕДЕВ цепочек. Репродукции ДНК предшествует раскручивание двойной спирали на одинарные полинуклеотиды. Рибонуклеиновая кислота (РНК) также представляет собой полину- клеотид такого же типа, но с заменой тимина на урацил и дезоксирибозы на рибозу. В настоящее время в большой серии работ, проведенных в 1960 — 1961 гг., показано, что РНК, выполняющая в клетках функции непосредственной «матрицы» для синтеза белка (так называемая РНК-переносчик информации или <<messenger»-PHK), образуется в клеточных ядрах под контролем ДНК (Бреннер, Жакоб и Мезельсон —Brenner, Jacob, Mesel- son, 1961; Гро, Хиатт и др. — Gros, Hiatt et al., 1961; Гро, Хиатт, 1961; Вейс, Накамото — Weiss, Nakamoto, 1961; Очоа, Бурма и др., 1961). Процесс образования этой РНК подобен синтезу, схема которого приведена на рис. 1, с той лишь разницей, что вместо дезоксирибонуклеотидов новая цепь формируется из рибонуклеотидов, причем к аденину «затравки» вместо тимина пристраивается урацил. Образовавшаяся таким образом РНК воспринимает «информацию», содержащуюся в ДНК, и переводит ее в более «деятельное» состояние. Эта РНК, образовавшаяся под контролем ДНК, в свою очередь контролирует синтез белков или, как образно говорят, она является матрицей синтеза белков. Все эти взаимосвязи, предполагавшиеся ранее лишь как теоретиче ски вероятные, в настоящее время экспериментально доказаны. РНК, образовавшаяся на поверхности ДНК и являющаяся матрицей синтеза белков («messenger»-PHK), составляет лишь часть клеточной РНК (несколько процентов). Большая часть клеточной РНК представлена другими формами РНК (sPHK или акцепторная, растворимая РНК и рибо- сомная, высокополимерная РНК), имеющими иные функции в синтезе белка. Функции РНК, образовавшейся в ядре («messenger»-PHK или, сокращенно, гаРНК),— это перенос генетической информации, содержащейся в ДНК, и преобразование этой информации в белковую форму. Выявление роли РНК и ДНК в синтезе белков уже давно послужило предпосылкой для гипотезы о том, что последовательность нуклеотидов может кодировать последовательность аминокислот, и математическая сторона этой проблемы кодирования (coding problem) была разработана в нескольких вариантах. Возможность экспериментальной проверки этих гипотез возникла в конце 1961 г., когда почти одновременно в двух лабораториях были найдены методы, позволяющие экспериментально сопоставлять последовательность нуклеотидов в составе РНК с последовательностью аминокислот в синтезируемых полипептидах (Ниренберг и Мэттей — Nirenberg, Matthaei, 1961; Ленгиел, Спейер и Очоа— Lenguel, Speyer, Ochoa, 1961). Это осуществлялось путем синтеза искусственных «матриц», полирибонуклеотидов известного суммарного состава, и использования их в системах синтеза белков вместо природных матриц. Работа в этом направлении пока только начата, однако и ее первые результаты представляют собой выдающееся достижение биохимии. С другой стороны, экспериментальное изучение проблемы кодирования синтеза белков полинуклеотидами РНК и ДНК стало также возможным благодаря исследованиям мутационных последствий изменений последовательности нуклеотидов в РНК вирусов и ДНК фагов, достигаемых физическими воздействиями на РНК и ДНК (Цугита и Френкель-Кон- рат — Tsugita, Fraenkel-Gonrat, 1960; Виттман, 1961; Крик, Бёрнет, Бреннер, Уотс-Тобин — Crick, Barnett, Brenner, Watts-Tobin, 1961). Изменяя нуклеиновые кислоты вирусов посредством мягких воздействий, приводящих к изменениям последовательности нуклеотидов в некоторых участках (например, путем превращения цитозина в урацил и аденина в гуанин под действием азотистой кислоты), и сопоставляя эти изменения
#ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 243 с изменениями последовательности аминокислот в белках, также удается выявлять характер кодирования последовательности аминокислот последовательностью нуклеотидов. Более подробно мы рассмотрим эти материалы в одном из последующих разделов. Здесь же следует отметить, что в результате этих исследований была экспериментально установлена трех- нуклеотидная природа кода, при котором три нуклеотида кодируют одну аминокислоту (ранее это было предсказано теоретически). Было также обнаружено, что почти все 64 возможные трехнуклеотидные комбинации имеют смысл, т. е. на каждую аминокислоту приходится несколько эквивалентных нуклеотидных сочетаний. Вопрос о наличии кодируемой генетической информации в составе нуклеиновых кислот уже не может оспариваться. Более того, сопоставление результатов, полученных в разных лабораториях и на разных объектах, показывает, что нуклеотидный код, по-видимому, универсален для различных представителей живого мира. Завершение работ этой серии и выявление «смысла» всех информативных сочетаний нуклеотидов, которые будут осуществлены, по-видимому, в ближайшие 1—2 года, явятся великим достижением биохимии и генетики, сравнимым по своим последствиям с экспериментальным расщеплением атомного ядра. Весьма серьезные успехи были достигнуты в последние годы и в изучении биохимических механизмов преобразования информации нуклеиновых кислот при синтезе белков, т. е. тех реальных биохимических реакций, которые обеспечивают образование из аминокислот полипептидной цепи, в которой последовательность аминокислотных остатков предопределяется последовательностью нуклеотидных остатков в РНК-матрице. Этот процесс довольно сложен — он обеспечивается многими факторами: избирательной активацией 20 аминокислот двадцатью особыми ферментами, образующими соединения аминокислот с адениловой группой АТФ, последующим переносом активированных аминокислот на особые акцепторы — молекулы низкомолекулярной растворимой РНК (бРНК). Присоединившись к концевой группе «РНК, аминокислотный остаток вместе с молекулой этой РНК «захватывается» особым ферментом переноса, приводящим свою «ношу» в контакт с матрицей — информативной РНК, расположенной на поверхности рибосом — мельчайших клеточных орга- нелл, простейших цитоплазматических структур, еще способных к осуществлению белкового синтеза. Существует несколько типов рибосом, но активными являются лишь так называемые димерные рибосомы с константой седиментации в ультрацентрифуге, равной 70S (TOS-рибосомы). Эти рибосомы состоят из двух обратимо ассоциированных более мелких 50S и ЗОЭ-рибосом, в пазу между которыми и формируется полипептидная цепь (Валлас, Сквайр, Цо — Wallace, Squires, Ts'o, 1961). Предполагается (но еще не доказано), что в составе молекул акцепторной sPHK имеются участки, комплементарные кодирующим триплетам матрицы, и это определяет установку аминокислот в полипептидной цепи в соответствии с информацией, содержащейся в матрицах. На рис. 2 и 3 мы попытались схематически показать процесс образования полипептидной цепи в соответствии с информацией матрицы при. взаимодействии основных участников этих реакций. Эта схема отличается большей сложностью от ряда аналогичных модельных схем, приводившихся нами ранее (Медведев, 1960, 1961а), чта связано с обнаружением ряда новых звеньев и особенностей белкового" синтеза. Несомненно, что весьма недалеко то время, когда эту гипотетическую схему можно будет заменить точной схемой, показывающей не только характер взаимодействия компонентов, но и характер полипептида в соответствии с последовательностью нуклеотидов в матричной РНК. 16*
244 Ж. А. МЕДВЕДЕВ Наиболее популярным и фактически обоснованным является в настоящее, время так называемый триплетныи неперекрывающийся код, соглас- , Фермент переноса I 0/г7верс/7шедля /7ОЛ1//УуЛУ7е0/77Ц&а Формиру/ощиися_ лолилелшс7 ,A/esse/7#er"-/?/M РШ-леренсс^лн- ЦН00рмаЦШ sPH/f Аншеная 70 S-риооссма Рис. 2. Гипотетическая модель взаимного расположения основных компонентов, взаимодействующих на заключительных этапах синтеза белка. Кодирующий * у/триллел? sPHX Фермент лереноса sP/Z/f А Кенаееея////А \ь\\Щ—. £к ^грулла sP///C Аминокислотные остатни .j-^ -Щу^ на fP///f пг|А|у|у|Ц|А|у|г1г1г1А1ШЛтак^^М Х+Матлиш Кодирующая нухлеолл/Яная ~ ^ /7елл?аднан чая ~^>/7е лоаледоёал7£лбнослкг Р//К-мал7раг/з/ и ель Рис. 3. Гипотетическая модель пяти возможных различных вариантов взаимодействия РНК-матрицы с системой переноса аминокислот, содержащей кодирующие триплеты, комплементарные соответствующим триплетам матрицы. но которому три рядом расположенных нуклеотида кодируют одну аминокислоту (рис. 3, 1-й и 2-й варианты). Однако то, что кодирующие одну аминокислоту нуклеотиды расположены рядом, пока не доказано. Большая длина растворимой. акцепторной РНК допускает предположение
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 245 о том, что кодирующие нуклеотиды расположены в разных участках, а остальная часть sPHK маскирована ферментом переноса. В этом случае код может быть перекрывающимся, и несмотря на это, изменение одного нуклеотида ведет к изменению позиции только одной аминокислоты, как это наблюдается при многих мутациях. Однако в настоящей статье мы хотели бы рассмотреть другую особенность этой системы, в общебиологическом плане, пожалуй, столь же важную, как и ее способность к воспроизведению специфичности и постоянства биологических структур. Мы имеем в виду так называемые «ошибки» репродукции биологических макромолекул. Теоретически невозможно представить такую систему воспроизведения специфичности полимеров, которая бы всегда действовала абсолютно точно и никогда бы не делала ошибок. Это правило характерно и для синтезов белков и нуклеиновых кислот. Определенная вариабельность любого синтеза представляет собой закономерную необходимость, и природа использовала эту необходимость для собственного развития, ибо естественный отбор, сортируя эти варианты, находил среди них такие, которые могли быть использованы для совершенствования живых систем. Понимание причин, порождающих «ошибки» синтезов, и особенностей синтетических систем, делающих эти ошибки возможными, имеет не только большое теоретическое, но и практическое значение. Накопление ошибок синтезов является, например, одной из причин постепенного старения организма, образования некоторых видов опухолей, увеличения или уменьшения патогенности вирусов и микроорганизмов. Ошибки мутационного характера являются исходным материалом для естественного и искусственного отбора. И, наконец, применение аналогов и антиметаболитов в медицине, земледелии и селекции основано на способности синтетических систем «ошибаться» и включать в циклы биохимических реакций измененные продукты. 2. «Ошибки» репродукции ДНК 1. Спонтанные «ошиб к и» синтеза ДНК. «Ошибки» репродукции ДНК, как правило, лежат в основе генетических мутаций, если они локализованы в генеративных клетках, и соматических мутаций, если они локализованы в клетках соматических тканей, особенно в период формообразования. Следует, по-видимому, особо выделить группу «скрытых» соматических мутаций в специализированных, сформированных тканях, так как эти мутации не приводят к формированию какой-либо измененной ткани, а подобны накоплению «шумов» в кибернетических системах, и они способствуют постепенной инактивации, «изнашиванию» всей биологической системы в целом. В отдельных случаях они приводят к возникновению злокачественных новообразований, а именно тогда, когда накопление изменений выводит клетку из-под контроля регулирующих систем (см. обзор Эфроимсона, 1961а). Мутации индивидуального гена в генеративных клетках возникают в среднем с частотой порядка 105—10е за одно поколение. Число генов у человека тоже лежит в пределах 105. Диплоидный набор хромосом человека равен 46, причем в каждой хромосоме имеется примерно 5000— 6000 молекул ДНК с молекулярным весом 5-Ю6—6-Ю6. Всего, таким образом, в каждой клетке человека имеется 2,3- 10б— 2,6- 10ь молекул ДНК. Если допустить, что каждая «ошибка» в репродукции ДНК ведет к мутации, то это означало бы, что при каждом делении клетки изменяется примерно 1 молекула ДНК. В действительности, однако, число «ошибок» репродукции ДНК выше, так как не все мутации
246 Ж. А. МЕДВЕДЕВ удается обнаружить и в связи с тем, что одной и той же аминокислоте может соответствовать несколько нуклеотидных сочетаний. Поэтому не всякое изменение последовательности нуклеотидов ведет к мутации. Таким образом, можно ориентировочно допустить, что на 20 000— 30 000 репродукций молекул ДНК возникает не более одной «ошибки». Это весьма высокая точность воспроизведения, если учесть, что молекулярный вес каждой молекулы ДНК равен примерно 6-10е, что соответствует 20 000 нуклеотидов в двойной цепи или 10 000 пар нуклеотидов. Поскольку репродукция молекул ДНК состоит из образования комплементарных пар нуклеотидов, то грубый расчет показывает, что одна, обеспечивающая изменение последовательности, пара (точечная мутация) возникает на 3-Ю8 комплементарных репродукций пар нуклеотидов. Такая высокая точность репродукции ДНК понятна,— ведь именно эта система сохраняет для миллионов последующих поколений наследственную информацию. Основную роль в сохранении информации в поколениях имеет, конечно, стабилизирующий отбор, однако даже отбор был бы бессилен сохранить вид неизменным в течение многих поколений, если бы частота «ошибок» репродукции ДНК была бы повышена сверх какого-то определенного предела. Факторы спонтанной изменчивости ДНК различны (образование выступов — узлов — в комплементарной цепи, окисление нуклеотидов, замещение, действие повреждающих агентов, например свободных радикалов, спонтанно образующихся в биологических системах, и т. д.). Менее вероятно спонтанное образование неверных пар, т. е. образование пар гуанина с тимином и т. д. Следует отметить, однако, что До- ноху и Трублад(Оопогше,ТгоеЫоос1,* 1960) попытались недавно показать, что, помимо обычных для ДНК комплементарных пар оснований А-Т, Т-А, Г-Ц, Ц-Г, могут существовать комплементарные пары и при других сочетаниях, например пара А-Г. Однако построения этих авторов имеют сугубо абстрактный характер и не опираются на какой-либо экспериментальный или фактический материал. Таким образом, очевидно, что система синтеза ДНК наиболее застрахована от спонтанной изменчивости, и именно поэтому она может обеспечивать сохранение и передачу из поколения в поколение наследственной информации. В «покое» ДНК существует в клетках в форме двойной спирали, активные группы которой замкнуты друг на друге по принципу комплементарного взаимодействия. Обмен ДНК при отсутствии митозов происходит в десятки раз слабее, чем обмен РНК и белков. Соответственно этому сама возможность случайной изменчивости ДНК снижена по сравнению с изменчивостью, например, РНК в несколько десятков раз. Следует, далее, учесть, что если под влиянием какого-либо фактора, хотя бы искусственного (например, повышенной радиации), произойдет изменение последовательности нуклеотидов в каких-либо молекулах ДНК, то соответственно этим изменениям будет изменена и информация, передаваемая к РНК и далее к белкам, в то время как обратной взаимозависимости изменений, по-видимому, не существует. 2. Эксперименатально индуцируемые «ошибки» репродукции ДНК. Существует много типов экспериментальных воздействий для индукции тех или иных изменений ДНК. Однако в первую очередь мы коснемся влияния на ДНК аналогов нуклеотидов, так как механизм их действия во многих случаях связан именно с возникновением «ошибок» синтеза. При многих других мутагенных воздействиях {радиация, алкилирующие агенты и т. д.) основой мутации является действие агента на сформированную предсуществующую полинуклеотид- ную цепь.
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 247 Спонтанное образование в цитоплазме и ядре небольших количеств различных аналогов нуклеотидов может иметь место и при нормальном метаболизме, в результате «ошибок» ферментативных реакций, действия свободных радикалов и т. д. Однако набор аналогов, испытываемых в экспериментальных условиях, значительно более широк, и это позволяет выявить среди них наиболее эффективные мутагены, ибо далеко не все аналоги обладают мутагенной активностью. Избирательность реакций при синтезе ДНК определяется пространственным совпадением активных групп азотных оснований нуклеотидов, реагирующих с образованием водородных связей. В связи с этим многие изменения других групп пуриновых и пиримидиновых оснований нуклеотидов не мешают существенно возможности включения полученного аналога в полинуклеотидную цепь, особенно если для введения в организм или в системы in vitro используется фосфорилированная форма аналога нуклеотида. Возможность включения в состав ДНК таких аналогов, как бромура- цил, йодурацил, хлорурацил, была показана в ряде лабораторий (Адлер, Леман и др. — Adler, Lehman et al., 1958; Дан, Смит,— Dunn, Smith, 1954; Заменгоф— Zamenhof, 1959; Zamenhof, Giovanni, Rich, 1956; Zamenhof, Rich, Giovanni, 1959). У бактерий Escherichia coli удавалось заместить бромурацилом почти 28% тимина ДНК (Заменгоф —Zamenhof, 1959). В то же время тиоурацил и тиотимин не обладали способностью включаться в состав ДНК. Последующее выращивание бактерий на обычной среде восстанавливало и нормальный состав ДНК, так как аналог не вызывал очень сильных изменений генетической конституции клетки и лишь усиливал мутационный процесс. В клетках млекопитающих, выращенных в культуре, удалось осуществить искусственную замену тимина на бромурацил почти на 80% (Хакала — Hakala, 1959). Однако во многих случаях аналоги оказывают сильное генетическое действие и нарушают функции ДНК (Фриш, Виссер — Frish, Visser, 1960). По данным Шапиро и Чаргаффа (Shapiro, Chargaff, 1960) бромурацил вызывал довольно значительные изменения в последовательности нуклеотидов бактериальной ДНК. К пониманию молекулярного механизма мутагенного действия аналогов биохимия в наибольшей степени приблизилась на уровне фагов — простейших живых существ, в составе которых имеется ДНК. Несколько лет назад Литман и Парди (Litman, Pardee, 1956) показали, что аналог тимина — 5-бромурацил может замещать тимин у фага Т-2 и что такая замена является весьма мутагенной для этого фага. Основываясь на этих данных, Бензер и Фриз (Benzer, Freese, 1958) •сравнили мутанты фага Т-4, индуцированные действием 5-бромурацила, с мутациями этого фага, возникающими спонтанно, путем анализа тонкой генетической структуры мутантов. Они обнаружили, что локализация бромурациловых мутаций является иной по сравнению со спонтанными мутациями. Анализ спонтанных мутаций показал, что они не являются рандомическими (в отношении локализации), а наиболее часто встречаются в определенных участках генетической системы (в так называемых горячих точках — hot spots). Бромурациловые мутации также были локализованы в каких-то ограниченных участках генетической системы. Обнаружение таких участков высокой мутабильности ДНК и возможность изучать мутации простейшей живой системы на уровне ее ДНК привлекли к себе большое внимание. Последующие работы этой лаборатории (Freese, 1959a, b, с; Фриз, 1961), в которых была сделана попытка вскрыть механизм мутагенного действия 5-бромурацила и некоторых других аналогов, представляют большой интерес. Испытав в этих опытах
248 Ж. А. МЕДВЕДЕВ довольно широкий спектр аналогов нуклеотидов, Фриз обнаружил, что наиболее эффективными мутагенами для фага Т-4 были: 5-бромурацил или 5-бромдезоксиуридин (аналоги тимина), 2-аминопурин (аналог аденина) и 2,6-диаминопурин. # Мутагенный эффект аналогов нуклеотидов сильно зависел от концентрации естественных субстратов синтеза ДНК. Заметный мутагенный эффект обнаруживался обычно лишь тогда, когда образование нормальных метаболитов было подавлено. Характер мутаций, их классификация, воспроизводимость, устойчивость и возможность «обращения» были очень детально изучены Фризом. Было установлено с помощью генетических карт, что мутации, вызванные бромурацилом и 2-аминопурином, локализованы в небольшой, но, по-видимому, общей области генома. Поскольку большинство этих мутаций было обратимо, Фриз предполагает, что они состояли в изменениях отдельных пар оснований ДНК. Установив ряд интересных закономерностей мутагенного процесса,-Фриз попытался расшифровать механизм мутагенного действия аналогов, опираясь при этом в основном на теоретические, «структурные» соображения. Воспроизведение последовательности нуклеотидов в составе ДНК определяется, как известно, структурной комплементарностью оснований, образованием пар аденина с тимином и гуанина с цитозином (или оксиметилцитозином у фагов группы Т-2, Т-4), связанных контактирующими активными группами с образованием водородных связей. Структурный анализ возможных комплементарных взаимодействий 5-бромурацила и 2-аминопурина показал, что эти аналоги комплементарны соответственно аденину и тимину, однако их комплементарность не столь узкая, как у нормальных нуклеотидов. Если бы дело состояло лишь в замещении того или иного нуклеотида его аналогом, то это не изменяло бы генетических свойств фага, так как в новом потомстве полинуклеотидных цепей исходная «материнская» последовательность нуклеотидов восстанавливалась бы полностью. Фактически так и происходило у 90% потомства фагов, у которых тимин был количественно заменен на 5-бромурацил. Они росли нормально и не обнаруживали никаких мутаций. Мутации возникали в результате «ошибок» в последовательности нуклеотидов дочерних полимеров, и наличие аналогов в матричной цепи способствовало более или менее определенному проценту этих «ошибок». В поисках структурных возможностей для возникновения этого увеличенного процента «ошибок» Фриз обратил внимание на допущение Уотсона и Крика (Watson, Crick, 1953a, b) о довольно редкой теоретической возможности «ошибок» воспроизведения дочерней цепи при таутомерном изменении аденина (в иминоформу), при котором он становится комплементарным с цитозином. В этом случае в дочерней цепи место, нормальна предназначенное для тимина, может быть замещено цитозином и таким образом может возникнуть устойчивое изменение последовательности нуклеотидов в дочерней и последующих цепях. Нечто аналогичное имеет место, по мнению Фриза, и при мутагенном действии 5-бромурацила и 2-аминопурина. Сильные электроотрицательные свойства брома (в сравнении с 5-метиловой группой тимина) увеличивают возможность образования таутомерной формы и, кроме того, потеря бромурацилом водородного атома в 1-й позиции также может служить причиной «ошибок» при образовании пар водородных связей. В результате этого, помимо комплементарности к аденину, 5-бромурацил может образовывать пары и с гуанином, вызывая, таким образом, изменение последовательности оснований, так как во втором поколении полину- клеотидов гуанин определяет позицию цитозина (или 5-оксиметилци- тозина).
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 249 Что же касается 2-аминопурина, то он, будучи в норме комплементарен с тимином, может взаимодействовать и с 5-оксиметилцитозином и, таким образом, также индуцировать устойчивое изменение последовательности нуклеотидов. На рис. 4 и 5 показаны химические модели таких «ошибок» в образовании комплементарных пар. Фриз указывает, что, по-видимому, следует различать два типа «ошибок» синтеза ДНК: «ошибки включения» и «ошибки в воспроизведении». В случае «ошибок включения» тот или иной аналог или нуклеотид Аденин 5-Фромурацнл (нормальная аминоформа) (нормальнаянагоформа) Гуанин 5-бромурацил (нормальная амоноформа) (резнаямольная форма) Рис. 4. Схема, демонстрирующая возможность образования двух типов комплементарных пар в случае включения 5-бромура- цила в полинуклеотидную цепь. &-Аминолуран Тимнн 8-Аминолурин Цшлоэин Рис. 5. Схема, демонстрирующая возможность образования двух типов комплементарных пар в случае включения 2-аминопурина в полинуклеотидную цепь. включается в неправильную позицию в предсуществующеи цепи и нарушает последовательность комплементарного участка в копиях. «Ошибки в воспроизведении» определяются особенностями процесса, рассмотренными выше. В работе Литмана и Парди (Litman, Pardee, 1960) независимо от Фриза был изучен механизм мутагенного действия 5-бромурацила на фаг Т-2. Авторы также попытались представить механизм мутагеннога действия этого аналога тимина на основе его двойной комплементарности (к аденину и к гуанину). Обсуждая здесь значение двойной комплементарной структуры ДНК в обеспечении устойчивости и репродукции, нельзя не отметить также, что по недавним расчетам (Pullman В., Pullman A., 1959) пара гуанина с цитозином является более строго подогнанной и, по-видимому, более точно воспроизводимой, чем пара тимин-аденин. Действие аналогов (эндогенных и искусственных) не является, конечна единственным фактором, вызывающим ошибки в воспроизведении ДНК. Хорошо известна мутагенность ионизирующей радиации, ультрафиолета
250 Ж. А. МЕДВЕДЕВ и ряда других воздействий на клетку. Обнаружен мутагенный эффект свободных радикалов, алкилирующих агентов и т. д. Однако по своему характеру эти мутации скорее представляют собой изменения предсуще- ствующэй генетической системы в большей степени, чем появление ошибок воспроизведения ее при процессах аутосинтеза ДНК. Изучение механизма, частоты и характера изменений ДНК до последнего времени привлекали к себе внимание главным образом генетиков. Однако эти явления имеют общебиологический интерес и могут быть использованы, как мы увидим в дальнейшем, и при обсуждении некоторых особенностей онтогенетического развития. 3. «Ошибки» репродукции РНК 1. Спонтанные «ошибки» в репродукции РНК. Изменчивость РНК в результате чисто спонтанных «ошибок» синтеза, несомненно, представляет собой более обычное явление, чем изменчивость ДНК. Во-первых, часть РНК получает, по-видимому, информацию от ДНК, и поэтому даже в том случае, если бы для РНК, кроме этого, не существовало бы никаких других форм изменчивости, то и тогда при синтезе РНК наблюдалось бы суммирование «ошибок» за счет повторения всех «ошибок» ДНК и «ошибок», возникающих при синтезе РНК под контролем ДНК. Кроме того, следует учесть, что синтез и обмен РНК осуществляются, например, в неделящихся ядрах в 50—100 раз активнее, чем обмен ДНК. РНК функционирует в клетках в форме одинарного полинуклеотида, отдельные фрагменты которого (особенно «узлы» вторичной структуры) более подвержены действию химических факторов. Ферментативный синтез РНК in vitro зависит от соотношений субстратов в среде. Это не доказывает, что аналогичная изменчивость, связанная с соотношением субстратов, имеет место in vivo, однако все же очевидно, что ограничивающие факторы, например, автономного синтеза РНК в цитоплазме не являются столь совершенными. Имеются данные, показывающие возможность линейного, удлинения (наращивания) молекул РНК in vivo. РНК выполняет в клетках весьма интенсивную функциональную «работу», связанную с перемещениями ее молекул (из хромосом в ядрышко, из ядрышка в цитоплазму), с временными взаимодействиями с растворимой РНК и более частым контактом с рибонуклеазой. Кроме того, цитоплазма клеток первой воспринимает различные физические и химические воздействия внешней среды, защищая ядро и активно выполняя буферную функцию. И, наконец, следует учесть, что в цитоплазме происходит значительно большее, чем в хромосомах, число разнообразных биохимических процессов, увеличивающих возможность боковых и неферментативных воздействий на обмен РНК. Трудно учесть, в какой степени все эти факторы увеличивают спонтанную изменчивость РНК, однако ясно, что эта изменчивость должна быть в десятки раз выше, чем изменчивость ДНК (в единицу времени). Однако, несмотря на столь большую возможную разницу в частоте «ошибок» синтеза и изменений предсуществующих молекул РНК и ДНК, обнаружение «ошибок» в строении РНК является значительно более трудным. «Ошибки» в синтезе РНК более часты, однако они временны, они лишь в очень ограниченном числе могут передаваться «по наследству» (при явлениях цитоплазматической наследственности), и каждое новое поколение начинает свое развитие от зиготы, которая содержит такой запас тинформации, на котором не отразилась существенно изменчивость РНК в онтогенезе предыдущего поколения.
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 251 «Ошибки» синтеза РНК неравнозначны и зависят от того, какие формы РНК оказываются в результате этого измененными. Недавно открытая особая форма РНК, так называемая тРНК или РНК-переносчик генетической информации («messenger»-PHK с молекулярным весом 300 000), обладающая особенно активным обновлением и образуемая под прямым контролем ДНК, является наиболее специфическим компонентом белково-синтезирующей системы. Изменения этой РНК оказывают непосредственное влияние на синтезируемый белок. Полимерная РНК рибосом (молекулярный вес 1 500 000), обладающая меньшей специфичностью и образуемая, очевидно, в результате аутосинтеза, несомненно, отличается минимальной стабильностью репродукции. Однако изменения, аккумулируемые этой РНК, до известных пределов могут, по-видимому, и не отражаться на молекулах синтезируемых белков. Растворимая РНК — акцептор аминокислот, так же как и гаРНК, выполняет свои функции в белковом синтезе благодаря особой специфичности строения и наличию определенной «информации», определяющей дифференциальное избирательное вз!аимодействие разных фракций этой РНК с аминокислотами и с разными участками матриц. Однако пока очень мало известно о механизмах синтеза растворимой РНК. 2. Экспериментально-индуцируемые «ошибки» репродукции РНК. Наглядным показателем возможной изменчивости РНК являются многочисленные факты включения в состав РНК различных нуклеотидных аналогов in vivo и in vitro. В ряде случаев (в опытах с бактериями) экспериментальное замещение обычных нуклеоти- дов РНК аналогами (например, 8-азагуанином или фторурацилом) достигало 25-40% (Горовиц и Чаргафф — Horowitz, Chargaff, 1959; Мендель — Mandel, 1957; Mandel, Altman, 1960). Литература, касающаяся включения десятков различных аналогов в синтез РНК, исключительно обширна, так как многие из этих веществ используются в антиопухолевой и антивирусной терапии. Естественно, что в данной работе нет необходимости в детальном обзоре всех этих материалов. Интересно лишь отметить, что весьма значительное включение 5-фтор- урацила в РНК вируса табачной мозаики, при котором аналог замещал от 28 до 47% урацила, входящего в эту РНК, не лишало вирус инфекционное™ и не изменяло соотношения оснований в потомстве такого вируса (Гордон, Стахелин — Gordon, Stachelin, 1959). Замещение урацила фторурацилом не оказывало также заметного мутагенного действия. Инфекционность вирусной РНК сохранялась также и при частичной замене урацила 2-тиоурацилом (Франки — Francki, 1960). Отмечено (Сантер, Теллер, Эндрюс — Santer, Teller, Andreus, 1960), что разные условия выращивания бактерий Е. coli вызывают изменения в соотношениях оснований в составе их РНК. Следует отметить и наблюдения, показывающие возможность синтеза нетипичной, функционально неактивной РНК в клетках, обработанных ингибитором белкового синтеза — хлорамфениколом (Эзекильд — Eze- kield, 1961). Интересные данные о возможности экспериментального синтеза в клетках особых функционально неактивных, инертных форм РНК были получены в недавних работах Менделя и Борека (Mandel, Borek, 1961a, b). Авторы обнаружили, что при помещении ауксотрофного мутанта Е. coli на среду, в которой отсутствовал метионин, клетки, несмотря на инги- бицию белкового синтеза, накапливали значительные количества РНК. Однако эта синтезированная в отсутствие белкового синтеза РНК не была
252 Ж. А. МЕДВЕДЕВ способна к осуществлению белкового синтеза даже после возвращения клеток к полноценному питанию. Эта РНК не была способна также поддерживать репликацию фаговых частиц. Наиболее заметной химической особенностью инертной РНК было отсутствие в ее составе дополнительных «необычных» нуклеозидов 2-метиладенозина, 6-1М-метиладенозина и тимин- рибозида, обычно присутствующих в небольшом количестве в составе РНК Е. coli. Однако весьма вероятно, что синтез растворимой РНК, которая в основном и аккумулирует эти необычные нуклеотиды, был подавлен ъ условиях метионинового голодания и именно это делало вновь синтезированную РНК неактивной. 4. Присутствие в составе РНК и ДНК небольших количеств «необычных» дополнительных нуклеотпдов и их возможная биологическая роль Классическая теория ауторепродукции нуклеиновых кислот основывается на идее комплементарности пар нуклеотидов, лежащей в основе модели ДНК Уотсона и Крика (Watson, Crick, 1953). Идея комплементарности теоретически применима и к случаю ауторепродукции РНК, и к явлению синтеза РНК на поверхности полинуклеотида ДНК. В своей классической форме принцип комплементарности был применен к -поли- нуклеотидным цепям, построенным из 4 нуклеотидов (с заменой тимина урацилом в случае РНК). Однако в последние годы в ряде лабораторий в составе РНК и ДНК были обнаружены небольшие количества так называемых дополнительных нуклеотидов, отличных по своему строению от аденилового, гуанилового, цитозилового, урацилового и тимилового рибо- и дезоксирибонуклеотидов, из которых в основном построены эти полимерные молекулы. Некоторые из этих дополнительных компонентов, как, например, 5-оксиметилцитозин, практически полностью замещают цитозин в составе ДНК некоторых фагов группы Т и таким образом выполняют в структуре молекул ДНК те же функции, которые у других объектов ложатся на цитозин. Однако в других случаях как количество, так и характер дополнительных компонентов нуклеиновых кислот свидетельствуют о их возможном особом значении в осуществлении биохимических функций нуклеиновых кислот. Содержание дополнительных нуклеотидов в составе нуклеиновых кислот подчиняется определенному правилу: наибольшее разнообразие этих компонентов обнаруживается в составе растворимой низкомолекулярной РНК, выполняющей функции переноса активированных аминокислот на матрицы белкового синтеза. Значительно меньший ассортимент и меньшие количества дополнительных нуклеотидов обнаружены в РНК рибосом и микросом и, особенно, в РНК вирусов, и лишь в редких случаях удавалось идентифицировать какой-либо из необычных компонентов в составе ДНК. Многие из первых сообщений (Кон—Cohn, 1957, 1960; Дэвис, Аллен — Davis, Allen, 1957; Литлфильд, Дан, Littlfield, Dunn, 1958; Дэвис, Кар- луцци, Роубейн — Davis, Carlucci, Roubein, 1959) о наличии в тотальной РНК ряда дополнительных нуклеотидов фактически были связаны с высоким содержанием этих нуклеотидов именно в растворимой фракции РНК. В составе растворимой низкомолекулярной РНК было обнаружено сравнительно высокое содержание метилцитозина, псевдоуридиловой кислоты, 5-рибозилурацила, 6-метиламинопурина, 1-метиладенина, 1-метил гуанина и тиминрибонуклеотида (Dunn, 1959, 1961; Дан 1961; Дан, Смит, Симпсон — Dunn, Smith, Simpson, 1960; Осава — Osawa, 1960a, b; Отака, Хотта, Осава — Otaka, Hotta, Osawa, 1959; Зингер, Кантони — Singei\ Cantoni, 1960; Кантони, 1961).
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 253 Количественные соотношения между нормальными и «дополнительными» нуклеотидами в растворимой РНК из клеток бактерии Е. colif приведенные в таблице 1, были определены недавно Даном, Смитом и Спааром (Dunn, Smith, Spahr, 1960). Таблица 1 Нуклеотидный состав растворимой РНК из Escherichia coli Моли на Юп молей суммы Адештп 20,3 Гуанин 32,1 Цитозин 28,9 Хранил 15,0 Иссидоурапил 2,1 Тпмипрпбонуклсюгид 1,1 2 мегнладепилоная кислота 0,3 6 метилами мои у рпновый рибонуклеотид .... 0,1 1-метнлгуанилоиая кислота 0,1 Имеются основания считать, что эти «примеси» не являются чем-то случайным, а связаны с функциями бРНК. Так, например, Осава и Отака (Osawa, Otaka, 1959; Osawa, 1960) расфракционировали растворимую РНК на пять компонентов, и тот из них, который содержал максимальное количество 5-рибозилуридина (псевдоуридина) (5,57%), обладал и максимальной способностью к акцептированию С14-лейцина. Этот результат заставил их предположить, что наличие в составе 6РНК «псевдоуридина» связано каким-то образом с акцепторной функцией, во всяком случае по отношению к С14-лейцину. Однако некоторые из этих компонентов обнаруживаются и в полимерных формах РНК из органоидов. Дан и Литлфильд (1958) обнаружили небольшие количества 6-метиламинопурина и 6-диме- тиламинопурина в РНК из микросом печени. В другой работе этой же лаборатории (Dunn, Smith, Simpson, 1960) микросомная фракция бактерий Е. coli была подвергнута дополнительному фракционированию. После этого анализу была подвергнута РНК из 708-рибосом, принимающих наиболее активное участие в синтезе белков (Тисьер, Шлессингер, Гро— Tissieres, Schlessinger, Gros, 1960). Авторы обнаружили, что 70S частицы были почти свободны от дополнительных нуклеотидов и содержали только 0,8 моля псевдоуридиловой кислоты на 100 молей уридиловой кислоты. Однако в рибосомах из клеток Neurospora содержание ряда добавочных нуклеотидов оказалось более отчетливым (Дан, 1961). И, наконец, следует отметить, что в составе ДНК пока не было обнаружено заметных количеств необычных дополнительных нуклеотидов, за исключением 6-метиламинопурина (Dunn, Smith, 1958), присутствующего в небольшом количестве в составе ДНК ряда мутантов Е. coli и в ДНК некоторых других объектов. Следует, однако, отметить, что в составе ДНК из многих источников и, особенно, из растений присутствует часто 5-метилцитозин, на долю которого приходится иногда от 0,2 до 6% суммы нуклеотидов ДНК. В недавних исследованиях Шапиро и Чаргаффа (Shapiro, Chargaff, 1960) были получены интересные данные о характере распределения этого нуклеотида в структуре ДНК зародышей риса. Поскольку именно сумма цитозина и 5-метилцитозина равна (в молярном выражении) содержанию гуанина в ДНК, то естественно предположить, что в двойной спиральной структуре этого полимера гуанин находится в парах не только с цитозином, но и с его производным, и таким образом, в том случае, если ресинтез новых полинуклеотидных цепей определяется только комплементарностью оснований, то замена цитозина на метил- .цитозин в ДНК должна быть рандомичной, т, е. однородной. В действи-
254 Ж. А. МЕДВЕДЕВ тельности же Шапиро и Чаргафф получили совершенно иные результаты* Разделив дробным осаждением ДНК зародышей риса на семь фракций, они обнаружили, что отношение цитозина к метилцитозину в составе этих фракций (ц/м) оказалось различным — от 2,50 до 3,36. Различными в этих фракциях были соотношения между суммой аденина и тимина, с одной стороны, и суммой гуанина и двух цитозинов, с другой (вариации от 1,09 до 1,47). Что же касается остальных показателей, то они точно соответствовали правилам комплементарности. Используя метод частичного расщепления препаратов ДНК, при котором в первую очередь расщепляются более лабильные межпуриновые связи, в то время как более прочные чисто пиримидиновые блоки остаются неповрежденными в форме так называемой апуриновой кислоты (около 2/3 всех пиримидинов остается в таких блоках), авторы определили молярные отношения тех пиримидинов, которые расположены в полинуклеотидах одиночно, т. е. соседями которых с двух сторон являются пуриновые основания. Характерно, что и в этом случае во всех семи фракциях ДНК распределение цитозина и метилцитозина было неодинаковым. В то время как от 12 до 22% от общего количества метилцитозина встречалось в форме одиночных вкраплений в пуриновые участки, лишь от 7 до 12% цитозина обнаруживало эту же особенность (для тимина соответствующие цифры колебались от 14 до 18%). Это также свидетельствовало, что метилцито- зин и цитозин не замещают друг друга в цепи и подчиняются индивидуальным закономерностям распределения, несмотря на то, что каждый из них образует, по-видимому, пары с гуанином противоположной цепи. Предположения, касающиеся возможной особой роли дополнительных нуклеотидов, пока весьма немногочисленны и осторожны. Литлфильд и Дан (Littlfield, Dunn, 1951) высказали предположение о том, что, находясь в составе матриц, «необычные» нуклеотиды могли бы кодировать положение «редких» аминокислот типа триптофана или цистеина, или же служить границей полимеризации аминокислот, обеспечивая необходимое окончание полипептидной цепи. Маркхем (Markham, 1958) считает, что метилированные компоненты спонтанно замещают обычные нуклеотиды просто потому, что они присутствуют в клетках, образуясь здесь для каких- либо иных целей. По мнению Крика (Crick, 1959), включение метилированных аналогов не должно влиять на характер кода, содержащегося в ДНК, так как метилированное основание образует пару с тем же основанием, которое может быть «подключено» и к обычному компоненту. Вполне естественно, что вопрос о роли дополнительных нуклеотидов нельзя решать одинаково для всех компонентов, ибо значение каждого из них может быть специфическим. Однако мы считаем возможным высказать предварительную гипотезу, которая, может быть, в какой-то степени подходит к оценке роли некоторых соединений этого типа. Учитывая мутагенный эффект некоторых нуклеотидных аналогов, связанный с индуцируемыми при их включении изменениями последовательности нуклеотидов (изменения информации), можно предположить, что некоторые «необычные» нуклеотиды и системы их синтеза представляют собой встроенный в организм фактор генерации эндогенных мутаций. Филогенетическое значение мутаций общеизвестно, однако аккумуляция соматических мутаций может регулировать и ряд онтогенетических процессов, способствуя, например, процессу накопления рандомических возрастных изменений. Старение представляет собой эволюционно необходимый признак, ибо оно обеспечивает смену поколений. В связи с этим не исключено, что совершенство процессов репродукции нуклеиновых кислот не «оттачивается» отбором до такой степени, когда оно может обеспечить, очень долгое сохранение живых структур во времени.
#0ШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 255 5. «Ошибки» биосинтеза белков При поверхностном анализе может казаться, что «ошибки» белкового синтеза являются во всяком случае более частыми, чем «ошибки» синтеза РНК, так как синтез белков происходит на матрицах, и, следовательно, он должен отражать все изменения, происходящие с матрицами. Кроме этого, в синтезе белков могут иметь место дополнительные источники отклонений, связанные с неточной активацией, неправильным присоединением растворимой РНК к матрице и т. д., которые дополняют число возможных отклонений синтезов белка, обусловленных изменениями матриц. Однако это только одна сторона возможной взаимосвязи между изменчивостью РНК и белка. Другая сторона этой взаимосвязи вскрывает противоположную стабилизирующую тенденцию, которая весьма затрудняет решение вопроса о сравнительной частоте изменений белков и РНК и даже может создавать предпосылки для редукции числа возможных изменений белков по сравнению с изменениями РНК. Главный из этих обратнодействующих факторов заключается, по-видимому, в том, что изменившиеся молекулы РНК могут в ряде случаев потерять одновременно с этим и свою способность служить матрицами белкового синтеза. О реальности этого фактора свидетельствуют, например, факты, показывающие, что включение в состав РНК ряда аналогов (например, 8-азагуанина) ингибирует синтез белка. Поскольку включение аминокислот в синтез белков определяется взаимодействием двух форм РНК (растворимой РНК и РНК-матрицы), имеющим, по-видимому, характер комплементарного взаимодействия, то молекулы растворимой РНК могут не взаимодействовать с изменившимися участками матриц. Однако если белки при своем синтезе и не повторяют всех «ошибок» своих матриц и адаптеров, то при их синтезе возможны другие дополнительные ошибки (неправильное взаимодействие с активирующим ферментом, неправильный перенос на РНК и др.). Эти «ошибки» имеют, несомненно, рандомический, рассеянный характер, и поскольку белковые молекулы не обладают способностью к аутосинтезу, то теоретически не должно происходить накопления таких «ошибок» до пределов, которые уже нарушали бы ту или иную биохимическую функцию. Однако практически накопление таких «ошибок» все же происходит в онтогенезе, так как белки и, особенно, стабильные белковые комплексы могут аккумулировать изменения независимо от матриц. В настоящее время имеется ряд факторов, показывающих возможность прямых экспериментальных и спонтанных изменений внутренней структуры белков и тех их признаков (аминокислотный состав), которые в норме зависят от свойств матриц. По-видимому, независимый от матриц случай неэквивалентной замены аминокислоты в белках мышц салаки отмечен недавно И. Н. Петренко и А. А. Карасиковой (1958). При созревании половых продуктов у рыб образуются белки, богатые аргинином. В основном этот аргинин поступал у самок из белков мышц, где его содержание падало с 9,9 до 4,5%. Напротив, у самцов при созревании содержание аргинина возрастало как в гонадах, так и в мышцах (с 3,7 до 7,5%). Некоторые сдвиги наблюдались и в содержании других аминокислот. Киси и Такэи (Kishi, Takei, 1957, 1959) провели недавно интересное исследование, показав, что содержание глицина, тирозина и треонина в столь специализированном белке, как фиброин шелка, зависело от возраста листьев тутовника, которыми выкармливали шелковичных червей. При выкармливании их молодыми листьями содержание глицина и тирозина было выше, а содержание треонина ниже, чем при использовании для
256 Ж. А. МЕДВЕДЕВ корма старых листьев. Добавление глицина к корму дугового шелкопряда также увеличивало содержание глицина в белке шелка. Имеется ряд наблюдений, показывающих, что и у растений аминокислотный состав белков может колебаться в определенных пределах в зависимости от условий питания. Анализу в этих случаях подвергались обычно тотальные белки, что не дает возможности судить о связи их с изменениями последовательности аминокислот. Однако в недавней работе Н. М. Сисакяна и Л. С. Маркосяна (1959) были обнаружены отчетливые изменения аминокислотного состава определенных белков зерна пшеницы (глиадина, альбумина и глобулина) в зависимости от условий выращивания растений. Различные синтезы белков, по-видимому, обладают разной точностью воспроизведения и некоторые из них отличаются очень большим процентом «ошибок». Боуден (Bawden, 1959) и Метьюс (Matthews, 1958) считают, что большое количество вирусного белка, остающегося в инфицированных клетках, и значительный процент неинфекционных вирусных частиц среди «потомства» вируса являются результатом «ошибок» вирусного синтеза. Между белковыми частицами и РНК вирусной частицы существует очень точная стерическая взаимосвязь, а использование «чужой» синтетической системы не обеспечивает, по-видимому, высокого выхода полноценных молекул. Спонтанные ошибки белкового синтеза можно разделить, по-видимому, на три группы: наследственные (мутационные), связанные с системой (ДНК —> РНК—> белок), онтогенетически устойчивые (ауторепродуци- руемая РНК—> белок) и обратимые эпизодические, зависящие от неточной работы синтетического конвейера, подающего аминокислоты на матрицы. Онтогенетически устойчивые и наследственные изменения синтеза белков в настоящее время подвергаются интенсивному изучению не только потому, что некоторые из них являются материалом для естественного отбора, но и в связи с тем, что некоторые из этих изменений являются причиной патологических изменений у людей и современная медицина очень часто сталкивается с явлениями молекулярной патологии. Изучение молекулярного уровня ряда болезней представляет в настоящее время одно из наиболее перспективных направлений медицинской химии. Естественно, что мы не может ставить своей целью сколько-нибудь полный обзор имеющихся в этой области фактов и ограничимся лишь отдельным примером. Бензер и Инграм с сотрудниками (Benzer, Ingram, Lehman, 1958; Hunt, Ingram, 1959, 1960, 1961; Ingram, Hunt, 1958) установили, что так называемая серповидноклеточная анемия и С-болезиь гемоглобина связаны с наследственно устойчивым изменением положения некоторых аминокислот в концевом участке гемоглобина. На рис. 6 показана последовательность аминокислот в концевой группе гемоглобина при этих патологических состояниях. ( А. Вал —Гис —Лей —Тре —Прол —Глю —Глю—Лиз — Гемоглобины | S. Вал —Гис —Лей —Тре —Прол —Вал —Глю —Лиз — I С. Вал —Гис —Лей—Тре —Прол —Лиз—Глю —Лиз- Рис. 6. Последовательность аминокислот в концевом фрагменте трех форм гемоглобина человека. А — пормальный; S — из клеток, измененных при серповидноклеточной анемии, С — гемоглобин при С-болезни. При этих патологических состояниях устойчиво изменено определенное аминокислотное звено большой молекулы гемоглобина, однако при полной замене нормального гемоглобина на S-гемоглобин наступает смерть
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 257 организма. Интересно отметить, что Хиллу и Швартцу (Hill, Schwartz, 1959; Hill, Swenson, Schwartz, 1960) удалось выделить из крови одного индивидуума особый G-гемоглобин, в котором в этой же позиции глютами- новая кислота была заменена на глицин. Такая вариабельность строго определенного звена гемоглобина, несомненно, не случайна, и она связана, по-видимому, с неустойчивостью какого-то детерминирующего участка генетических матриц. Работы Инграма с сотрудниками привлекли к молекулярной изменчивости гемоглобина широкое внимание. За сравнительно короткий срок были выявлены некоторые другие наследственные патологические изменения этого белка. В работе Браунитцера с сотрудниками (Braunitzer, Hilschman, Mailer, 1960) сравнение последовательности аминокислот с TV-конца у нормального и S-гемоглобина было продолжено до 28—30 аминокислот. При этом было обнаружено изменение и в 26-й позиции, причем оно опять касалось глютаминовой кислоты. В новой работе Хунт и Инграм (Hunt, Ingram, 1961) сравнили нормальный гемоглобин с патологической ^-формой, встречающейся в Южной Азии. Была обнаружена разница лишь в одном пептиде триптического гидролизата и опять в форме замены глютаминового остатка на лизин. Сопоставление этих фактов указывает на неустойчивость именно глютаминовой детерминанты. Изучение молекулярной изменчивости гемоглобинов осуществляется сейчас широким фронтом (см. обзор Эфроимсона, 19616) во многих лабораториях, и, кроме того, завершаются расшифровка последовательности аминокислот во всей молекуле этого белка и сопоставление ее с трехмерной моделью. Все это позволяет надеяться, что в недалеком будущем мы будем знать полную картину основных молекулярных изменений этого белка. Случай с гемоглобином интересен тем, что здесь была изучена точная связь патологического изменения с последовательностью аминокислот. В десятках других исследований также устанавливается появление в организме при различных патологических процессах (чаще всего в крови) каких-либо ненормальных белков, специфических по ряду признаков (электрофоретические свойства, молекулярный вес, аминокислотный состав). Весьма интересные случаи синтеза измененных белков обнаружены недавно в работах по экспериментальному мутагенезу вирусов. Особенно интересной оказалась в этих опытах возможность установления связи между изменениями последовательности азотных оснований в РНК при мутациях вируса под действием азотистой кислоты и изменениями последовательности аминокислот в вирусном белке, синтезируемом под действием этой РНК. Первые данные в этом направлении были получены Цуги- той и Френкель-Конратом (Tsugita, Fraenkel-Conrat, 1960). В их опыте белок мутанта, полученного от обработки только очищенной вирусной РНК, обнаружил отчетливые изменения аминокислотного состава. В нем произошла замена остатков пролина, аспарагиновой кислоты и треонина на остатки лейцина, аланина и серина. Это направление работ было расширено в исследованиях Виттмана (1961), сообщенных им, в частности, в докладе на 5-м Международном биохимическом конгрессе. Используя в качестве мутагенных воздействий на РНК вируса табачной мозаики (ВТМ) нитриты и азотистую кислоту, автор решил проследить, изменяется ли у мутантов последовательность аминокислот в белковых частицах, и таким образом установить прямую связь между изменением последовательности нуклеотидов и измененргем последовательности аминокислот. Виттману действительно удалось обнаружить изменения белков примерно у половины мутантов. Отсутствие видимых изменений в белках части 17 Проблемы кибернетики, вып. 9
258 Ж. А. МЕДВЕДЕВ мутантов автор пытается объяснить на основе предположения о том, что только часть РНК ВТМ содержит информацию, касающуюся синтеза белковых субъединиц. Виттман предполагает, что изменение вирусного белка оказывается возможным только в том случае, когда спонтанное или вызванное химическим воздействием превращение нуклеотидов локализовано в той части молекулы РНК, которая содержит информацию для синтеза белка. Если это превращение нуклеотидов оказывается вне «гена», тогда возникают изменения, которые ведут только к изменению внешних признаков заражения, а вирусный белок остается неизменным. Этот «ген», следовательно, образован не всеми 6500 нуклеотидами, составляющими нить РНК. Размер этой генной области может быть рассчитан, по мнению Витт- мана, исходя из числа превращений оснований на одну молекулу РНК» вызванных обработкой нитритом (что можно определить экспериментально), и числа измененных аминокислот у соответствующего мутанта. Когда размер этой области будет известен, окажется возможным определить, сколько в среднем нуклеотидов кодируют одну аминокислоту в белке ВТМ. В недавней работе Очоа с сотрудниками (Speyer, Lengyel, Basilio, Ochoa, 1962) материалы, касающиеся корреляций изменчивости нуклеотидов РНК вируса табачной мозаики с изменениями последовательности аминокислот белкового компонента вируса, были обобщены в форме весьма показательной таблицы. Большая часть данных этой таблицы была составлена Очоа с сотрудниками на основании первоначальных сообщений и к тому времени еще неопубликованных данных, и поэтому авторы этих наблюдений (третий столбец) приводятся нами без ссылок на соответствующую публикацию. Таблица 2 Замещения аминокислот в НТО2-мутаптах вируса табачной мозаики Замещение Число наблюдений Автор Изменение последовательности нуклеотидов асп* - асп* - асп - арг - глю - глю*- глю - глю*- илей- лей - про - про - сер - сер - тре - тре - тре - тир - ► сер у ала ► гли ► ЛИЗ ► гли ► гли ► гли ►iV-вал >вал >вал >фал >лей >сер >лей ► фал ► сер ► илей ► мет ^фал 4 6 2 1 5 1 2 1 2 1 1 2 3 1 3 1 7 3 1 Цугита, Френкель-Кон- рат Виттман—Цугита, Виттман Виттман Цугита Цугита Цугита Виттман Цугита Виттман Виттман Виттман Цугита, Виттман Виттман Виттман Цугита, Виттман Цугита Виттман Виттман Цугита УАГ, УАА (УАЦ) _* УУЦ УАЦ -> УГЦ УАГ -^ УГГ УАГ -* УАА УЦГ -* УГГ УАГ ._* УГГ УАГ -^ УГГ (УЦГ)-*УУГ (УЦГ) _» УУГ УУА-^УУГ УУЦ __^ УУУ УЦЦ -^ УУЦ УЦЦ-^УУЦ УУЦ _» УУЦ (УУА, УУ6) УУЦ -^ УУУ УЦЦ-^ УУЦ УАЦ -* УАУ УАЩУЦЦ)_>УАГ| УУА-> УУУ асп* — аспарагиновая кислота или аспарагин, глю*—глютаминовая кислота или глютамин.
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 259 Эпизодические рандомические «ошибки» синтеза белка могут возникать в результате неровной работы всех ступеней белкового синтеза. Теоретически они обратимы, и в онтогенезе вряд ли происходит отчетливое накопление таких «ошибок». Однако несомненно, что способность к возникновению таких «ошибок» может ослабевать или усиливаться в зависимости от многих внутренних и внешних факторов. Типичным случаем таких «ошибок» является, например, возможность взаимодействия того или иного специфического активирующего фермента с какой-либо необычной для него аминокислотой. В недавней интересной работе Уонга и Мол- дайва (Wong, Moldave, 1960) было, например, обнаружено, что очищенный триптофанактивирующий фермент может в небольшом проценте взаимодействовать с глицинаденилатом и переносить глициновый остаток на растворимую РНК. Такие «ошибки» могут «исправляться» на последующих стадиях синтеза, но могут, по-видимому, проходить незамеченными и вызывать рандомические изменения последовательности аминокислот у некоторой части белковых молекул. Интересный случай изменения белка описан недавно в работе Шапира с сотрудниками (chapira, Dreyfus et al., 1961). Авторы наблюдали превращение глицина в серии и фенилаланина в тирозин после их включения в глобин. Авторы предполагают, что это превращение происходит путем локальной замены аминокислот. При обмене аминокислот также, по-видимому, могут спонтанно возникать аналоги нормальных соединений и d-формы (Буланже и Осте — Boulanger, Osteux, 1960). Кроме того, извне с пищей в организм может поступать в небольших количествах очень широкий спектр «необычных» аминокислот, присутствующих в разных видах растений, в бактериях и грибах, особенно в свободной фракции. Многочисленные эксперименты с аналогами аминокислот показывают, что некоторые из них могут включаться в синтез белка, и поэтому такое же включение может иметь место и по отношению к некоторым экзогенным аналогам. Особенно обширный интересный материал, касающийся «ошибок» синтетических систем, получен в результате испытаний различных аналогов аминокислот (этионина, тиэнилаланина, селенметионина, фторфенил- аланина, 5-метилтриптофана, азатриптофана и ряда других). Во многих случаях подобные аналоги ингибируют синтез белков, однако в ряде случаев они включаются в синтезируемые белки, изменяя формируемые молекулы (Baker, Johnson, Fox, 1958; Cohen, Cowie, 1957; Cohen, Munier, 1959; Gros, Tarver, 1955; Hancock, 1960; Munier, 1959; Rabinovitz, McGrath, 1959; Pardee, Prestidge, 1958; Richmond, 1959; Sidransky, Farber, 1956; Yoshida, 1958 и др.). Во многих из этих исследований белки, содержащие тот или иной аналог, были действительно выделены и изучены. Весьма интересно, что в ряде случаев это замещение не сопровождается потерей белком его биологической активности. Так, например, при частичном замещении в амилазе из Bacillus subtilis метионина на этионин и фенилаланина на фторфенил- аланин фермент не теряет своих специфических свойств (Йошида — Yoshida, 1958, 1960; Yoshida, Yamasaki, 1959). При этом было показано, что этионин и фторфенилаланин действительно замещали метионин и фенил- аланин в полипептидной цепи. В работе Мюнье (Munier, 1959) была обнаружена почти полная замена фенилаланина фторфенилаланином в белках Е. coli, которая тем не менее сохраняла способность бактерий к замедленному росту. В другой работе Мюнье (Munier, 1960) наблюдал полное замещение фенилаланина фторфенилаланином или |5-2-тиэнилаланином в щелочной фосфатазе этого белка. Новое интересное направление в изучении экспериментальной изменчивости белков возникло недавно в результате i7*
260 Ж. А. МЕДВЕДЕВ серии работ двух лабораторий (Хамерс, Хамерс-Кастерман — Hamers, Hamers-Casterman, 1959, 1961; Наоно, Гро — Naono, Gros, 1960; Буссард, Наоно и др.— Bussard, Naono et al., 1960; Gros, Naono, 1961). В этих опытах изучалось влияние изменения РНК с помощью нуклеотидных аналогов (тиоурацила, азагуанина и др.) на синтезируемые клетками белки. В ряде случаев измененная РНК продуцировала энзиматические белки с резко измененной ферментативной активностью (дефективные белки). В недавней работе Наоно и Гроса (Naono, Gros, 1960) было показано, что фторурацил, включаясь в РНК, тормозил включение пролина и тирозина в молекулы фосфатазы. Попытки теоретического математического расчета точности белкового синтеза были предприняты Пэлингом (1959) и Пасын- ским (1960). Оба автора рассчитывают разные уровни допустимых «ошибок». Однакр авторы анализируют синтез белка как одноступенчатый процесс, и поэтому их расчеты могут быть применены лишь к взаимодействиям типа: аминокислота+фермент активации.. 6. Заключение. Биологическое значение «ошибок» репродукции биополимеров Интерес к изучению «ошибок» репродукции биологических полимеров непрерывно растет, и это вполне понятно. От изучения этого аспекта биосинтеза нуклеиновых кислот и белков существенно зависит решение ряда важнейших теоретических и практических проблем и прежде всего таких, как понимание закономерностей эволюции на основе мутаций, выявление эффективных мутагенов, проблема канцерогенеза и отбор наиболее эффективных ингибиторов белкового и нуклеинового обмена, используемых в антивирусной и антиопухолевой терапии, выявление природы большого числа патологических состояний и ряда наследственных болезней и т. д. Эти проблемы, связанные с возникновением и накоплением «ошибок» синтезов РНК, ДНК и белков, интенсивно разрабатываются в настоящее время, и прогресс в этой области одновременно создает хорошие предпосылки и для выяснения общих закономерностей и механизмов синтеза белков и нуклеиновых кислот. Нам хотелось бы обратить внимание и на то, что некоторые проблемы онтогенеза, и в первую очередь проблема старения, тесно связаны с явлениями накопления «ошибок» репродукции клеток, органелл и, особенно, полимерных молекул. На этот аспект проблемы старения мы уже обращали внимание в специальной статье (Медведев, 19616). Особенность процессов медленного старения заключается в том, что он аккумулирует все виды и формы рандомических изменений молекулярных систем и процессов и является в связи с этим хорошзй биологической моделью постепенной потери информации кибернетической системой в связи с накоплением «шумов». Реакции воспроизведения полимеров отличаются высокой, но не абсолютной степенью точности. Это же можно сказать и про многие, если не все, другие биохимические, линейные и циклические комплексы реакций,— абсолютная точность и здесь, по-видимому, невозможна. Наряду с тем или иным определенным конечным продуктом возможны, хотя и на минимальном уровне, некоторые отклонения в результате «боковых» и неферментативных взаимодействий, под действием эндогенной и экзогенной радиации, под действием свободных радикалов, всегда присутствующих в биологических системах, несогласованности отдельных реакций и т. д. Точность выхода того или иного биохимического продукта является результатом отбора и длительной эволюции от меньшей точности к большей точности. Естественно, что процесс совершенствования реакций
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 261 прекращается, как только прекращается отбор в этом направлении, как только большее совершенство становится эволюционно невыгодным. И поскольку суммирование всех гтих неточностей и «ошибок» лежит в основе старения, то прекращение отбора на точность репродукции прекращается при достижении максимальной целесообразности той или иной продолжительности жизни вида. Именно поэтому развитие приспособлений, обеспечивающих постоянство живой организации на всех уровнях ее сложности, никогда в естественных условиях не доходит до идеального совершенства. Экспериментальное увеличение совершенства процессов молекулярной и надмолекулярной репродукции теоретически, конечно, возможно, однако оно может быть лишь результатом очень длительной и широко организованной исследовательской работы. Однако значение исследований ошибок репродукции биологических макромолекул не ограничивается выявлением биохимической основы филогенетических и онтогенетических изменений. Как мы видели, именно это направление исследований в работах с вирусами и фагами впервые подвело биохимию и генетику к расшифровке генетического кода нуклеиновых кислот, к фундаментальнейшей проблеме биологии, решение которой еще недавно казалось делом далекого будущего. ЛИТЕРАТУРА Дорфман В. А., 1958. Белок как основа эмбрионального формообразования, Успехи совр. биол. 45, 3, 313—327. Медведев Ж. А., 1960. Роль растворимой РНК в промежуточных реакциях белкового синтеза и ее связь с ферментативными системами активации аминокислот, Успехи совр. биол. 50, 2, 121—135; 1961а. Воспроизведение и перенос информации при синтезе биологических макромолекул, Журн. Всесоюзн. химич. о-ва им. Д. И. Менделеева 6, 3, 268—275; 19616. Старение организма на молекулярном уровне, Успехи совр. биол. 51, 3, 299—316. Пасы некий А. Г., 1960. О роли матричных структур в явлениях воспроизведения, Биофизика 5, 1, 16—20. Петренко И. И., К а р а с и к о в а А. А., 1958. Аминокислотный состав белков в процессе созревания половых продуктов у салаки Рижского залива, Докл. АН СССР 122, 6, 1071 — 1072. П о л и н г «П., 1959. Природа сил, действующих в процессе удвоения молекул в живом организме, Сб. трудов Междунар. симпозиума «Возникновение жизни на земле», изд. АН СССР, 222—23J. Сисакян Н. М., Маркосян Л. С, 1959. Аминокислотный состав белков зерна пшеницы, Биохимия 24, 6, 1094—11СЗ. Эфроимсон В. П., 1961а. Анализ управляющих механизмов канцерогенеза, Сб. «Проблемы кибернетики», вып. 5, Физматгиз, 217—243; 19616. Управляющие механизмы возникновения антител в свете данных генетики иммунитета и биохимии аномальных гемоглобинов человека, Сб. «Проблемы кибернетики», вып. 6, Физматгиз, 161—181. Ad 1 е г L., L ehm a n L. et al., 1958. Enzymatic synthesis of DNA. 4, Proc. Nat. Acad. Sci. 44, 7, 640—647. A d 1 e г M., W e i s s m a n В., Gutman A., 1958. Occurence of methylated purine bases in yeast RNA, J. biol. chem. 230, 2, 717—723. Baker R.,John son J., Fox S., 1958. Incorporation of p-fluorophanylalanine into proteins of Lactobacillus arabinosus, Bioch. Bioph. acta 28, 318—327. Bawden F. C, 1959. Viruses Retrospect and prospect, Proc. Roy. Soc. Ser. B151, 943, 157—168. В e n z e г S.,Freese E., 1958. Proc. Nat. Acad. Sci. 44, 112. Benzer S., Ingram V., Lehman H., 1958. Three varieties of human haemoglobin D, Nature 182, 4639, 852—854. Boulanger P., Osteux R., 1960. Le probleme de la formation de D-aminoaci- des dans les tissus sains et cancereux, Acta Unio internat. contra cancrum. 16, 5, 1044-1049. Braunitzer G.,Hilschmann N.,Muller R., 1960. Ober den Ort des spezi- fischen Auslausches von Aminosauren in der 5-Kette bei pathclogischen menschlichen Hamoglobinen, Hoppe—Beyler's Z. physiol. Chemie 318, 3—6, 234—237. Brenner S., Jacob F., Meselson M., 1961. An unstable intermediate carrying information from genes to ribosomes for protein synthesis, Nature 190, 4776, 576—581.
262 Ж. А. МЕДВЕДЕВ Bussard A., NaonoSh., GrosF., Monod J., 1960. Effetsd'un analogue de l'uracile sur les proprietes d'une proteine enzymatique synthetisee en sa presence, С. г. Acad. Sci. 250, 24, 4049—4051. К a h т о н и Г., 1961. Изучение Р—РНК из печени кролика, Реф. секц. сообщ. 5-го Междунар. биохим. конгресса, секция 3. Cohen G.,Cowie D., 1957. Replacement total de la methionine рдг la selenomethionine dans les proteines de E. coli, С. г. Acad. Sci. 244, 5, 680—683. Cohen G., M u n i e г R., 1959. Bioch. Bioph. acta 31, 2, 347—356. С о h n W. E., 1957. Feder. Proc. 16, 166; 1960. Pseudouridine a carbon—carbon linked ribonucleoside in RNA, Biol. chem. 235, 5, 1488—1498. Crick F. H. C, 1959. The present position of the coding problem, In «Brookhaven Symposia in Biol.» 12, 35—39. Crick F. H. C, Barnett L., В г e n n e г S., W a t t s-T о b i n R., 1961. General nature of the genetic code for proteins, Nature 192, 4809, 1227—1231. Davis F. F., A 1 1 e n F., 1957. J. biol. Chem. 227, 907. Davis F. F., С а г 1 u с с i A. F., R о u b e i n I. F., 1959. Trace nucleotides in certain ribonucleic acids from yeast, J. biol. Chem. 234, 6, 1525—1531. Donohue J., Trueblood K., 1960. Base pairing in DNA, J. molec. Biol. 2, 6, 331—363. Dunn D. В., 1959. Additional components in RNA of rat liver fractions, Bioch. Bioph. acta 34, 1, 286—237; 1961. The occurence of 1-methyladenine in RNA, Bioch. Bioph. acta 46, 1, 198—200. Дани Д., 1961. Добавочные компоненты в растворимой РНК и во фракциях структурных элементов клетки, Реф. секц. сообщ. 5-го Междунар. биохим. конгресса, секция 3. Dunn D. В., S m i t h J., 1954. Nature 174, 305; 1958. Biochem. J. 68, 627. Dunn D. В., S m i t h J. D., S i m p s о n M. V., 1960. The distribution of additional components in RNA from particulate and soluble fractions of cells, Biochem. J. 76, 2, 24. Dunn D. В., Smith J., Spahr F., 1960. Nucleotide composition of soluble RNA from E. coli, J. Molec. Biol. 2, 113—117. E z e k i e 1 d D., 1961. IncreaseinRNA in the bacterial chromatin body during chloramphenicol treatment, Bacteriol. 81, 2, 319—326. Francki R. J. В., 1960. Infect ivity of RNA from tobacco mosaic virus containing 2-thiouracil, Virology 10, 3, 374—376. F r e e s e E., 1959a. The specific mutagenic effect of base analogues on phague T-4, J. Molec. Biol. 1, 2, 87—105; 1959b. On the molecular explanation of spontaneous and induced mutations. In «Brookhaven Symposia in Biol.» 12, 63—75; 1959c. The difference between spontaneous and base-analogue induced mutations of phage T-4, Proc. Nat. Acad. Sci. 45, 4, 622—633. Фриз Э., 1961. Молекулярный механизм мутаций. Симпозиум 1, 5-го Международного биохимического конгресса. F г i s h D. M., V i s s er D. W., 1960. Synthesis of protein and DNA in E. coli treated with 5-bromodeoxyurudine, Bioch. Bioph. acta 43, 2, 546—548. Gordon M. P., S tacheli n M., 1959. Studies on the incorporation of 5-fluoroura- cil into virus nucleic acid, Bioch. Bioph. acta 36, 2, 351—361. Gros F., H i a 11 H. et al., 1961. Unstable RNA revealed by pulse labelling of E. coli, Nature 190, 581—585. Гро Ф., Хиатт X., 1961. Метаболические свойства РНК-«посредника» Е. coli, Симпозиум 1, 5-го Международного биохимического конгресса. Gros F., NaonoSh., 1961. Bacterial synthesis of «modified» enzymes in the presence of a pyrimidine analogue, In «Symp. on Protein Biosynthesis». Gros D., T a r v e r H., 1955. Studies on ethionine, J. biol. Chem. 217, 1, 169—182. H a k a 1 a M. Т., 1959. Mode of action of 5-bromodeoxyuridine on mammalian cells in culture, J. biol. Chem. 234, 12, 3072—3076. Hamers R.,Hamers-Casterman C, 1959. Synthesis by E. coli of a f-galacto- sidase-like protein under the influence of thiouracil, Bioch. Bioph. acta 35, 269—271. Hamers R.,Hamer s-C asterman C, 1961. Synthesis by E. coli of an abnormal P-galactosidase in the presence of thiouracil, J. molec. Biol. 3, 166—174. Hancock R., 1960. Accumulation of pool aminoacids in Staph, aureus following inhibition of protein synthesis, Bioch. Bioph. acta 37, 1, 47—55. Hill R., Schwartz H., 1959. A chemical abnormality in haemoglobin G, Nature 184, 4684, 641—64 2. Hill R., Swenson R., Schwartz H., 1960. Characterization of a chemical abnormality in haemoglobin G, J. biol. chem. 235, 11, 3182—3187. Horowitz J., Chargaff E., 1959. Massive incorporation of 5-fluorouracil into a bacterial RNA, Nature 184, 4694, 1213—1215. Hunt J. A., Ingram V. N., 1959. A terminal peptide sequence of humen haemoglobin, Nature 184, 640—641; 1960. Abnormal human haemoglobins, Bioch. Bioph.
«ОШИБКИ» РЕПРОДУКЦИИ НУКЛЕИНОВЫХ КИСЛОТ И БЕЛКОВ 263 acta 42, 3, 409-—421; 1961. Abnormal human haemoglobins, Bioch. Bioph. acta 49, 3, 520—533. Ingram V. N., 1958. Scient. Amer. 198, 68. { n g r a m V. N., H u n t J., 1958. Nature 181, 1062. Д ж о с с Дж., 1961. Исследования механизма синтеза ДНК. Симпозиум 1, 5-го Международного биохимического конгресса. К. i s h i Y., T a k e i Т., 1957. J. Agric. Chem. Soc. Japan 31, 7, 504—506; 1959. Bull. Fac. Text. Fibers. Kyoto Univ. 2, 3, 354—361 (на японск. яз. см. Реф. журн. «Биологическая химия», 1958, реф. № 16783 и 1961. Реф. № 5С780.) Lengyel P., Speyer J., О с h о a S., 1961. Synthetic polynucleotides and the amino acid code, Proc. Nat. Acad. Sci. 47, 12, 1936—1942. Litman R. M., P a r d e e А. В., 1956. Nature 178, 529; 1960. The induction of mutants of bacteriophage T-2 by 5-bromouracil, Bioch. Bioph. acta 42, 1, 117—130; 131—140. Littlfield J.W.,DunnD. В., 1958. The occurence and distribution of thyamine and three methylated adenine bases in RNA from different sources, Biochem. J. 70, 4, 642—651. M and el H. G., 1957. Incorporation of 8-azaguanine and growth inhibition in Bacillus cereus, J. biol. Chem. 225, 1, 137—150. Mandel H. G., A 1 t m a n R., 1960. The depression of the incorporation of sulfur amino-acids into Вас. cereus by 8-azaguanine, J. biol. Chem. 235, 7, 2029—2035. Mandel L., Borek E., 1961a. Alteration in RNA structure produced by methionine deprivation, Feder. Proc. 20, 1, 357; 1961b. Variability in the structure of RNA, Bioch. Bioph. Res. Comm. 4, 1, 14—18. Markham R., 1958. Symposium Soc. Gener. Microb. 8, 163. Matthews R. E. F., 1958. Studies on the relation between protein and nucleoprotein particles in turnip yellow mosaic virus infections, Virology 5, 192—205. M u n i e r R. L., 1959. Substitution totale de la phenylalanine par la m-fluorophenylala- nine dans les proteins d'Escherichia coli, С. г. Acad. Sci. 248, 12, 1870—1873; 1960. Ibid. 250, 21, 3524—3526. N а о n о Sh., G г о s Т., 1960. Synthese par E. coli d'une phosphatasemodifiее en presence d'un analogue pyromidique, С. г. Acad. Sci. 250, 23, 3889—3891. Mirenberg M., Matthaei J. H., 1961. The dependence of cell-free protein synthesis in E. coli upon naturally occuring or synthetic polyribonucleotides, Proc. Nat. Acad. Sci. 47, 10, 1588—1602. Q ч о а С, Б у р м а Д., К р е г е р Г., В е й л л Д., 1961. Стимулируемое ДНК ферментативное включение иуклеотидов из нуклеозидтрифосфатов в РНК, Симпозиум 1, 5-го Международного биохимического конгресса. О saw a S., 1960a. The nucleotide composition of RNA from subcellular components of yeast, E. coli and rat liver, Bioch. Bioph. acta 42, 2, 244, 254; 1960b. Preparation and some properties of a soluble RNA from yeast, Bioch. Bioph. acta 43, 1, 110—126. О s a w a S., Otaka E., 1959. The relation between the ability of binding an amino acid and the 5-ribosyluridine nucleotide content of the RNA, Bioch. Bioph. acta 36, 2. 549—551. О t a k a E., H о t t a I., O s a w a S., 1959. Occurrence of the fifth nucleotide in soluble RNA in yeast, Bioch. Bioph. acta-35, 1, 266—267. , PardeeA. В., Prestidge L. S., 1958. Effect of azatriprophan on bacterial enzyme and bacteriophage, Bioch. Bioph. acta 27, ЗЗЭ—334. Pullman В., Pullman A., 1959. The electronic structure of purine-pyrimidine pairs of RNA, Bioch. Bioph. acta 36, 2, 343—350. RabinovitzM.,McGrath H., 1959. Protein synthesis by rabbit reticulocytes, J. biol. Chem. 234, 8, 2091-2)95. Richmond M. H., 1959. Incorporation of caravanine by St. aureus, Biochem. J. 73, 2, 261—264. SanterM., Teller D. C, Andrews W., 1960. Environment-induced changes in the base ratios of RNA of E. coli, J. molec. Biol. 2, 5, 273—275. Ш а п и р а, Дрейфус, К р ю, Л а б и, 1961. Превращение глицина в серии и фе- нилаланина в тирозин после их включения в глобин, Реф. секц. сообщ. 5-го Меж- дунар. биохим. конгресса, секция 2, 185. Shapiro H., Char gaff E., 1960. Studies on the nicleotide arrangement in deoxyribonucleic acids, Bioch. Bioph. acta 39,1, 62—67, 68—82; 1960a. Severe distortion by 5-bromouracil of the sequence characteristics of a bacterial DNA, Nature 188, 4744, 62-63. Sidransky II., FaberE., 1956. The effect of ethionine upon protein metabolism in the pancreas of rats, J. biol. Chem. 219, 1, 231—243. S i n g e r M. F., С a n t о n i G., 1960. Studies on soluble RNA rabit liver, Bioch. Bioph. acta 39, 1, 182—183. Speyer J., L e n g у e 1 P., В a s i 1 i о С, О с h о a S., 1962. Synthetic polynucleotides and the amino acid code. Proc. Nat. Acad. Sci. 48.
264 Ж. А. МЕДВЕДЕВ Tissicres A. ,Schlessinger D., Gros F., 1960. Amino acid incorporation into proteins by E. coli ribosomes, Proc. Nat. Acad. Sci. 46, 11, 1450—1162. TsugitaA., F r a e n к e 1-C о n r a t H., 1960. Proc. Nat. Acad. Sci. 46, 1585. Wallace J., Squires R., Ts'o P., 1961. Location of newly synthesized protein precursors in reticulocite ribosomes, Bioch. Bioph. acta 49, 1, 130—140. Watson J. D., С rick F. H. C, 1953a. Molecular structure of nucleic acids. A structure for DNA, Nature 171, 4356, 737—738; 1953b. The structure of DNA, Cold Spring Harbor Symp. on Quantitative biology 18, 123—131. W e i s s S. В., N а к a m о to Т., 1961. The enzymatic synthesis of RNA. Nearest- neighbor base frequences, Proc. Nat. Acad. Sci. 47, 9, 1400—1405. Виттман Г. Г., 1961. Изучение корреляции между РЫК и белком в вирусе табачной мозаики, Симпозиум 1, 5-го Междунар. биохим. конгресса. Wong К., М о 1 d a v e К., 1960. Enzymatic participation of enzyme-bound amino acid adenylates in amino acid incorporation into protein, J. biol. Chcm. 235, 3, 694—699. Y о s h i d a A., 1958. Studies in the mechanism of protein synthesis: bacterial a-amilase containing cthionine, Bioch. Bioph. acta 29, 1, 213—214; 1960. Studies on the mechanism of protein synthesis, Bioch. Bioph. acta 41, 1, 98—103. YoshidaA., Yamasaki M., 1959. Studies on the mechanism of protein synthesis, Bioch. Bioph. acta 34, 1, 158—165. Zamenhof S., 1959. Further studies on the unstable and unnatural DNA, Ann. N. Y. Acad. Sci. 81, 3, 784—787. Zamenhof S., Giovanni R., Rich K., 1956. Escherichia coli containing unnatural pyrimidines in its DNA, J. Bacterid. 71, 1, 60—69. Zamenhof S., Rich K., Giovanni R., 1959. Studies on I hy ami ne-5-brom uracil «exchange» in DNA of E. coli, J. biol. Chem. 234, 11, 2960—2964.
VIII. ВОПРОСЫ МАТЕМАТИЧЕСКОЙ ЛИНГВИСТИКИ СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ Г '( Н. А. БАЛАНДИНА * (МОСКВА) В алгорит]у|р синтаксического анализа текста существенную роль играет анализатор — список конфигураций языка. На содержательном уровне под конфигурацией понимается пара слов и указание о грамматической связи между ними. Точное определение понятия конфигурации будет дано ниже. Анализатор используется при установлении грамматических связей в тексте. Это достигается путем сличения некоторых пар слов фразы текста с конфигурациями, входящими в анализатор *). Анализатор должен быть не слишком громоздким. Это необходимо для того, чтобы излишне не загружать машинную память и нужную конфигурацию находить в анализаторе с меньшими затратами машинного времени. Ниже рассматриваются методы организации анализатора, целесообразного для машинного анализа текста. Поясним содержание задачи. Точная ее постановка приводится после определения всех необходимых понятий. Рассматривается текст, слова которого заменены их грамматической информацией, состоящей из признаков. Каждый признак может принимать одно из некоторого числа различных значений. Значения признаков закодированы целыми положительными числами. Если данный признак для данного слова не имеет смысла, ему приписывается значение 0. В тексте с установленными грамматическими связями между словами возможны различные типы таких связей. Конфигурация задается следующими данными: признаками пары слов, входящих в конфигурацию, порядком следования этих слов в тексте и типом грамматической связи между ними. Как известно, при установлении грамматических связей между словами некоторые признаки оказываются несущественными. Это выражается в том, что тип конфигурации сохраняется при различных значениях таких признаков. Например, для конфигурации «переходный глагол + существительное в винительном падеже» время, лицо, число глагола и род, число существительного являются несущественными признаками (читаем книгу, читал книги). Таким образом, если в анализатор входит группа конфигураций одного типа связи и эти конфигурации характеризуются различными значениями несущественных признаков и одинаковыми наборами значений остальных, «существенных» признаков, то анализатор можно сократить, заменив такую группу конфигураций одной конфигурацией с указанием несущественности соответствующих признаков (в таких случаях значения! *) Подробно этот вопрос изложен в статье О. С. Кулагиной [1].
266 Н. А. БАЛАНДИНА несущественных признаков заменяются нулями) *).. При этом анализатор сохранит свойства, необходимые для его использования. Итак, нас интересуют два вопроса: 1) как сможет машина определить несущественность признаков, 2) как провести сокращение анализатора за счет несущественных признаков. Рассмотрения, приводимые ниже, относятся к фиксированному анализатору. Он может не совпадать с полным списком конфигураций языка. Можно указать несколько способов задания несущественных признаков. Несущественность признаков может быть априорной для алгоритма. Так, например, она может вытекать из предварительного изучения конфигураций языка. В таком случае способ задания несущественных признаков (назовем его 1-м способом) заключается в том, что для каждого типа конфигурации заранее указываются несущественные признаки или признаки, несущественные при определенных значениях некоторых других признаков. Возможен и другой способ. Пусть в нашем распоряжении имеется анализатор и сведения о том, какие значения может принимать каждый признак, но нет никаких данных о несущественности признаков. Тогда некоторые несущественные признаки можно найти на основании следующих рассуждений. Пусть в анализатор входит группа конфигураций одного типа связи такая, что один из признаков — «изменяющийся»— принимает в этих конфигурациях все возможные значения, а все остальные — «фиксированные»— признаки принимают один и тот же набор значений. Тогда изменяющийся признак является несущественным, так как тип конфигурации не зависит от значения этого признака. Это — 2-й способ выделения несущественных признаков. Можно указать 3-й способ выделения несущественных признаков, являющийся обобщением 2-го способа. Признак является несущественным для конфигураций данного типа, если среди конфигураций всех других типов, содержащихся в анализаторе, не найдется конфигураций, содержащих тот же набор значений остальных (всех, кроме несущественного) признаков. В работе рассматриваются методы сокращения анализатора за счет несущественных признаков. Перейдем к точной постановке задачи. 1. Постановка задачи В дальнейшем нам понадобится ряд понятий, введенных в статье [1]. Упорядоченная система А = (а1э ..., аа) из п неотрицательных целых чисел называется словом (на содержательном уровне это — грамматическая информация о слове из реального текста, состоящая из закодированных признаков). Число ai называется i-м знаком слова (значение i-то признака). Будем считать, что i-й знак слова может принимать одно из s{ разных положительных значений и значение 0. Слово, все знаки которого равны 0, назовем концевым. Слово называется значащим, если не все а{ равны 0. Конечная упорядоченная система слов Q = {А1, ..., AQ} называется текстом. Индекс означает порядковый номер слова в системе. Рассматриваются тексты с наложенными связями, полными и правильными. Связи называются полными, если каждому значащему слову А1 сопоставляется *) Можно показать, что использование нуля одновременно для обозначения несущественного признака и признака, не имеющего смысла для данного слова, не ведет к недоразумениям.
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 267 значащее слово Aj той же фразы *), а каждому концевому слову фразы — оно само. В этом случае слова Аг и А1 называют связанными, слово А1 — управляемым, слово А1 — управляющим. Значащее слово, управляемое самим собой, называется самоуправляющим. Связи называются правильными, если выполнены следующие условия: 1) если слово Aj управляет словом A'1, Ajl управляет словом АК, ..., слово Aja управляет словом Аг, то слово Аг не может управлять словом А>\ 2) различные пары связанных слов расположены в тексте так, что одна пара слов либо предшествует другой, либо охватывает другую. Связи подразделяются на типы. Типы связи занумерованы неотрицательными целыми числами от 1 до М. Упорядоченная четверка К = (В, С, h, t) элементов, где В и С —слова, a h и £ —неотрицательные целые числа (/г = 0, 1, 2, 3; t=l, ...,M), •называется конфигурацией. Конфигурация К обозначается также через (kv ..., /c2n, k2n+l, k2n+2), где kv ..., kn— знаки слова В с сохранением порядка, а &,1+1, ..., к2л — знаки слова С с сохранением порядка, &2п+1 —число /г, &2п+2 —число t. Две конфигурации К = (кг, ..., /c2rl+2) и К' — (k'v ..., к'2П+2) назовем совпадающими, если их соответствующие знаки, кроме, возможно, (2я+1)-го, равны, т. е. если kL=kl при любом 1ф2п-{-1; в противном случае конфигурации называются различными. Примечание. Конфигурация, как кортеж с 2п + 1 знаками, представляет собой запись условий, которые должны быть выполнены для того, чтобы два слова были связанными в тексте. Будем считать, что в конфигурации сначала перечислены признаки управляемого слова, затем — признаки управляющего слова, причем на месте несущественных признаков могут стоять нули. Значение &2п+1 (число к) указывает, в каком порядке слова должны стоять в тексте (к = О, если порядок следования слов в тексте безразличен; h — 1, если управляемое слово должно стоять в тексте перед управляющим; h = 2, если управляемое слово должно стоять в тексте после управляющего; h = 3, если управляемое слово совпадает с управляющим). Значение к2п+2 (число t) указывает тип связи данной пары слов; к2п+2 будем называть типом конфигурации. Конфигурацию K = (kv . ..,Ar2n+2) назовем обобщением конфигурации К = (kv . ., 7 &2г1+2), если К может быть получена из К заменой некоторых знаков слов и, возможно, числа h нулями, т. е. если &2rl+2 = &2п+2, а при 1 < / < 2п + 1 из kL Ф kL вытекает kL = 0. Конечная система Ш = {К1, ..., Kv] называется анализатором, если в ней нет двух различных конфигураций, из которых одна есть обобщение другой. Анализатор, в котором любые две конфигурации одного типа различаются хотя бы одним знаком слов, ненулевым в обеих конфигурациям, а любые две конфигурации разных типов различаются хотя бы одним из первых 2п-\-1 знаков, ненулевых в обеих конфигурациях, назовем приведенным анализатором. Таким образом, приведенный анализатор не может содержать совпадающих конфигураций. Конфигурации, которые могут одновременно входить в приведенный анализатор, назовем совместными. Иначе говоря, две конфигурации одного типа К1 = (к\, . . ., к\п+2) и К2 = (к1, ...,к\п+9) совместны тогда и только тогда, когда среди пар чисел к\, к\, 1ф2п-\-1, существует хотя бы одна такая, что к\ Ф к] и к] Ф 0, к\ф0; а две конфигурации разных типов К1^^], . . ., к\п+2) *) Фразой называется отрезок текста между двумя соседними концевыми словами.
268 Н. А. БАЛАНДИНА и К2 = {к\, .. ., kln+2) совместны тогда и только тогда, когда среди иц) чисел к\, /с?, 1ф2пу существует хотя бы одна такая, что к] Фк\ и к\ фО, к\Ф 0. Систему конфигураций назовем совместной, если все конфигурации системы попарно совместны между собой. Анализатор 9Л называется обобщением анализатор! $Щ, если каждая конфигурация из Ш есть обобщение некоторой конфигурации анализатора Ш. Пусть теперь $Щ — приведенный анализатор; рассмотрим обобщенный анализатор Ш, состоящий из попарно совместных конфигураций, и присоединим к нему все конфигурации из анализатора Ш, совместные с конфигурациями из Ш. Полученный таким образом анализатор ЬЯ назовем сокращенным для приведенного анализатора ЗЛ. Целью настоящей работы является построение по приведенному анализатору Ш с помощью некоторых правил обобщения сокращенного анализатора Ш. Правила обобщения выбраны в соответствии со способами задания несущественных признаков (см. выше). Ниже описаны эти правила обобщения; будем также называть их правилами сокращения. 1-й способ и соответствующее ему 1-е правило не требуют пояснений. Из 2-го способа вытекает 2-е правило сокращения анализатора. Пусть приведенный анализатор $Щ содержит группу конфигураций R = {K1 К5} **■ = \^1» * • * » ^271» 'С2П+1> "-2П+2/» iv \nly . . . , n,2n, n,2n + 1, ^2n+2/ одного типа, удовлетворяющую условиям: 1) t знаков слов (/х-й, /2-й, ..., /,-й) принимают один и тот же набор значений (kLl, ki2, . ..,&t/), т. е. kLl = /сГх = . .. = kix = /с^, k}t = kJt = .. . =ksit = kit; 2) остальные 2n — t знаков слов принимают все возможные наборы значений, т. е. s= [] s,. В этом случае признаки, соответствующие знакам /х, l2t...,lt, считаем несущественными и группа R может быть заменена обобщенной конфигурацией K = (kv ...Д2п+2), где kL, если /= /1? /2, . . ., /,, 1< /<2га, kt: ^2n+l' О, если / Ф /1? /2, ..., /р l<Z<2rc, ^2П+1' еСЛИ ^2П+1 = ^2П + 1= • • • =^2П+1' О в противном случае, k — k1 a2n+2 "~ a2n+2* Полученную таким образом конфигурацию К будем называть кон фигурацией, обобщенной по /х-му, ..., /гму знакам, и обозначать через К(1г, 1г, . . ., /,). Множество конфигураций К(1г, /2, . .., lt) будем обозначать через Г(/х, Z2, .. ., lt).
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 269 Из 3-го способа вытекает 3-е правило сокращения анализатора. Пусть приведенный анализатор 3ft содержит группу R конфигураций Л. = (К1, . . . , /С2п, /С2п + 1, ^2П+2/> К — (/ef, ...» k\n, &!n+i» /С2П+2) одного типа связи такую, что 1) t знаков слов (/А-й, /2-й, . . .,/гй) принимают один и тот же набор значений (kiv ki2, . ..,&(,); 2) среди конфигураций других типов связи, входящих в 9ft, не имеется конфигураций с тем же набором (kiv . .., kL/). Тогда группу R можно заменить обобщенной конфигурацией К = (/ср ..., &2п+2), знаки которой определяются так же, как во 2-м правиле. Пример. Пусть слова имеют длину 2, причем первый знак слова может принимать значения 0, 1, 2, а второй знак слова может принимать значения 0, 1, 2, 3. Рассмотрим приведенный анализатор Ш = {К\ К\ ...,£"}: К1 = (11 21 1 1) ч К2 = (21 21 1 1) К3 = (22 21 0 1) Я4 =(23 21 0 1) Я5 = (11 22 2 1) К* = (12 21 2 1) А:7 = (11 23 0 1) Я8 = (13 21 1 1) Я9 = (12 22 2 2) Я10 = (23 13 2 2) Я11 = (22 13 0 3) }9ft3. тг, aft2, Ш содержит конфигурации трех типов: 1, 2, 3. 1-й и 2-й знаки конфигурации принадлежат управляемому слову, 3-й и 4-й — управляющему слову, 5-й знак характеризует порядок следования слов в тексте, 6-й знак указывает на тип связи между словами. Пользуясь 2-м правилом обобщения и обобщая конфигурации только по одному знаку, можно построить для 9ft следующие обобщенные конфигурации: для группы {К1, К2} -Я1 = (01 21 1 1) для группы {К\ К3, К4}-К2=(2д 21 0 1) для группы {К1, К6, К8}-К3 = (10 21 0 1) для группы {К1, К\ К1}-К* = (11 20 0 1) для группы {К3, К*} -£5 = (02 21 0 1) для группы {К\ К8} -Я6 = (03 21 0 1). По условию совместности, конфигурации К1, К2; К1, К3; К1, К*; К2, Кь] К2, К6; К3, /f4; К3, Къ\ К3, К6 попарно несовместны, а конфигурации К1, К5; К\ К6; К2, К3; К2, К4; К\ Кь; К\ К6; К\ К6 попарно совместны. Для анализатора ЯЛ можно построить только два анализатора 9ft1 и 9ft2,
270 Н. А. БАЛАНДИНА содержащих совместные конфигурации, обобщенные по одному знаку (11 20 0 1) (01 21 1 1) Ш = (03 21 0 1), 9Й2 = (02 21 0 1).. (02 21 0 1) (03 21 0 1) Сокращенные анализаторы, соответствующие этим обобщенным анализа- торам, имеют вид (11 20 0 1) (01 21 1 1) (03 21 0 1) (02 21 0 1) (02 21 0 1) (03 21 0 1) ТО1 = (21 21 1 1), ^ (11 22 2 1) (12 22 2 2) Ш "(11 23 0 1) (23 13 2 2) (12 22 2 2) (22 13 0 3) (23 13 2 2) (22 13 0 3). Пользуясь 3-м правилом обобщения, для анализатора ЗК, кроме обоб щенных конфигураций, получаемых с помощью 2-го правила, можно построить еще дополнительные, например: для группы [К\ К\ Кь, К7}-К1 = (01 20 0 1) для группы {К8} -Я8 = (13 20 1 1) для группы {К10} -Я9 = (03 10 2 2) и так далее. Из этого примера видно, что сокращение анализатора за счет 2-т или 3-го правила может оказаться неоднозначным. 2. О сокращении анализатора Задача заключается в следующем: даны приведенный анализатор и правило сокращения. Требуется максимально сократить анализатор. Для наглядности представим все возможные обобщенные конфигурации для анализатора в виде системы точек на плоскости. Соединим между собой точки, соответствующие несовместным обобщенным конфигурациям. Точкам, не соединенным непосредственно, соответствуют совместные обобщенные конфигурации. Каждой точке припишем неотрицательное число — вес w, равный числу конфигураций, которое сокращает обобщенная конфигурация, соответствующая этой точке. Такую систему назовем системой-! . В новой интерпретации задача формулируется так: из системы-1 выбрать подсистему попарно не соединенных между собой (изолированных) точек с наибольшим суммарным весом,— назовем ее максимальной подсистемой. Если максимальных подсистем несколько, выбрать ту из них, которая содержит минимальное число точек. Для примера 1 (правило 2) получим систему-1, изображенную на рис. 1. Конфигурации, обобщенные по одному и тому же знаку, помещены в столбцы. Над каждым столбцом указано, по какому знаку обобщены соответствующие конфигурации, и веса этих конфигураций. В этом случае максимальную систему составляют точки, соответствующие конфигурациям, входящим в обобщенный анализатор ЯЛ1, так как Ш1 имеет суммар-
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 271 ный вес W = 4, а Ш2 имеет суммарный вес W = 3. Точки максимальной подсистемы отмечены кружками. Нетрудно заметить, что понятие соединенности точек не обладает свойством транзитивности, так как две точки, порознь соединенные с третьей, могут оказаться несоединенными. Аналогично, понятие несоединенноств точек не транзитивно. Например, на рис. 1 точки К2 и К3; К2 и К* не соединены, но К3 и К* соединены; точки К1 и К2; К1 и ^ЙГ4 соединены, но К = (0727 07j K=(O22707j\ K=f032?0/J К =(702? 07J Г(47 7( =(77200/J Рис. 1. ш,-а шг-а w.*a Шл-а К2 и /£4 не соединены. Две системы точек назовем изолированными, если все точки одной системы не соединены с точками другой системы. Можно указать некоторые достаточные условия вхождения точки в максимальную подсистему. Например, если всю систему-1 можно разбить на изолированные системы, то максимальная подсистема получится объединением максимальных подсистем всех изолированных систем. Возникает вопрос: нельзя ли построить общие правила для определения вхождения точки в максимальную подсистему так, чтобы эти правила основывались, может быть, на большой, но неполной информации о связях этой точки с другими точками системы-1? Приведем пример системы-1, для которой нельзя построить таких правил. Рассмотрим некоторую точку системы-1. Ее окрестностью 1-го порядка назовем совокупность точек, с ней непосредственно соединенных. Ее окрестностью к-то порядка назовем совокупность всех точек ее окрестности (к—1)-го порядка и всех точек, с ними непосредственно соединенных. Системе точек на рис. 2 отвечает некоторая совокупность обобщенных конфигураций. Пусть для простоты каждая точка системы имеет вес w=a. Если для построения алгоритма различения того, входит ли точка а в максимальную подсистему или нет, ограничиться рассмотрением связей точки а с точками любой из нечетных окрестностей, то нецелесообразна включать точку в максимальную подсистему, так как в этом случае система, не содержащая точек а, р, у, будет иметь больший суммарный вес W, чем любая система, содержащая точку а. Если же рассматривать связи точки а с точками любой из четных окрестностей, то точку а целесообразно включить в максимальную подсистему*). Рис. 2. *) Построенный пример использует идеи Ю. И. Журавлева [2]
272 Н. А. БАЛАНДИНА Таким образом, для построения максимальной подсистемы нужно пользоваться полной информацией о строении системы-1 точек. Практически это сводится к полному перебору Есех возможных подсистем. Для полного перебора потребовалось бы слишком большое число операций машины. Приводимый ниже алгоритм опирается на ограниченную информацию о строении системы конфигураций для данного анализатора, он построен с использованием информации об окрестностях 1-го порядка и частичного перебора. Алгоритм достаточен для нужд машинного перевода. 3. Описание алгоритма сокращения анализатора На основе принципа, изложенного ниже, могут быть построены сокращенные анализаторы, содержащие конфигурации с любым допустимым числом обобщенных знаков. В настоящей работе приводится алгоритм, дающий сокращенный анализатор с конфигурациями, обобщенными по одному знаку. Сокращение анализатора проводится для каждого типа связи в отдельности. Обобщенные конфигурации строятся по правилу 2 [см. п. 1]. Приведем крупноблочную схему строения алгоритма *): (1 - т) | AmBmCmDmF (m)p(m<M)\W Ост, 1 где введены следующие обозначения: т — параметр, означающий тип связи конфигураций анализатора; ira = l, 2, ..., М\ Ат —оператор, настраивающий программу на работу с анализатором Шш, содержащим конфигурации /гг-го типа связи; Вт—оператор, с помощью которого для Шт строятся всевозможные конфигурации, обобщенные по одному знаку; эти конфигурации объединяются в таблицы Г(/), каждая из которых содержит конфигурации К (/), обобщенные по одному и тому же /-му знаку; Ст —оператор, с помощью которого в таблицах Zv, являющихся попарными объединениями таблиц Г(/), выбираются совместные подсистемы с максимальным весом; Dm—оператор, с помощью которого из таблиц Zv выбирается система TV совместных конфигураций с наибольшим суммарным весом (/V —обобщенный анализатор) и к ней присоединяются конфигурации из $Шт, совместные с /V; W —оператор печати сокращенного анализатора; (—->) — оператор засылки константы; F ( ) — оператор переадресации; р( = ) — оператор выработки логического условия путем сравнения. Приведем теперь более подробное описание блоков этого алгоритма. Блок Вт для приведенного анализатора Шт строит все возможные конфигурации, обобщенные по одному знаку. Конфигурации К (/) строятся следующим образом. В каждой конфигурации К1£УИт выделяется набор значений всех знаков слов, кроме Z-ro знака; обозначим этот набор через //J, 1 < £< 1т, Iт — число конфигураций в Шт. Множество наборов значений всех знаков слов, кроме /-го, в конфигурациях анализатора Шт обозначим через Нt. Согласно *) О пзнятиях и обозначениях, употребляех\шх в схемах программ, см. статью А. А. Ляпунова [3].
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 273 правилу 2, конфигурация, обобщенная по 1-му знаку, строится для группы, состоящей из sL конфигураций с одним и тем же набором Н*\ . Поэтому для того, чтобы определить, входит ли К1 в группу, для которой может быть построена одна из конфигураций К (I), подсчитывает- ся число d\ конфигураций, имеющих набор Н\. Обобщение проводится только в том случае, когда d] = si. Конфигурациям К(1) приписывается вес w~ = s, — 1. K(l) L По условию совместности таблица Г(/) состоит из совместных конфигураций. Обозначим через yt число конфигураций таблицы Г(/). Меняя/, 1</<2п, получим для анализатора Шт все возможные конфигурации, обобщенные по одному знаку. Обозначим через L число непустых таблиц Г(/). Приведем логическую схему программы оператора Вт: Bm = (0-*.L)(0-.-/)I(0-*Y)Bl(l-»-oJ(*-^/)(0-*rf!)X XDHlDl}p(H\ = Hi)\r(d\)\FU)pU<IJ\X. 1 2 Xp(dJ = *,)tC,YF(Y)jF(i)/»(i</Jt/»(Y<0)tx 3 4 5 XF(L)|F (/)/>(/< 2л) J, где введены следующие обозначения: т — параметр, означающий номер типа связи конфигураций анализатора Шт; L — число непустых таблиц Г(/) для анализатора Шт; / — параметр, означающий номер признака, по которому проводится сокращение, и соответственно номер таблицы Г (/), / = 1, 2, ... ..., 2л; Y —число конфигураций таблицы Г(/), Y = l» 2, ..., yL; у строится во время работы программы; I — параметр, означающий номер конфигурации в $Щт, для которой строится обобщенная конфигурация, i = l, 2, ..., Im; / — параметр, означающий номер конфигурации в 9Кт, с которой сравнивается i-я конфигурация, / = i\ * + 1, ..., Jm; Im — число конфигураций в анализаторе $Щт; d\ — счетчик числа конфигураций с набором Ht; В( —оператор, настраивающий программу на построение конфигураций таблицы Г(0; Da —оператор получения набора Н] путем логического умножения конфигурации К1 на специальную константу а(; QY —оператор, строящий и запоминающий у-ю обобщенную конфигурацию таблицы Г (/); D^ —оператор получения набора Н\ путем логического умножепия конфигурации К* на специальную константу а(; г( ) — оператор увеличения содержимого счетчика на 1. Упорядочим множество непустых таблиц Г (/) и обозначим их через Г(/), 1</<L, а знаки, по которым обобщены конфигурации таблиц, обозначим через /,, /2, ..., /^, так что Г* означает таблицу Г(/н) конфигураций, обобщенных по /н-му знаку, l<x<L. 18 Проблемы кибернетики, вып. 9
274 Н. А. БАЛАНДИНА Блок Ст выбирает в таблицах, являющихся попарными объединениями таблиц 1\, .. ., Тьу совместные подсистемы с максимальным весом. Итак, рассматриваются таблицы Zv, каждая из которых составлена из двух различных таблиц Tiy тогда {Zv} = {Zl^Z2J ... ZN), где N = —* ~~ . Пусть Zv составлена из таблиц Г* и 1\, содержащих конфигурации К(1у) и К(1%) соответственно. В зависимости от выполнения условий совместности конфигурации из Гх и 1\ могут оказаться как совместными, так и несовместными. Очевидно, что конфигурации несовместны, если они имеют одинаковый набор #?х^ значений общих ненулевых знаков слов, и совместны в противном случае. Во всех конфигурациях из Гх и 1\ выделим наборы значений ббщих ненулевых знаков слов. Множество таких наборов обозначим через {Я^}. Число различных наборов обозначим через Px^. Разобьем все конфигурации из Гх и Г^ на группы так, чтобы q-я группа содержала все те и только те конфигурации, которые имеют набор #?х*х, l<Q<P»a- Очевидно, что каждая конфигурация поцадет только в одну группу. Рассмотрим конфигурации q-й группы. Конфигурации из Гн (соответственно из Гя) совместны между собой, так как различаются значениями А,-го (соответственно х-го) знака, но не совместны ни с одной конфигурацией из Гх (соответственно из Г^) по построению. Таким образом, q-я группа распадается на две системы совместных конфигураций, из которых одна принадлежит таблице Гх; обозначим эту систему через Z%Yt, ее суммарный вес — через WQKy а число конфигураций в ней — через у\. Другая система принадлежит таблице Г^; эту систему обозначим через Z^, число конфигураций в ней —через yl, а ее суммарный вес —через \¥%. Выберем из них ту, которая имеет больший суммарный вес, обозначим его через WQ. В случае, если W£ = WJJ, выбирается система, содержащая меньшее число конфигураций. Если число конфигураций в системах оказалось равным, выбирается система Z%yi. Конфигурации из разных групп совместны по построению. Меняя q от 1 до Рхь проведем такой выбор совместной системы с наибольшим суммарным весом во всех группах. Объединяя все системы, получим совместную систему Zv; Zv=(JZv конфигураций с наибольшим о суммарным весом WVy WV=^]WQ. о Меняя х и X, l<x<L, x + l<A,<L, получим множество таблиц {Zv} с весом Wv, l<v<iV, N= L(L~iy> . Приведем логическую схему программы оператора Ст: Cm = (l^v)(l^x)i7Ex(x + l^^)coUEAx(l^QHD0X 7 •X GoxRoxG0,Rox/> (W* = Wl) \p(y° = yQK) f1 Y4»t X 8 9 10 X \p (yl- yi > 0) t "sk<d t J p (W% - Wl < 0) t со /TV (Q) X 11 12 13 14 Xp(Q<PKK)\F(v)F(X)lp(l<L)\F(x)p^<L)\, 15 16 17
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 273 где введены следующие обозначения: V —параметр, означающий номер строящейся таблицы Zv; х —параметр, означающий номер таблицы из {Тг}, с помощью которой строится Zv, х = 1, 2, ..., L; X —параметр, означающий номер второй таблицы из {Tj}, с помощью которой строится Zv; X = х + 1, ..., L\ q —параметр, означающий номер группы конфигураций с одними тем же набором значений знаков, ненулевых в конфигурациях ЛГ(/Х) и К(1у), 1<Q<PxxI число РхХ находится во время работы программы; Ех — оператор, настраивающий программу на работу с таблицей Гн; Е^ —оператор, настраивающий программу на работу с таблицей 1\; 6НХ — оператор получения константы ах^ путем логического умножения констант ах и а^; D0 — оператор выделения набора H^i^ из конфигураций таблиц Гх и Г^ путем умножения их на константу ахХ; GQX —оператор выделения системы Z%Yt конфигураций q-й группы, т. е. конфигураций с набором Я?х^, принадлежащиг таблице Гн; Gox — оператор выделения системы Z%^ конфигураций q-й группы, т. е.. конфигураций с набором II i^ принадлежащих таблице 1\; RQX — оператор подсчета суммарного веса W^ системы Ъ%^\ Rqa, — оператор подсчета суммарного веса W\ системы Z?^; Sx —оператор записи системы Z?x в таблицу Zv; S^—-оператор записи системы Ъ%^ в таблицу Zv; соf—оператор безусловного перехода. Блок D^ выбирает из таблиц Zv Z2, ..., Zn систему совместных конфигураций с наибольшим суммарным весом и к ней присоединяет совместные конфигурации анализатора 2Лт. Подробнее: на 1-м шаге среди таблиц Zx, Z2r . .., ZN выбирается таблица с наибольшим весом; если таких таблиц несколько, выбирается таблица с наименьшим индексом. Таблицу с наибольшим весом обозначим через Qv ее вес обозначим через Wv Строятся таблицы <*)Z такие, что ^)Zv состоит из конфигураций таблицы Zv, совместных с конфигурациями таблицы 0Х, l<v<iV. На /г-м шаге из таблиц <b-i>Z выбирается таблица Qh с наибольшим суммарным весом, который обозначается через Wh\ из таблиц <*-*>£ строятся таблицы </l)Z, содержащие конфигурации, совместные с конфигурациями из Qh. Меняем h до тех пор, пока все конфигурации таблиц Z не будут н исчерпаны. Таблица 7V= [j 8Л, где Я —число шагов выбора, является обобщенным анализатором для приведенного анализатора 3Jim. Присоединяя к N конфигурации из ЗЯт, с ней совместные, получим сокращенный анализатор Шт. Меняя т от 1 до М и объединяя построенные анализаторы, получим сокращенный анализатор, содержащий конфигурации всех типов связи^ Приведем логическую схему программы этой части алгоритма: Vm = {O^N)(l-+hnQbP(Wh*0)\Th\JhY{h)UVm. 18 19 где введены следующие обозначения: h — параметр, означающий номер шага выбора таблицы с максимальным весом; /г = 1, 2, ..., Я; 18*
276 Н. А. БАЛАНДИНА Qh — оператор выбора таблицы Qh из таблиц (h-i)Z путем последовательного сравнения весов таблиц С1-1^, С1-1^, ..., (/l-1)Zyv. Если в системе имеется несколько таблиц с наибольшим весом, то выбирается таблица с наименьшим индексом; Wh— вес таблипы Эл; Тл —оператор присоединения 0^ к таблице N; U^—оператор построения таблиц <Ч2, состоящих из конфигураций таблиц ^-^Z, совместных с 0Л; Vm —оператор выбора конфигураций из анализатора ЯКт, совместных с TV, и присоединения их к N (построение сокращенного анализатора). 4. Пример построения сокращенного анализатора Вышеописанный алгоритм был запрограммирован на машину «Стрела», и с ее помощью был проведен эксперимент. Был рассмотрен JZ7S/7 /. -3275 2 7 -327/ 77 / 22/7 О 7 -3274 О 7 -2227 7 / *32/2 / / 34// О 7 \-3/// О / ^32/3 / / 72/7 О / 232/ 2 / //// О / зз// а / 242/О / •27237 7 3472 7 7 3372 а 7 3223 2 7 2724 О / "2/// / / -2/25 2 / /22/ /7 7 37/2 /7 / ^2//4 О / <^2/2/2 / ^2/252 / ///4 / / ^2/22 / / *3//4 О / Рис. 3. приведенный анализатор Шг, состоящий из 30 конфигураций одного типа. Конфигурации из 5ЩХ записайы в среднем столбце рис. 3. Числа различных значений знаков конфигураций таковы: /^ = 0,1,2,3; /с2 = 0, 1,2, 3,4; fc8 = 0,lf 2; А4 = 0,1,2,3,4,5,6; для 1-го знака: для 2-го знака: для 3-го знака: для 4-го знака: для 5-го знака- - числа А: 5Х = 3, s2 = 4, *з = 2, *4 = 6» для 6-го знака —числа t: *, = 0,1,2; А. = 1.
СОКРАЩЕНИЕ АНАЛИЗАТОРА ПРИ МАШИННОМ ПЕРЕВОДЕ 277 Во время работы программы для анализатора Шг строятся конфигурации, обобщенные по одному знаку. Полученные обобщенные конфигурации записаны в правом столбце рис. 3. Выписаны только первые четыре знака обобщенных конфигураций, так как 5-й знак (число К) не учитывается при выборе совместной системы, а 6-й знак (число t) имеет одно и то же значение /св =1 во всех обобщенных конфигурациях. Конфигурации каждой группы, допускающей обобщение, соединены с соответствующей обобщенной конфигурацией справа. Для анализатора ЗЯг обобщение может быть проведено не однозначно, так как некоторые конфигурации могут быть обобщены несколькими способами (на рис. 3 каждая такая конфигурация соединена с несколькими обобщенными конфигурациями справа). Для наглядности конфигурации, обобщенные по одному знаку, помещены на рис. 4. Конфигурации из таблиц Г(1), Г (2), Г(3), Г (4) распо- ложены соответственно в 1-м, 2-м, 3-м и 4-м столбцах рис. 4. Конфигурациям приписаны веса wK(i) = st — 1, так что wi = 2 — вес конфигураций 1-го, ау2 = 3 — вес конфигураций 2-го, w3 = 1 — вес конфигураций 3-го, ад4 = 5 — вес конфигураций 4-го столбцов. Несовместные конфигурации соединены. рИСв 4. В результате работы программы в системе обобщенных конфигураций была выбрана система совместных конфигураций, дающая наибольшее сокращение; система состоит из шести конфигураций. На рис. 4 этой системе соответствует система изолированных точек с максимальным суммарным весом. Для наглядности эти точки отмечены кружками. В левом столбце рис. 3 записаны конфигурации сокращенного анализатора. Конфигурации групп, для которых проведено обобщение, соединены с соответствующими конфигурациями сокращенного анализатора. В сокращенный анализатор входят также конфигурации из $Щ1? совместные с выделенной системой обобщенных конфигураций. Таким образом, сокращенный анализатор Ъиг состоит из 14 конфигураций. Суммарный вес конфигураций обобщенной системы равен числу сокращенных конфигураций анализатора ЯЛ1? т. е. 16. ЛИТЕРАТУРА [1] Кулагина О. С, Об использовании машины при составлении алгоритмов анализа текста, Сб. «Проблемы кибернетики», вып. 7, Физматгиз, 1961, 209—223. [2] Журавлев Ю.И.,0 невозможности построения минимальных дизъюнктивных нормальных форм функций алгебры логики в одном классе алгоритмов, ДАН СССР 132, 1960, 504—506. [3] Ляпунов А. А., О логических схемах программ, Сб. «Проблемы кибернетики», вып. 1, Физматгиз, 1958, 46—74. Поступило в редакцию 4 IX 1961. 220J
ТЕОРИЯ ИНФОРМАЦИИ И ПОЭТИКА (Энтропия ритма русской речи) Л. М. КОНДРАТОВ (КУЙБЫШЕВ) 1. Постановка задачи Статистические исследования языка как кода с вероятностными ограничениями позволили внести в лингвистику точные числовые оценки. Такой подход может найти применение и в поэтике, поскольку материалом поэзии является язык со всеми его статистическими закономерностями. Настоящая работа посвящена изучению закономерностей ритма русской речи и изменению степени ее неопределенности (энтропии) в зависимости от ритмических требований, налагаемых различными типами текстов, начиная с научной и деловой прозы и кончая классическими стихотворными размерами. 2. Ритм как вероятностный процесс Характеристикой ритма русской речи служит последовательность чередования ударных и безударных слогов в слове и предложении (интонация при этом не учитывается). В отличие от многих индо-европейских языков ударение в русском языке может падать на любой слог «значимого» слова. Такими «значимыми» словами, имеющими обязательное ударение, могут быть существительные, прилагательные, глаголы, числительные, наречия и многие местоимения. Частицы, союзы и часто местоимения примыкают к «значимым» словам и образуют единое с ними ритмическое слово. Такого мнения придерживался в разбивке текста на ритмические типы* слов Томашевский, что подтверждается близостью его данных с таблицей 1 настоящей статьи. Существует и другой метод разбиения текста на самостоятельные (ударные) слова — метод Шенгели, заключающийся в том, что деление на слова производится по возможности более дробно и безударными остаются только предлоги, союзы и частицы. Этой методики придерживаются в своих работах по формальному анализу стиха А. Н. Колмогоров и Н. Г. Рычкова. Следуя методике Томашевского, положенной в основу настоящей работы, в тексте «И он сказал им: Перестанете вы или нет? Они замолчали. Стало очень тихо, так тихо, что слышно было муху, жужжавшую за стеклом» будет одно односложное слово (остальные слились с соседними словами), по статистике Шенгели таких слов пять. На материале «Пиковой дамы» расхождение в количестве односложных ударных слов достигло весьма значительной величины: у Томашевского
280 A, M. КОНДРАТОВ односложные слова составляют около 7% всех слов текста, а у Шен- гели — более 15%! В настоящей работе была использована система записи ритмических видов слов, предложенная Чудовским и Томашевским: каждое «значимое» слово записывается не графически *), что затруднило бы Подсчет ритмических видов слов, а в виде степени, основание которой показывает количество слогов в слове, а показатель — порядковый номер (от начала слова) ударного слога. Так, предложение, приведенное нами выше, запишется в виде 22 З2 53 I1 З3. 22 43. 21 21 21 З2 З2 21 21 42 З3. Любой текст русской речи, разбитый на ритмические виды слов, будет представляться последовательностью чисел, появление каждого из которых будет иметь свою энтропию. Ограничения, налагаемые разными текстами на ритм русской речи, относятся как к употреблению отдельных ритмических видов слов, так и к сочетаниям этих видов, что сокращает полную энтропию ритма, которая в свою очередь является компонентом полной энтропии речи. Определению величины энтропии ритма и посвящена настоящая работа. Из восьми по-разному ритмически организованных текстов (научной, деловой, художественной прозы, разговорной речи, акцентного стиха, четырехстопных ямбов Блока, Ломоносова и Пушкина) производилась выборка в тысячу «значимых» слов, затем подсчитывались вероятности (а вернее, статистические частоты) появления каждого ритмического вида слова (см. таблицу 1), наконец, по формуле Шеннона**) Нх = с (—рг logpx — р2 logp2 — ... — pN logpN) была найдена степень неопределенности (энтропия) ритма каждого из восьми текстов (см. таблицу 1, а также итоговую таблицу). Для научной прозы выборка в 1000 слов была взята из статьи Р. Л. Добрушина, А. М. Яг- лома, И. М. Яглома «Теория информации и лингвистика» ***), для деловой прозы — из каталога к выставке живописи Н. Крымова, для разговорной речи — из пьесы Чехова «Вишневый сад», для акцентного стиха — из произведений Маяковского «Облако в штанах», «Во весь голос» и стихотворений 1925—1929 гг., для художественной прозы были взяты выборки по 100 слов из произведений десяти авторов. Кроме того, было взято по 1000 слов из ямбов Блока, Пушкина и Ломоносова. По величине энтропии на слово делением ее на среднюю длину слова была найдена энтропия ритма па слог. Значение энтропии последовательно уменьшалось от научной прозы, имевшей наибольшую энтропию ритма, и до ямба Ломоносова, который дал самую маленькую степень ритмической неопределенности как на слово, так и на слог. Малая величина энтропии на слог в научном тексте, выпадающая из общей закономерности, объясняется, по-видимому, словарем этого текста: средняя длина слова здесь больше, чем таковая для «литературного языка» (см. таблицу 1). *) При графической записи ударный слог записывается как J., безударный — как ^, а словоразделом служит вертикальная черта; например, слово «графически» в графической записи имеет вид |^-"J_ ^-'^-'|. **) Здесь Hi — энтропия опыта, имеющего N исходов (ритмических видов слов), с — коэффициент пропорциональности, зависящий от основания логарифмов (для двоичных логарифмов, принятых в данной работе, равный единице или одному биту (около 3,32 десятичной единицы)) и plf p2t ..., pN — вероятности (статистические частоты) каждого ритмического типа слов. ***) Журнал «Вопросы языкознания», 1960, № 1.
о н и а н CD Я S о td Н 3=1 о § I о н р И О н о н td g ►с к я Ф Н Н В б о • К Н U № Ш К да р tt О О * 8з & о о о .§ ч и о о td р ю «-*сю со м»го •<1 СО СП СО M»tfc«. СП 00-<1 СЛО 00 СО СП IND 050 -J -J СО СП 8 о 8 о о 8 о о о (((( ( ( М ( ( ( н ( (Ы (М ( Ы ( ( (((( (((( 8888 оооо оооо оооо оооо оооо оооо оооо СОООО оооо оооо оооо OOQQ оооо оооо оооо оооо ооо о ((((( ( ( ( (н ( < <М ( (Ы ( (Ы (( Ы ( ( ( ((((( OOOQO oi*^or IS 88888 н*.^ OS M»tO > м» со м»0 ооооо ооооо i*h*N500 SI ) О О ОО _>оооо О м»00 О So ооо оооо Ом» м*00 ооооо о о ооо ооооо ( ( ( ( (н ( ( ( (Ы ( ( <Ы < ((М(( (X ( ( ( н(( ( ( ( 8 ооооо Ом^ОО О М» СП О С5 М»0 8о оооо ON м* |-»>0 СО СО 00 СП ОЮ оооооо ooto ооо tO tO О ^J OS tO оооооо 8 ооооо СО CD СП tO M» оооооо ООм. ООО О СП СО О м» О ООО ОО О оом»ооо *»Ь0*»ООО OQ ОООО оооооо ОООО ООО )0000 О ЭОООО О >о оооо СП СП СП См СП о> » и м и < < (Ы ( (М < (!-((( Ы (. Ы Г - - w pi: J ; ооооо О м^^оо м» СО О^ м» ООООО о со ooto о со ^i ooto со ооооо О м* СОЮ О ►S- СП 00 С5 М» ооооо огоюоо 00 СО СП ООО о оооо О м» со м» о О СОСЛ tOO ооооо otoooo ОСО ь&»-<1 О ооооо ОМ-ООО О С5 О СО О ооооо ооооо о соосоо й (0 19 И ( ( (ь- ( (Ы (Н( ( . Ы ( ( оооо M»-vj 4N О to «<| м»£ч оооо М»СО 00О tO^-<I 00 ОООО to со оо ю too со^ оооо м»СО О м> ОЭ -*4 СО ГО О м»00 м» О СТ> О ►&» СП «<1 00 оооо СО СП 05 О О CfttO СО оооо tO CM 4NO О tO -*4 СО оооо to as си о 05 СО OS M» СО СО СО СО КО М ( (Н (Ы Ы ( М» М» i^fc. 005 О СО СП СО Ом»0 «JtO -<| <1 СП м» О м»0 OS OS 00 СО СО 00 Ом»0 00СУ5 СП ►&» ^JCO оюо СП tO OS «<1 м» СО огоо СП 00 СО со to «д осоо *-0^ оосо осоо сп to со СП м» СП tOND (Н М М**М» " 00 СП О 00 Ом. оосо СЛО м» м» ОСО М»СО м» м» OS OS •<1СО м» м» tO СП СО 00 СО •<! ►*» СП tO M» rfsto CD~4 tO M» СП м» СПО н о к W 048 083 074 078 м» о СП 068 990 Цифр. графич. разг. научн. делов. худож. Виды слов Виды текстов Стихи ак- центн. Блок Пушкин Ломоносов Ямбы н н л 8 и а р н о н Е •в я и ее а о ее о и о ее р и а .л
282 A. M. КОНДРАТОВ 3. Определение энтропии ритма без учета словораздела Для определения величины Н2, характеризующей ограничения, налагаемые текстом на сочетания двух ритмических видов слов, необходимо подсчитать статистические частоты всех видов парных сочетаний и по формуле Шеннона Л2 = Яа2(а1) = Л(а1а2)-Я(а1) найти эту величину для каждого текста. Аналогично, подсчитав частоты всевозможных сочетаний трех, четырех и т. д. смежных ритмических видов слов, можно найти величины Н3, НА и т. д. вплоть до На>- Величина #со — предельная энтропия ритма — будет характеризовать сокращение степени ритмической неопределенности речи при наложении на нее ритмических требований текста. Однако практическое нахождение энтропии высокого порядка связано с большими трудностями. Так, например, даже для определения величины Н2 потребовалось бы подсчитать не менее четырехсот (самых употребительных) сочетаний двух ритмических видов слов на материале в несколько тысяч парных сочетаний. Поэтому целесообразно упростить процедуру подсчета и учитывать не сочетания различных ритмических видов слов, а количество безударных слогов между ударными без учета словораздела, что дает приближенное значение Н2 (см. таблицу 2). Таблица 2 Статистические частоты количества безударных слогов между ударными I Колич. слогов (беэуд. интерв.) 0 1 2 3 4 5 1 6 7 Энтропия Н2 Разность Тексты Ж% X V л X 056 164 327 265 131 038 013 006 2,38 1,56 п о Ч с* 064 249 303 215 117 035 012 005 2,40 1,32 о X 056 330 359 163 069 018 002 001 2,12 1,35 с со са Р. 085 359 352 145 053 006 000 000 2,04 1,21 060 288 314 194 103 028 009 004 2,32 и о X 117 350 330 156 046 010 001 000 2,12 § о 087 325 332 179 063 012 002 000 2,15 Is 064 284 330 189 084 038 010 001 2,31 В 103 298 321 197 068 008 005 000 2,21 и и аи 006 494 321 149 018 011 001 000 1,67 1,60 013 771 004 208 000 004 000 000 0,91 1,95 При таком подсчете текст записывается в виде последовательности чисел, обозначающих количество безударных слогов между ударными. Так, приводимый нами в качестве примера текст запишется следующим образом: 11322. 12111221124. (Если два ударных слова идут подряд, то в записи появляется число 0.) Для определения Н3 были подсчитаны частоты парных сочетаний безударных промежутков (см. таблицу 3).
ТЕОРИЯ ИНФОРМАЦИИ И ПОЭТИКА (ЭНТРОПИЯ РИТМА РУССКОЙ РЕЧИ) 283 Таблица 3 Статистические частоты парных сочетаний безударных интервалов m о, Инте 00 01 02 03 04 05 10 11 12 13 14 15 16 17 20 21 22 23 24 25 26 27 30 31 32 33 34 35 36 37 40 41 42 43 44 45 46 47 50 51 52 53 54 55 56 57 60 61 62 63 64 65 X в* се 02 13 21 12 07 01 12 18 54 41 32 05 02 00 13 73 100 86 44 08 03 00 15 54 91 58 29 12 04 02 04 14 35 36 26 10 04 03 | 01 06 14 07 05 02 02 01 02 01 05 02 02 01 m о ч CD 02 20 16 13 11 02 22 65 78 46 28 06 | 03 01 17 76 93 69 * 28 13 05 02 14 58 63 50 16 10 03 01 04 20 34 27 21 08 02 01 01 04 17 08 03 01 01 00 01 02 04 03 ' 02 00 i 1 х 03 12 40 10 05 04 22 115 , 103 59 26 05 02 00 33 119 126 54 20 07 00 00 10 46 57 36 12 02 00 00 01 30 25 07 04 01 00 01 00 06 07 03 02 00 00 1 00 00 01 01 00 00 00 с* со Он 02 24 49 04 06 00 29 147 112 52 12 . 07 00 00 33 137 120 52 16 04 00 00 13 56 39 22 13 02 00 00 02 13 22 12 04 00 00 00 00 04 01 01 00 00 00 00 00 00 | 00 1 00 00 00 1 енев о, 06 07 24 17 06 00 20 85 70 66 31 14 02 00 19 94 85 64 35 14 03 00 06 59 70 35 21 04 01 00 02 38 34 И 14 04 00 00 02 04 12 04 06 00 1 00 00 01 02 02 01 02 01 п ° * 16 57 36 07 05 01 42 121 117 54 07 02 01 00 39 123 110 35 17 06 00 00 23 50 43 23 15 02 00 00 09 И 19 05 02 00 00 00 00 03 04 01 02 00 00 00 10 00 00 01 00 00 о 16 28 33 10 06 04 30 104 114 52 24 01 00 00 38 108 109 64 08 02 02 00 И 54 56 42 14 02 00 00 04 26 14 10 09 00 00 00 01 05 04 02 00 00 00 00 00 00 00 01 01 00 оев- ° а R.O 05 23 19 13 01 03 17 87 89 59 20 07 05 00 18 95 111 65 28 11 01 01 14 55 64 35 13 07 01 00 05 18 29 13 13 05 01 00 01 07 13 , 08 05 1 03 1 01 00 00 02 06 02 00 00 нтн. < о 01 03 02 00 00 1 00 03 245 137 100 1 05 04 00 00 03 169 88 43 12 05 01 00 00 92 26 28 01 02 ш 00 06 06 05 01 00 00 00 00 07 03 01 00 00 00 1 00 00 00 01 00 00 00 01. 03 04 05 00 00 01 569 00 200 00 04 00 | 00 00 00 00 00 00 00 00 00 02 180 00 30 00 00 00 00 00 00 00 00 00 00 00 00 00 01 00 00 00 00 00 00 00 00 00 00 00 00
284 А. М. КОНДРАТОВ Продолжение таблицы 3 Интерв. | 70 71 Г 72 73 74 Энтроп. Научн. 00 01 02 01 02 2,36 Делов. 00 01 01 02 01 2,31 Худож. 00 00 00 00 01 2,12 Равг. о о оо о о о оо о 2,00 Тургенев 00 00 02 01 01 2,31 Чехов о о ооо о о ооо 2,12 Лесков оо ооо о о оо о 2,08 1 Достоевский 01 00 00 00 00 2,25 Акцентн. стих 88888 1,65 1 Ямб 1 ооо о о ооооо 0,79 Все остальные сочетания отсутствовали. К вышеназванным выборкам по тысяче слов были добавлены выборки из прозы Лескова («Леди Макбет Мценского уезда»), Тургенева (рассказ «Стук, стук, стук»), Чехова (рассказ «Невеста»), Достоевского («Преступление и наказание»), а также, по данным Томашевского (книга «Язык и стих»), была найдена величина Н2 для «Пиковой дамы» Пушкина. Четырехстопные ямбы Пушкина, Блока и Ломоносова были объединены в одну выборку в тысячу слов, примерно по 300—350 слов от каждого поэта. Энтропия Н2 всех текстов заметно уменьшилась, причем в акцентном стихе и четырехстопном ямбе особенно'значительно (см. итоговую таблицу). Менее заметно произошло уменьшение величины Н3 по сравнению с Н2. Энтропия речи прозы почти не сократилась, если учесть пределы точности при выборке в тысячу слов. На основании данных таблиц 2 и 3 можно сделать вывод, что ритмические требования прозаической речи ничтожно малы и не налагают на текст почти никаких ограничений. Ритмические виды слов в прозе следуют почти как независимые, подчиняясь лишь задачам передачи смысла, хотя полная энтропия и затрачивается в очень незначительных размерах на придание фразе ритмической завершенности (особенно в начале и конце предложения). Итоговая таблица Вид текста Научная проза . Деловая проза . Художеств, проза Тургенев . . . Достоевский . Чехов .... Лесков .... Разговорная речь Акцентный стих Ямб Блок Пушкин . . . Ломоносов . . Сгедняя длина слова 3,56 3,16 2,95 2,87 2,95 2,70 2,75 2,68 2,67 нсл 3,94 3,72 3,47 3,25 3,27 2,86 3,10 2,82 2,75 ^слог 1,11 1,18 1,18 1,13 1,11 1,13 1,05 1,03 На 2,38 2,40 2,12 2,32 2,31 2,12 2Л5 2,04 1,67 0,91 Из 2,36 2,31 2,12 2,31 2,25 2,08 2,08 2,00 1,65 0,79 Pa8H.Hi-H2 1,56 1,32 1,35 1,21 1,60 1,95 Равн. На-Нз 0,02 0,09 0,00 0,01 0,06 0,04 0,07 0,0£ 0,02 0,12
ТЕОРИЯ ИНФОРМАЦИИ И ПОЭТИКА (ЭНТРОПИЯ РИТМА РУССКОЙ РЕЧИ) 285 Ритм художественной прозы не дал значимых отклонений от ритма деловой и научной прозы; по-видимому, отличие этих стилистически различных видов состоит не в ритме (если только это не «поэма в прозе»), а в образной системе художественной речи. Различие же поэтической и прозаической речи заметно видно на материалах таблиц 1, 2, 3 и итоговой таблицы (маленькое уменьшение Н3 по сравнению сЯ2в акцентном стихе объясняется, по-видимому, тем, что подсчет парных интервалов был «сплошным», не учитывавшим строфику; при учете же последней энтропия акцентного стиха уменьшилась не на 0,02, а примерно на 0, 25). 4. Энтропия ритма стихотворной речи Любой осмысленный текст, будь это научная статья или поэтическое произведение, является порождением системы языка, на котором этот текст шшисан. Система русского языка и любого другого накладывает ограничения на сочетания букв, слов, слогов и предложений. Эти ограничения обусловливают ритмические закономерности речи, так как ритм -строится: 1) из первичных ритмических единиц — слогов, состоящих из одной гласной и 0, 1, 2, ..., N согласных букв (в устной речи —звуков); 2) из «значимых» слов, каждое из которых состоит из одного ударного и 0, 1, 2, ..., N безударных слогов; так как нельзя придумать «самое длинное слово русского языка», то теоретически может быть сколько угодно различных ритмических видов слов; 3) из сочетаний «значимых» слов в предложениях или строках стихов; стихосложение в отличие от обычной речи представляет собой такую систему построения текстов, ограничения которой носят не вероятностный, а фиксированный характер. Если количество «значимых» слов, сочетания которых создают ритм речи, в прозе целиком зависит от количества слов, нужных для передачи •смысла, то в стихосложении это количество «значимых» слов и, следовательно, ударений строго фиксировано. Ритмическая единица обычной речи (предложение) не является точным эквивалентом ритмической единицы стихотворной речи (поэтической строки и строфы). Ограничения стихосложения касаются как употребления отдельных слов, так и сочетаний их по два, по три и т. д. Например, в четырехстопном ямбе «запрещено» употребление таких ритмических видов слов, как 91 или 93 (см. таблицу 1), или таких сочетаний, как 5Х53 и т. п. В акцентном стихе эти запрещения менее строги, но тем не менее и для него вряд ли возможны такие ритмические виды слов, как 127, или сочетания 9377. Эти запрещения позволяют дать каждому стихотворному размеру точные количественные характеристики (на основе словоразделов) и вычислить Н^ (предельную энтропию) для каждого размера в отдельности. Если для прозы величина #2 близка к значению #«, то для каждого стихотворного размера //«,' примерно равна величине энтропии на стих, так как связи между ритмами последовательных стихов (и пределах строфы) очень слабо выражеЕш и подчиняются, как почти независимые события, правилам умножения вероятностей. 5. Некоторые замечания В заключение хотелось бы сделать ряд замечаний по поводу применения математических методов и, в частности, методов теории информации в такой сугубо «гуманитарной» науке, как поэтика. Теория информации на современном уровне развития позволяет оценивать только «кодовую»
286 , A. M. КОНДРАТОВ информацию, игнорируя ее смысловую и человеческую ценность. Еще более сложна оценка информации, содержащейся в произведении искусства, где ее передача происходит при наличии целого ряда параметров: стилистического, семантического и т. д. В настоящей работе был рассмотрен лишь ритм. Теория информации позволяет внести в поэтику точные количественные меры. Вслед за лингвистикой математические методы находят применение и в науке о таком специфическом языке, как искусство. Поступило в редакцию: первый вариант 26 VII 1961,, окончательный вариант 30 V 1962.
ЭМПИРИЧЕСКИЕ ДАННЫЕ О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ (МОСКВА) При решении ряда теоретических и практических задач, связанных с автоматической обработкой информации, иногда необходимо знание статистических закономерностей, характеризующих распределение букв в русских печатных текстах. Изучение этих закономерностей может осуществляться йод различными углами зрения [1, 2]. В настоящей работе рассматриваются распределения букв и двухбуквенных сочетаний в пределах границ слова и с учетом их позиции в слове. Аналогичный подход уже применялся ранее для анализа распределения букв в английских печатных текстах [2]. Приводимые ниже эмпирические данные (таблицы 1—8) были получены путем статистической обработки частотного словаря форм слов, составленного В. И. Григорьевым и Р. Г. Котовым по русским деловым текстам протяженностью около 30 000 слов (или соответственно 200 000 букв). В таблице 1 показано распределение частот *) появления отдельных букв без учета их позиции в слове. Зависимость частот появления букв от их позиции в слове иллюстрируется таблицами 2, 3, 4. Таблица 1 Распределение частот появления букв в текстах а-0,0808 6-0,0170 в-0,0569 г—0,0111 д-0,0388 е-0,0836 ж-0,0096 3-0,0174 и-0,0700 й-0,0158 к-0,0264 л-0,0248 м-0,0337 н-0,0723 0-0,1047 п-0,0371 р-0,0584 с-0,0466 т-0,0625 V-0,0202 ф-0,0017 х-0,0132 ц-0,0029 4-0,0180 ш-0,0050 щ-0,0035 ъ-0,0003 ы-0,0179 ь-0,0168 э-0,0017 ю-0,0063 я-0,0249 Буквы и двухбуквенные сочетания в зависимости от их позиции в слове могут быть разделены на три класса: а) буквы (сочетания букв), стоящие в начале слова; б) буквы (сочетания букв), стоящие в середине слова; в) буквы (сочетания букв), стоящие в конце слова. В однобуквенном слове буква, а в двухбуквенном слове сочетание букв считаются стоящими в начале слова. *) Под частотой появления какого-либо элемента текста (например, буквы или двухбуквенного сочетания) здесь понимается отношение числа случаев обнаружения этого элемента к числу всех элементов обследуемого текста.
288 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Таблица 2 Распределение частот появлепия начальных букв слова а-0,0239 6-0,0440 в-0,0953 г-0,0183 д-0,0551 е-0,0096 ж-0,0024 з-0,0283 и-0,0766 й-0,0000 к-0,0443 л-0,0061 м-0,0293 н-0,0692 0-0,0963 п-0,1539 р-0,0444 с-0,0905 т-0,0313 у-0,0332 ф-0,0093 х-0,0042 ц-0,0039 ч-0,014б ш-0.0036 щ-0,0002 ъ-0,0000 ы-0,0000 ь-0,0000 э-0,0094 ю-0,0010 я-0,0019 Таблица 3 Распределение частот появления букв, вст речающихся в середине слова а-0,0918 6-0,0143 в-0,0535 г-0,0114 Д-0,0417 е-0,0973 ж-0,0133 з-0,0172 и-0,0602 й-0,0081 к-0,0241 л-0,0335 м-0,0214 н-0,0868 0-0,1109 п-0,0168 р-0,0740 с -0,0463 т-0,0676 у-0,0157 ф-0,0002 х-0,0062 ц-0,0032 ч-0,0228 ш-0,0063 щ-0,0050 ъ-0,00п3 ы-0,0159 ь-0,0152 э-0,0003 ю-0,0051 я-0,0138 Таблица 4 Распределение частот появления конечных букв слова а-0,0936 6-0,0005 в-0,0311 г-0,0023 д-0,0089 е-0,1026 ж-0,0008 3-0,0069 и-0,1059 й-0,0661 к-0,0178 л-0,0065 м-0,0924 н-0,0125 0-0,0866 п-0,0010 р-0,0054 с-0,0014 т-0,0736 у-0,02(Ю ф-0,(Ю00 х-0.0538 ц-0,0004 4-0,0007 ш-0,0003 щ- 0,0002 ъ-0,0000 ы-0,0460 ь-0,0418 э-0,()<ИЮ ю-0,0170 я-0,0979 | Таблица 5 Распределение частот появлепия в текстах различных двухбуквенных сочетаний Предшествующая буква А Б В Г Д Последующая буква I А 01736 07239 02202 05350- Б 01059 — 00017 — 00046 в 05157 00006 00125 00068 01508 г 00689 00006 00006 — 00552 Д 02754 00017 00108 00108 00552 Е 02123 02089 03767 00159 07347 Ж 01235 00398 — — 00006 3 04086 — 01309 — 00102
О РАСЦРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 289 Продолжение таблицы 5 Предшествуй. ющая буква \_ К 1 Ж 3 и п 1 к j 1 л 1 м | и | о п 1" с т V ф X ц ч UI HI i ; Ъ I ы ' ь 1 ! ; э ! ю 1 Я 1 А 00023 00933 j 05862 00501 j ~ j 05145 | 03454 1 04194 12213 00017 01753 12111 01565 10597 00051 00120 00381 ! 00114 i 02817 00455 1 00455 1 | — — 1 I — г. 00654 00034 i 00114 1 00347 ! - 1 00006 1 00102 | •- 06846 -~ 00011 00182 00028 | 01030 1 - j — 1 j — j — j ■ 00182 | 00285 i i 1 - j 00023 00006 в 03215 j •- ! 02157 J 06937 ..._ j 00040 ! | Последующая буква Г 02362 _.. 00262 00905 ._.. 00006 — | 00023 00074 12486 00057 00979 01548 04115 00131 — 1 00341 ! 00017 j i j 00006 — 1 00017 — 01571 — 00040 1 00279 j .... 00888 06391 — 00689 00006 — 00501 | — — j — j j — — — 00137 — J — 1 00097 00114 Д 06585 01144 01713 j 00643 00040 j 00023 j i 1 i | 01935 1 09174 """ 00336 00011 00802 02191 I ~ — 00028 I — — — — 00336 1 — 1 — 00535 01303 E 01332 j 04570 j 00780 05281 1 00672 10119 j 06300 | 07159 03437 05111 11024 03420 04132 00780 00080 00102 00899 07131 02168 01611 00193 03039 1 00154 — — j 00672 Ж 01292 -- 00006 01030 — 00279 01172 — 1 00085 02504 — 00380 00011 — 01002 — — 1 i — 1 — — — ! 00063 — — 00080 j 00307 3 01360 — 00040 02794 — 00051 00017 00006 00006 02379 00006 — 00011 — 00262 — 00006 1 — — — — — 00063 00563 Й0006 — 00586 19 Проблемы кибернетики, вып. 9
290 Г. Г, БЕЛОНОГОВ, Г. Д. ФРОЛОВ Предшествующая буква • . А Б В Г Д Е Ж 3 И и к л м н 0 п р с т У ф X ц ч ш III ъ ы ь э 10 ! i я и 00808 00848 05213 00484 04285 00188 01070 01793 03540 — 03608 03631 - 05640 18194 00694 00575 05856 02367 09083 00017 00080 00267 01827 02203 01468 01485 00017 00028 — ~~ П 01446 — --- — 03318 — — 02589 — — — — — 06S69 —' — — — 00006 — — — — — — _ 01457 — — — 00017 К 03682 00006 01167 00085 00825 00933 00324 00131 03961 00040 — 01229 00028 02789 02350 — 00034 03785 00973 00882 — 00006 00023 00102 00001 — - 00142 J ооз; д; 00051 00О0(> ! 00034 | | Продолжение таблица :> Последующая буква Л 03961 01172 02646 01258 02134 07228 — 00194 04393 — 00268 01337 00131 — 07575 01400 — 02749 00102 00928 00672 00011 — 00108 00120 — — 00996 — 00(>23 om/jG : СО 137 м 03785 00034 00108 — 00074 11001 — 00603 04160 00085 00171 — 00080 — 07398 — 00643 00330 00142 00176 ~ - — — i 1 — — j 02328 00063 j 1 i i ._ ! j 01127 | H 11285 00381 02777 01975 02185 15354 01958 00922 02971 00376 00114 00552 00472 04815 08867 00273 01235 04559 02618 01155 — 00131 — 01406 45528 000(53 j — 1 000u7 03113 00023 — 00407 I 0 00011 06465 09982 07353 05577 00529 00006 01144 00689 01081 09265 04655 03153 14000 00524 13186 15024 04246 08508 — 00228 03517 00051 00006 00114 — — 01337 — 00006 П 01639 ._. 00273 "" 00165 00367 - 00006 00182 — 00006 00028 00057 — 02026 00802 00222 02880 0006S 02834 — — — -- 00222 — — — —
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 29$ Продолжение таблицы 5 Предшествующая буква А Б В Г Д Е Ж 3 и я к л м II О 1 II р 1 с т 1 У 1 ф ! х ц ч 1JI щ ! -I 1 Ь ! ы ! ь i. ! э 1 К) я р \ 04382 01184 01275 01810 01400 08451 — 00239 03215 — 02146 — — — 08121 12617 00017 01992 04672 00273 00546 00359 — 00051 00142 — | 00085 j — | 00OS0 _.._ 00040 с 05270 | 00370 01064 00006 01616 05031 — 00011 02083 02840 00023 00102 00028 00324 08565 — 00216 00427 03073 02373 — 00091 — — i - - | 00922 1 00734 00028 — 00262 т 07097 00034 00569 00006 00028 07102 — 00006 04354 00154 01258 00006 — 01759 13203 00063 01747 16641 — 01446 — 00011 — 01303 00307 | — 01383 | 00085 00854 07074 01263 Последующая буква У 00125 00415 00831 00393 01889 00102 00154 00763 ■ — — 01263 01428 01087 01508 00017 02072 04115 00427 02106 — 00011 00023 00017 00285 00057 1 00051 i | 001)00 1 — — — 1 ~~ ф 00006 — — — — 00017 — — 00011 — — -- 00011 00006 00051 — — 00017 — i — 00017 | __ ! 1 ' — | — | , 00017 | — х J 01542 00518 00074 • 00216 01872 — — 01679 — — — 00740 00017 00051 00381 00137 1 00182 " 1 - ! — ; — — 04371 ..... i ! 1 00666 ц OHIO —; 00006 — 00011 00199 — — 00814 00154 — ._- —. j 00262 00085 ! — ! 00057 | j ! 00046 ! — — — ; — 1 1 — 00011 ! ! 00006 | ООООС) j '■■ I. ч. 1 02151 :— 00011 00040 j. 00097 j 01150 1 00006 [ .'— ' 01867 1 00023 ! Г" .- 00006 ! 00006 !; 00114 Г 01906 j — J oooii i 00290 j 00131 j j 01320 \ "" j > ' j ' -- 1 ! ; — | 00239 I — ! — ; 00182 ; 00017 t.9*
292 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Продолжение таблицы 5 I Предшествующая буква А 1 Б В Г д Е 1 ж 3 и й к л м н О п р с т У ф X ц ч ш щ ъ j ы ! ь 1 э 1 Ю j я 1 _ Последующая буква Ш 00330 — 00552 00080 00637 — — 00148 00330 00006 ! — — 00114 00228 — 00501 00040 — 00615 — — — 00068 — — — 00188 00478 00649 — — ш 00267 00290 00011 § 00296 — — 00080 — — — — — 00245 — — — 00097 00381 — — — — — — 1 — 00006 — — 01787 00267 ъ — 00199 — 00023 — — — — — — — — — — — — — — — — — — — — — — — — — — — ы — 02316 04860 00837 | — — 00393 — — 00017 00609 00643 09083 — 00044 02003 00506 02914 — — — 00148 — — — — — — — ! — 1 — 1 L — 00011 00046 00114 _._ 00091 00085 — — — 06442 — 00535 — 00034 00256 00837 06346 — — — — 00256 00097 00074 - — — 1 — — — э 00080 _._ — _._ — 1 — — -- .— 00091 -- — — .... _... ... | .._ "~ "" -- — .... | ю 01838 — — — 00137 — — 00984 — — 00717 — 00028 00199 — 00023 00063 — 01884 — _... — — 00051 — 00006 — 1 00501 — J 00017 — | 00546 1 я 02146 00285 00450 | 00484 00159 — 1 00051 i 07341 i ~ — 1 03164 00347 01440 01064 00193 01514 03859 00558 00268 — '" — - __. — 00023 00028 1 00176 ... — 00131
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 293 Таблица 6 Распределение частот иоявления двухбуквенных сочетаний в начале слова Предшествующая буква А Б В Г Д Е Ж 3 И п к л 1 м н О 11 р с т 1 у ф X ц ч ш щ ъ ы ь э ю я 1 А 09767 01427 00451 03418 00038 — 26738 — 08452 00038 08114 53078 — 01127 26858 03606 14913 — 00751 01277 — 06949 00263 | — — — - '"' Б — 00113 — 00113 — — — 1 — — _.. .... — 31216 — — 01202 — 00225 — — | — i -- — — — 1 — Последующая буква В 04620 — 00828 00451 05146 — — 00188 — 00751 — — — 01427 - 00376 00338 09391 00150 00526 — 00113 00113 — — — — 00601 — 00826 г — 00263 — — 00301 — — — — — — 14199 — — 00038 — 00824 — — — j — — — | — 1 — — 1 00639 д 00038 00075 00639 00676 00301 01352 — 00451 00338 — — — 03832 — — 00075 — 06799 — — — — — — — — — — 00601 Е 03343 05710 01503 09842 01728 01841 01164 — 00038 02329 07851 16040 — 50937 07813 02554 04545 — 00301 — 04207 03869 00075 00188 — "" .__ — ж — — — — — — — — — — — — 00376 — — 00075 — 00413 — — — — — — — — — 00526 3 00075 — — — 00639 — — — 05785 00038 — 00038 00038 00038 00038 — 00075 — 00826 — — — — — — ! ~~ | — — j i - i 1
294 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Продолжение таблицы 6 Последующая буква И Л М 00225 05034 00263 06348 00676 00338 00864 02968 07888 01728 00075 00301 00601 08640 00301 00075 01390 00038 00751 01728 00038 00263 00225 00563 00075 04508 02855 05785 00038 I 04690 03193 00451 06123 12997 05559 00113 00038 01991 00451 04320 00038 00188 01728 00376 00789 03193 00526 01202 00038 00601 00488 02830 00488 01127 02216 02780 00376 02630 02404 03569 00113 00038 00^13 19458 15251 03794 18970 00301 27046 00488 06085 06348 70057 08339 20886 06499 01352 01690 00038
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 295 Предшествующая буква 1 А 1 ' i \\ ; в г Д ' Е Ж 3 и \а к л м н О 11 р с: т У ф X Ц ч iLL Ъ ы ь э Я :> 1 09358 j 02630 03343 06123 j 02216 03043 — 00376 -■ — 04470 — — — 09241 j 37526 — | 09428 j. 04095 00113 ! 03606 j 00225 i ! — ! 00150 1 i - 1 ... i i j 00188 с 00075 j — ■ 06724 1 ! j 02780 i l -- 06311 J — j "" -~ — 1 — 1 09091 j — — ! j 10969 ! 1 i 1 - i i — i i " ; 00188 i | (НЮ38 П родолжение Последующая буква 'Г y 0(5048 | ! j 01427 01953 j — 1 j 00113 00188 | ' — i i j 00150 | — | — 00038 j — 00038 — — — 21261 00338 ._. — 00639 00376 00038 00676 — 10217 05184 13223 00714 — 00639 00451 — j 00075 ; — ! 04733 01991 i 05071 — 00038 — - — i ! - 1 -- Ф " 1 j 1 ___ j 1 | -- _.. ._. — — — — — 00188 — — i I 1 i 1 _... " — -- i I 00113 i i - 1 1 X 1 | 00488 J 1 j — 04320 — — — — 02104 00113 — ■ 00563 | — ] 00038 j — ; — i j таблицы 6 a 1 """ ~т 1 1 — — I — — 1 — 1 — — — — 00376 — — ! 1 00301 1 — j .... — — 1 ...._ 1 __ - ; — j! и — — — — — ■— — — — — — 01164 — — 00526 — 02930 — — 1 — j 00038
296 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Предшествующая буква А Б В Г Д к ж 3 и 1 я к л м н О 1 п р с т У ф X ц ч ш щ ъ ы ь э ю я ш — — ._ — — — _^_ — - — — — -- — — — — — -- — — — — — 04282 — ш _! — — • — 00451 — — -- — — _.... ..._ — 00639 00338 — -- — — --- ..._ — — — Продолжение Последующая буква Ъ — — __._ _._ — — — — — — — — — — — — — — — — ._ — — ы _.._ 09391 12847 — 00676 ь — 00113 - _ ', - — ! i 00376 00939 -- — 00075 00075 00038 02442 — — — — — — _.. _... — — - — ...._ _.... --- — — — — -- — — -- — — — — э 00413 .... ..... - .... .... .... __.. — .... — — _.._ — — — таблицы 6 ю _... _.. -- - я 1 1 -- i 1 — I ! 00075 — 00263 ! .... 00113 — ! - — | - 00301 -- — — __. 00113 — — — — — ._. — — — — — — - — — 0015U 00751 j — 01127 00225 — : -
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 297 Распределение частот появления двухбуквенн Предшествующая буква А ь ' В г Д 1 Е ж з 1 II и ! к | Л м 1 н 1 о и р с т У ф \ ц 1 ч ш Щ 1 ъ ы ! ь э ю я А 00179 09722 02780 05934 00<Ш 01292 02487 00723 — 04447 03317 04064 04959 00033 02162 10966 01041 10966 00073 — 00081 00081 03178 00455 00642 ..._ — - Б 02317 - 00041 01813 00049 00163 00520 00008 00138 — 03252 — — — 00081 01016 — .... ■■- — — 00154 00829 00033 00008 ых сочетаний в с Последующая буква И 06015 00008 — 01853 05300 ... 03040 07836 - 00057 ._. — 00106 12494 01601 00179 05007 00049 — 00463 - 00008 — 00024 — 02875 — - 00187 Г 01049 00008 — — 00789 02366 00374 02162 .._ 00008 ооозз 01918 05828 — 01398 00228 — — ..._ — 00187 — 00163 Д 03756 00008 00016 00219 00723 09706 01666 02349 01658 00057 00033 — 02764 11169 — 00447 — 01471 00845 ... 00041 - — 00886 .._. ._. 00764 02422 Е 03000 02244 04495 00008 08511 00163 05446 00805 02479 ._.. 00325 10990 07235 06999 03073 02552 15161 01479 05089 00309 00049 00122 00366 10576 02715 02146 00276 00008 00154 _... 01772 Таблица 7 ,ередине ж 01853 00057 — 00008 01715 -- 00008 01471 00561 008^2 — 00350 03495 — 01114 ._. — 00935 — .... — — — ■-• ..... 00065 _.... — 00439 слова 3 06129 — 00041 — 00008 01333 ■-- 00057 02739 " 00008 00024 , _... - 03382 — — — — 00195 — 00008 — — - — 00089 | 01203 | 00008 — 01642 \
298 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Предшествующая буква ' ; А i; и г Д к ж ;> И й к л м н О п р с; т У (I) X ц ч Ш ш '1 ь ы ь [) К) я тт J 1 01130 J 01171 ! 07991 00358 1 05520 00146 01309 02227 00008 — 02845 01992 01935 23875 1 00878 j 00748 I 07251 i U1496 ; 10771 ! 00024 | 00098 j ! 00065 02601 j 03000 ! 01634 | 02008 i 00024 | 00024 ; — i ! 02357 j ! - i - 02325 j — — 01073 — - — — — 02268 — — _ — ! — — I — j — 1 1 — 1 — j 00098 i i 1 — ; 00024 i П родолжение Последующая буква К 03878 00008 j 02357 00130 02081 01106 00463 00187 03650 00065 — 00813 00089 04780 01309 — j 00049 03910 01390 : 00244 i i l I 00016 1 00033 j 00228 1 00130 I j 00593 1 00886 | — j 00008 j 00057 i л 05430 01309 03991 1 00301 00236 11202 j — 1 00276 05203 — ' 00545 01097 00829 — 10820 01569 — 02674 00146 j 00821 00024 00008 1 ~ 00236 1 00171 | — 02040 1 — 1 — 00065 00122 i M " """'I 03951 | 00049 00073 — 00106 j 04430 — 00862 05024 00122 ! — — — — 05243 — 01130 00211 00195 00114 — j — ! — 1 — — | — 02390 00089 I — 1 — 01707 11 1 ! 16079 j 00553 | 03479 i 02796 02910 22363 02796 00927 04414 00528 00163 00772 00837 07552 10795 00390 01764 05991 03739 | 00471 -■ 00187 j — ! 03016 1 00715 j 00098 00089 05300 | 00008 оата табли 0 00016 04064 10584 J 02991 04609* 00756 00008 01585 01780 02357 09039 04438 03634 15226 00756 03707 18469 01699 10568 -- 00033 1 04625 1 00081 00008 00130 1 -- 02723 j — | — 1 00008 цы 7 II 03122 — 00024 — 00236 01610 — — 00423 — — 00041 00081 — 01699 00959 00317 03552 1 00098 02837 — ! — — 1 — — — j 00317 — — ! •— i _
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 299 1редшест- вующан буква А Б В Г Д Е Ж 3 И Й К Л м н О п р с т У ф X ц ч ш щ ъ ы ь э ю я р 04910 01024 01886 01317 02203 12218 — 00260 03528 — 02951 — — — 08714 03585 00024 00805 06552 00325 — 00463 — 00122 00203 — 00098 — 00114 — 00016 ----- с 07511 00610 00057 00008 02309 06625 — 00016 01666 04056 00033 00146 00203 00455 10226 — 00276 00626 04715 00992 — 00130 — — — — 02138 01821 — — 00325 Продолжение Последующая буква Т 09576 00130 01203 00008 00041 06389 — 00008 06398 00219 02414 00008 — 03242 10454 00016 02878 20761 — 00910 -- 00016 — 01650 00008 — 02739 00122 00122 01455 02374 у 00187 00358 01918 00390 01975 00146 00163 00975 — — 00661 00886 00772 02065 00024 00691 05406 00293 02520 .... — — 00008 00073 00098 00073 00008 — — — — Ф _.._ — — — — 00024 -- — 01260 — — — 00016 00008 00041 — — 00081 — 00024 — — — — — — _. — X 00772 00821 — — 00309 02130 — — — — — — — — 00602 00073 00423 00195 00138 — — — — — — 00293 ] — — — — таблицы 7 Ц 01268 — 00008 — 00016 00236 — — — 00219 — — — 00374 00041 — — 00081 ~~ _ — ™ — — — — 00016 — ! 00008 00008 ч 03024 — 00016 00057 00138 | 01683 00008 — 1 02748 00033 — 00008 00008 00163 02455 — 00016 00317 i i 00203 00423 -■ — — 00341 — — 00219 i 00016
300 Г. Г. БЕЛОНОГОВ. Г. Д. ФРОЛОВ Продолжение таблицы 7 Предшест- вующап буква 1 А Ь В г 1 д Е | Ж о и к л м 1 11 1 ° 11 р с т У ф X ц ч ш ш ъ ы ь э ю я Последующая буква [ . \ ш 00430 — 00789 — U0114 00910 — — 00374 00471 00008 — 00163 00325 — 00667 00065 — 00707 — -- 00268 — __. — 00268 01520 — _.. — щ 00374 00496 00016 ъ ..._ 00366 — ы 00496 04235 | _.. | — .._ 00317 ооозз .__ 00439 — ! ! i 1 ! ! - 00480 00130 1 - 1 . ! 1 - 00024 1 - ! - j 1 - 00382 — — — — ! 03089 — — ...... — — __.. ..... I '"' | i i ! 00154 01528 10194 .._. 00195 02374 00244 01195 — — — — — — ! -■- 00008 | - - ! - — | 02569 | — — — — 00366 | - | — 1 i ь 00008 00016 — — — 00130 00016 _... 06747 -- 00098 ~~ 00325 00138 02211 — -- — — 00415 00073 00049 _.._ — — :j. 00008 — __ - ■ — _... - — — — 00130 — — — — — — — — — - — — .... — — 10 03325 — — - — 00146 — - — — 00943 — 00016 00008 — 00033 00008 — 00878 — — — — — 00008 — 00024 — 00008 01610 я 1 1 00276 00293 1 00577 — 00569 00106 — 00057 00057 00154 00065 ' 01463 01016 00236 02219 ! 00211 00488 00049 — j — — — — 00033 00041 00455 i i i i 00016 i 1
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 301 Таблица 8 Распределение частот появленоя двухбуквенпых сочетаний в конце слова Предшествующая буква 1 А 1 ! в I ! Г ; д ! Е i Ж 3 И й ! к л м н С) п р : с; т 1 у ф X ц i I ч ш HI i ъ i 1 ы ! ь э Последующая буква А 01074 05714 01342 08360 | — 00230 00575 — 22779 03758 01419 12348 — 00614 05714 01956 08322 — 00038 00882 | 00383 00652 00614 00038 | — ! ■"■ ! — Б 00115 — — — ... — — 00038 — 00115 — 00077 — 1 — __. -- 1 -- — — _._ — — ! — В 01802 — -■■ •- — 00499 — 02148 ..._ .... — i 23967 — 00882 — 03643 I 00115 j . ! ! i j 00345 __ I — г ..._ """" — — 00383 — ~~ — 00707 01035 I — I ! — 1 _. 00268 ; -- j _... 1 --- 1 _ 1 j j i 1 —' I j .... | — Д 00805 — .... — — 02263 — ..._ 00077 ... __. 00077 05292 — 00153 — __.. i j i 1 j i 1 ; — — E 00307 00499 02186 00652 03260 06634 03758 00192 27841 03720 03873 00997 07325 08858 00230 00920 02339 03413 — — 00115 00038 00153 01726 00575 I 20746 00345 j — ж — 1 — i — 1 — 00729 — — — — — — — — — — -- — — ; — — __. — 00115 | — 1 "" 3 00460 — — — • — 0287t> — — 00038 — j — — — 00038 — — 1 | 1 j 1 — i i - I 00153 | ! 0057J > i
302 Г. Г. БЕЛОНОГОВ, Г. Д. ФРОЛОВ Предшествующая буква А В В Г Д Е Ж И п к л м н О п р с т у ф X ц ч ш щ Ы ь э К) я и 00115 00038 — 01304 00614 00575 00345 01265 23891 — 14841 12348 27841 02416 00537 00038 08858 00038 13844 — _ 00077 — 03873 00422 00460 .__ 00077 — — — П 00537 - — ... — 11159 — __ 14380 — — — — 35510 — — — — — — - ... — _ 09395 — — — — Продолжение Последующая буква К 06404 — — — 01074 — ._ 01802 — — 00652 — 00077 05062 • — — 03988 — — — — — — — 00077 — — — — Л 01189 — _._ — 01112 — — 03298 — — — ._. ..._ — — — 00192 — — — — -- -- 00920 — -- — 00307 м 05867 — _..- — 52537 — — 05100 — — - — 2139S — 00192 — — 00038 — — — "" 09088 02914 н - 01572 -- — ■- — 04218 — — 00997 00038 — 00077 — 00882 04640 — — — — — — — -- — — — — -- — 00077 таблицы 8 о _ 00499 02224 34438 00383 — - 00077 00077 — 03528 02684 0П26 17218 — — 01496 — 04678 — — 00115 00077 — 00115 _, ._ — — ..... П 00038 - — — — — — 00038 — -'- — — — — 00115 00844 — — — 00038 — — — — — — -- — — —
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 303. Продолжение таблицы 8 Предшествующая буква Последующая буква Ф | 00690 j 00690 00077 0026S 00920 02378 00383 00690 00192 00192 I 00614 00230 00038 I 00268 | _ 00115 00038 00115 17793 03029 00920 00614 02608 00077 00728 02876 00038 00115 00077 00383 00690 03720 00115 00537 05944 01227 05752 03605 00307 00805 00767 02109 00115 00077 01572 00345 — 1 43026 00102 ; 01035 06980 i 02608 10546 00230 00192 00077 00537 28301 04487 |
;зо4 Г. Г. БЕЛО ЙОГОВ, Г. Д. ФРОЛОВ Продолжение таблицы 8 Предшествующая буква Ш ш А в в 1 1 д Е Ж 3 и й к л м н О 11 р с т 1 у ф X ц ч ш 1Д ъ ы ь э ю и 0007 -- — ..._ -- — -- - 0022 : — i 000с 1 - — — 1 -■■ I — ! 00038 00077 Последующая буква ъ - Ы 04065 01572 02876 ■ — ь 01074 00115 00767 Э 00384 | 00499 I 02761 00822 17372 01879 02224 02224 01112 -- 03145 00230 00307 0498Г) 11888 | 31637 00959 00537 00307 | 00384* I I — ю 00537 — — — 00230 — 06327 13307 00537 00307 00920 00575 00077 39575 00153 .— 00115 01342 ■ — 1 — , 00268 | — i 05982 13690 02071 03029 02378 00038 00537 25080 00307 01342 03260 00077 00038 00920 00805
О РАСПРЕДЕЛЕНИИ БУКВ В РУССКОЙ ПИСЬМЕННОЙ РЕЧИ 305 Количество двухбуквенных сочетаний в слове на единицу меньше количества букв в нем. Поэтому двухбуквенные сочетания, расположенные в середине слова, могут быть только у слов, состоящих не менее чем из четырех букв. Таблица 5 иллюстрирует распределение двухбуквенных сочетаний без учета их позиции в слове. Здесь список различных двухбуквенных сочетаний вместе с частотами их появления в текстах представлен в виде двумерной таблицы. Строка таблицы обозначается предшествующей буквой, а столбец — последующей буквой двухбуквенного сочетания. На пересечении строки и столбца указана частота появления двухбуквенного сочетания. В целях экономии места частоты в таблице бив последующих таблицах условно записаны в виде целых чисел. Чтобы получить истинное значение частоты появления двухбуквенного сочетания, необходимо умножить соответствующее целое число на величину 10_6. В таблицах 6, 7, 8 показано распределение двухбуквенных сочетаний, стоящих соответственно в начале, в середине и в конце слова. Эти таблицы построены аналогично таблице 5. Сопоставление таблиц 2—4 и 6—8 показывает, что частота появления отдельных букв и двухбуквенных сочетаний существенным образом зависит от их позиции в слове. Частота появления букв и двухбуквенных сочетаний зависит также и от длины слов. Для однобуквенных, двухбуквенных и трехбуквенных слов существование этой зависимости очевидно. Однако такая зависимость имеет место и* для слов большей длины, причем для различных букв и двухбуквенных сочетаний она носит различный характер. Таблицы экспериментальных данных, иллюстрирующие это утверждение, весьма громоздки. Поэтому они здесь не приводятся. ЛИТЕРАТУРА [1] Лебедев Д. С. и Г а р м а ш В. А., О возможности увеличения скорости передачи телеграфных сообщений, Электросвязь 1, 1958. [2] Bourne Charles P. and Ford Donald F., A study of the statistics of letters in english words, Information and Control 4, 1, March 1961, 48—67. Поступило в редакцию 18X1 1961. 26 Проблемы кибернетики, выи. 9
ПРИМЕНЕНИЕ МЕТОДА ИНТЕРПОЛЯЦИИ ДЛЯ НАХОЖДЕНИЯ СЛОВ В СЛОВАРЕ ПРИ МАШИННОМ ПЕРЕВОДЕ ЯО ЧЖАО-ВЭЙ (ПЕКИН) § 1. Введение При МП с одного языка на другой перед нами прежде веете встает вопрос: как эффективным способом получить при помощи словаря, записанного в машине, словарную информацию каждого отдельного слова текста, чтобы затем на основе этой информации провести грамматический анализ предложений и после всего сделать перевод. Отсюда видно, что вопрос о нахождении слов в словаре является существенным в исследованиях по МП. Практика также показывает, что при переводе на машине с одного языка на другой на поиски слов в словаре требуется значительно больше времени, чем на грамматический анализ и перевод. Поэтому совершенно необходимо улучшать способы нахождения слов в словаре. Фактически решение этого вопроса сводится к установлению соотношений между некоторыми величинами и отсюда к точному определению места нахождения в памяти машины соответствующей каждому слову текста словарной информации. Другими словами, требуется найти адреса ячеек памяти, где находится информация слова. В данной статье излагаются результаты работы по установлению связи между словами языка и адресами ячеек памяти, где хранится словарная информация слов. § 2. Слово и число Предположим, что дано конечное множество элементов {ав,ах, ... , a^-J. Назовем его алфавитом. Каждый элемент этого множества at (i = 0, 1, ... , г—1) мы назовем буквой. Под словом понимается конечная последовательность, состоящая из ограниченного числа букв алфавита, например аг; c^agcx^; аг ... c^a^a^, каждая последовательность обозначает одно слово. п раз Заметим, что: а) каждый элемент слова состоит из одной буквы*); б) порядок следования букв в слове строго определен. Предположим, что данный алфавит имеет порядок следования букв а0, ах, ... , аг-1. Мы можем установить взаимно однозначное соответствие между этими буквами и множеством, которое состоит из г чисел {0, 1, ... ...,г—1}, считая,«что каждая буква at (i = О, 1, ... , г—1) соответствует *) В одном и том же слове может неоднократно появляться одна и та же букв.), к тому же слово может состоять только из одной буквы. 20*
308 Я О ЧШАО-ВЭЙ числу i в r-ичной системе. Таким образом, слова, состоящие из букв алфавита {а0, а1? ... , аг_х}, могут рассматриваться как однозначно определенные положительные числа в r-ичной системе. Как показано у Королева [2], слово находится во взаимно однозначном соответствии с числом wn = V1"1 -i- vn_2 + • • • + V° = 2 Vn_i • (i) n Мы будем называть число Wn = У кхгп'% значимым кодом слова ak-flkz . . . a.kn или просто кодом слова а/^а/^ . . . а/,п. Так как формула (1) выражает одно и только одно число, то для каждого заданного положительного числа (1) (в 7-ичной системе) будет однозначно определено слово а/ча^2 . . . <x/in. Мы можем также привести формулу (1) к следующему виду: умножим обе части формулы (1) на /—Л/ (где М--какое-то целое число): -;- Л^т-»—i-u-f ... + hnr-и = 1; Ау»-'-м + ^i A-,r»-'--w. -i—1 f=.-!-;-1 s S |-Л/ Пусть /i —s —M = 0, откуда /i = s + _l/. Тогда Й^ = 2 V "* + 2 kf*'1; i=l K-s-j-i полагая £ = 6* -f /\ получим: i=l j=l или где w^SV'-i-jR, (2) 7=1 M rc = s + M, й = У к6^Г\ Таким образом, соответствующее слову число состоит из двух частей. Первую часть назовем основой слова — это главная часть слова. Вторую часть назовем окончанием слова — то, что остается после отделения главной части слова. Поэтому вполне очевидно, что каждое слово может быть представлено в виде (2). С помощью этого метода в языке легко строится соответствие между «корнем слова» (неизменяемой частью слова) и «флексией» (тем, что остается после отсечения неизменяемой части слова). § 3. Интерполяционная формула Из § 2 следует, что если задан алфавит, то для каждого слова по формуле (1) можно определить число, находящееся с ним во взаимно однозначном соответствии. В то же время на практике мы часто имеем дело не во всем множеством слов, а только с ограниченной частью этого множества. Другими словами, число слов словаря ограничено. Поэтому мно-
О НАХОЖДЕНИИ СЛОВ В СЛОВАРЕ ПРИ МП 309 жество чисел, находящихся с ними во взаимно однозначном соответствии, также ограничено. Таким образом, мы можем расположить их в монотонно возрастающую (или монотонно убывающую) последовательность и получить на числовой оси ряд соответствующих точек о)0, (о1? ... , (Од (предполагая, что словарь состоит из N + 1 слов): О)0 < 0)х < ... < CO.v. (3) Построим прямоугольную систему координат. На оси ординат у будем отмечать адреса ячеек памяти машины, а на оси абсцисс х будем изображать числа, определяемые по формуле (1) и соответствующие словам, выбираемым из словаря (см. рис.). Предположим, что информация слов из последовательности (3), хранящаяся в словаре, помещается последовательно в N -\- 1 ячейках A, A -f- 1, ... ..., А + N памяти машины. Тогда мы можем считать, что существует такая монотонная непрерывная функция у = f(x), что значение ее в точке G)t равно А + i, т. е. /(©4)=Л + 1, i = 0, 1, ..., N. (4) Если выбрать о)0, со^ . . ., сод: в качестве интерполяционных точек выведенной нами функциональной зависимости, то можно использовать метод интерполяции точек для того, чтобы получить удовлетворяющий формуле (4) интерполяционный многочлен =- n~r,N -4- алх N- + ал (5) так, чтобы ф(©4)=Л+«. Поэтому коэффициенты ai в формуле (5) должны удовлетворять следующей системе уравнений: . -|- aN — A -;■ «о^о «1<"Ч- апо) 0Ш1 аха) N-1 1, апо) ал(й Л-1 . + а v = А -!- «О^д ~i_ aiUJV id) Л-1 . . . -^-aN = A-\-N. (6) Определитель системы (6) является определителем Вандермонда: Д = N ,*N- G)'v О) .. . соп coiN со' N-1 G)iN GK ... (О, k, j=0 a>£ w;\ Л-1 (Од 1
310 НО ЧЖАО-ВОИ Так как все со0, щ, . . ., сод различны, то А Ф 0. Поэтому коэффициенты а0, av ..., ад- в формуле (5) можно однозначно определить из системы (6), а следовательно, многочлен (5) также однозначно определяется. Для того чтобы конкретно найти многочлен cp(#), можно уравнения (5) и (6) переписать в виде апХ' а*ы а.сд1. "Г 0>N — ф (#) — 0, ад -(A -i-i) = 0, i = 0, 1, .. ., N. (7) Так как однородная система (7) имеет решение, не тождественно равное нулю, то определитель системы должен равняться нулю, т. е. I Ф (#) 1 ! А 1 пли х- <*0 % О) %-{ со?' Л-j-J 1 О), (Of ! А + i 1 со,- со2 j Л-;-7У I (0\ (х)\ ... (о^-1 оуг, o)f-1 со* 1 1 >Л-1 ,,,ЛГ : Ф(.г)-Л 1 х х2 ... • A'-l ГЛ (JL)0 ОИ со/У—* о)д J 1 С01 Coy . . . G)^-1 (D* О, 0)t (OJ2 ... G)^-1 uHv I откуда получаем: <р(х)-А=Ц(х -а),) ^ .7 = 0 или А: ЛГ ><=! (* —CDfe)[] (©ft — ©.,) j=0 у=ф(*)=^ + 2 {41 (-—-)}• о (8) Фактически это—частный случай интерполяционного многочлена Лагранжа. Очевидно, что он удовлетворяет условию <р((о{)=А + 1. Формула (8) при условиях существования определенного алфавита, который мы должны определить, выражает функциональную зависимость между числом х, однозначно определяемым по формуле (1) и соответствую-
О НАХОЖДЕНИИ СЛОВ В СЛОВАРЕ ПРИ МП 311 щим каждому выбираемому нами слову словаря, содержащего N -|- 1 слов, и у — адресом ячейки памяти, где хранится информация слова. Тогда для каждого х находим целое число у: »-3{*П (££)]■ о» /? = 1 3=0 П } Зфк Таким образом, в машине не надо хранить значимые коды самих слов, достаточно хранить лишь словарную информацию. § 4. Заключение I. Предположим, что уже готов словарь, необходимый для МИ; количество слов Аг в нем определено. Тогда мы можем по формуле (1) для каждого слова словаря вычислить соответствующее ему число, а по формуле (8) определить функциональную зависимость между числом ж, полученным по формуле (1) и соответствующим каждому слову этой части словаря, и адресом у ячейки памяти машины, где хранится словарная информация этого слова. Отсюда вопрос о нахождении в словаре отдельных слов текста для получения их словарной информации сводится к следующему: A) по формуле (1) находим число, соответствующее данному слову; B) подставляем найденное число в формулу (9) и вычисляем величину у; В) Л -,- у и есть адрес ячейки словаря, где хранится информация данного слова. II. Очевидно, формулы (1) и (8) однозначны. Если слова, которые отыскиваются, имеются в составленном нами словаре, то вопрос о нахождении слова в словаре решается однозначно. Однако на практике, так как одно м то же слово играет разную грамматическую роль в предложении, форма этих слов также претерпевает соответствующие изменения, например изменения окончаний и служебных слов, имеющих различные грамматические функции. Такое явление имеет место, например, в русском языке. Поэтому для одних и тех же слов ввиду изменения окончаний числа, вычисляемые по формуле (1), могут получить неодинаковые значения, и после подстановки их в формулу (9) у принимает дробное значение. Если число, соответствующее искомому слову, вычисляется по формуле (2), тогда это не так страшно. Конечно, при этом нужно заново вычислить со0, о^, ..., сод,, участвующие в формулах (8) и (9), и подставить величину х, вычисляемую по формуле (2) и соответствующую искомому слову, в новую формулу (9). Если полученное у — не целое число, то это означает, что мы должны исследовать остаточный член /?, чтобы посредством определенных правил привести у к форме, имеющейся в словаре. Однако это исследование для китайского языка не требуется. III. Несмотря на то, что после составления словаря мы можем по формуле (1) установить зависимость (8), на практике оказывается, что конкретное нахождение выражения (8) сравнительно сложно, и если объем данного словаря увеличивается, тогда нужно вновь вычислять каждую часть формулы*(8), что также является громоздкой работой. Кроме того, если для каждого слова мы не можем в одной ячейке памяти поместить всю словарную информацию, соотношение (8) также нуждается в соответствующем исправлении.
312 ЯО ЧЖАО-ВЭЙ ЛИТЕРАТУРА [1] К у л а г и н а О. С. и В а к у л о в с к а я Г. В., Опытные переводы с французского языка на русский на машине «Стрела», Сб. «Проблемы кибернетики», вып. 2, Физматгиз, 1959, 283—288. [2] Королев Л. П., Кодирование и свертывание кодов, ДАН СССР 113, № 4, 1957, 746—747. [3] X у Ц з у-ч и, Методы вычисления, Изд. высшего образования, Пекин, 1959. [4] Королев Л. Н., Методы выборки нужного слова из словаря, Вычислительная техника, АН СССР, Москва, 1958, 116—118. [5] К у л а г и н а О. С, О машинном переводе с французского языка на русский. 1. Сб. «Проблемы кибернетики», вып. 3, Физматгиз, 1960, 181—208. Поступило в редакцию 3 III 1962.
IX. КРАТКИЕ СООБЩЕНИЯ ПРИМЕР ЦЕН ОПТИМАЛЬНОГО ПЛАНИРОВАНИЯ А. Л. БРУДНО (МОСКВА) В некоторых работах по математическим методам экономики (эконометрики) вычисляются цены продуктов, вытекающие определенным образом из оптимального, варианта производства. Предлагаемая заметка состоит из примера, подзывающего, что пользоваться такими ценами нужно осторожно *). Ничтожные (стремящиеся к нулю) различия способов производства, с затратами близкими к единице, могут завести эти цены в бесконечность, а ничтожное удорожание способов производства при неизменных потребностях и мощностях может сильно уменьшить эти цены. Обозначения. Пусть имеются два поля i = 1 и i = 2, на которых производятся две культуры /с = 1 и к = 2. Введем обозначения: Mi (га) —площадь поля i\ Ak (if) —потребность в культуре к; агк (руб/га) — затраты на единицу площади поля i для культуры / , %ik (ц/га) — урожайность культуры к на поле i\ 'ih- -aik/Kk (Руб/Ц) — затраты на единицу культуры к на поле i\ xih (га) —площадь поля i, занятая культурой к. Пример. 1-6! 1 + е2 1-6 I 1-е4 1 14-е2 1-6 1-е4 1-е4 1 1 + е2 0<е<1 е2<< aik hik bik = aik : Xih Требуется засеять поля так, чтобы собрать заданный урожай {Ah} при минимальных затратах: 22 aikxik — min- Прежде чем решать задачу, поставленную в примере, заметим, что первая культура дешевле производится на втором поле, а вторая —на первом, ибо ^21 ■ у12 " 1-6 1-е4 < 1-е2 1-е4 1 1-i-e2 ¥ = К Jw *) Независимо от названия: «цена», «оценка», «стоимость вместе с рентой» которое не влияет на наш пример.
314 А. Л. БРУДНО Если первую культуру засеять на втором поле, а вторую -на первом, то они будут производиться с минимальными затратами, но урожай каждой из них будет равен 1 — е4, что меньше заданного А1 = А2=\. Если же первую культуру сеять на первом поле, а вторую —на втором, то заданный урожай будет получен и даже часть полей останется свободной, но затраты не будут минимальными. Решение. Легко сосчитать, что заданный урожай с минимальными затратами получается только при хп-х22-е*:(1 ! г*), | Затраты= 2(l-^-Л(р^). Сами цифры для нас роли не играют. Существенно только, что все xik > 0, т. е. что в оптимальном варианте каждая культура производится на обоих полях. Найдем ренты ?\ (руб/га) полей и цены*) ck (руб/ц) продуктов в оптимальном варианте производства. Первая культура производится на обоих полях. Поэтому в рассматриваемых работах вводятся такие ренты rt, чтобы цена сх единицы (ц) первого продукта, произведенного на первом и втором полях, была одной и той же. Таким образом, Ац А21 Для второй культуры аналогично имеем: Решая эти два уравнения с двумя неизвестными /•, получаем: (1-:-е2) е2 Р а с с м о т р и м поведение цен. Пусть г выбрано столь малым, чтобы величина 1 : е была поразительна велика. Так как при этом 82<б<е, то различие между полями и по затратам на производство, и по урожайностям будет ничтожным. Сперва возьмем б близким к е2. Тогда ренты будут близки к нулю, а цены близки к 1 : (1 -|— е2), т. е. к затратам на производство культуры на невыгодном для нее поле. Теперь начнем увеличивать б от е2 до е. При этом останутся неизменными и потребности Ak, и площади полей Mit и их урожайности Xik. Слегка изменятся только затраты а12 = а21, которые уменьшатся от 1-е2 до 1-е. Но при этом цены возрастут от величины 1:(1-|-е2), близкой к единице, до поразительно большой величины 1 : [е (1 -f e2)]. Резюмируем. При ничтожном различии в затратах и урожай- ностях полей одно только небольшое удешевление способов производства может колоссально увеличить цены оптимального плана. Замечание 1. Результаты нашего примера не связаны с незаменимостью культур к=1 и к = 2. Результаты сохранятся, если вместо задания AL=l и А2=1 мы потребуем только, чтобы А1 + А2 = 2, т. е. примем культуры взаимозаменяемыми в потреблении. *) Ренты иногда называют «прокатными стоимостями», но мы уже говорили, что различия в названиях не отражаются на нашем примере.
ПРИМЕР ЦЕН ОПТИМАЛЬНОГО ПЛАНИРОВАНИЯ 31о Замечание 2. В транспортной задаче линейного программирования пример, подобный нашему, невозможен, как показывает Теорема*). Если {г {} — ренты транспортной задачи, то для каждого i найдутся такие А > 0 и /, что при увеличении мощности поставщика i на А и одновременном уменьшении на А мощности поставщика j общие расходы на производство и перевозку всего продукта в оптимальном варианте упадут на Аг{. Замечание 3. Численный пример. Положим б = 8 = 0,1. Если культуру к = 1, 2 посеять на поле /с, то часть полей (е2/(1 -f- e2) ъ 1%) останется свободной, но затраты на единицу продукции и цены будут примерно равны 1. При оптимальном плане затраты на единицу продукции упадут на 10% (до 0,9:1,01^0,9), но цены возрастут в десять раз (1: (0,1-1,01) ^ 10). Замечание 4. Увеличим задание Аг-= Л2= 1 нашего примера на небольшую величину. Легко сосчитать, что в оптимальных вариантах отношение приращения затрат к приращению продукции равно цене продуктов с1 = с2 (оптимального варианта). Может быть, не лишне отметить, что это отношение (его можно сделать сколь угодно большим) не совпадает с затратами на производство самой единицы дополнительной продукции (они не превосходят 1 : (1-f-е2) < 1), а происходит от изменения способа производства других частей продукта. Замечание 5. Зафиксируем в j нашем примере малое е — б и проследим за изменением цены с = с1 = с2 как функции задания А = Лг = А2. При ^4< 1 — е4 постоянно будет с=1 — е. При 1 — е4<Л<1 + е2 засеваться должны все варианты, цена с= 1 : [е (1-f е2)], т. е. весьма высока (при малом е) и постоянна. При ^4=1 + е2цена скачком падает до с = 1. При Л>1 + е2 задание невыполнимо. Таким образом, никаких значений, кроме 1 — е,1 и 1:[е(1 + е2)], цены вообще принять не могут ни при каком задании А. Во всем этом рассуждении вместо Л= А1= А2 можно было взять .4 — (^-f А2): 2. *) См. «Применение цифровых машин в экономике», Сборник. Изд-во АН СССР, 1962. Поступило в редакцию 24 III 1962.
О СИНТЕЗЕ СХЕМ ИЗ ПОРОГОВЫХ ЭЛЕМЕНТОВ /;. 10. ЗАХАРОВА (МОСКВА) Один из вопросов теории схем состоит в следующем: насколько расширение запаса средств, используемых при синтезе, влияет на сложность схемы, реализующей функции из Pfe.JJ Рассмотрим частный случай схем из функциональных элементов [1], реализующих функции алгебры логики. Из [1] известно, что для этого класса схем в случае произвольного конечного базиса для функции Шеннона L(n) справедливо следующее асимптотическое равенство: L (п) — с — \с — константа, зависящая от базиса). Возьмем теперь в качестве базиса множество Ш, состоящее из всевозможных пороговых элементов [2, 3], т. е. функциональных элементов, реализующих функции вида п-1 ., -, y=s\gn( 2 Ej-Sj-Л). j=0 где х.£ (0, 1], ^ и и —некоторые целые числа и О при z < О, ipn z>0. Число 1] называется порогом элемента. Можно считать, что значение п-1 порога удовлетворяет условию — s<r)<s-|- 1, где s= ^. | g. j, так как 3=0 при н>5-, 1 элемент реализует тождественный нуль, а при r,^—s — тождественпую единицу. Пороговый элемент имеет п входов и один выход. Схемы из пороговых элементов строятся по тем же правилам, что и схемы из функциональных элементов. Каждый вход порогового элемента, по определению, имеет некоторый вес, а именно, i-й вход имеет вес, равный ^. Положим вес порогового элемента равным s, а вес схемы из пороговых элементов равным сумме весов составляющих ее элементов. Функция Шеннона L(n) определяется обычным образом. Теорема. В схемах из пороговых элементов on L (п) ~ - . Г0Щ 1 1 щ 2п п следует из [4]. Покажем, что L(n)>^. Пусть дана схема из пороговых Доказательство. Асимптотическое неравенство L(п) ^ 2п
318 Е. Ю. ЗАХАРОВА элементов. По ней можно однозначно построить ориентированный граф следующим образом. Изобразим элементы точками (вершинами) и припишем им значения соответствующих порогов. Вершины соединим ребрами по следующему принципу. Если к i-му входу некоторого элемента присоединен выход другого элемента, то проведем между соответствующими вершинами | £t | параллельных ребер, направленных к первой вершине, и припишем всем этим ребрам знак коэффициента £4. И так для каждого входа каждого элемента. По полученному графу схема восстанавливается однозначно. Вес графа положим равным весу исходной схемы. Для получения нижней оценки L(n) достаточно оценить сверху число Q (n, L) ориентированных графов с L ребрами и п различимыми входными вершинами, не содержащих ориентированных циклов и внутренним вершинам которых приписаны значения порогов элементов, а ребрам —знаки плюс или минус. Пусть такой граф G, содержащий L ребер, имеет hk вершин, в каждую из которых входит к ребер (Л =1,2, . . ., а). Набор Н = {hlt /г2, . . ., ка} называется порядковой структурой графа G. Подсчитаем число D(H) способов приписывания значений порогов элементов внутренним вершинам графа G с порядковой структурой Н. Пороговый элемент полностью задается значениями коэффициентов £t и порога т]. Абсолютные значения коэффициентов определяются самим графом. Чтобы задать знаки коэффициентов £;., нужно приписать знак каждой группе ребер, соответствующей одному и тому же входу элемента. Число способов, которыми это можно сделать, не превосходит 2L. Далее, если в вершину входит s ребер, то значение порога, как это выше указывалось, разумно выбирать из целочисленного отрезка [— s, s-\-1], т. е. для этой вершины имеем 2.^ + 2 способов приписывания значения порога. Итак, а D (//)< 2L2"2'll3"2.. .(а -. 1)4 Л = 2 Л,. 1=1 Число R (п, Н) неизоморфных ориентированных графов без ориентированных циклов с п различимыми входными вершинами и порядковой структурой Н удовлетворяет неравенству [1] а R (и, Н) < 8L (к -\ n)h-h"rr\ L = ^ *А4. Число Н (L) порядковых структур у графов, имеющих L ребер, равно числу разбиений L на неупорядоченные положительные целочисленные» слагаемые (такое разбиение содержит hh слагаемых, равных к). Как известно, #(L)<2L. Очевидно, что Q(n, L)<H(L)mbx(R(n, H)-D(H)). п Так как h<L, a + 1 </, + /?, то /)(#)< 2L+/l (L-/г)\ Я (л, H)D(H)<AL(L~n)Lny ( (п, L)<.BL(L- /?)L!n (А и В — константы).
О СИНТЕЗЕ СХЕМ ИЗ ПОРОГОВЫХ ЭЛЕМЕНТОВ 319 Поэтому, если L < --- (1 — е), е > 0, то Q(n,L) M t>„ ' —> U при п —л ос . Отсюда следует, что L(n)^-:- . Теорема доказана. Замечание. Нижняя оценка для L(n), полученная в базисе Ш% остается верной, если вместо Ш рассматривать его подмножество 91, состоящее из всех монотонных симметрических функций и отрицания. Из всего сказанного вытекает, что такого расширения запаса средств, как это имеет место в базисах 91 и 5Ш, недостаточно для того, чтобы была возможна более простая реализация большинства функций, чем при использовании конечных базисов. ЛИТЕРАТУРА [1J Л у п а н о в О. Б., Об одном методе синтеза схем, Известия ВУЗ, серия радиофизики, 1958, № 1. |2] В а р ш а в с к и й В. И., Функциональные возможности схем из пороговых элементов, ДАН 139, № 5, 1961. [3]MurogaS., The principle of majority decision logical elements and the complexity of their circuits, «Informat. processing», Paris — Munchen — London, 1960, 400—407. |4| 3 a x a p о в а Е. Ю., Об одном обобщении электронно-ламповых схем, Сб. «Про- 5лемы кибернетики», вып. 7, Физматгиз, 1962. Поступило в редакцию 15 XI 1961t
О СРАВНЕНИИ ДВУХ ТИПОВ КОНЕЧНЫХ ИСТОЧНИКОВ о. Б. лупанов (МОСКВА) В этой заметке строятся примеры, выясняющие количественные соотношения между конечными источниками и конечными источниками некоторого специального типа [1, 2]. Рассматриваемый здесь вопрос возник в связи с задачей о соотношении сложности автоматов, представляющих и перечисляющих одно и то же событие [3, 4], и исследовался в работе Г. М. Корпелевич для автоматов Мура [5]. 1. Источники. Некоторые известные факты. Пусть А = {а, Ь, с, ...} —конечный алфавит. Источником (над ^4) будем называть конечный ориентированный граф [7], ребрам которого приписаны буквы алфавита Л, в котором отмечена одна вершина (начальная вершина) и выделено некоторое множество вершин {конечные вершины). Вершины ° ^^™Х1Г источника будем называть также состояниями источника. На рис. 1 приведен пример источника. Рис- *• Каждому ориентированному пути в источнике естественным образом поставим в соответствие слово в алфавите А, выписывая подряд буквы, приписанные ребрам этого пути (допускаются салюпересекающиеся пути; допускается также путь, состоящий из одной вершины; ему соответствует пустое слово, которое мы будем обозначать символом X). Пусть Ш — произвольное множество состояний источника. Обозначим через 7\}j(3JJ) множество*) (различных) слов, соответствующих всевозможным путям, начинающимся в состояниях из Ш и оканчивающимся в конечных состояниях. Множества Шх и 5W2 будем называть отличимыми, если Т^(Шг) ф Т% (5Ш2). Множество Т%({х0}), где xQ — начальное состояние источника 31, будем обозначать также через <%**). Обозначим, далее, через Л^(2Я) множество*) состояний, являющихся концами ребер, которые исходят из состояний множества ЯЛ и которым приписана буква а. Пусть \i — произвольное слово в алфавите А. Обозначим через M^(\i) множество*) всех состояний источника 91, являю- *) Это множество может оказаться пустым. **) О множестве S^ говорят, что оно порождается источником 51. Как известно, класс множеств слов (т. е. класс событий), представимых конечными автоматами [3], совпадает с классом множеств слов, порождаемых (конечными) источниками. Именно такой критерий представимости событий был предложен в дипломной работе А. И. Серебряного (МГУ, 1959); см. также [2]. 21 Проблемы кибернетики, вып. 9
322 О. Б. ЛУПАНОВ гдихся концами путей, исходящих из начального состояния и определяющих слово |i. Множество У1 состояний источника 31 будем называть достижимым, если %l = M^(v) для некоторого слова v. Очевидно, что если множество 91 достижимо, то множество N^(31) также достижимо. Два источника 31 и 35 будем называть эквивалентными, если S% = S#t Источник над А будем называть специальным, если из каждого его состояния исходит столько ребер, сколько букв в алфавите А, причем этим ребрам приписаны различные буквы алфавита А. Очевидно, что в специальном источнике S над А для любого слова \х в алфавите А и любого состояния х в © имеется ровно один путь, начинающийся в х, которому соответствует \i. Как известно (см., например, [1]), А) для каждого источника 21 с п состояниями существует эквивалентный ему специальный источник ©, имеющий не более 2'1 состояний*). Целью настоящей заметки является построение примеров источников с п состояниями, для которых эта оценка достигается**). Будут указаны две последовательности источников: 21п для трехбуквенного алфавита и 93 rt для двухбуквенного алфавита***). Мы будем пользоваться следующим известным фактом. *) Специальный источник (S строится следующим образом. Каждому из 2П подмножеств Ш множестве всех состояний источника 51 ставится в соответствие состоя- . ние х^ (будущего источника И). Для любых а и УЯ (а б Л) состояние х<™ соединяется ребром (направленным от #«п). которому приписана буква а, с (одним) состоянием х а . Начальным состоянием источника (S объявляется состояние xlXQ\, где х0 — начальное состояние источника 51, а конечными —все состояния, соответствующие подмножествам, содержащим конечные состояния источника 51 (на рис. 2 изображен специальный источник, построенный этим способом для источника рис. 1). Источник (£ обладает следующим свойством: (*) М/у (\i) = xM / ч для любого слова \i. Это свойство может быть доказано индукцией по длине слова \i. Для пустого слова А, это тривиально: {х0\ = Мф) и A/g (ад = ^Хо>=^я(Х);, Пусть (*) доказано для всех слов длины т—\ и и.— произвольное слово длины т. Пусть а — последняя буква слова и.. Тогда и.=^а,где v— некоторое слово длины w — 1. Имеем М^ (ц) = М^ (va) = N%{M^ (v))=(b силу ипдук- Рис. 2. тивного предположения ) Я%(* ) = ~-xM^(va)—xM^(H) Эквивалентность источников 5i и (S теперь вытекает из следующей цепочки соотношений (X <—>Y означает, что из X следует У и наоборот): V- € ^9{4—* Мы (jx) содержит конечную вершину <—► «--*хм (д) = Л/^(И') (см. (*)) —конечная вершина в £ <—> u. g S„. **) В работе Г. М. Корпелевич показано, что при переходе от автомата Мура [5] с п состояниями, перечисляющего событие, к автомату Мура, представляющему то же самое событие, в некоторых случаях число состояний необходимо увеличить до 2^21 ***) Источники 5(п описываются лишь потому, что для них достижение указанной оценки почти не требует доказательства.
О СРАВНЕНИИ ДВУХ ТИПОВ КОНЕЧНЫХ ИСТОЧНИКОВ 323 Б) Пусть % — произвольный специальный источник, эквивалентный источнику 91. Тогда число состояний источника % не менее числа попарно отличимых достижимых множеств состояний источника 91*). 2. Источник 9tn (над алфавитом {а, 6, с}), л>2. Состояния занумерованы числами 1, 2, ..., п. Ребра, которым приписана буква а, суть(1, 2), (2, 3), . .., (п— 1, я), (и, 1); они определяют циклическую пере- п). Ребра, которым приписана буква 6, суть > > определяют транспозицию Рис. 3. становку состояний (12 (172), (2,~1), (ЗГЗ), (4,4), ...,(п,п); они состояний 1 и 2. Ребра, которым приписана буква с, суть (2, 1), (2,~2), (3,~3), . ..,(п7п). Состояние 1 является начальным и единственным конечным. На рис. 3 изображен источник 316 (здесь параллельные ребра совмещены). Покажем, что специальный источник с минимальным числом состояний, эквивалентный источнику 2tn, имеет 2Ч состояний. В силу А) и Б) для этого достаточно показать, что: I. Все подмножества состояний в 9(п достижимы. II. Все подмножества состояний в Шп попарно отличимы. I. Достижимость. 1) Так как циклическая перестановка (ребра с буквой а) и транспозиция (ребра с буквой Ь) порождают все перестановки, то от фиксированного подмножества из к состояний по путям, соответствующим словам над {а, Ь), можно перейти к произвольному подмножеству из к состояний. *) Пусть S3 —произвольный источник над А. Обозначим через S™ (|л) множество всех слов v таких, что H-vg^S1™. Очевидно, для любого слова \i имеем S^ (|л) = Г™ (Л/™ (|л)). (**) Перейдем теперь непосредственно к доказательству утверждения Б). Пусть М— множество всех достижимых и попарно отличимых подмножеств Ш состояний источника 91. Для каждого 1 из М выберем по одному слову п.™ такому, что Mor(^) = 9ft; множеству Ш поставим в соответствие состояние Мсу (|xw) источника 5 (это будет состояние, так как g — специальный источник). Для завершения доказательства достаточно показать, что для различных Ш\ и 2Я2 из М состояния М% ^WlJ и М% ^Ш ) Различны- в самом деле, если Шх ^М, Ж2 € М% Ш1 Ф 9Я2. то Т^(Шх)ф Т^(Ш2) (отличимость). Отсюда в силу эквивалентности источников 5i и Зг и из (**) имеем: Но (см. (**)) Поэтому и, следовательно, = 1, 2. 21*
324 О. Б. ЛУПАНОВ 2) Подмножество {1} тривиально достижимо. 3) Некоторое подмножество из к состояний можно получить из некоторого подмножества из & —1 состояний. Например, N% ({2, 3, .. ., /cj) = -{1,2,3, ..., к}. Так можно получить все непустые подмножества. Пустое подмножество также достижимо, так как N% ({1}) пусто. II. Отличимость. Все подмножества состояний отличаются друг от друга уже множествами определяемых ими слов в алфавите {а} длины от 1 до п: множество {il9 i2, ...,ik) определяет ровно к слов указанного вида, длины которых равны п-\-1 — il9 п-\-1 — £2,... . .., n+l-ik. 3. Источник 85л (над алфавитом (а, £}), п>3. Состояния занумерованы числами 1, 2, ..., п. Ребра, которым приписана буква а, суть(ТГ2), (2/3), ..., (л-1, л), (^1), (п, 2).Ребра, которым приписана буква Ъ, суть (27*1), (l7~3), (37t), (4Гб), ...,(л-2,л-1), > Рис. 4. (л—1, га). Состояние 1 является начальным и единственным конечным. Заметим, что в источнике 33п из каждого состояния исходит ровно два ребра. На рис. 4 изображен источник 93б (ребра, которым приписана буква а, изображены сплошными линиями; ребра, которым приписана буква 6, — пунктирными; сами буквы опущены). Покажем, что специальный источник с минимальным числом состояний, эквивалентный источнику 58п, имеет 2'1 состояний*). Так же как и в предыдущем случае, для этого достаточно установить достижимость и отличимость подмножеств. I. Достижимость. Рассмотрим следующие три числовые характеристики непустых множеств Ш состояний источника 33п: к (ЭЛ) — число элементов множества 2J}; /(9Л) —разность между наибольшим и наименьшим номерами состояний из ЭД1; т(ЗЛ) — наименьший из номеров состояний в Ш. Каждому непустому множеству Ш поставим в соответствие тройку чисел (к (5Ш), /(2Я)> т(Ш)). Частично упорядочим (непустые) множества Ш в соответствии с лексикографическим упорядочением этих троек, т. е. 1) если к(Шг)<к(Ш2)9 то Шг<Ш2; 2) если к(Шг) = к(Ш2)9 но 1(Шг)<ЦШ2)9 то Шг < Ш2\ 3) если к(Шг) = к(Ш2)9 ЦШг) = 1(Ш2)9 но /гг(5Ш1)< /и(ЯЙ2), то Шг<Ш2. Очевидно, что это отношение транзитивно. Далее, при таком отношении порядка имеется единственный минимальный элемент: {1} (этому множеству соответствует тройка (1, 0, 1); всякое другое одноэлементное множество имеет тройку (1, 0, т)> т> 1; всякое множество из двух или более элементов имеет тройку (к, Z, т)у /с>2). *) Для и = 1, 2 аналогичные источники (над {а, Ъ}) изображены соответственно на рис. 5, а и 5, б. *<3<э aj б) Рис. 5.
О СРАВНЕНИИ ДВУХ ТИПОВ КОНЕЧНЫХ ИСТОЧНИКОВ 325 Перейдем теперь непосредственно к доказательству достижимости. Доказательство будем проводить индукцией по введенному частичному упорядочению. а. Множество {1} (минимальный элемент) достижимо. р. Пусть 5Ш — произвольное (непустое) множество, содержащее элемент, отличный от 1, и пусть все множества 31 такие, что 5Ji<9K, достижимы. Покажем, что 9JJ также достижимо. Элементы множества Ж расположим в порядке возрастания: 9Л = {хх, х2, .. /, xh}, хх < х2 < .. . <xk. Возможны несколько случаев. 1) х1 = 1, х2 = 2. Рассмотрим множество 3Ri = {x3 — 1, ...,xk — 1, л} [xk<Cn, поэтому xk— 1<7г— 1). Так как к^^Х /с(ЗЛ), то ^КШ. В силу индуктивного предположения 5ЩХ достижимо. Очевидно, что ^»n(2Ki)==^5 поэтому и Ш достижимо. 2) хг—19 х2=3 (поэтому х3, если оно существует, не менее 4). Рассмотрим множество Щ12 = {1, 2, х3— 1, ..., xk — 1}. Так как /с(2Л2) = /с(2Л) и/(Ж2)</(ЗЛ), то 5Ш2<9К. Очевидно, что ^п(5Ш2) = ЗЛ. 3) ^=1, #о>4. Рассмотрим множество ЗЛ3 = {2, #2 — 1, ...,xfe—1}. Так как й(5Ш3)"= £(5Ш) и /(2)?3) </(5Ш), то ЗЯ3 < Ш. Очевидно, что Л&П(ЯИ.) = ЯК. 4) ^>2. Рассмотрим множество 9Л4 = {л;1—1, х2 — 1, .. ., хк — 1}. Так как к(Ж4) = к(Ш), Z (ЗЛ4) = Z (5Ш), m(5»l4)< т(5Ш), то $Ш4<$Щ. Очевидно, что iV^n (5Ш4) = 5W. Таким образом, достижимость всех непустых множеств установлена. Пустое множество также достижимо, так как {п} достижимо и Nsx\n{n} пусто. II. Отличимость устанавливается точно так же, как и для источника 31п (ребро (п, 2) здесь никакой роли не играет). 4. Связь с другими «автоматными» понятиями. Пусть U —автомат Мили — Трахтенброта [7, 8] с входным алфавитом А и выходным алфавитом В и 91 —некоторое множество выделенных его состояний (рис. 6, а). Этот автомат определяет два источника: 1) источник U' над А (рис. 6, б), Рис. 6. получающийся из диаграммы автомата стиранием выходных букв, приписанных ребрам, и 2) источник U" над В (рис. 6, в), получающийся из диаграммы автомата стиранием входных букв, приписанных ребрам; очевидно, что источник U' является специальным. Говорят, что автомат U представляет событие S^ и перечисляет событие Syy. Рассмотренные выше примеры источников (21п и S3n) показывают, что при переходе от автомата Мили — Трахтенброта с п состояниями, перечисляющего некоторое событие, к автомату, представляющему то же самое событие, иногда необходимо увеличение числа состояний до 2п.
326 О. Б. ЛУПАНОВ ЛИТЕРАТУРА (1] Chomsky N., Miller G. A., Finite state languages, Inf. and Control 1, 2, 1958, 91—112 (русский перевод: Кибернетич. сб., вып. 4). {2] ГлебскийЮ. В., Кодирование с помощью автоматов с конечной внутренней памятью, Сб. «Проблемы кибернетики», вып. 7, 1962, 127—149. [3] К л и н и С. К., Представление событий в нервных сетях и конечных автоматах, Сб. «Автоматы», ИЛ, 1956, 15—67. {4] Козмидиади В. А., О множествах, пер&числимых и разрешимых автоматами, ДАН СССР 142, 5, 1962, 1005—1006. (5] М у р Э. Ф., Умозрительные эксперименты с последовательностными машинами, Сб. «Автоматы», ИЛ, 1956, 179—210. {6] К 6 n i g D., Theory der endlichen und unendlichen Graphen, Leipzig, 1936. (7] M e a 1 у G. H., A method for synthesizing sequential circuits, Bell Syst. Techn. J. 34, 5, 1955, 1045—1080. [8] ТрахтенбротБ. А., Об операторах, реализуемых в логических сетях, ДАН СССР 112, 6, 1957, 1005—1007. Поступило в редакцию И V 1962.
УСЛОВИЯ ПОЛНОТЫ ДЛЯ НЕРАВНОМЕРНЫХ КОДОВ Ал. А. МАРКОВ (ГОРЬКИЙ) Пусть 31 = {аъ .. ., ат] — алфавит с основанием m, U = {и1У . .., и.т) — система слов в алфавите 35 = {^х, Ь2, ..., bN} с основанием N. Рассматривается кодирование слов в алфавите 9!, осуществляемое путем замены каждой буквы а{ £ 31 в каждом ее вхождении в кодируемое слово соответствующим ей словом ui £ U. Всюду на протяжении этой статьи кодирование с помощью системы U будет предполагаться взаимно однозначным, т. е. таким, что из соотношения щх .. . щ =щг ... щ следует / = /с и i8 = f8 для всех 5=1,2, ...,А. Если это условие выполняется, систему слов U будем называть независимой. Говорят, что система U имеет свойство префикса [1], если ни для каких слов u^Uj^U не имеет места и{ = и$, где Р —слово в алфавите 35. Систему U назовем полной, если для любого слова v в алфавите 33 система {U[Ju} не является независимой. Через F(95) будем обозначать множество всех слов в алфавите 95; множество слов в 95, являющихся началами кодов слов в 31, обозначим через рГ)хР(Щ- Если У £ pr^F (95), то через У обозначим множество слов р в алфавите 33 таких, что слово Ур может быть представлено в виде щх щ2 ... щк, где l(u>ik)>l($) (через 1(a) обозначается длина слова а). Для слова (или бесконечной последовательности букв) У через У (t) будем обозначать начальный отрезок У длины t. Будем говорить, что система U имеет свойство конечной задержки, если существует число Г/m такое, что для любой бесконечной последовательности У букв в алфавите 95, для которой каждый начальный отрезок У (t) принадлежит множеству ргуцР^), и любого числового интервала [t, t+T^] существует t*^[t9t + T^] такое, что пустое слово Л принадлежит У (£*), но для любого непустого слова Р£У(£* (если такое существует) слово У (t*) p не является началом Y. В противном случае будем говорить, что система U имеет бесконечную заде риску. В настоящей работе устанавливается эквивалентность некоторых условий полноты системы U. Кроме того, показано, что если система U не имеет свойства префикса, но имеет свойство конечной задержки, то она не полна. Из этого, в частности, следует, что если система U осуществляет оптимальное двоичное кодирование, то U имеет либо свойство префикса, либо бесконечную задержку. Для случая, когда система U не имеет свойства префикса, в работе [2] был предложен критерий для распознавания свойства
328 Ал. А. МАРКОВ независимости и свойства конечной задержки. Этот критерий состоит в том, что построенный некоторым образом граф G(U) не имеет циклов, проходящих через вершину Л, тогда и только тогда, когда система U независима, и не имеет никаких циклов тогда и только тогда, когда система U имеет свойство конечной задержки. Построение графа G(U) мы предполагаем известным. Для упрощения формулировок будем пользоваться языком исчисления предикатов. Для рассматриваемых свойств системы U введем следующие предикаты: ПДИ)^—>U имеет свойство префикса;4 n.2(U)^—^U имеет свойство конечной задержки; n3(U)^—^U полна; т n4(U)^—*U удовлетворяет условию 2(Ц)=2 N~l(u^ = l; n5(U)4-_* 3 р V v($veprviF(®)). P6f(sb) veF($) Лемма 1. Если система U независима, то Z^< l. Утверждение леммы не является новым. Этот результат был получен Мак-Милланом [3]. Мы дадим здесь более простое доказательство, идея которого окажется полезной и при доказательстве теоремы 1. Рассмотрим систему слов Un= {vili2... i 11< is<Cm\ l<s</z}, где yili2 | = щ^иХг . .. щ . Очевидно, что система Un, так же как и система Ur является независимой. Нетрудно проверить, что %тп) = %(\1)- Пусть L = mdix{l(ui)}, Z = min {Ци^}. Величина Z/rrm может быть представлена Ln в виде Z/vm\= 2 ckN~hi гДе cfe —число слов длины к в системе 1Г\ Так ^u ' k=ln как система Un независима, то ch<:N . Отсюда следует, что Zmn\< (L — l) n+l. Если предположить, что Z^) > 1, то при достаточно большом п мы будем иметь Zr^n\ = Z/m > (L — l)n-\-1, что противоречит предположению о независимости Uu. Следовательно, Z/^<1. Теорема 1. n4(U)->n3(U). Это утверждение непосредственно вытекает из леммы 1. Теорема 2. n5(U)->n4(U). Доказательство. Пусть слово р£F(S3) таково, что р^Gpr^F(S3) для любого v £^(33). Рассмотрим, как и в лемме 1, систему слов U% где п > j . Через Рк обозначим множество всех слов длины А: в алфавите S3. Пусть по отношению к системе Un имеем Р = {Рх, .. . ,PS}- Ясно, что для любого v£F(SQ) имеет место pug pr^nF^). Следовательно, если к > Ln, то каждое слово из Pk имеет в качестве префикса одно из слов pt £ p. Так как всего Рк содержит Nh слов, то мы 8 имеем 2 -^Vfe~Z(Pi)>A^. Умножая обе части последнего неравенства г=1 на N~ ~ р), получим 2 N~l Wi) >N~' *°- ВвиДУ Т0Г0> чт0 п > ~1~ ^ г=1 каждое слово PPi(i= 1, 2, . . ., s) принадлежит Un, причем очевидно, что ppi=^pp. при гФ]. Таким образом, множество {рр1э ..., РРЛ
УСЛОВИЯ ПОЛНОТЫ ДЛЯ НЕРАВНОМЕРНЫХ КОДОВ 329 состоит из различных слов системы Un. Отсюда следует, что z(m== 2 N~Hv)>j] ,v-'(Ppi>>iv-'(P), т. е. для любого п >—^-р— мы имеем Zmn) >N~l (P). По лемме 1 Z(ll)<l. Но если Z/эд < 1, то limZmn\ = 0, так как Z/un\ = Zm\. Сле- Ь п-*оо довательно, Z^=i. Теорема доказана. Пусть 5Cjff(35). Слово ZB назовем аннулирующим для множества # по отношению к системе U, если для каждого слова Р £ i? имеет место PZ#=0 (0—настое множество). Лемма 2.f -lfl5(U)~> у "В 3 ZbvP(Pb=0). bcf(SB) 2ве^(^8) рев Достаточно доказать лемму для всего множества i^ (S3), так как очевидно, что если ZB является аннулирующим словом для множества В и В0С^В, то ZB является также аннулирующим словом и для В0. Определим на F (35) бинарное отношение Я^ц так, что (и,з)6% —и="й (в, о 6*4»)). Отношение 91^ рефлексивно, симметрично и транзитивно и, следовательно, является отношением эквивалентности на Г(Щ. Если а £$8, то ш = {г |aeg^V (Ag^cSae g U)}. Отсюда следует, что и = а влечет ua = va для каждого a (=93 т. е. отношение 9tu стабильно справа. Тогда, если 5 с:/?(93) есть 91и-класс и для v£В и некоторого a>6F(93) множество aay пусто, то, очевидно, и для любого v'£B имеет место и'оу=0. Легко видеть, что число 9^-классов конечно. Пусть В0 = {р1, ..., PJ —множество представителей всех этих классов. Из приведенных выше рассуждений следует, что если слово Z является аннулирующим словом для В0 относительно U, то оно будет аннулирующим словом и для F (23). Ввиду пП5(11) существует слово Ф(Pi) такое, что P^(Px)=0. Далее определим слово ф(Р2) так, чтобы Р2Ф(Pi)ф(Р2) = 0- На £-м шаге определяем слово ф(р.) так, чтобы Pi<P(Pi) •.. ф(Рг)=0> и т. д. Положим^ ZBo = ф (Рх) ... ф(Р,). Замечая, что если для некоторого х множество х пусто, то для любого х' множество хх' также пусто, мы заключаем, что ZBo является аннулирующим словом для множества В0 по отношению к системе U, а следовательно, и для множества F(SQ). Теорема 3. n3(U)-* П5(Ц). Доказательство. Предположим, что П5(Ц) неверно. Покажем, что j-огда ^найдется слово v £^(93) такое, что система слов U = {^, ...,wm, ит+1}, где ut = ut для i = l, 2, . . ., m, а Zm+1 = vy является независимой. Ввиду того, что пП5(Ц), найдется слово w^F^ такое, что^=0, причем ни для каких слов a,pgF(93) и u{gU не имеет места u{a = wff. Рассмотрим соотношения вида щ ... щ гш/ = е, 1 h где слово е есть вершина графа G (U). Каждое из таких соотношений определяет некоторое слово ww', причем очевидно, что ww' = 0. Обозначим через w0
330 Ал. А. МАРКОВ любое из самых длинных слов (если таких окажется несколько), определяемых соотношениями этого вида. Если таких соотношений нет, то положим w0 = w. Пусть В — множество всех концов слова до0, ZB — слово, аннулирующее множество В по отношению к системе U, определяемое по лемме 2. Пусть у принадлежит 33 и не является первой буквой слова w0, a 0 —число, большее или равное длине слова w0ZB. Возьмем v = w0ZByQ. Заметим, что, не ограничивая общности, можно предполагать, что l(v)>L, что мы и будем иметь в виду в дальнейшем. Для доказательства того, что система U независима, нам надо показать, что граф G(U) не имеет циклов, проходящих через вершину Л. В графе G(U) ввиду условия и{а фы)0$ переход из вершины Л в какую-либо вершину возможен только в том случае, если такой переход был возможен и в G(U), т. е. множества вершин ранга 1 у графов G(U) и G(U) совпадают. Покажем, что если а является вершиной графа G(U), причем q((x)>1, и в графе G(U) возможен переход из а в вершину р, которого не было в G (U), то из р ни в одну из вершин графа G(U) переход невозможен. Отсюда будет следовать, что граф G(U) не имеет циклов, проходящих через вершину Л. Согласно нашему предположению и{г ... щ, =«Р, где Z(P)</(u/;. Поскольку слово а является концом одного из слов системы U и Z(a)<L< l{v), то слово v не может совпадать ни с одним из слов щЛ9 . .., щл . Следовательно, щ = v, так как в противном случае переход из а в Р был бы возможен и в графе G(U). В силу определения слова w0 соотношения вида щх ... щ i^ = ap возможны'только тогда, когда а — r\w'b> где ^ — начало слова w0. Соотношения вида щл . . . щ v = ap определяют переход из вершины а в новые вершины Рх, р2, ...,PS, 5<Z(^0), причем каждое из слов Ру имеет вид Р;- = w^ ZB Ye, где w(Qj) — конец слова w0. Слово ZB является аннулирующим для множества {w^{\ .. ., w^}c^B по отношению к системе U. Кроме того, в силу выбора слова уе никакой конец слова v не является началом слова v. Следовательно, по отношению к системе U для любого /=1, 2, ..., s имеет место Р; = 0. Таким образом, мы убедились, что система U неполна в случае, если "1П5(11). Отсюда следует, что П3(11)-^ П5(11). Теорема доказана. Объединяя теоремы 1 — 3, мы получаем: Теорема 4. Условия n3(U), П4(Й), П5(U) равносильны. Теорема 5. —iII1(U)<S na(U)-* ~|ПБ(и). Доказательство. Пусть а 6 23. Если в U нет слова вида а\ то для любого р очевидно, что pa2L+1 = 0. Если же для некоторого к слово ak принадлежит U, то ввиду П2(11) среди вершин графа G (U) не может содержаться вершин вида а* при />1. Следовательно, в этом случае для любого слова р при некотором п имеет место рап = {Л}. Из условия теоремы следует существование такого у£/т(93), что v= 0- Но тогда $a'lv=0. Теорема доказана. Известно [1], что если двоичное кодирование системой U является т _ оптимальным, то Z^ = 2 2 *"'=1, последнее же по теореме 4 равносильно П5(И). Из теоремы 5 непосредственно получаем
УСЛОВИЯ ПОЛНОТЫ ДЛЯ НЕРАВНОМЕРНЫХ КОДОВ 331 Следствие. Если двоичное кодирование не имеет свойства префикса, но имеет свойство конечной задержки, то оно не является оптимальным. Примечание при корректуре. Как стало известно автору, аналогичное доказательство неравенства Мак-Миллана (лемма 1) содержится в заметке Karush I. «A simple proof of an inequality of McMillan», IRE Trans., IT-7, 2, 1961, 118. ЛИТЕРАТУРА [1] Gilbert E. N., M о о г e E. F., Variable — lenth binary encodings, Bell Syst. Techn. J. 38, 4, 1959, 933 (русский перевод: Кибернетич. сб., вып. 3, М., 1961). (2] Марков Ал. А., Нерекуррентное кодирование, Сб. «Проблемы кибернетики», вып. 8, Физматгиз, 19С2. (3] М с М i 11 а п В., Two inequalities implied by unique decipherability, IRE Trans. IT-2, 4, 1956, 115 (русский перевод: Кибернетич. сб., вып. 3, М., 1961).
К ВОПРОСУ О СУЩЕСТВЕННОЙ ЗАВИСИМОСТИ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ Н. А% СОЛОВЬЕВ (КАЛИНИН) В этой заметке исследуется вопрос о существенной зависимости функций алгебры логики. Рассматриваются такие функции, которые получаются из данной путем подстановок констант вместо некоторых ее аргументов, а также изучается вопрос о существенной зависимости функций от оставшихся аргументов. Вопросы, изложенные ниже, находят применение в некоторых задачах синтеза управляющих систем. Аппаратом для решения рассматриваемых задач является представление функций алгебры логики посредством специальной канонической формы — так называемых полиномов Жегалкина [3] *). Определе ни е. Функция алгебры логики f{x1, ..., ха) называется существенно зависящей от xt, если имеет место соотношение /(#!» ..., Xi_lt О, a?i+1, ..., хп)Ф/(х1У ..., xi_1, 1, ^i+i, ..., ^п)- Замечание. Очевидно, для того чтобы функция алгебры логики / существенно зависела от переменной xt, необходимо и достаточно, чтобы xi входила по меньшей мере в одну из конъюнкций приведенного многочлена Жегалкина для функции /. Дадим более простое доказательство утверждения, содержащегося в [4] (лемма 16). Теорема 1. Пусть f(x1, ..., хп) — функция алгебры логики, существенно зависящая от п, п>2, переменных. Тогда существует такая переменная xi (l<i<rc) и такая константа С, что при подстановке этой константы С вместо х{ получается функция, существенно зависягцая от п—1 переменных. Доказательство. Представим функцию / в форме приведенного многочлена F (см. [3], а также [2]). Тогда возможны четыре случая: 1. F содержит конъюнкцию х±х2 ... хп ранга п (см. [2]) и хотя бы одну конъюнкцию (п—1)-го ранга. 2. F содержит конъюнкцию п-то ранга и не содержит ни одной конъюнкции (п—1)-го ранга. * 3. F не содержит конъюнкции п-то ранга, но содержит такие конъюнкции 3^, 212, ..., 3ts, что их произведение 2^ % ... 3JS есть конъюнкция (п—1)-го ранга. 4. F не содержит конъюнкции n-го ранга, и произведение любого подмножества . конъюнкций, входящих в F, не является конъюнкцией (п—1)-го ранга. *) См. также [2].
334 Н. А. СОЛОВЬЕВ Например, последнему случаю удовлетворяет функция /, приведенный многочлен которой имеет вид XiX^X^ -\- X^X^Xq -\- ХуС± -\- Х1 -р #4. Случай 1. Пусть 91 — конъюнкция (п—1)-го ранга, содержащаяся в F. Легко видеть, что искомым аргументом будет то существенное переменное функции /, которое не входит в 91, а искомой константой — число % 0. Случай 2. В этом случае теореме будет удовлетворять любая существенная переменная, а константой является число 1. Случай 3. Пусть 3tl7 9t2, ..., 9ts — те конъюнкции приведенного многочлена F, произведение которых Я3 = 211212 ... 2ts есть конъюнкция (п—1)-го ранга. Тогда искомым переменным будет то существенное переменное функции /, которое не входит в S3, а константой — число 0. Случай 4. Пусть хх — та существенная переменная функции /, которая имеет минимальное число т вхождений в формулу приведенного многочлена F. Все члены приведенного многочлена F разбиваются на три группы (некоторые из них могут оказаться пустыми): 1) З^, ..., 2tm£i (члены, содержащие х{); 2) 3lj, ..., 9tm' (члены, полученные из членов первой группы отбрасыванием переменной хг); 3) 831? 932, ..., 33s (остальные члены). Рассмотрим произведение ® = «1...ит.»1...аз8 членов второй и третьей групп. Так как © не может быть конъюнкцией (п— 1)-го ранга (иначе бы имели случай 3), то S не содержит некоторой переменной Xj(i=fcj). Эта переменная может входить только в конъюнкции ЭДт'+1, 91т'+2,.-ч 2fm- Но так как число вхождений х^ не меньше т, то т' = 0, т. е. вторая группа пуста. Поэтому при подстановке 1 вместо xi члены первой группы перейдут соответственно в 9tx, ..., 9tm и ни с чем не сократятся. Теорема доказана» Теорема 2. Пусть f(x1, ..., хп)— функция алгебры логики, существенно зависящая от п, п > 2, переменных. Тогда для любого i, i = 1, 2, ..., п, существует такое f (i Ф /) и такие п—2 констант, что при подстановке этих констант на место переменных, отличных от xi и х-, получается функция, существенно зависящая от xi и х*. Доказательство. Пусть xi — некоторая переменная, от которой функция / зависит существенно. Собирая в приведенном многочлене для функции / конъюнкции, содержащие xiy получаем: / = Vi + /2. Возможны три случая: 1) /2=const, 2) иф const и Д= 1, 3) /2 ф const и /х ф 1. Случаи 1)—2). Функции /х в первом случае и /2 во втором, очевидно, зависят от п—1 переменных; выбирая одно из них, скажем х^, по определению существенной зависимости можно найти такие наборы п—2 констант, что при подстановке этих констант на место переменных, отличных от Хг, из функций /х в первом случае и из /2 во втором можно получить о. о'. соответственно функции х.3 и х.д. В обоих случаях получаем функцию, существенно зависящую от х{ и s..
О СУЩЕСТВЕННОЙ ЗАВИСИМОСТИ ФУНКЦИЙ АЛГЕБРЫ ЛОГИКИ 335 Случай 3). Сделаем подстановку каких-нибудь констант, для определенности пусть все они равны 0, на место тех переменных функции /2, которые не входят в/г. Так как /гф1 и, следовательно, fx Ф const (ибо /х^= 0), то найдется такое переменное, от которого функция /х зависит существенно. Пусть к — число существенных переменных /х и заодно из них. По определению существенной зависимости найдется такой набор к—1 констант, что при подстановке этих констант на место переменных, отличных от Xj, из функции /х можно получить функцию x°J. Сделаем соответствующую подстановку тех же к—1 констант для функции /2. В результате всех подстановок из функции / можно получить одну из трех функций: хгх°д -{- const, x%xa.i + х°з, x^.i -f- x°.j, - т. е. функцию, существенно зависящую от хь и #.. Теперь возникает вопрос, имеет ли место следующее более сильное утверждение: Пусть f(xi, ..., ха) — функция алгебры логики, существенно зависящая от п переменных. Тогда существует такое i, что для всех /, i Ф /, существуют такие п—2 констант и такие п—2 переменных, что при подстановке этих констант на место переменных, отличных от xi и я-, получается функция, существенно зависящая от х-г и Xj. Как показывает пример функции Х^ -\- ХуС^ -р Х^Х^ -{- Х<% -j- Х^С^ Г ^3*^4» это утверждение имеет место не для всех функций алгебры логики. ЛИТЕРАТУРА [1] Я б л о н с к и й С. В., Функциональные построения в А*-значной логике, Труды МИ АН им. Стеклова, т. LI, 1958. [2] Кузнецов А. В., О бесповторных контактных схемах и бесповторных суперпозициях функций алгебры логики, Труды МИ АН им. Стеклова, т. LI, 1958. [3] Ж е г а л к и и И. И., Арифметизация символической логики, Матем. сб. 35 и 36, 1928. [4] Л у п а н о в О. Б., Об одном классе схем из функциональных элементов, Сб. «Проблемы кибернетики», вып. 7, Физматгиз, 1962. [5] Новиков П. С, Элементы математической логики, Физматгиз, 1959. Поступило в редакцию 23 IV 1962.
О СУПЕРПОЗИЦИЯХ ФУНКЦИЙ В Р* с. в. яблонский (МОСКВА) В настоящей заметке рассматриваются формулы Э!, построенные из функций системы Pk (формулы в /с-значной логике [1]). В дальнейшем мы будем пользоваться записью 9l[glf ...,gr], обозначающей формулу, построенную из функций gv ..., gr, каждая из которых принадлежит Ph. Определение. Формулы ЗГ и Si" называются эквивалентнымиУ если они реализуют равные*) функции. Для эквивалентных формул будем писать 9Г = 9Г. Пусть 93 — подформула формулы 91 и $ =gi(S5it • •., 95m-(i)), где $!,.,., S8m(i)—подформулы формулы 95. Определение. Подформулы 93!, ,.., 93m(i) называются непосредственно содержащимися в 93. О ц р е д е л е н и е. Формула 91 называется нормальной формой, если* каковы бы ни были ее эквивалентные подформулы 93' и 9$", ни °ДР4 из них не содержит другую и они не могут непосредственно содержаться в одной и той же подформуле. Теорема. Каждую формулу 91 можно привести к эквивалентной ей нормальной форме путем применения следующих операций: 1. Замена подформулы 93' на 93", если 33" — подформула формулы 95' и 93' -93". 2. Отождествление переменных в функциях, из которых построена формула 91. Доказательство. Путем. применения операции 1 формулу 91 можно привести к эквивалентной формуле 91', в которой эквивалентные подформулы не могут содержаться одна в другой. Остается рассмотреть случай, когда эквивалентные подформулы могут непосредственно содержаться в некоторых подформулах. Пусть 93 = ^(ЗЗ^ . *., 23m.(i)) —одна из подформул формулы 91\ Подформулы ЗЗх, ..., 93™ <i> можно разбить на классы эквивалентных формул. Пусть ©17 ..., ©р(i) — какие-то представители из этих классов. В соответствии с разбиением подформул 93lf ..., 95m (i) на классы произведем отождествление переменных в функции gi#Результат этого отождествления переменных обозначим через g\. Легко видеть, что формула *) Две функции, принадлежащие Р^ называются равными, если одну из них можно получить из другой путем добавления и изъятия несущественных переменных [1]. /г 22 Проблемы кибернетики, вып. 9
338 С. В. ЯБЛОНСКИЙ эквивалентна формуле 33. Если в формуле ЗГ заменить подформулу S3 на ©, то получим формулу, эквивалентную исходной. Производя эту операцию, мы, в конце концов, после конечного числа шагов придем к формуле 31", являющейся нормальной формой и эквивалентной 31. Данная теорема аналогична теореме о приведении дизъюнктивной формы к совершенной дизъюнктивной нормальной форме. Нетрудно видеть, что в отличие от дизъюнктивных нормальных форм результат приведения к нормальной форме не однозначен. Пусть / (хъ ..., ха) = 31 [gb . .., gr]. Теорема. Формула 3t[g1, . ..,gr] может быть приведена к эквивалентной формуле 3t' [g[, . . ., gr'], где функции g[y ..., gr получаются из функций gv . . ., gr путем отождествления переменных и каждая из функций g[, .. ., gr' зависит не более чем от kk переменных. Доказательство. Возьмем одну из нормальных форм 31', эквивалентную St. Она удовлетворяет требованиям, поставленным в теореме. Поскольку здесь мы можем считать, что все фиктивные переменные (отличные от хг, ...,#л) исключены, например, путем отождествления с xl9 то число p(i) (см. доказательство предыдущей теоремы) не превосходит числа всех функций от п переменных, т. е. p(i)<*kk . Определение. Порядком системы функций 1гх, .. ., hm называется максимальное число п ременных, встречающихся у функций этой системы. Порядком замкнутого класса, имеющего конечный базис, называется наименьший порядок его базисов [2]. Пусть ЯК — замкнутый класс из Pk, имеющий порядок s. Теорема. Из всякой полной в Я& системы функций можно получить путем операции отождествления переменных полную систему, которая имеет порядок, не превосходящий кк . Доказательство. Пусть gv ..., gr — какая-то полная система из ЯК. Пусть, далее, f\, ..., f9 — полная система из ЯК, имеющая порядок s. Тогда /i(*i» .••>zs) = st1[g1, ..., gr], Согласно предыдущей теореме формулы Э1х, ..., 3tp путем отождествлений переменных можно привести к эквивалентным формулам Щ, ..., Sip так, что /iK, • • • ,xa) = st;[g;, ..., g'r,], /p(3l, -■■»*.) = »*>[£. •••, gr'] и функции g'i зависят не более чем от /cfeS переменных. Следовательно, система g[, ..., gr> является искомой полной системой. В случае, когда Ш = Рк (ft>3), предыдущая теорема может быть усилена. Теорема. Из всякой полной в Рk(к>3) системы функций можно получить путем операции отождествления переменных полную систему, которая имеет порядок, не превосходящий к . Доказательство. Пусть gx, . .., gr — какая-то полная система из Рк. Пусть Ъ(хг), .. .,/kft(£i), t(?u •••' xs) — система, состоящая из всех функций от одного переменного и функции /, существенно зависящей более чем от одного переменного и принимающей все к значений, причем / получена из некоторой функции gi путем отождествления переменных.
О СУПЕРПОЗИЦИЯХ ФУНКЦИЙ В Рк 339 Тогда fi(xi) = %i[gv ■■■, gT), /fc* (*i) = 9ffcfc [ffx. ••••&]• Как и в доказательстве предыдущей теоремы, будем иметь: где функции gi зависят не более чем от кк переменных. Пусть gi существенно зависит более чем от одного переменного и принимает все к значений. Тогда, опираясь на основную лемму из [1] или как в [4], нетрудно показать, что из gi путем отождествлений переменных можно построить функцию f(xv ..., xs), существенно зависящую более чем от одного переменного, принимающую все к значений и такую, что s</cft, В самом деле, для функции gt(xl9 . ..,ятм) на основании леммы из [1] можно указать систему наборов а' к-1={оХ~\ у От (г) j такую, что g%(а0) = 0, . . ., gi (а*"1) = к— 1 и в матрице а? <*m(i) а4 пк~Х в каждом столбце выпускается хотя бы одно значение. Разобьем столбцы матрицы А на классы, относя к одному классу одинаковые столбцы. Ясно, что число s таких классов не будет превосходить кк. Произведем в функции gi отождествление переменных в соответствии с разбиением столбцов матрицы А на классы. Тогда функция g?i (xv . .., хт (i)) перейдет в функцию, которую мы обозначим через f(xl9 ..., xs). Если обозначить через р°={Р? р;>, р1 fe—1 w k—i ...РГ} наборы, соответствующие при этом преобразовании наборам а0, то /(Р°) = 0, ..., /(Pfe—4) = А:— 1 и в матрице , а1 ft-t В ft0 Pi» R° Ps р! .. Р fe-1 в каждом столбце выпускается хотя бы одно значение. Ввиду этого функция f(xv ..., xs) принимает все к значений и зависит существенно более чем от одного переменного, причем s<&fe. Легко видеть, что система g'v . .., gr образует искомую полную систему. 22*
340 С. В. ЯБЛОНСКИЙ Данные теоремы позволяют значительно усилить результаты, полученные Шестопал [3] и Саломаа [4]. Определение. Базис gl9 ...,gr замкнутого класса Ш называется простым, если никакую функцию, входящую в него, нельзя заменить на одну или несколько функций, каждая из которых получается из нее путем отождествлений каких-либо переменных, так чтобы в результате этой замены система функций была полной в ЯЛ. Теорема. Замкнутый класс Ш из Pk, имеющий порядок s, обла- дает не более чем 2 различными (два базиса не различаем, если один получается из другого путем переименования переменных) простыми базисами. Доказательство. Каждый простой базис из ЯК имеет порядок, не превосходящий /? = /с/1\ Общее число функций от р переменных равно kkV. Следовательно, простой базис является подмножеством мно- жества, состоящего из /cft элементов. В случае, если Ш — РкУ /с>3 (5 = 2), можно дать более хорошую оценку для числа различных простых базисов (ср. с [4]). kkhh Теорема. Число простых базисов в Рк (к > 3) не превосходит 2 Доказательство аналогично доказательству предыдущей теоремы; используется тот факт, что порядок простого базиса в Рк не превосходит кк. ЛИТЕРАТУРА [1] Я б л о н с к и й С. В., Функциональные построения в &-значной логике, Труды Матем. ин-та им. В. А. Стеклова 51, 1958, 5—142. [2] Post E. L., Two-valued iterative systems, Princeton, 1941. [3] Шестопал Г. А.,О числе простых базисов булевых функций, ДАН СССР 140, 2, 1961, 314—317. [4] S а 1 о m a a A., Turun Yliopiston Julkaisuja annales universitatis Turkuensis, sarja- series-A., I, 52, 1962. Поступило в редакцию 12 VII 1962.
X. ХРОНИКА О КООРДИНАЦИИ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫ ПО КИБЕРНЕТИКЕ НА УКРАИНЕ (Информация) В декабре 1961 г. при Президиуме Украинской Академии наук был создан Научный совет АН УССР по комплексной проблеме «Кибернетика» под председательством академика АН УССР В. М. Глушкова. В Совет входят ведущие ученые из научно-исследовательских организаций и учебных заведений республики. Совет проводит ежемесячные заседания с обсуждением научных и научно-организационных вопросов, касающихся развития научно-исследовательской работы в области кибернетики и внедрения полученных результатов в народное хозяйство республики. В 1962 г. на заседаниях Совета были заслушаны и обсуждены доклады: Б. Н. Малиновского, Использование управляющей машины широкого назначения для автоматизации управления технологическими процессами (январь). А. А. Ляпунова, Управляющие системы в живой природе (март). С.Л. Соболева, Машинная дешифровка древних текстов майя (апрель). Р. X. Зарипова, О машинных экспериментах по сочинению музыки (май). С. М. Гершензона, Проблема генетической информации (июнь). Проведена также дискуссия на тему «Информационные проблемы автоматизации диагностики заболеваний» с вступительным словом академика АН УССР В. М. Глушкова (февраль). С целью более тесной координации научно-исследовательской деятельности по проблеме и работ по внедрению полученных результатов Совет организовал ряд республиканских семинаров с привлечением к участию в них всех заинтересованных лиц из городов Украины, а такж« других республик Советского Союза. Для регулярного обмена информацией между участниками семинара материалы заседаний (доклады и краткие резюме их обсуждения или стенограммы дискуссий) будут размножаться и рассылаться всем участникам семинара, а также всем заинтересованным организациям, учреждениям и отдельным лицам. Для включения доклада или сообщения в повестку семинара необходимо представить его текст в машинописном виде в двух экземплярах к заседанию семинара. Доклады иногородних участников семинара могут быть заслушаны и обсуждены по машинописным текстам докладов, если личное участие докладчика в работе семинара по каким-либо причинам затруднено.
342 О КООРДИНАЦИИ РАБОТ ПО КИБЕРНЕТИКЕ НА УКРАИНЕ Ниже следует название семинаров с краткой аннотацией вопросов, обсуждающихся на их заседаниях. 1. Теория автоматов (научный руководитель В. М. Глушков)'. На заседаниях семинара обсуждаются вопросы: Способы конструктивного задания алфавитных отображений, пред- ставимых в конечных автоматах. Алгебра регулярных событий. Алгоритмы абстрактного синтеза и анализа конечных автоматов. Автоматы и алгоритмы. Характеристика некоторых классов бесконечных автоматов. Связь теории автоматов с теорией полугрупп. Характеристика классов изоморфных автоматов и событий. Композиция автоматов. Проблема полноты систем конечных автоматов. Вопросы структурного синтеза и минимизации автоматов. Приложение теории автоматов к теории самообучающихся систем. 2. Автоматизация мыслительных процессов (научный руководитель В. М. Глушков). На семинаре обсуждаются вопросы: Принципы и особенности мыслительных процессов, характерных для человека в творческой сфере его деятельности, а также возможности их алгоритмического описания. Моделирование на современных вычислительных машинах таких процессов, как распознавание образов, образование понятий, распознавание осмысленности предложений, вывод логических следствий, доказательство теорем, выработка стратегий в играх, сочинение музыки и др. Обучение как основа в моделировании умственной деятельности человека. Теория обучающихся систем, а также практическое построение алгоритмов с обучением. Соотношение между точным (по мере возможности) моделированием творческих процессов и спецификой машинных алгоритмов, имитирующих эти процессы. 3. Вопросы теории математических электронных цифровых машин (научный руководитель В. М. Глушков). На семинаре обсуждаются вопросы: Алгоритмические структуры МЭЦМ (организация процесса обработки числовой и буквенной информации, алгоритмические языки и автопрограммирование, алгоритмический синтез). Логические структуры МЭЦМ (управление операциями, логический структурный синтез в конкретных системах элементов, учет надежности работы системы при синтезе). Элементные структуры МЭЦМ (расчет параметров элементных структур для различных функционально полных систем элементов, статическая и динамическая надежность элементов и комплексов). 4. Методы математического моделирования и теория электрических цепей (научный руководитель Г. Е. Пухов). На семинарах обсуждаются доклады по различным вопросам теории, конструирования и применения математических машин и устройств для моделирования краевых задач математической физики, теории упругости, строительной механики, интегральных и дифференциальных уравнений, задач оптимального планирования, линейных и нелинейных алгебраических уравнений, а также по методам анализа и синтеза линейных и нелинейных электрических и магнитных цепей. 5. Некоторые проблемы биокибернетики и применение электроники в биологии и медицине (научный руководитель Н. М. Амосов). На заседаниях семинара обсуждаются вопросы:
О КООРДИНАЦИИ РАБОТ ПО КИБЕРНЕТИКЕ НА УКРАИНЕ 343 Приложение теории информации в биологии и медицине. Принципы автоматического управления в биологических системах и их особенности. Некоторые принципы кодирования информации в нервной системе. Восприятие и переработка информации в рецепторах и центральной нервной системе. Современные представления о природе нервного возбуждения с позиций биокибернетики. Некоторые вопросы моделирования элементов центральной нервной системы. Мышление и психическая деятельность человека. Принципы построения самоорганизующихся нейронных сетей и бионика. Вопросы автоматизации сбора информации и диагностики заболеваний человека. Приложение биокибернетики к диагностике и лечению заболеваний нервной системы. Вопросы применения биоэлектрости- муляции. Проблема протезирования некоторых органов человеческого организма. Управление процессами возбуждения и торможения в центральной нервной системе посредством электрических и электромагнитных воздействий. Биология клетки в свете биокибернетики. 6. Математическая и структурная лингвистика (научный руководитель Л. А. Калужнин). На семинаре обсуждаются вопросы: Принципы построения специализированных информационных языков ЭЦМ. Информационный язык для автоматизации библиографических поисков литературы по радиоэлектронике и вычислительной технике. Принципы построения специализированных устройств для преобразования языковой информации. Семантический анализ текстов на русском языке на ЭЦМ. Самообучающиеся алгоритмические системы преобразования языковой информации. Использование ЭЦМ для статистического анализа естестведных языков. Принципы построения машинных словарей для перевода текстов с одного языка на другой. 7. Экономическая кибернетика и исследование операций (научный руководитель В. С. Михалевич). На семинаре обсуждаются вопросы: Общие методы решения многовариантных задач оптимизации (линейное, динамическое, целочисленное программирование, последовательный анализ и др.). Общие методы исследований операций. Задачи оптимального планирования народного хозяйства (планирование работы транспорта, планирование материально-технического снабжения, размещение лроизводительных сил, межотраслевой и межрайонный баланс и др.). Задачи оптимального проектирования (проектирование железных и шоссейных дорог, газопроводов, линий электропередачи и др.). Задачи оптимального оперативного планирования предприятий (использование оборудования, определение производственного цикла, расчет производственных графиков, диспетчеризация, контроль производства и др.). Задачи управления эксплуатационной деятельностью железнодорожного транспорта (составление оптимальных графиков движения, работа сортировочных станций, работа производственного транспорта). 8. Синтез систем автоматического управления (научный руководитель В. И. Иваненко). На семинаре обсуждаются такие вопросы: Проблемы синтеза систем автоматического управления, в частности, критерии синтеза, методы аналитического решения задач синтеза, синтез систем, близких к оптимальным, автоматический синтез (самонастраивающиеся системы), критерии для оценки систем с автоматическим синтезом. Вопросы конструирования самонастраивающихся систем.
344 СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В МГУ Задачи динамических игр, в частности игр погони. 9. Управляющие машины и системы (научные руководители: В. В. Иванов, Б. Н. Малиновский и В. И. Скурихин). На семинаре обсуждаются вопросы: Управляющие машины (общие принципы построения, конкретные управляющие машины, надежность работы, связь с объектами, элементы самосовершенствования). Общие вопросы методики алгоритмизации производственных процессов (конкретные примеры алгоритмизации, самосовершенствующиеся и самообучающиеся алгоритмы для целей управления, алгоритмизация и программирование задач для систем с программным управлением). Общие вопросы построения систем управления объектами (системы управления сосредоточенными объектами, системы управления распре^- деленными объектами, датчики и исполнительные органы для систем управления с цифровыми машинами, специальные и телемеханические устройства для передачи информации в системах автоматического и полуавтоматического управления, линии связи для систем управления, примеры конкретных систем автоматического и полуавтоматического управления для сосредоточенных и распределенных объектов). 10. Вычислительная математика (научные руководители Г. Н. Положий и В. Е. Шаманский). На семинаре заслушиваются и обсуждаются доклады по численным и приближенным методам: а) решения обыкновенных дифференциальных уравнений, б) решения уравнений в частных производных применительно к многомерным задачам математической физики, в) решения задач линейной алгебры, г) решения задач линейного и динамического программирования, д) построения оптимальных управлений с использованием современной вычислительной техники. В докладах, представляемых на семинар, предусматривается как изложение оригинальных результатов, так и сообщения реферативного и обзорного характера. На семинаре решается вопрос о целесообразности включения доклада в сборник трудов семинара; сборники будут сдаваться в печать по мере накопления материала. В течение 1962 г. предполагается размножить отдельными выпусками по 3—5 докладов объемом в 1—1,5 печатного листа каждого семинара. Ученый секретарь Совета А. А. Стогний СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В МГУ В 1961/62 учебном году в МГУ продолжал работать семинар по кибернетике под руководством А. А. Ляпунова и С. В. Яблонского. В течение года было проведено шесть заседаний, на которых были заслушаны следующие доклады: К. Штайнбух (ФРГ), Моделирование нервных процессов (6 IX* 1961). Ж. Р и г е (Франция), О работах французских математиков в области кибернетики (22 IX 1961). М. Г. Гааз е-Р апопорт, О некоторых концепциях обучения (9 III' 1962).
СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В МГУ 345 Г. А. Д в о р к и н, О кодировании и механизме процесса передачи информации при биосинтезе белков (23 III 1962). М. А. Айзерман, Опыты по обучению машин распознаванию образов без внесения в программу машин их свойств (6 IV 1962). A. А. Ляпунов, О некоторых работах в области программирования (27 IV 1962). В 1961/62 учебном году в МГУ продолжал также работать семинар по математическим вопросам кибернетики под руководством С. В. Яблонского. В течение года было проведено двадцать восемь заседаний, на которых были заслушаны следующие доклады: Н. А. Карпова, Доказательство минимальности дерева в классе разделительных многополюсников. Реферат статьи Edward F. Moore, Minimal Relay Complete Decoding Networks (IBM Journal, November 1960). Э. И. Нечипорук,0 сложности схемв некоторых базисах, содержащих нетривиальные элементы с нулевыми весами (6 X 1961). См. ДАН 139, № 6, 1961, 1302-1303. Э. И. Нечипорук, О сложности суперпозиций в базисах, содержащих нетривиальные линейные формулы с нулевыми весами (13 X 1961). См. ДАН 136, № 3, 1961, 560—563. Н. А. Горбовицкая, Об эквивалентных преобразованиях автоматов некоторого типа (20, 27 X 1961). Сдано в печать в сборник «Проблемы кибернетики». Е. П. С о п р у н е н к о, О реализации некоторых булевых функций схемами из функциональных элементов в базисе, состоящем из штриха Шеффера (3, 10 XI 1961). Б. А. Трахтенброт, О языках для описания функционирования конечных автоматов (17, 24 XI; 1 XII 1961). О. Б. Л у п а н о в, О сравнении сложности реализации монотонных функций контактными схемами, содержащими лишь замыкающие контакты, и произвольными контактными схемами (8, 15 XII 1961). См. ДАН 144, № 6, 1962, 1245-1248. Б. М. КлоссиЭ. И. Нечипорук, О классификации функций многозначной логики (22 XII 1961). См. настоящий сборник. B. И. Л е в е н ш т е й н, Об автоматах и самонастраивающихся автоматах для декодирования сообщений (16, 23 II; 2 III 1962). См. ДАН 140, №6, 1961, 1274-1277; ДАН 141, №6, 1961, 1320-1323. Ю. П. О ф м а н, О построении универсального автомата для одного класса автоматов (9 III 1962). Е. Ю. 3 а х а р о в а, О синтезе схем из пороговых элементов (16 III 1962). См. настоящий сборник. О. Б. Л у п а н о в, Реферат статьи Б. А. Трахтенброта «Асимптотическая оценка сложности логических сетей с памятью» (23, 30 III 1962). ДАН 127, № 2, 1959, 281-284. О. Б. Л у п ан о в, О реализации функций алгебры логики релейно- контактными схемами (6 IV 1962). См. УМН 15, № 4, 1960, 199—202. Л. М. Лихтенбаум, Принцип двойственности в теории графов (13 IV 1962). См. УМН 13, № 5, 1958, 185-190. Ю. И. Янов, О тождественных преобразованиях регулярных выражений (20, 27 IV; 4 V 1962). См. ДАН 117, № 2, 1962, 327-330. В. Б. Кудрявцев, О некоторых вопросах полноты для систем автоматов (11, 18, 25 V 1962). Сдано в печать в сборник «Проблемы кибернетики». 23 Проблемы кибернетики, вып. 9
346 СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В НОВОСИБИРСКЕ СЕМИНАРЫ ПО КИБЕРНЕТИКЕ В НОВОСИБИРСКЕ В феврале 1962 г. в Институте математики СО АН СССР начал работать семинар по математической логике и кибернетике под руководством А. А. Ляпунова. В течение февраля — апреля было проведено четырнадцать заседаний, на которых были заслушаны следующие доклады: Ю. Л. Васильев, Оценка сложности дизъюнктивных нормальных форм (18, 25 II; 29 III 1962). В. А. Устинов, Применение электронных вычислительных машин в исторических исследованиях (1 111 1962). А. А. Л я п у н о в, О функциях множеств (15 III 1962). А. Н, Ляпунов (Ленинград), Обзор работ по задаче о коммивояжере (22 III 1962). А. П. Е р шо в, Об экономии памятив операторных схемах (5 IV 1962). Н. И. Глебов (Казань), О представлении операторов над памятью- и об эквивалентности подмножеств категории (12, 19 IV 1962). О. Б. Лупанов (Москва), Принцип локального кодирования (13 IV 1962). О. Б. Лупанов (Москва), Различие в сложности реализации монотонных функций в классе всех контактных схем и в классе схем без размыкающих контактов (14 IV 1962). И. А. Мельчук, Л. Н. Иорданская (Москва), Об автоматическом анализе языковых текстов (21, 23 IV 1962). A. А. Стогний (Киев), О программировании логических задач (25 IV 1962). В апреле 1962 г. в Новосибирском государственном университете были прочитаны следующие лекции по кибернетике: О. Б. Лупанов (Москва), Асимптотические оценки сложности, графов (13 IV 1962). И. Е. Т а м м (Москва), Расшифровка кодов наследственности (15 IV 1962). B. М. Глушков (Киев), Теория персептррна (16 Л V 1962). П. С. Новиков (Москва), Новые работы по математической логике (17 IV 1962). В феврале 1962 г. начал работать семинар по кибернетике при Совете молодых ученых Новосибирского академгородка. С февраля до мая было проведено 12 заседаний, на которых были заслушаны следующие доклады: А. А. Л я п у нов, О современных проблемах кибернетики (14II 1962). Ю. И. Журавлев, Обзор математической проблематики кибернетики (21 II 1962). И. А. Полетаев, О персептроне (28 II 1962). A. А. Ляпунов, Обзор работ по машинному переводу (7 III 1962). B. А. У с т и н о в, Об использовании ЭВМ в гуманитарных науках (14 III 1962). Э. В. Е в р е и н о в, О вычислительных системах (21 III 1962). А. В. Гладкий, О некоторых вопросах математической лингвистики (28 III 1962). Л. В. Канторович, Об основах математической экономики (4 IV 1962). А. А. Ляпунов, Об основах современной генетики (И IV 1962). Р. И. Солганник, О расшифровке наследственных кодов (18 IV 1962). Ю. Б. Р у м е р, Физика лазеров (25 IV 1962). А. А. Ляпунов, Об управляющих системах в живой природе (9 V 1962).
КИБЕРНЕТИКА В ДАЛЬНЕВОСТОЧНОМ ГОСУДАРСТВЕННОМ УНИВЕРСИТЕТЕ 347 ПЯТЬ ЛЕТ ЛЕНИНГРАДСКОЙ СЕКЦИИ КИБЕРНЕТИКИ В шестой год деятельности вступила секция кибернетики Ленинградского Дома ученых им. М. Горького. В первый период деятельности секции ею руководил Л. В. Канторович. С конца 1958 г. председателем секции, является Л. П. Крайзмер. Ежегодно, кроме секционных заседаний, организуются семинары и циклы лекций. В 1957—1958 гг. проведен цикл из 11 лекций «Управляющие и счетно-решающие устройства». 131959—1961 гг. регулярно читались лекции по циклу: «Кибернетика, ее современные приложения и перспективы развития». В 1961—1962 гг. действовал семинар по самоорганизующимся системам. В Ленинграде стало традицией проведение областным правлением Научно-технического общества радиотехники и электросвязи имени А. С. Попова научно-технических конференций, посвященных Дню радио. Секция постоянно в них участвует. За эти годы на секции кибернетики ЛДУ обсуждено на заседаниях, семинарах и конференциях более 150 докладов по вопросам вычислительной техники и теории информации, применения методов кибернетики в управлении производственными процессами, по биологии, медицине, лингвистике, экономике. Ряд заседаний секции состоялся непосредственно на предприятиях, в научно-исследовательских и учебных институтах. Запомнились выездные заседания в отделе программного управления Ленсовнархоза, на станкостроительном заводе им. Свердлова, в Ленинградском университете, Институте электросвязи имени М. А. Бонч-Бруевича и ряд других. В числе проблемных и информационных докладов были, в частности, прочитаны: 1. Работы ленинградских математиков в области автоматического программирования. Л. В. Канторович (XI 1958). 2. Определение грамматики языка методами кибернетики. Н. Д. Андреев (111 1959). 3. Идеи и методы исследования операций. И. А. Полетаев (III I960)- 4. О работах по медицинской электронике и кибернетике в Англии. Д. Н. Меницкий (X 1960). 5. О применении теории поисков к некоторым вопросам экологии^ Р. В. Орфеев (IV 1961). Бюро секции стремилось организовать обмен опытом, не замыкаясь в узких рамках. Значительную часть докладов и сообщений на секции прочитали специалисты из Москвы, Киева и других городов. Среди них были П. К. Анохин, В. М. Глушков, А. А. Ляпунов, Я. 3. Цыпкин, А. Е. Кобринский, А. В. Напалков и многие другие. А. А. Лебедев КИБЕРНЕТИКА В ДАЛЬНЕВОСТОЧНОМ ГОСУДАРСТВЕННОМ УНИВЕРСИТЕТЕ В 1961/62 учебном году на кафедре высшей алгебры и геометрии Дальневосточного государственного университета в городе Владивостоке* работал студенческий семинар по кибернетике. Участники семинара — студенты-математики четвертого и пятого курсов физико-математического» факультета, специализирующиеся по вычислительной математике- Всего было проведено 34 заседания. Часть заседаний была посвящена ознакомлению с основами теории алгоритмов, решению задач по теории алгоритмов. 2а*
348 КИБЕРНЕТИКА В ДАЛЬНЕВОСТОЧНОМ ГОСУДАРСТВЕННОМ УНИВЕРСИТЕТЕ На других заседаниях проводился обзор работ по автоматизации программирования, проведенных в СССР и опубликованных как в сборниках «Проблемы кибернетики», так и в других изданиях. И, наконец, докладывались работы, выполненные участниками семинара. Большинство этих докладов стало основой дипломных работ. Своеобразным итогом годовой работы семинара явилась успешно прошедшая в июне 1962 г. защита шести дипломных работ, написанных участниками семинара. Дипломная работа Л. Гринько «О некоторых преобразованиях логических схем программ» является естественным продолжением работ Н. Г. Арсентьевой (см. «Проблемы кибернетики», вып. 4) и Р. И. Подлов- ченко (см. «Проблемы кибернетики», вып. 1 и 3). Дипломница применила методы преобразования логических схем, разработанные Р. И. Подловчен- ко, к преобразованию схем решения двух задач: алгебраического сложения „двух квадратных матриц и построения матрицы порядка пт путем подстановки п2 матриц m-го порядка каждая на места элементов матрицы я-го лорядка. Если первая задача имеет более простую логическую схему гло сравнению с примерами, рассмотренными Р. И. Подловченко, то вторая ^имеет в составе своей схемы оператор, зависящий от шести параметров, л соответственно шесть циклов. При преобразовании логической схемы «торой задачи дипломнице удалось разработать два различных метода перехода от параметров схемы счета к рабочим параметрам, что соответствует двум способам организации циклов в программах (переменные сравнения и сравнения с константой с переменным содержанием). Работы Л. Пугачевой и В. Быгпева посвящены решению задачи об отыскании оптимального (в смысле затраты времени) пути от одного места некоторого условного города к другому. В качестве результата решения авторы указывают путь и виды транспорта, каким нужно пользоваться на каждом из участков пути. Метод Вышева предполагает предварительное знание всевозможных маршрутов в городе и их сокращенную запись в памяти машины. Алгоритм Пугачевой построен таким образом, что машина сама организует составление маршрута, перебор встречающихся маршрутов и выбор подходящего. В дипломных работах Л. Дячиньг и Г. Дабижи рассматриваются вопросы автоматизации ручного программирования. В основу работ легли уже известные алгоритмы автоматизации: ПАПА (см. статью В. В. Мартынюка «О методе символических адресов» в сборнике «Проблемы кибернетики», вып. 6) и ВУЗП (см. А. И. Китов и Н. А. Крипицкип, «Электронные цифровые машины и программирование», Физматгиз, 1959). Авторы частично видоизменили их с учетом особенностей программирования для двухадресной машины «Минск-1», которой располагает ДВГУ, а затем построили рабочие программы, которые будут использованы в работе Вычислительного центра ДВГУ. И, наконец, шестая работа — «Программирующая программа для весьма узкого класса задач» — выполнена Л. Максаковой. Узкий класс задач автор выделяет по виду логических схем, с помощью которых решаются эти задачи. В число требований, предъявляемых к логическим схемам, относимым к данному классу, входят: условие зависимости операторов только от одного параметра, условие вхождения в логический оператор не более двух логических условий и т. п. Программирующая программа для такого класса задач оказалась сравнительно невелика по объему, информация для нее проста. На примере этой работы стало отчетливо видно преимущество построения программирующей программы для отдельных классов задач перед универсальной программирующей программой. Т. Л. Гаврилова
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 1—2 июня 1962 г. в г. Москве состоялась теоретическая конференция философских (методологических) семинаров по философским вопросам кибернетики, организованная Научным советом по комплексной проблеме «Кибернетика» и Научным советом по философским вопросам естествознания АН СССР совместно с партийным комитетом Президиума Академии. В работе конференции приняло участие около 1000 специалистов — математиков, философов, физиков, инженеров, биологов, медиков, лингвистов, психологов, экономистов — из Москвы (приблизительно 800 чел.), Ленинграда, Киева, Новосибирска, Тбилиси и других городов Советского Союза. Конференцию открыл председатель Научного совета по комплексной проблеме «Кибернетика» акад. А. И. Берг. Во вступительном слове он говорил о значении кибернетики в свете решений XXII съезда КПСС и новой Программы партии. Кибернетика,— подчеркнул Берг,— должна помочь обеспечить оптимальный уровень управления целенаправленным, высокоэффективным и хорошо организованным трудом строителей коммунизма в науке, в народном хозяйстве — в экономике, промышленности и т. д. Для этого необходимо продолжить работу по укреплению идеологических, методологических и философских основ кибернетики. На конференции было заслушано десять докладов. Доклад А. А. Маркова «Что такое кибернетика?» был посвящен определению предмета кибернетики. Начав с критики тех философов, которые в начале 50-х годов объявили кибернетику «реакционной лженаукой», докладчик выразил затем свою неудовлетворенность принятыми определениями кибернетики через понятие информации. А. А. Марков предложил определение предмета этой науки, не опирающееся на понятие информации. В основе определения Маркова лежит понятие причинной сети. Причин^ ной сетью Марков называет конечную систему материальных объектов (узлов), каждый из которых может находиться в конечном числе состояний: между состояниями узлов имеют место причинные зависимости^ действующие во времени, которое рассматривается как дискретное, поделенное на «такты»; естественно возникает понятие изоморфизма причинных сетей. Наряду с «жесткими» причинными зависимостями в причинных сетях допускается наличие «нежестких», вероятностных причинных зависимостей — нелапласовской детерминированности. Необходимо также допустить причинно обусловленное порождение новых узлов в сети и исчезновение старых. Кибернетику Марков определяет как общую теорию причинных сетей, изучающую их с точностью до изоморфизма. При этом понятие причинной зависимости уточняется Марковым посредством введения понятия о совокупности законов природы, по отношению к которой рассматривается дапная причинная сеть. Имепно, согласно Маркову, уместно говорить, что событие А есть причина события В относительно
350 КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ совокупности законов природы М, если В происходит после А и может быть выведено из того, что произошло событие А, в силу законов природы из совокупности М *). Понятию причинности родственно понятие информации, так как последняя может пониматься следующим образом: «событие А содержит информацию о событии В по отношению к совокупности законов природы М, если на основании совокупности законов природы М из того, что имеет место событие А, можно заключить о наличии события В» (оговорка о предшествовании одного события другому отсутствует). Оба понятия, причинности и информации, допускают нелапла- совские видоизменения. Изучаемые в кибернетике (наряду с дискретными) непрерывные системы (т. е. системы с непрерывным временем и непрерывным пространством) рассматриваются Марковым как предельные случаи. Ввиду того что природа причинных сетей может быть самой разнообразной, кибернетика тесно переплетается со всеми другими науками и может быть приложена к ним. В докладе А. А. Ляпунова и С. В. Яблонского «Теоретические проблемы кибернетики»**) была поставлена задача охарактеризовать теоретические вопросы кибернетики, исходя из ее взаимодействия с областями знания, к которым оказываются приложимыми результаты и методы этой науки. Кибернетика, с точки зрения докладчиков,— это наука об общих закономерностях течения процессов управления и строения управляющих систем. Она взаимодействует с многими отраслями знания, изучающими конкретные процессы управления. По своим методам кибернетика является точной наукой. Всякое управление осуществляется посредством передачи информации; поэтому кибернетика изучает процессы хранения, передачи, переработки и восприятия информации и ее кодирования на разных языках, а также устройства, их выполняющие. Переработка информации производится в соответствии с тем, какова цель управления; поэтому важной областью проблематики кибернетики является область, которая называется «методы принятия решений» и которая касается путей достижения целей управления. В этой области важную роль играют методы линейного и динамического программирования и теории игр. После того как решение принято, его необходимо реализовать, а для этого надо определить, какие действия и в какой последовательности надо произвести, чтобы достичь цели. Эта задача решается теорией алгоритмов. Теория алгоритмов, разрабатываемая как область математики и математической логики и сыгравшая очень большую роль внутри математики, вышла сейчас далеко за пределы внутриматематическои тематики; она приобрела огромное значение.в самых различных областях человеческой деятельности — в таких вопросах, как управление производством, планирование пародного хозяйства и т. д. Прикладным аспектом теории алгоритмов является программирование для электронных вычислительных машин. Теория устройств, осуществляющих переработку информации в соответствии с заданным алгоритмом, является центральным звеном теоретической кибернетики. В основе кибернетики лежит представление о дискретности процессов управления и строения управляющих систем, а также стремление к выявлению элементарных актов, каналов связи, обратных связей, иерархичности управления и совместного рассмотрения строения и функционирования управляющих систем. ' *) В последнее время А. А. Марков, учитывая критику приведенного определения со стороны А. В. Кузнецова, согласился с ним в том, что к этому определению следует добавить указание на то, что при выводе В из А допустимо упоминать только о событиях в интервале времени от А до В. **) Доклад представлял собой введение в более подробный текст под тем же названием, представленный участникам конференции. Этот текст полностью публикуется в настоящем выпуске (см стр. 5—22).
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 351 Во второй части доклада указывается на исключительную важность разработки математических методов конструирования управляющих систем. Разработка этих методов происходит на некоторых специальных модельных объектах, обладающих ограниченными возможностями, но зато относительно простой структуры, которые выбираются так, чтобы сохранялось их сходство с реальными управляющими системами; в качестве такого рода объектов используются объекты, заимствованные из математической логики, из техники (контактная схема, автомат), из теории вычислительных машин (программы), из биологии (нервная сеть) и т. д. При этом методы, отработанные для сравнительно узких классов модельных объектов, оказываются применимыми в более широких сферах. В кибернетику нельзя включать все вопросы, относящиеся к применению математики в таких науках, как биология или экономика; неверно также включать в кибернетику дискретную математику в целом, хотя развитие дискретной математики тесно связано с кибернетикой. А. Н. Леонтьев в докладе «О некоторых особенностях переработки информации человеком» сообщил об исследованиях по изучению процесса переработки информации человеком, которые проводятся им и его сотрудниками. Исследование ставило, в частности, задачу выявления влияния значимости сигнала на процесс переработки информации человеком, поскольку учет важности сообщения как раз и является специфически человеческой чертой восприятия информации. Исследование показало, что при повышении значимости сигнала скорость переработки информации возрастает: время реакции на сигнал повышенной значимости снижается. Развиваемый докладчиком подход, позволяя выделить некоторые особенности переработки информации человеком, расширяет, по его мнению, круг процессов, описываемых в теории информации, что, естественно, должно привести к развитию и самой теории. Доклад «Моделирование свойств раздражителя нервной системой» сделал Е. Н. С о к о л о в. Он рассказал о проводимых им и его сотрудниками экспериментальных работах по изучению моделирующих свойств нервной системы (исследования проводились на людях и касались так называемого ориентировочного рефлекса; параллельно шли аналогичные опыты на собаках). На конференции были зачитаны тезисы доклада А. Н. Колмогорова «Жизнь и мышление с точки зрения кибернетики». В § 1 этих тезисов Колмогоров, приведя то описание основных свойств жизни, которое дано в статье А. И. О и а р и н а «Жизнь» в Большой Советской Энциклопедии (т. 16 второго издания), утверждает, что оно может служить основой для определения жизни, абстрагированного от конкретной природы элементарных физических процессов, специфическая организация которых дает нам основание называть их целостное системное протекание явлениями жизни. Обращая внимание на два обстоятельства: на то, что в век астронавтики возникает реальная возможность встречи с новыми формами движения материи, обладающими «основными важными для нас практически свойствами живых и мыслящих существ», и на то, что с развитием современной вычислительной техники появились в принципе ничем не ограниченные возможности моделирования любых сложно организованных материальных систем, Колмогоров приходит к выводу, что в настоящее время возникла необходимость сделать определение жизни и мышления чисто функциональным. Параграфы 2 и 3 тезисов Колмогорова представляют собой немного измененные тезисы доклада «Автоматы и жизнь», прочитанного им на методологическом семинаре механико-математического факультета МГУ
352 КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 5 ацреля 1961 г. (см. бюллетень «Машинный перевод и прикладная лингвистика», 1961, № 6, стр. 3—8). В § 2 Колмогоров рассматривает вопрос о том, возможно ли создание искусственных живых существ, способных к размножению, прогрессивной эволюции, в высших формах обладающих эмоциями, волей и мышлением. По его мнению, «в рамках материалистического мировоззрения не существует никаких состоятельных принципиальных аргументов против положительного ответа на наш вопрос». При анализе явлений жизни существенна не диалектика бесконечного, а диалектика большого (чисто арифметическая комбинация большого, числа элементов создает и непрерывность и новые качества). В § 3 говорится о том, что объективное изучение в терминах кибернетики наиболее тонких видов творческой деятельности человека может уже в ближайшем будущем получить большое практическое значение; «серьезное объективное изучение высшей нервной деятельности человека представляется мне, — говорит Колмогоров,— необходимым звеном в утверждении материалистического гуманизма». В § 4 говорится о некоторых результатах в теории автоматов, полученных Колмогоровым и Ю. Офманом, и выдвигается предположение о том, что основные трудности, относящиеся к моделированию работы человеческого мозга, непосредственно связанной с развитием человеческой культуры, включая все ее составные части от элементарных трудовых навыков до художественного и научного творчества, связаны не с задачей изготовления достаточно большого числа ячеек моделирующего автомата, а со своеобразием той программы, которая должна привести автомат в действие. В этом последнем отношении теория автоматов дает несколько обескураживающие наметки. Вполне возможно, что некоторые алгоритмы, выработанные в процессе органической эволюции или развития человеческой культуры, отличаются тем, что для построения моделирующей программы потребуется очень длинное, основанное на «методе перебора» вычисление. В шуточной форме: возможно, что автомат, способный писать стихи на уровне больших поэтов, нельзя построить проще, чем промоделировав все развитие культурной жизни того общества, в котором поэты реально развиваются. Доклад «Об управляющих системах живой природы и общем понимании жизненных процессов» сделал А. А. Л я п у н о в. Он отметил, что применение кибернетического метода в биологии требует определения ряда общзбиологических понятий, и прежде всего определения живого. По мнению докладчика, жизнь, жизнедеятельность, живое нужно понимать как специфическое состояние вещества; это состояние характеризуется чрезвычайно высокой устойчивостью; эта устойчивость обеспечивается иерархичностью систем управления и тем, что управляющие системы живого используют для выработки сохраняющих реакций информацию, кодируемую на мономолекулярном уровне. По мнению докладчика, в рамках развиваемой им концепции живого находит свое естественное объяснение структурированность биологических объектов, которая, например, проявляется в наличии таких биологических форм, как популяция, организм, отдельные органы, клетки, органеллы клеток и отдельные биологически значимые молекулы, а также в эволюции. Докладчик отметил проникновение кибернетических концепций в биологию в ряде направлений, в частности в области генетики, где достигнуты успехи в расшифровке биомеханизма работы гена. Возникшая в генетике проблема объяснения механизмов перекодирования наследственной информации является по своей природе кибернетической. В. М. Глушков (Киев) в докладе «Мышление и кибернетика» отметил, что исследование мыслительного процесса является одной иа
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 353 важных задач кибернетики. В настоящее время ограниченность интеллектуальных возможностей человека сказывается на темпах прогресса в ряде областей — в управлении экономикой, в научно-исследовательской работе и т. д. Изучение мышления, которое в кибернетике осуществляется с помощью моделирования, необходимо для того, чтобы человек с помощью машин мог восполнять недостатки и расширять возможности своей интеллектуальной деятельности. Вслед за Колмогоровым В. М. Глушков подчеркнул, что, говоря о неограниченных возможностях моделирования, не надо забывать, что в настоящее время мы продвинулись в этой области еще очень мало и 1е.чь идет о принципиальных возможностях. Неограниченное» принципиальных возможностей моделирования он связал с тезисом марксистской диалектики о том, что непознаваемых вещей в природе нет. ■} Глушков вымелил два уровня моделирования мыслительных процессов: уровень, H2j котором моделируется внешнее проявление мыслительного процесса -* прежде всего его проявление в языке,— и другой., более глубокий уровень, когда моделируются законы, на основе которых устроено и функционирует то устройство, которое реализует мыслительный процесс. На первом* уровне, на котором для описания мышления используются формальные языки, нельзя описать не только все мышление в целом, но даже ту его часть, которая называется логическим мышлением. Второй уровень связан с разработкой теории самоорганизующихся и самообучающихся систем; при исследовании на этом уровне возникаег ряд глубоких проблем, связанных с моделированием мыслительных процессов. Обсуждая вопросы, относящиеся к возможностям машин, докладчик приходит к выводу, что нет научных оснований не признавать, что машина в каждом отдельном случае может быть «умнее» каждого конкретного человека. Но машина не может быть умнее человечества в целом, что связано с тем местом, какое она занимает в обществе. Когда мы сравниваем интеллектуальную мощь человека и машины, мы должны говорить не о мыслительных способностях отдельного человека, а брать все то, что создано гением, волей и трудом тысяч поколений людей, и тогда сюда включится все то, что создается машинами. Человек — творец, а машина — орудие и помощник человека; и такое отношение должно сохраниться. В социальном отношении машина всегда будет лишь помощником человека. И. Б. Новик в докладе «О природе информации и особенностях кибернетического моделирования» остановился на понятии «черного ящика» в кибернетике; он отметил, что связанный с этим понятием функциональный подход дает возможность ориентироваться в вопросах, относящихся к структурам, внутренний механизм которых мы еще не полностью понимаем. А. И.Фельдбаум в докладе «Процессы обучения людей и автоматов» рассказал о выявившихся в настоящее время общих методах построения автоматов. Изучение процесса обучения людей представляет большой интерес для создания обучающихся автоматов. Фельдбаум дал следующее определение понятия обучающегося автомата (самообучающейся системы, системы автоматического обучения): системой автомагического обучения называется система, алгоритм которой изменяется целенаправленным образом, причем этот алгоритм не заложен в систему ее конструктором. Он выделил три пути подхода к разработке систем автоматического обучения, которые он назвал математическим, психологическим и физиологическим методами. При математическом подходе задача построения автомата формулируется и решается как задача математическая. На этом пути удалось достичь-
354 КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ серьезных успехов, особенно в теории оптимальных систем. Но математический метод нельзя считать единственным. В этой связи А. И. Фельд- баум подверг, критике точку зрения на кибернетику как на чистую математику: такой взгляд является неправильным, он односторонен. Математика и математические процессы грандиозны по своей общности, но математика имеет свои границы. Это касается математики вообще, тем более математики в ее современном виде; современная математика весьма нуждается в развитии применительно к новым областям. В сложных случаях, когда применение одного лишь математического метода становится затруднительным (а иногда и невозможным), конструкторам автоматов приходится обращаться к рассмотрению человеческой деятельности, подражать действиям человека, имитировать процесс человеческого обучения. В процессе обучения огромную роль играет поиск. Именно по пути разработки алгоритмов поиска часто и идут создатели новых автоматов. В качестве примера Фельдбаум ссылается на работы, ведущиеся в Киеве под руководством В. М. Глушкова, а также на автомат для доказательства теорем геометрии Евклида на плоскости, разработанный в США (в основу алгоритма положен тот анализ процесса решения математических задач, который проведен Д. Пойя в его книге «Как решить задачу?», см. русский перевод, Учпедгиз, М., 1959). Этот метод, который Фельдбаум называет психологическим, дополняется методом физиологическим, основанным на перенесении в разработку автоматов приемов дрессировки животных, основанных на торможении неправильных и поощрении правильных рефлексов. В докладе приведены примеры использования психологического и физиологического методов (в сочетании с математическим), в частности относящиеся к автоматам, обучающимся распознаванию образов (персепт- рон Ф. Розенблата в США). Фельдбаум отмечает возможность достижения в будущем того, что машины смогут не только решать, но и ставить для решения все более и более сложные задачи. Доклад на тему «Кибернетика и некоторые пути рационализации обучения» сделал Л. Н. Л а н д а (содержание доклада изложено в его статье «О кибернетическом подходе к теории обучения», опубликованной в журнале «Вопросы философии», № 9, 1962, стр. 75—87). Доклад об основных направлениях работы секции философских вопросов кибернетики Научного совета по комплексной проблеме «Кибернетика» АН СССР сделал А. Г. С п и р к и н. С обсуждением философских и общетеоретических вопросов кибернетики на конференции выступило свыше тридцати человек. Основными проблемами, привлекшими внимание участников конференции, были: определение предмета кибернетики, основные понятия кибернетики (информация, обратная связь и др.)» философские вопросы, связанные с моделированием мыслительных процессов, кибернетика и логика, кибернетика и биология. Ряд выступавших, принимая основные идеи определения кибернетики, предложенного А. А. М а р к о в ы м, предлагали вместе с тем его видоизменить или дополнить. На кибернетику, сказал Ю. Я. Б а з и- л е в с к и й, естественно смотреть как на метод оптимизации причинных процессов. Ю. А. Г а с т е в, согласившись с тем, что в задачу кибернетики входит оптимизация причинных сетей, вместе с тем высказал убеждение, что нет необходимости связывать определение кибернетики с таким сложным понятием, как понятие причинности; в ряде случаев надо говорить не о причинных, а о корреляционных сетях. Ряд выступавших отметили, что определение Маркова представляется им слишком широким. Такой взгляд высказали А. А. Малиновский (Одесса) л П. С. Дышлевый (Киев). По мнению Малиновского, в кибернетике
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 355 следует рассматривать не только системы собственно управления, но включить в нее изучение и более широких вопросов, относящихся к системам различных типов; специфическим для кибернетики является качественное изучение изменений; для биологии чрезвычайно важно, что кибернетика позволяет решать вопросы, не имея точных количественных показателей, не имея даже представления о некоторых звеньях изучаемого лроцесса, а располагая сведениями лишь о типе взаимоотношений в этих звеньях. А. И. П р о х о р о в сказал, что, по его мнению, следует принять определение кибернетики, которое дано А. И. Б е р г о м: кибернетика — это наука о целенаправленном оптимальном управлении сложными динамическими системами. Б. М. Кедров, стремясь установить место кибернетики в системе наук, сформулировал концепцию кибернетики как науки о новой, не известной ранее форме движения материи, характерной особенностью которой является процесс управления. Большое место в выступлениях заняло обсуждение философских аспектов основных понятий кибернетики. Л. Н. Курчиков (Одесса) говорил о том, что понятие информации следует рассматривать вместе с рядом других понятий (категории различия, множества возможностей, разнообразия, сложности). Подчеркнув объективный характер информации, он подверг критике антропоморфный взгляд на информацию. Против антропоморфного подхода к понятию информации высказался также В. С. Т ю х т и н. А. А. Б р у д п ы й (Фрунзе) обратил внимание на связь понятия информации с понятием изоморфизма и подчеркнул значение исследования семантической значимости информации в связи с кибернетическим анализом человеческой деятельности. Н. Н. Воробьев (Ленинград) заметил, что с философской точки зрения существенно, что к понятиям случайности и необходимости теория игр — теория конфликтных ситуаций, протекающих в основном в условиях неопределенности,— добавляет важное понятие неопределенности. На понятии обучения остановился М. Г. Гааз с-Р а п о п о р т. По его мнению, это понятие имеет право на существование лишь по отношению к тем системам, законы функционирования которых мы по-настоящему не знаем. Ряд выступавших (Ю, Я. Базилевский, С. А. Яновская и др.) подвергли обсуждению логические вопросы кибернетики. Ю. Я. Базилевский обратил внимание на то, что основным методом кибернетики является метод моделирования процессов, имеющий целью нахождение оптимальных вариантов решений. Метод моделирования, предполагающий сопоставление общих закономерностей, протекающих в различных процессах, требует введения представления об абстрактных процессах и их различных — математических и физических —интерпретациях. В связи с этим, сказал он, является чрезвычайно существенным развитие общей теории семантики. На вопросах, связанных с логикой, остановилась также С. А. Яновская. Она указала на то, что в настоящее время традиционная логика утеряла всякое научное и педагогическое значение и тратить па ее изучение время и силы нашей молодежи не следует. Важность вопроса о логике кибернетики отметил А. А. Мали- до в с к и и. Ряд выступавших: Н. Г. Б р у е в и ч, П. К. Анохин, А. И. Прохоров, С. М. Ш а л ю т и н (Курган) и др.— высказались против тезиса о возможности так называемого «машинного мышления». Н. Г. Б р у е в и ч, отметив, что аргументы, выдвигаемые в пользу возможности соревнования «мышления» машин и человеческого мышления, ле являются убедительными, подчеркнул вместе с тем важность усилий
356 КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ по увеличению творческих возможностей человека с помощью машин- Наличие цели, сказал П. К. А н о х и н, является центральным узлом всего поведения человека, и уже поэтому невозможно сравнивать машину с человеком. По мнению С. М. Ш а л ю т и н а, возможность мышления у машин исключается благодаря тому, что в возникновении мышления решающую роль играют трудовая деятельность и человеческие общественные отношения; именно труд будет определять те стороны сознания,, которые мы пе сможем промоделировать в кибернетических системах. Против ограничительных тенденций в вопросе о возможностях машин высказались Л. Б. Б а ж е н о в, Ю. А. Г а с т е в, М. Г. Гаазе- Рапопорт. Ход развития науки, сказал Баженов, говорит о том, что действительная специфика тех или иных предметных областей открывалась не теми, кто еще до изучения данной предметной области настаивал на ее специфике, а теми, кто стремился видеть неизвестное в известном и которых сама логика научных исследований наталкивала на определенные выводы. Коснувшись тезиса, согласно которому невозможно создать искусственную кибернетическую систему, осуществляющую функции, которые мы в себе называем мышлением, на том основании, что человек развился естественным путем, он сказал, что если общественная природа мышления не есть нечто непознаваемое, она может, в принципе, быть моделируема на соответствующим образом устроенных машинах. А. И. У е м о в (Иваново) отметил, что существуют различные точки зрения в вопросе о возможностях машин; большинство ученых придерживается взгляда, что любое заданное поведение человека в принципе может быть промоделировано на машинах. Г. Б. Линковский отметил два направления в современной науке: конструирование технических устройств, обладающих рядом свойств живых систем, и работы по созданию искусственным путем живой материи из неживой; Сейчас наступила эпоха взаимопроникновения живой и неживой материи, о чем, в частности, свидетельствует развитие протезирования. Подчеркнув, что «целесообразная» работа современных машин не имеет самостоятельности и они остаются придатком целесообразной деятельности живого организма — человека и его мозга, он выразил убеждение, что, заглядывая в будущее, с философской точки зрения мы не должны исключать возможности создания новых видов живой материи, доселе не известных человеку. Е. Л. Брусиловский выдвинул идею о том, что для решения вопроса о соотношении возможностей машины и мышления существенно изучение процессов творческой деятельности человека. Быть может, как раз творчество, сказал он, является тем, что отличает человека от машины. Вместе с тем он допустил, что машина сможет решать творческие задачи, что можно создать искусственное устройство, которое будет работать лучше, чем мозг человека. В связи с этим он отметил, что высказываемые иногда опасения, связанные с будущим развитием машин, действительно имеют некоторое основание. П. К. Анохин, А. В. Н а п а л к о в, К. С. Т р и н ч е р и др. посвятили свои выступления вопросам применения кибернетики в биологии. По мнению П. К. Анохина, узлом, вокруг которого группируются философские вопросы кибернетики, связанные с жизнью и мышлением, является обратная связь. А. В. Напалков отметил, что при изучении высшей нервной деятельности возникает много проблем, тесно связанных с кибернетикой и имеющих философское значение. К. С. Т р и н- ч е р поставил вопрос, существуют ли принципиально неограниченные возможности моделировать любую функцию живого организма. Он сообщил о результатах исследований, из которых, по его мнению, на основа-
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 357 нии термодинамических соображений, следует, что процесс эмбриогенеза не может быть моделирован. О непримиримой враждебности кибернетики витализму говорил Ш. Г. А д э и ш в и л и (Тбилиси). Он напомнил о борьбе Н. Винера против виталистических выводов, связанных с бергсоновским пониманием времени, против противопоставления процессов в живой природе и в неорганическом мире. Винер, сказал Адэишвили, указал на то, что необратимые процессы характеризуют не только жизнь, но и неживую материю (термодинамические, квантовомехапические и вообще статистические закономерности), что с кибернетикой существенно связана концепция необратимого течения времени как в живой, так и в неживой природе, в частности в автоматах. Это, подчеркнул Адэишвили, существенно для понимания предмета кибернетики: кибернетика изучает сложные динамические целенаправленные системы; такие системы являются в известной мере статистическими, так как обладают возможностями выбора для осуществления целенаправленного действия; при этом динамика связана не с ньютоновым, а с необратимым, «бергсоновским», временем. Ряд выступлений был посвящен социальным аспектам кибернетики и ее применению к общественным наукам. Н. Н. Воробьев поставил вопрос об отношении между философским понятием антагонизма и понятием антагонизма в теории игр. Разъяснение этого вопроса необходимо для выяснения того, в какой мере теория антагонистических игр применима к изучению общественных явлений. В выступлении Г. А. Бурцева (Свердловск) был поставлен вопрос о необходимости философского анализа значения средств связи и коммуникаций в обществе; необходтю, сказал он, научиться определять влияние процессов передачи информации на общественное развитие в том или ином конкретном случае. Бурцев подчеркнул, что насущная задача сегодня — привлечение кибернетики к решению задач регулирования человеческого общества, строительства коммунизма, укрепления дела мира. О роли кибернетики в оптимальном планировании народного хозяйства при социализме говорил П. Г. К у з- н е ц о в. Необходимость изучения структуры циркуляции информации в обществе подчеркнул в своем выступлении Б р у д н ы й. О приложениях кибернетики к педагогике говорил Г а с т е в. Он напомнил о той работе, которая проводилась в 20—30-х годах в Москве в Центральном институте труда (ЦИТ). Этот институт, занимавшийся проблемами организации труда, вместе с тем уделял постоянное внимание вопросам педагогики. Ставя вопрос об использовании положительного наследства ЦИТ, стремившегося разработать методы обучения на основе строгих критериев, Гастев упомянул о работе по выработке точных и эффективных методов подготовки програхммистов, начатой в Лаборатории электромоделирования ВИНИТИ. В докладах и выступлениях на конференции был поставлеп ряд научно-организационных вопросов. Ляпунов говорил о том, что современное высшее образование должно быть, приближено к тем требованиям, которые предъявляются жизнью в связи с развитием кибернетики и электронно-вычислительной техники; при этом в первую очередь следует поставить вопрос о расширении и повышении уровня математического образования. Он обратил, далее, внимание на то, что подготовка кадров во всех областях, связанных с кибернетикой, приобрела крайне актуальный характер. В частности,-для развития кибернетического направления в биологии необходимо резкое расширение физико-математической подготовки биологов, которые в настоящее время практически не получают никакого математического образования. Необходимо создать мощные кибернетические центры и научные коллективы, хорошо оснащенные
358 КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ современной техникой и состоящие из специалистов всех необходимых профилей. За введение в 11-х классах средней школы предмета «Элементы кибернетики» высказался Гааз е-Р а п о п о р т. Ряд выступавших говорили о важности упорядочения терминологии кибернетики. С заключительным словом выступил А. И. Берг. Он рассказал о развертывании исследований по кибернетике в Советском Союзе, особо остановившись на применении математики и кибернетики в биологии и экономике. Математика, сказал Берг, поможет нам лучше решать задачи во всех областях. Важное значение имеют математика, кибернетика, электронные машины в экономических исследованиях, в социалистическом планировании. Переход от социализма к коммунизму будет в значительной степени определяться качеством методов планирования. Задача состоит в том, чтобы перейти к оптимальному планированию. Берг остановился на социальных аспектах применения кибернетической техники. Применение электронных вычислительных и управляющих машин при кани- талнзме приводит к безработице, обостряет противоречия буржуазнога общества. Но не следует думать, что внедрение этих машин при социализме не связано ни с какими трудностями; трудности возникают, и для их преодоления в социалистическом обществе приходится принимать необходимые меры, планово перераспределять рабочую силу, целесообразна размещать предприятия и т. д. Остановившись на некоторых теоретических вопросах применения кибернетики в экономике, Берг обратил внимание на то, что при введении автоматизации следует исходить прежде всего из экономической эффективности. Для определения последней важное значение имеют понятие оптимальной себестоимости изделий и требование их оптимальной долговечности, их оптимальной надежности. .Оптимизация — это важнейшая проблема; оптимизация это и есть кибернетика. В заключение Берг подчеркнул необходимость наведения порядка в терминологии кибернетики, а также расширения издания литературы по математическим основаниям кибернетики. Конференция приняла решение, в котором было отмечено, что развитие кибернетики имеет важное значение для реализации выдвинутой XXII съездом КПСС и Программой партии задачи создания материально- технической базы коммунизма. Партия рекомендует и призывает организовать широкое применение кибернетики, электронных вычислительных и управляющих устройств в производстве, в научных исследованиях, в сфере учета, статистики, управления. Для осуществления этого необходимы быстрое, решительное и широкое развертывание исследовательской работы в области кибернетики и связанных с нею наук, организация мощных научных коллективов, состоящих из ученых различных специальностей и оснащенных современной техникой, разрабатывающих актуальные проблемы кибернетики, создание научных кибернетических центров, ускорение подготовки кадров по кибернетике. Важную роль в повышении уровня и результативности научной работы в области кибернетики, вычислительной математики, математической логики, теории автоматов и других наук играют теоретический и методологический анализ и обобщения, создающие условия для широких научных синтезов. Фундаментальной основой всей методологической работы в области кибернетики является диалектико-материалистическое мировоззрение. В решении говорится, что за последние годы проведена определенная работа в области методологических вопросов кибернетики. Вместе с тем конференция отметила, что исследования в области методологических и общетеоретических вопросов кибернетики еще носят недостаточно пла-
КОНФЕРЕНЦИЯ ПО ФИЛОСОФСКИМ ПРОБЛЕМАМ КИБЕРНЕТИКИ 359 номерный и организованный характер и отстают от требований научного познания и практики. Конференция обратила внимание ученых, работающих в области кибернетики, естественных и гуманитарных наук, советских философов на необходимость теоретического анализа результатов кибернетики, на философское осмысление ее взаимодействия с другими науками и ее приложений в практике народного хозяйства, на методологическое обобщение результатов кибернетики. Конференция подчеркнула значение кибернетических методов в биологии и лингвистике, в экономических пауках, в психологии, педагогике, призвала уделять еще большее внимание взаимодействию кибернетики с естественными и гуманитарными науками. Конференция потребовала дальнейшего укрепления содружества философов, математиков, специалистов в области естественных и гуманитарных дисциплин в разработке философских вопросов кибернетики, призвала переключить внима^ ние с отвлеченных вопросов, не имеющих прямой связи с вопросами современного этапа в развитии кибернетики, на актуальные философские проблемы, выдвинутые этой наукой и ее практическими приложениями. Конференция признала целесообразным периодическое (примерно раз в 1—2 года) проведение региональных и всесоюзных конференций по философским и общеметодологическим вопросам кибернетики и ее отдельных отраслей, а также по отдельным узловым методологическим проблемам кибернетики. Конференция обратила внимание на необходимость организации систематической подготовки кадров по философским вопросам кибернетики. Для упорядочения терминологии по кибернетике конференция признала целесообразным организовать соответствующую работу в Научном совете по комплексной проблеме «Кибернетика» и Комитете по терминологии АН ССР. Более подробное изложение ряда докладов и выступлений, имевших место на конференции, см. в обзоре: «Конференция по философским вопросам кибернетики», опубликованном в журнале «Вопросы философии», 1962, № И, стр. 146—153; там же (стр. 153—154) напечатан полный текст решения конференции. Б. В. Бирюков
ИСПРАВЛЕНИЯ К ВЫПУСКУ 8 Стр. | 40 1 48 51 51 52 53 71 71 71 71 82 83 183 278 278 279 279 279 281 233 341 342 343 343 343 343 345 Строка | Напечатано | Должно быть 18 св. 1 сн. 1 » 1 » 12 Ь 3 св. 4 » 10 ь 12 » 14 » 7 сн. 12 св. 10 сн. 23 св. лсный столбец 26 св. правый столбец 6 св. леный столбец 15 св. прлный столбец 27 св. праный столбец 9 сн. леный столбец 5 си. 1 леный столбец 16 СВ. табл.16. 8 св. 20 » 4 сн. 1 » 8 св. M[S(%°\ Я)]г£ TGaTF ^(GiL^i) i—=1 Б*(Е()фА %б(1> Ф А IhW-lhiT)^ = 1(F(0))~ 2«'(01/(Л(*))- -/(*•(*))] /(*(0))>S «'(01/(^1 (0)- -/№(0)1 | 2 «'(01/с«(0)- -f(F3(t))]>f(F(0)) Т-1 2 а'(*)[/Ci (*))-/(*•(«)))> 1=2 Т-1 > 2 «'(01/(^ с*»-/с. (*»] (=2 д; выходных символом aves о, что somplcxes системы процес qui impossible epuation С. Н. Яблонскому ^il+1+IH-l+l+lilH-H-l l + 1 + l-HII+l-Hll Так функция т ieob0 ф2,ал п-з п. М [S (-21й'), 3?)] $ ТсСТр «?$гв (GiUBi) i=l 1 ^+(^) = Л 4б(1)=^л //<»(T)_#u>(T) = T—i =/(^(0))-2а'(0[/(^а)(0)- <=2 1 -/(Я» (0)1 T—1 1 /(^(0))> 2 а'(0[/С(1)(0)- f=2 -/(Я«(0)1 T—1 I 2 «'(*)[/(^(2)«)-/(^(0)i>\ t=2 4 >f(F(0))\ T-i ]>' a'W[/(iwl)W)-/(iwt,W)]> /=2 T-l > ^cc'W[/(^2)W)-/(^(8)(0)] t=2 «1 A' выходных символов 1 avec то, что complexes систем процесс qui est impossible equation I С. В. Яблонскому 1 blbil + l + H + l + l+llll+l + l l+l + l + ll+l + llll Так как функция 1 т*3 1 "ЧьО ♦«.«к- 1 т^ iel,i 1 /ujg)(3 1 ^/<»>(,) |